アルファ合成: コンピュータビジョンにおける画像合成の技術を習得する
By Fouad Sabry
()
About this ebook
アルファ合成とは
コンピューター グラフィックスにおけるアルファ合成またはアルファ ブレンディングは、1 つの画像を背景と組み合わせて、部分的または完全な透明の外観を作成するプロセスです。多くの場合、画像要素 (ピクセル) を個別のパスまたはレイヤーでレンダリングし、結果として得られる 2D 画像を合成と呼ばれる単一の最終画像に結合すると便利です。合成は、コンピューターでレンダリングされた画像要素とライブ映像を組み合わせるときに映画で広く使用されています。アルファ ブレンディングは、2D コンピュータ グラフィックスでも、ラスタライズされた前景要素を背景の上に配置するために使用されます。
どのようなメリットがあるのか
(I) 以下のトピックに関する洞察と検証:
第 1 章: アルファ合成
第 2 章: デジタル合成
第 3 章: PNG
第 4 章: RGB カラーモデル
第 5 章: ガンマ補正
第 6 章: クロマサブサンプリング
第 7 章: BMP ファイル形式
第 8 章: RGBA カラーモデル
第 9 章: グレースケール
第 10 章: 透明性 (グラフィック)
(II) アルファ合成に関する一般のよくある質問に答える。
(III) 多くの分野でアルファ合成を使用する実際の例。
この本は誰に向けたものなのか
専門家、大学生、大学院生、愛好家、趣味人、そしてあらゆる種類のアルファ コンポジットに関する基本的な知識や情報を超えたい人。
Read more from Fouad Sabry
コンピュータビジョン [Japanese]
Related to アルファ合成
Titles in the series (100)
修復: コンピュータビジョンにおけるギャップを埋める Rating: 0 out of 5 stars0 ratingsコンピュータビジョン: コンピュータービジョンの深部を探る Rating: 0 out of 5 stars0 ratingsコンピュータステレオビジョン: コンピュータービジョンにおける奥行き知覚の探求 Rating: 0 out of 5 stars0 ratings画像ヒストグラム: 視覚的な洞察を明らかにし、コンピューター ビジョンの画像ヒストグラムの深さを探る Rating: 0 out of 5 stars0 ratings画像圧縮: ビジュアルデータ最適化のための効率的なテクニック Rating: 0 out of 5 stars0 ratingsノイズ減少: 明瞭度の向上、コンピュータ ビジョンのノイズ低減のための高度な技術 Rating: 0 out of 5 stars0 ratingsヒストグラム均等化: 画像のコントラストを強化して視覚認識を強化 Rating: 0 out of 5 stars0 ratings視覚: 計算による視覚処理に関する洞察 Rating: 0 out of 5 stars0 ratingsガンマ補正: コンピューター ビジョンの視覚的な鮮明さを高める: ガンマ補正技術 Rating: 0 out of 5 stars0 ratingsトーンマッピング: トーン マッピング: コンピューター ビジョンにおける視点を照らす Rating: 0 out of 5 stars0 ratings水中コンピュータビジョン: 波の下でコンピューター ビジョンの深さを探索する Rating: 0 out of 5 stars0 ratingsホモグラフィー: ホモグラフィー: コンピューター ビジョンの変換 Rating: 0 out of 5 stars0 ratings色空間: コンピューター ビジョンのスペクトルを探索する Rating: 0 out of 5 stars0 ratingsアフィン変換: 視覚的な視点を解き放つ: コンピューター ビジョンにおけるアフィン変換の探索 Rating: 0 out of 5 stars0 ratingsレティネックス: レティネックスでコンピュテーショナル ビジョンの秘密を明らかにする Rating: 0 out of 5 stars0 ratings適応フィルタ: 適応フィルタリングによるコンピュータビジョンの強化 Rating: 0 out of 5 stars0 ratingsコンピュータビジョンの基本マトリックス: 「コンピュータ ビジョン」の範囲内で、「コンピュータ ビジョン 基本マトリックス」というタイトルの本のサブタイトルを提案してください。提案されたサブタイトルには「:」を含めないでください。 Rating: 0 out of 5 stars0 ratingsバンドル調整: 正確な再構築のためのビジュアルデータの最適化 Rating: 0 out of 5 stars0 ratingsハフ変換: コンピューター ビジョンにおけるハフ変換の魔法を明らかにする Rating: 0 out of 5 stars0 ratingsラドン変換: ビジュアルデータに隠されたパターンを明らかにする Rating: 0 out of 5 stars0 ratingsフィルターバンク: コンピューター ビジョンのフィルター バンク技術に関する洞察 Rating: 0 out of 5 stars0 ratings異方性拡散: 異方性拡散による画像解析の強化 Rating: 0 out of 5 stars0 ratingsカラーマネジメントシステム: デジタル環境における視覚認識の最適化 Rating: 0 out of 5 stars0 ratings共同写真専門家グループ: 共同写真専門家グループ規格でビジュアルデータの力を解き放つ Rating: 0 out of 5 stars0 ratingsランダムサンプルのコンセンサス: コンピュータビジョンにおけるロバスト推定 Rating: 0 out of 5 stars0 ratings射影幾何学: コンピューター ビジョンにおける射影幾何学の探索 Rating: 0 out of 5 stars0 ratingsアダマール変換: コンピューター ビジョンにおけるアダマール変換の力を明らかにする Rating: 0 out of 5 stars0 ratings幾何学的ハッシュ: 画像の認識とマッチングのための効率的なアルゴリズム Rating: 0 out of 5 stars0 ratingsブロブの検出: ビジュアルデータのパターンを明らかにする Rating: 0 out of 5 stars0 ratings人間の視覚系モデル: 知覚と処理を理解する Rating: 0 out of 5 stars0 ratings
Related ebooks
適応フィルタ: 適応フィルタリングによるコンピュータビジョンの強化 Rating: 0 out of 5 stars0 ratings双一次補間: バイリニア補間による画像の解像度と鮮明さの向上 Rating: 0 out of 5 stars0 ratingsカラーマッチング機能: コンピュータビジョンにおける分光感度を理解する Rating: 0 out of 5 stars0 ratings画像の分割: ピクセル精度を通じて洞察を引き出す Rating: 0 out of 5 stars0 ratingsアンチエイリアシング: コンピュータービジョンの視覚的な鮮明さを強化する Rating: 0 out of 5 stars0 ratingsアクティブコンター: アクティブコンター技術によるコンピュータービジョンの進歩 Rating: 0 out of 5 stars0 ratings色の見え方モデル: コンピュータビジョンにおける知覚と表現を理解する Rating: 0 out of 5 stars0 ratings記述的な幾何学: 視覚領域のロックを解除: コンピューター ビジョンにおける記述幾何学を探索する Rating: 0 out of 5 stars0 ratingsアルゴリズムの確率: 基礎と応用 Rating: 0 out of 5 stars0 ratingsクアッドツリー: 画像解析のための階層データ構造の探索 Rating: 0 out of 5 stars0 ratingsテクスチャ マッピング: コンピュータービジョンにおける次元性の探求 Rating: 0 out of 5 stars0 ratings射影幾何学: コンピューター ビジョンにおける射影幾何学の探索 Rating: 0 out of 5 stars0 ratings部屋 シェーディング: ビジュアル レンダリングの深さを探る: コンピューター ビジョンにおけるフォン シェーディング Rating: 0 out of 5 stars0 ratingsベクターグラフィックス: コンピューター ビジョンでベクター グラフィックスをマスターする Rating: 0 out of 5 stars0 ratingsハリスコーナーディテクター: 画像特徴検出の魔法を明らかにする Rating: 0 out of 5 stars0 ratingsハフ変換: コンピューター ビジョンにおけるハフ変換の魔法を明らかにする Rating: 0 out of 5 stars0 ratingsホモグラフィー: ホモグラフィー: コンピューター ビジョンの変換 Rating: 0 out of 5 stars0 ratingsスケール不変特徴量変換: コンピューター ビジョンにおけるスケール不変特徴量変換の力を明らかにする Rating: 0 out of 5 stars0 ratings境界ボリューム: コンピューター ビジョンにおける空間表現の探求 Rating: 0 out of 5 stars0 ratingsフィルターバンク: コンピューター ビジョンのフィルター バンク技術に関する洞察 Rating: 0 out of 5 stars0 ratings固有顔: 固有顔で視覚認識の深さを探る Rating: 0 out of 5 stars0 ratingsブレゼンハム ライン アルゴリズム: コンピュータビジョン向けの効率的なピクセルパーフェクトラインレンダリング Rating: 0 out of 5 stars0 ratingsグーローシェーディング: グーロー シェーディング: コンピューター ビジョンを照らす Rating: 0 out of 5 stars0 ratings内側軸: コンピューター ビジョンの核心を探る: 内側軸を明らかにする Rating: 0 out of 5 stars0 ratings異方性フィルタリング: コンピューター ビジョンにおける視覚的な複雑性を解明する Rating: 0 out of 5 stars0 ratings不等角投影法: コンピュータービジョンにおける奥行き知覚の探求 Rating: 0 out of 5 stars0 ratings二次元コンピュータグラフィックス: 視覚領域の探索: コンピューター ビジョンにおける 2 次元コンピューター グラフィックス Rating: 0 out of 5 stars0 ratings三次元投影: コンピュータービジョンの奥深さを解き放つ Rating: 0 out of 5 stars0 ratingsコンピュータビジョンの基本マトリックス: 「コンピュータ ビジョン」の範囲内で、「コンピュータ ビジョン 基本マトリックス」というタイトルの本のサブタイトルを提案してください。提案されたサブタイトルには「:」を含めないでください。 Rating: 0 out of 5 stars0 ratingsマルチビュー三次元再構成: コンピュータビジョンにおける空間認識のための高度な技術 Rating: 0 out of 5 stars0 ratings
Reviews for アルファ合成
0 ratings0 reviews
Book preview
アルファ合成 - Fouad Sabry
第 1 章: アルファ合成
アルファ合成またはアルファブレンディングは、画像と背景を混合して、コンピューターグラフィックスの部分的または完全な透明度をシミュレートするプロセスです。多くの場合、イメージ コンポーネント(ピクセル)をさまざまなパスまたはレイヤーでレンダリングし、結果の 2D ピクチャをコンポジットと呼ばれる 1 つの最終イメージにマージすると便利です。フィルムは、コンピュータレンダリングされたグラフィック要素とライブ映像をマージするときに、合成を多用します。アルファ ブレンディングは、ラスタライズされた前景アイテムを 2D コンピューター グラフィックスの背景の上に配置するためにも使用されます。
要素の色に加えて、各画像要素を効果的に統合するには、関連するマットを維持することが重要です。このマットレイヤーは、カバレッジ情報(描画されるジオメトリの形状)を提供し、画像内で何かが描画された領域と何も描画されなかった領域を簡単に区別できるようにします。
2 つの画像を結合するための最も基本的な操作は、一方を他方の上に配置することですが、いくつかの異なるプロセスまたはブレンド モードが使用されます。
1970年代後半、Alvy Ray SmithとEd Catmulは、ニューヨーク工科大学のコンピュータグラフィックス研究所でアルファチャネルの概念を導入しました。1981年、Bruce A. Wallaceは、物理的な反射率/透過率のモデルを使用して、同一の直進演算子を導き出しました。
アルファという用語の使用は、スミスによって次のように説明されています:「ギリシャ文字 {\displaystyle \alpha A+(1-\alpha )B} (アルファ)を使用して、この場合、2つの描写AとBの間の補間量を制御する \alpha 古典的な線形補間式のために、それをそう呼びました」。
つまり、画像 A を画像 B に重ね合わせる場合、 \alpha 数式の の値は A のアルファ チャネルから直接取得されます。
2D 画像では、各ピクセルの色の組み合わせが保持され、多くの場合、赤、緑、青 (RGB) が混在します。アルファ合成が採用されている場合、各ピクセルのアルファ チャネルには 0 から 1 の範囲の追加の数値が含まれます。値 0 は、ピクセルが完全に透明であることを示し、下のピクセルの色を見ることができます。1 つは、ピクセルが完全に不透明であることを示します。
アルファ チャネルが存在すると、画像合成プロセスは合成代数を使用して表現できます。たとえば、写真 A と B の 2 つの写真がある場合、最も頻繁な合成プロセスは、A が前面に、B が背景に表示されるように画像を組み合わせることです。これは、A 対 B として記述できます。over に加えて、Porter と Duff は、2 つのピクセルのカバレッジが概念的に直交してオーバーレイされている場合に 2 つのピクセルの色をブレンドするためのオプションを考慮して、合成演算子 in、hold out by (しばしば省略される)、atop、および xor (および逆演算子 rover、rin、rout、ratop) を定義しました。
たとえば、over 演算子は、次の式を各ピクセルに適用することで実装できます。
{\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}{\displaystyle C_{o}={\frac {C_{a}\alpha _{a}+C_{b}\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}}ここで C_{o} 、 C_{a} は C_{b} 、結果における画素の色成分を表し、画像A及び画像Bを個々に、各カラーチャンネル(赤、緑、青)に個別に適用し、一方 {\displaystyle \alpha _{o}} 、 \alpha _{a} は \alpha _{b} 、各画素のアルファ値である。
要するに、over 演算子は標準的なペイント操作です (Painter のアルゴリズムを参照)。イン演算子とアウト演算子は、アルファ合成のクリッピングに相当します。この 2 つはアルファ チャネルのみを使用し、2 番目のイメージの色成分を無視します。さらに、プラスは添加剤混合を定義します。
イメージにアルファ チャネルが含まれている場合は、アルファが直線(関連付けられていない)または乗算済み(関連付けられている)の 2 つの一般的な表現を使用できます。
RGB コンポーネントは、ストレート アルファを使用する場合の不透明度に関係なく、オブジェクトまたはピクセルの色を表します。これは、前のセクションの over 演算子によって暗黙的に示される手順です。
乗算済みアルファでは、RGB 成分はオブジェクトまたはピクセルの放出を示し、アルファ成分はオクルージョンを示します。次に、over演算子は次のようになります。
{\displaystyle C_{o}=C_{a}+C_{b}(1-\alpha _{a})}{\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}プリマルチプライアルファの最大の利点は、正確なブレンディング、補間、フィルタリングが可能であることです。
ピクセルの色がストレート (乗算されていない) RGBA タプルを使用して指定されていると仮定すると、値が (0, 0.7, 0, 0.5) のピクセルは、最大緑強度の 70% と 50% の不透明度を持ちます。色相が完全に緑の場合、そのRGBAは(0, 1, 0, 0.5)になります。
PNG と TIFF は、アルファ チャネルをサポートする最も一般的な画像形式です。GIF はアルファチャンネルをサポートしていますが、ファイルスペースの点では非効率的です。QuickTime フォーマットのアニメーションや Apple ProRes 4444、Techsmith マルチフォーマットコーデックなど、一部のビデオコーデックにはアルファチャンネルが含まれています。
一般に、BMP ファイル形式はこのチャネルをサポートしていません。それにもかかわらず、アルファチャネルを32ビット(888-8)または16ビット(444-4)などの他の形式で保存することは可能ですが、すべてのコンピューターまたはプログラムがそれを読み取ることができるわけではありません。 これらのBMPを生成するために、特定のプログラムも開発されており、これは主にビデオゲームで使用される。
一般的なデジタル写真のRGB値は、物理的な光の強度を直接反映するのではなく、ガンマ補正メカニズムによって圧縮されます。
{\displaystyle C_{\text{encoded}}=C_{\text{linear}}^{1/\gamma }}この変換は、人間の非線形の輝度の知覚によりよく一致するもの \gamma を選択することで、エンコードされた画像の限られたビット数をより有効に活用します。
したがって、このような画像を操作するコンピューター プログラムは、RGB 値を線形空間にデコードし (ガンマ圧縮を削除して)、線形光強度を混合してから、結果の画像にガンマ圧縮を再適用する必要があります。
{\displaystyle C_{o}=\left({\frac {C_{a}^{\gamma }\alpha _{a}+C_{b}^{\gamma }\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}\right)^{1/\gamma }}ガンマ圧縮の前に、プリマルチプライは、プリマルチプライされたアルファとペアになったときに線形空間で実行されます。この結果、以下の式が得られます。
{\displaystyle C_{o}=\left(C_{a}^{\gamma }+C_{b}^{\gamma }(1-\alpha _{a})\right)^{1/\gamma }}ガンマ補正はカラーチャンネルにのみ適用されることに注意してください。アルファチャンネルは常にリニアです。
同様の理由で採用されていますが、透明色と画像マスクは、重ね合わせた画像ピクセルと背景ピクセルのシームレスな混合を妨げます(画像全体のピクセルまたは背景ピクセル全体のみが許可されます)。
同様の効果は、Truevision TGA 画像ファイル形式の 16 ビット RGBA ハイ カラー モードや、対応する TARGA および