Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

アルファ合成: コンピュータビジョンにおける画像合成の技術を習得する
アルファ合成: コンピュータビジョンにおける画像合成の技術を習得する
アルファ合成: コンピュータビジョンにおける画像合成の技術を習得する
Ebook96 pages13 minutes

アルファ合成: コンピュータビジョンにおける画像合成の技術を習得する

Rating: 0 out of 5 stars

()

Read preview

About this ebook

アルファ合成とは


コンピューター グラフィックスにおけるアルファ合成またはアルファ ブレンディングは、1 つの画像を背景と組み合わせて、部分的または完全な透明の外観を作成するプロセスです。多くの場合、画像要素 (ピクセル) を個別のパスまたはレイヤーでレンダリングし、結果として得られる 2D 画像を合成と呼ばれる単一の最終画像に結合すると便利です。合成は、コンピューターでレンダリングされた画像要素とライブ映像を組み合わせるときに映画で広く使用されています。アルファ ブレンディングは、2D コンピュータ グラフィックスでも、ラスタライズされた前景要素を背景の上に配置するために使用されます。


どのようなメリットがあるのか


(I) 以下のトピックに関する洞察と検証:


第 1 章: アルファ合成


第 2 章: デジタル合成


第 3 章: PNG


第 4 章: RGB カラーモデル


第 5 章: ガンマ補正


第 6 章: クロマサブサンプリング


第 7 章: BMP ファイル形式


第 8 章: RGBA カラーモデル


第 9 章: グレースケール


第 10 章: 透明性 (グラフィック)


(II) アルファ合成に関する一般のよくある質問に答える。


(III) 多くの分野でアルファ合成を使用する実際の例。


この本は誰に向けたものなのか


専門家、大学生、大学院生、愛好家、趣味人、そしてあらゆる種類のアルファ コンポジットに関する基本的な知識や情報を超えたい人。

Language日本語
Release dateMay 5, 2024
アルファ合成: コンピュータビジョンにおける画像合成の技術を習得する

Read more from Fouad Sabry

Related to アルファ合成

Titles in the series (100)

View More

Related ebooks

Reviews for アルファ合成

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    アルファ合成 - Fouad Sabry

    第 1 章: アルファ合成

    アルファ合成またはアルファブレンディングは、画像と背景を混合して、コンピューターグラフィックスの部分的または完全な透明度をシミュレートするプロセスです。多くの場合、イメージ コンポーネント(ピクセル)をさまざまなパスまたはレイヤーでレンダリングし、結果の 2D ピクチャをコンポジットと呼ばれる 1 つの最終イメージにマージすると便利です。フィルムは、コンピュータレンダリングされたグラフィック要素とライブ映像をマージするときに、合成を多用します。アルファ ブレンディングは、ラスタライズされた前景アイテムを 2D コンピューター グラフィックスの背景の上に配置するためにも使用されます。

    要素の色に加えて、各画像要素を効果的に統合するには、関連するマットを維持することが重要です。このマットレイヤーは、カバレッジ情報(描画されるジオメトリの形状)を提供し、画像内で何かが描画された領域と何も描画されなかった領域を簡単に区別できるようにします。

    2 つの画像を結合するための最も基本的な操作は、一方を他方の上に配置することですが、いくつかの異なるプロセスまたはブレンド モードが使用されます。

    1970年代後半、Alvy Ray SmithとEd Catmulは、ニューヨーク工科大学のコンピュータグラフィックス研究所でアルファチャネルの概念を導入しました。1981年、Bruce A. Wallaceは、物理的な反射率/透過率のモデルを使用して、同一の直進演算子を導き出しました。

    アルファという用語の使用は、スミスによって次のように説明されています:「ギリシャ文字 {\displaystyle \alpha A+(1-\alpha )B} (アルファ)を使用して、この場合、2つの描写AとBの間の補間量を制御する \alpha 古典的な線形補間式のために、それをそう呼びました」。

    つまり、画像 A を画像 B に重ね合わせる場合、 \alpha 数式の の値は A のアルファ チャネルから直接取得されます。

    2D 画像では、各ピクセルの色の組み合わせが保持され、多くの場合、赤、緑、青 (RGB) が混在します。アルファ合成が採用されている場合、各ピクセルのアルファ チャネルには 0 から 1 の範囲の追加の数値が含まれます。値 0 は、ピクセルが完全に透明であることを示し、下のピクセルの色を見ることができます。1 つは、ピクセルが完全に不透明であることを示します。

    アルファ チャネルが存在すると、画像合成プロセスは合成代数を使用して表現できます。たとえば、写真 A と B の 2 つの写真がある場合、最も頻繁な合成プロセスは、A が前面に、B が背景に表示されるように画像を組み合わせることです。これは、A 対 B として記述できます。over に加えて、Porter と Duff は、2 つのピクセルのカバレッジが概念的に直交してオーバーレイされている場合に 2 つのピクセルの色をブレンドするためのオプションを考慮して、合成演算子 in、hold out by (しばしば省略される)、atop、および xor (および逆演算子 rover、rin、rout、ratop) を定義しました。

    たとえば、over 演算子は、次の式を各ピクセルに適用することで実装できます。

    {\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}{\displaystyle C_{o}={\frac {C_{a}\alpha _{a}+C_{b}\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}}

    ここで C_{o} 、 C_{a} は C_{b} 、結果における画素の色成分を表し、画像A及び画像Bを個々に、各カラーチャンネル(赤、緑、青)に個別に適用し、一方 {\displaystyle \alpha _{o}} 、 \alpha _{a} は \alpha _{b} 、各画素のアルファ値である。

    要するに、over 演算子は標準的なペイント操作です (Painter のアルゴリズムを参照)。イン演算子とアウト演算子は、アルファ合成のクリッピングに相当します。この 2 つはアルファ チャネルのみを使用し、2 番目のイメージの色成分を無視します。さらに、プラスは添加剤混合を定義します。

    イメージにアルファ チャネルが含まれている場合は、アルファが直線(関連付けられていない)または乗算済み(関連付けられている)の 2 つの一般的な表現を使用できます。

    RGB コンポーネントは、ストレート アルファを使用する場合の不透明度に関係なく、オブジェクトまたはピクセルの色を表します。これは、前のセクションの over 演算子によって暗黙的に示される手順です。

    乗算済みアルファでは、RGB 成分はオブジェクトまたはピクセルの放出を示し、アルファ成分はオクルージョンを示します。次に、over演算子は次のようになります。

    {\displaystyle C_{o}=C_{a}+C_{b}(1-\alpha _{a})}{\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}

    プリマルチプライアルファの最大の利点は、正確なブレンディング、補間、フィルタリングが可能であることです。

    ピクセルの色がストレート (乗算されていない) RGBA タプルを使用して指定されていると仮定すると、値が (0, 0.7, 0, 0.5) のピクセルは、最大緑強度の 70% と 50% の不透明度を持ちます。色相が完全に緑の場合、そのRGBAは(0, 1, 0, 0.5)になります。

    PNG と TIFF は、アルファ チャネルをサポートする最も一般的な画像形式です。GIF はアルファチャンネルをサポートしていますが、ファイルスペースの点では非効率的です。QuickTime フォーマットのアニメーションや Apple ProRes 4444、Techsmith マルチフォーマットコーデックなど、一部のビデオコーデックにはアルファチャンネルが含まれています。

    一般に、BMP ファイル形式はこのチャネルをサポートしていません。それにもかかわらず、アルファチャネルを32ビット(888-8)または16ビット(444-4)などの他の形式で保存することは可能ですが、すべてのコンピューターまたはプログラムがそれを読み取ることができるわけではありません。 これらのBMPを生成するために、特定のプログラムも開発されており、これは主にビデオゲームで使用される。

    一般的なデジタル写真のRGB値は、物理的な光の強度を直接反映するのではなく、ガンマ補正メカニズムによって圧縮されます。

    {\displaystyle C_{\text{encoded}}=C_{\text{linear}}^{1/\gamma }}

    この変換は、人間の非線形の輝度の知覚によりよく一致するもの \gamma を選択することで、エンコードされた画像の限られたビット数をより有効に活用します。

    したがって、このような画像を操作するコンピューター プログラムは、RGB 値を線形空間にデコードし (ガンマ圧縮を削除して)、線形光強度を混合してから、結果の画像にガンマ圧縮を再適用する必要があります。

    {\displaystyle C_{o}=\left({\frac {C_{a}^{\gamma }\alpha _{a}+C_{b}^{\gamma }\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}\right)^{1/\gamma }}

    ガンマ圧縮の前に、プリマルチプライは、プリマルチプライされたアルファとペアになったときに線形空間で実行されます。この結果、以下の式が得られます。

    {\displaystyle C_{o}=\left(C_{a}^{\gamma }+C_{b}^{\gamma }(1-\alpha _{a})\right)^{1/\gamma }}

    ガンマ補正はカラーチャンネルにのみ適用されることに注意してください。アルファチャンネルは常にリニアです。

    同様の理由で採用されていますが、透明色と画像マスクは、重ね合わせた画像ピクセルと背景ピクセルのシームレスな混合を妨げます(画像全体のピクセルまたは背景ピクセル全体のみが許可されます)。

    同様の効果は、Truevision TGA 画像ファイル形式の 16 ビット RGBA ハイ カラー モードや、対応する TARGA および

    Enjoying the preview?
    Page 1 of 1