Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

떨림: 디더: 컴퓨터 비전의 시각적 노이즈
떨림: 디더: 컴퓨터 비전의 시각적 노이즈
떨림: 디더: 컴퓨터 비전의 시각적 노이즈
Ebook125 pages1 hour

떨림: 디더: 컴퓨터 비전의 시각적 노이즈

Rating: 0 out of 5 stars

()

Read preview

About this ebook

디더란 무엇인가


디더링은 양자화 오류를 무작위화하는 데 사용되는 의도적으로 적용된 노이즈 형태로, 이미지의 색상 밴딩과 같은 대규모 패턴을 방지합니다. 디더링은 디지털 오디오와 비디오 데이터 모두를 처리하는 데 일상적으로 사용되며 오디오를 CD로 마스터링하는 마지막 단계 중 하나인 경우가 많습니다.


당신이 얻을 수 있는 혜택


(I) 다음 주제에 대한 통찰력 및 검증:


1장: 디더링


2장: 아날로그-디지털 변환기


3장: 동적 범위


4장: 신호 대 잡음비


5장: 하프톤


6장: 아날로그 녹음과 디지털 녹음 비교


7장: 압축 아티팩트


8장: 샘플링(신호 처리)


9장: 양자화(신호 처리)


10장: 그레이스케일


(II) 디더링에 관한 대중의 주요 질문에 답변합니다.


(III) 다양한 분야에서 디더링을 사용하는 실제 사례.


이 책은 누구를 위한 책인가


전문가, 학부생, 대학원생, 매니아, 취미생활자, 그리고 모든 종류의 떨림 에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들.

Language한국어
Release dateMay 5, 2024
떨림: 디더: 컴퓨터 비전의 시각적 노이즈

Read more from Fouad Sabry

Related to 떨림

Titles in the series (100)

View More

Related ebooks

Reviews for 떨림

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    떨림 - Fouad Sabry

    챕터 1: 디더

    디더링은 양자화 실수를 무작위화하는 데 사용되는 의도적인 노이즈의 일종으로, 사진의 컬러 밴딩과 같은 대규모 패턴을 방지합니다. 디더링은 일반적으로 디지털 오디오 및 비디오 데이터 처리에 사용되며 CD용 오디오 마스터링의 마지막 단계 중 하나인 경우가 많습니다.

    일반적으로 디더링은 회색 음영 이미지를 흑백으로 변환하여 결과 이미지의 검은색 점 밀도가 원본 이미지의 평균 회색 수준에 근접하도록 하는 데 사용됩니다.

    … 디더의 가장 초기의 [응용]은 제2차 세계 대전에서 나왔습니다.

    폭격기는 항법과 폭탄 궤적 계산을 위해 기계식 컴퓨터를 활용했습니다.

    흥미롭게도, 이 컴퓨터들(수백 개의 톱니바퀴와 톱니바퀴가 들어 있는 상자들)은 비행기 기내에서 더 정확하게 작동했고, 덜 견고하게 작동했다.

    엔지니어들은 항공기의 진동이 끈적끈적한 움직이는 부품으로 인한 실수를 최소화한다는 점에 주목했습니다.

    퀵 홱 움직이는 대신 부드럽게 움직여야 한다더 일관성 있게 움직였다.

    소형 진동 모터가 컴퓨터에 포함되었으며, 디더라는 용어는 흔들다를 의미하는 중세 영어 동사 didderen에서 파생되었습니다. 오늘날 기계식 계량기를 두드려 정확도를 높일 때 디더링을 사용하고 있습니다. 현대 사전은 디더를 매우 불안한 마음 상태, 혼란 또는 동요 상태로 정의합니다.

    아주 적은 양으로, Dither는 단어의 긍정적인 의미에서 디지털 시스템을 보다 아날로그적으로 효과적으로 만듭니다.

    Ken Pohlmann, 디지털 오디오의 원리

    제 2 차 세계 대전 직후, 디더라는 용어는 아날로그 계산 및 유압 구동 무기에 관한 문헌에 발표되었습니다.

    Dither는 디지털 처리 및 분석을 포함한 다양한 분야에 적용됩니다. 이러한 응용 분야에는 디지털 신호 처리가 필요한 디지털 오디오, 디지털 비디오, 디지털 사진, 지진학, 레이더 및 일기 예보 시스템이 포함됩니다.

    정량화는 실수를 낳습니다. 이러한 부정확성이 신호와 관련된 경우 결과는 주기적이거나 예측 가능할 수 있습니다. 일부 영역, 특히 수용체가 이러한 왜곡에 민감한 영역에서는 주기적 실수로 인해 원치 않는 인공물이 발생합니다. 이러한 영역에 디더를 도입하면 오류가 무작위 노이즈로 변환됩니다. 오디오 산업이 그 대표적인 예입니다. 인간의 귀는 뚜렷한 주파수를 감지한다는 점에서 푸리에 변환과 유사하게 작동합니다.

    아날로그 시스템에서는 신호가 연속적인 반면 PCM 디지털 시스템에서는 신호의 진폭이 고정된 값 또는 숫자 집합 중 하나로 제한됩니다. 이 방법을 양자화라고 합니다. 각 코딩된 값은 개별 단계입니다. 신호가 디더링 없이 양자화되면 원래 입력 신호와 관련된 양자화 왜곡이 발생합니다. 이를 방지하기 위해 신호는 디더링되는데, 이는 고조파 및 기타 매우 바람직하지 않은 왜곡을 수학적으로 제거하고 일정하고 고정된 수준의 노이즈로 대체하는 절차입니다.

    생산 과정에서 각 샘플을 나타내는 데 더 많은 수의 비트가 자주 사용됩니다. 컴팩트 디스크를 만들려면 16비트로 줄여야 합니다.

    이를 수행하는 방법에는 여러 가지가 있습니다. 예를 들어 추가 비트를 버릴 수 있습니다. 이를 잘림이라고 합니다. 또한 잉여 비트를 가장 가까운 값으로 반올림할 수 있습니다. 그러나 이러한 각 전략은 예측 가능하고 계산 가능한 결함을 생성합니다. 디더링은 이러한 부정확성을 지속적이고 고정된 수준의 노이즈로 대체합니다.

    6비트 잘림 오디오 샘플 예제

    16비트 정현파


    6비트로 축소


    6비트로 감소


    이 파일을 재생하는 데 문제가 있습니까? 미디어 지원을 참조하십시오.

    예를 들어 다음 값을 가진 파형을 생각해 보십시오.

    1 2 3 4 5 6 7 8

    파형이 20% 감소하면 다음과 같은 값이 생성됩니다.

    0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4

    이러한 값을 줄이면 결과 데이터는 다음과 같습니다.

    0 1 2 3 4 4 5 6

    대신 이러한 값을 반올림하면 다음과 같은 데이터 결과가 나타납니다.

    1 2 2 3 4 5 6 6

    원래 파형의 진폭을 20% 줄이는 기술은 일관된 실수를 초래합니다. 일부에 대해 앞서 언급 한 매개 변수를 충족하는 사인파를 고려하십시오. 위의 예에서 볼 수 있듯이 사인파의 값이 3.2에 도달할 때마다 단축된 결과는 0.2씩 잘못됩니다. 사인파의 값이 4.0에 도달할 때마다 앞에서 설명한 것처럼 단축된 결과가 0.0 줄어들기 때문에 오류가 발생하지 않습니다. 사인파의 주기 전반에 걸쳐 오류의 크기는 규칙적이고 반복적으로 변합니다. 이 실수는 특히 왜곡으로 드러납니다. 귀가 왜곡으로 인식하는 것은 반복되는 양자화 오류로 인한 불연속 주파수의 추가 정보입니다.

    두 자리 숫자(예: 4.8)를 어느 방향으로든 반올림할 수 있습니다. 한 번은 5로 반올림한 다음 다음에는 4로 반올림할 수 있습니다. 이렇게 하면 장기 평균이 4가 아닌 4.5가 되어 시간이 지남에 따라 값이 실제 값에 더 가까워집니다. 그러나 이로 인해 여전히 결정 가능한(더 복잡하지만) 오류가 발생합니다. 값 4.8이 발생할 때마다 결과는 0.2% 오류이고 다른 경우에는 0.8입니다. 이로 인해 여전히 정량화되고 반복되는 오류가 발생합니다.

    다른 옵션은 4.8을 반올림하여 5번 중 4번을 5로 반올림하고 5번은 4로 반올림하는 것입니다. 장기적으로 이 수치는 정확히 4.8이 될 것입니다. 불행히도 여전히 반복적이고 예측 가능한 결함이 발생하며 이러한 결함은 계속해서 가청 왜곡으로 나타납니다.

    그 결과 디더링이 발생합니다. 예측 가능하고 반복적인 방식으로 반올림 또는 반올림하는 대신 임의로 반올림 또는 반올림할 수 있습니다. 0.0과 0.9 사이의 일련의 난수(예: 0.6, 0.1, 0.3, 0.6, 0.9 등)를 만들어 4.8에 더하면 결과가 10번 중 2번은 다시 4로 잘리고(0.0 또는 0.1이 4.8에 더해지면) 10번 중 8번은 결과가 5로 잘립니다. 각 조건은 4로 반올림될 확률이 20%이고 5로 반올림될 확률이 80%입니다. 이러한 결과의 장기 평균은 4.8이며 양자화 오류는 랜덤 노이즈입니다. 이 소음은 다른 솔루션에서 생성되는 측정 가능한 왜곡보다 귀에 덜 불쾌합니다.

    양자화 또는 재양자화 전에 디더링이 도입되어 입력 신호에서 양자화 노이즈를 분리하고 비선형 동작(왜곡)을 방지합니다. 비트 심도가 낮은 양자화에는 더 많은 디더링이 필요합니다. 이 기술은 여전히 왜곡을 발생시키지만 왜곡은 무작위이므로 결과 노이즈는 기본적으로 원하는 신호와 상관 관계가 없습니다.

    Lipshitz와 Vanderkooi는 AES 저널에 발표된 중요한 연구에서 뚜렷한 확률 밀도 함수(PDF)를 가진 다양한 노이즈 유형이 디더 신호로 사용될 때 다르게 반응한다는 것을 입증했으며, 디더는 디지털 필터의 일반적인 문제인 주기적 한계 주기를 깨는 데 활용될 수 있습니다. 일반적으로 랜덤 노이즈는 한계 사이클에 의해 생성되는 고조파 톤보다 덜 성가시다.

    직사각형 확률 밀도 함수(RPDF) 정의된 범위 내의 모든 값은 디더 노이즈 내에서 발생할 확률이 동일합니다.

    삼각 확률 밀도 함수(TPDF) 디더 노이즈는 삼각형 분포를 갖습니다. 발생 확률은 범위의 중간에 있는 값에 대해 가장 큽니다. 두 개의 개별 RPDF 소스를 결합하여 삼각형 분포를 얻을 수 있습니다.

    가우스 PDF 분포는 정규 분포를 따릅니다. 이 종 모양 또는 가우스 곡선은 마이크 프리앰프와 같은 아날로그 소스에 의해 생성된 디더링의 특징입니다. 녹음의 비트 심도가 충분하면 프리앰프 노이즈는 녹음을 디더링하기에 충분합니다.

    노이즈 형성은 양자화 오류의 스펙트럼 에너지를 수정하는 필터링 절차로, 종종 귀가 가장 민감한 주파수를 강조하지 않거나 신호 및 노이즈 대역을 완전히 분리합니다. 디더가 노이즈 셰이퍼의 피드백 루프 내부 또는 외부에 삽입되는지 여부는 최종 스펙트럼을 사용하는 경우 최종 스펙트럼에 영향을 미칩니다. 내에 있는 경우 디더링은 오류 신호의 일부로 간주되며 실제 양자화 오류와 함께 형성됩니다. 양자화 창 밖에 있는 경우 디더는 원래 신호의 일부로 처리되고 자체적으로 형성되지 않고 양자화를 선형화합니다. 이 경우 최종 노이즈 플로어는 플랫 디더 스펙트럼과 곡선

    Enjoying the preview?
    Page 1 of 1