Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

피라미드 이미지 처리: 시각적 분석의 깊이 탐구
피라미드 이미지 처리: 시각적 분석의 깊이 탐구
피라미드 이미지 처리: 시각적 분석의 깊이 탐구
Ebook116 pages57 minutes

피라미드 이미지 처리: 시각적 분석의 깊이 탐구

Rating: 0 out of 5 stars

()

Read preview

About this ebook

피라미드 이미지 처리란 무엇입니까?


피라미드 또는 피라미드 표현은 컴퓨터 비전, 이미지 처리 및 신호 처리 커뮤니티에서 개발한 다중 스케일 신호 표현의 한 유형으로, 신호 또는 이미지가 반복적으로 평활화 및 서브샘플링을 거치게 됩니다. 피라미드 표현은 척도 공간 표현과 다중 해상도 분석의 전신입니다.


당신이 얻을 수 있는 혜택


(I) 다음 주제에 대한 통찰력 및 검증:


1장: 피라미드(이미지 처리)


2장: 척도 불변 특성 변환


3장: 가보르 필터


4장: 척도 공간


5장: 가우시안 블러


6장: 기능(컴퓨터 비전)


7장: 가우스의 차이


8장: 코너 감지


9장: 구조 텐서


10장: 평균 이동


(II) 피라미드 이미지 처리에 관한 대중의 주요 질문에 답변합니다.


(III) 다양한 분야에서 피라미드 이미지 처리를 사용하는 실제 사례.


이 책은 누구를 위한 책인가


전문가, 학부 및 대학원생, 매니아, 취미생활자 및 모든 종류의 피라미드 이미지 처리에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들.

Language한국어
Release dateMay 11, 2024
피라미드 이미지 처리: 시각적 분석의 깊이 탐구

Read more from Fouad Sabry

Related to 피라미드 이미지 처리

Titles in the series (100)

View More

Related ebooks

Reviews for 피라미드 이미지 처리

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    피라미드 이미지 처리 - Fouad Sabry

    1장: 피라미드(이미지 처리)

    피라미드 표현 또는 줄여서 피라미드는 컴퓨터 비전, 이미지 처리 및 신호 처리 분야의 연구원들이 개척한 일종의 다중 스케일 신호 표현입니다. 스케일 공간 표현과 다중 해상도 분석 이전에는 피라미드 표현이 있었습니다.

    피라미드는 크게 저역통과와 대역통과의 두 가지 범주로 나눌 수 있습니다.

    이미지에 필요한 스무딩 필터를 적용한 후 결과를 가로 방향과 세로 방향 모두에서 2배로 서브샘플링하여 저역통과 피라미드를 만듭니다. 결과 사진은 다시 한 번 같은 방식으로 처리되고 이 주기가 여러 번 반복됩니다. 여러 번 반복하면 이미지 크기가 줄어들고 부드러움은 향상되지만 공간 샘플링 밀도는 감소합니다(즉, 이미지 해상도 감소). 시각적으로 전체적인 멀티 스케일 표현은 피라미드와 유사하며, 원본 이미지가 맨 아래에 있고 그 위에 연속적인 주기에 의해 생성된 더 작은 이미지가 겹쳐져 있습니다.

    픽셀별 차이를 계산할 수 있도록 피라미드의 연속된 수준에서 이미지 간의 차이를 만들고 인접한 해상도 수준 간에 이미지 보간을 수행하여 대역통과 피라미드를 구성합니다.

    피라미드 생성을 위해 많은 평활화 커널이 제안되었습니다. 오늘날의 더 강력한 프로세서는 피라미드 생성 프로세스에서 더 큰 지원 가우스 필터를 평활화 커널로 사용할 수 있도록 합니다.

    가우스 피라미드의 후속 사진은 가우스 평균(가우시안 흐림)을 사용하여 축소되고 가중치가 부여됩니다. 피라미드의 하위 수준에 있는 각 이웃 픽셀은 국소 평균을 갖는 픽셀로 표현됩니다. 이 방법은 텍스처 합성 분야에서 널리 사용됩니다.

    가우스 피라미드와 마찬가지로 라플라시안 피라미드도 각 흐림 각도 간의 차이 이미지를 저장합니다. 더 높은 레벨의 다른 사진에서 고해상도 이미지를 재구성하기 위해 가장 낮은 레벨만 차이 이미지가 아닙니다. 이 방법을 사용하여 이미지를 압축할 수 있습니다.

    Simoncelli와 다른 사람들은 이미지 압축, 텍스처 생성 및 물체 감지에 사용되는 다중 스케일, 다중 방향 대역 통과 필터 뱅크인 조종 가능한 피라미드를 발명했습니다. 라플라시안 피라미드와 유사하지만 각 레벨에서 단일 라플라시안 또는 가우스 필터를 사용하는 대신 조정 가능한 필터 뱅크가 사용됩니다.

    피라미드는 초기 컴퓨터 비전에서 원시 이미지 데이터에서 다중 스케일 이미지 속성을 생성하는 데 사용된 주요 멀티 스케일 표현이었습니다. 일부 연구자들은 이론적 근거, 다중 스케일 표현에서 하위 샘플링 단계를 분리하는 기능, 이론적 분석을 위한 보다 강력한 도구, 원하는 규모로 표현을 계산할 수 있는 기능 때문에 스케일 공간 표현을 선호하여 서로 다른 해상도에서 이미지 표현을 연관시키는 알고리즘 문제를 피할 수 있습니다. 피라미드는 예전만큼 인기가 없지만 그럼에도 불구하고 스케일 공간 표현에 대한 계산 효율적인 근사치를 전달하는 데 널리 사용됩니다.

    라플라시안 피라미드는 소스 이미지에서 레벨을 추가하거나 제거하여 다양한 스케일에서 디테일을 확대하거나 줄일 수 있습니다. 그러나 이러한 유형의 세부 조작으로 인해 종종 후광 오류가 발생하여 양측 필터와 같은 대안을 만들게 된다는 것은 잘 알려져 있습니다.

    Adam7 알고리즘은 다른 인터레이스 기술과 함께 특정 그림 압축 파일 형식에서 사용됩니다. 이들은 시각 자료를 위한 피라미드 모양으로 볼 수 있습니다. 각 해상도에 대해 다른 파일을 저장하거나 생성할 필요 없이 하나의 파일이 많은 뷰어 해상도를 지원할 수 있는데, 이는 해당 파일 형식이 대규모 기능을 먼저 저장하고 나중에 파일에 세분화된 세부 정보를 저장하는 방식 덕분입니다. 이렇게 하면 작은 썸네일을 표시하거나 작은 화면에 표시되는 특정 뷰어가 사용 가능한 픽셀로 표시할 수 있을 만큼만 이미지를 빠르게 다운로드할 수 있습니다.

    {챕터 1 종료}

    2장: 배율 불변 특성 변환

    David Lowe는 1999년에 이미지에서 로컬 특징을 찾고, 특성화하고, 일치시키기 위한 컴퓨터 비전 알고리즘으로 SIFT(Scale-Invariant Feature Transform)를 개발했습니다. 물체 인식, 로봇 매핑 및 내비게이션, 이미지 스티칭, 3차원 모델링, 제스처 인식, 비디오 추적, 개별 야생 동물 식별 및 매치메이킹은 이 기술의 가능한 많은 용도 중 일부에 불과합니다.

    Object SIFT 키포인트는 먼저 훈련 이미지 세트에서 추출됩니다.

    이미지의 모든 개체에 대한 기능 설명은 해당 개체에 대한 키 포인트를 분리하여 만들 수 있습니다. 다른 많은 객체가 있는 테스트 이미지에서 객체를 찾으려고 할 때 훈련 이미지에서 추출되었기 때문에 이 설명을 사용할 수 있습니다. 학습 영상에서 추출된 특징은 이미지 스케일, 노이즈 및 조명의 변화에도 불구하고 신뢰할 수 있는 인식을 달성할 수 있어야 합니다. 이러한 반점은 일반적으로 이미지 가장자리 또는 대비가 높은 다른 영역에 있습니다.

    또한 이러한 기능은 원본 장면에서와 같이 한 이미지에서 다음 이미지까지 동일한 상대적 위치를 유지해야 합니다. 문의 네 모서리만 기능으로 사용되면 문이 열려 있는지 닫혀 있는지 인식이 성공합니다. 그러나 프레임의 점도 사용되는 경우 두 경우 모두 인식에 실패합니다. 마찬가지로, 처리 중인 세트의 두 이미지 사이에 관절 또는 유연한 물체의 내부 형상에 변화가 있는 경우 해당 물체에 있는 특징이 더 이상 작동하지 않을 수 있습니다. 이러한 국부적 변동은 모든 특징 일치 오류의 평균 오차에 상당한 영향을 미칠 수 있지만, 실제로 SIFT는 이미지에서 훨씬 더 많은 수의 특징을 감지하고 사용하여 영향을 완화합니다.

    이 섹션에서는 원래 SIFT 알고리즘에 대한 간략한 개요를 제공하고 배경 소음이 많거나 시야가 가려진 환경에서 객체 인식을 위한 몇 가지 대체 방법에 대해 간략하게 설명합니다.

    SIFT 디스크립터는 수용장 측정을 사용하여 이미지를 분석합니다.

    로컬 이미지 기능은 감지하고 설명할 수 있는 경우 개체 인식에 도움이 될 수 있습니다. SIFT 기능은 불연속적인 관심 지점에서 객체의 모양을 기반으로 하기 때문에 이미지 크기 조정 또는 회전의 영향을 받지 않습니다. 관점의 사소한 변화와 조명 및 소음의 변화를 견딜 수 있습니다. 또한 불일치 가능성이 적고 정확한 물체 식별이 가능하며 매우 독특하고 추출하기 쉽습니다. 그러나 높은 차원이 문제가 될 수 있으므로 최상의 빈 우선 검색이 있는 k-d 트리와 같은 확률적 알고리즘이 일반적으로 사용됩니다. 로컬 기능의 (대규모) 데이터베이스와 간단하게 일치시킬 수 있습니다. 물체의 위치와 포즈를 계산하는 데 물체에서 3개의 SIFT 특징만 있으면 되므로 부분 폐색에 강력한 SIFT 특징 세트를 기반으로 하는 물체 설명이 가능합니다. 상대적으로 작은 데이터베이스와 오늘날의 컴퓨팅 성능으로 거의 즉시 인식이 가능합니다.

    Lowe의 접근 방식을 사용하면 이미지가 로컬 기하학적 왜곡에 강하면서도 이미지 변환, 크기 조정 및 회전에 영향을 받지 않는 대규모 기능 벡터 세트로 변환되며, 조명의 변화는 더 적습니다. 영장류의 시각에서

    Enjoying the preview?
    Page 1 of 1