Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

문서 모자이크: 문서 모자이크를 통해 시각적 통찰력 확보
문서 모자이크: 문서 모자이크를 통해 시각적 통찰력 확보
문서 모자이크: 문서 모자이크를 통해 시각적 통찰력 확보
Ebook75 pages35 minutes

문서 모자이크: 문서 모자이크를 통해 시각적 통찰력 확보

Rating: 0 out of 5 stars

()

Read preview

About this ebook

문서 모자이크란 무엇인가


문서 모자이크는 문서의 여러 개의 겹치는 스냅샷 이미지를 함께 연결하여 하나의 큰 고해상도 합성물을 만드는 프로세스입니다. 문서의 모든 부분이 카메라의 시야에 의해 스냅샷으로 촬영될 때까지 문서를 손으로 책상 위에 고정된 카메라 아래로 밀어 넣습니다. 문서가 카메라 아래로 미끄러지면서 문서의 모든 움직임이 비전 시스템에 의해 대략적으로 추적됩니다. 문서는 연속적인 스냅샷이 약 50% 정도 겹치도록 주기적으로 스냅샷을 생성합니다. 그런 다음 시스템은 겹쳐진 쌍을 찾아 모든 쌍이 하나의 문서로 연결될 때까지 반복적으로 연결합니다.


당신이 얻을 수 있는 혜택


(I) 다음 주제에 대한 통찰력 및 검증:


1장: 문서 모자이크


2장: 이미지 스티칭


3장: 디모자이크


4장: 문서 레이아웃 분석


5장: 롤링 셔터


6장: 카메라 자동 보정


7장: 컴퓨터 스테레오 비전


8장: 강체 모션 분할


9장: 이미지 텍스처


10장: 이미지 수정


(II) 문서 모자이크에 관한 대중의 주요 질문에 답변합니다.


(III) 다양한 분야에서 문서 모자이크 사용에 대한 실제 사례.


이 책은 누구를 위한 책인가


전문가, 학부 및 대학원생, 열성팬, 취미생활자, 모든 종류의 문서 모자이크에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들.

Language한국어
Release dateMay 5, 2024
문서 모자이크: 문서 모자이크를 통해 시각적 통찰력 확보

Read more from Fouad Sabry

Related to 문서 모자이크

Titles in the series (100)

View More

Related ebooks

Reviews for 문서 모자이크

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    문서 모자이크 - Fouad Sabry

    1 장 : 문서 모자이크

    문서 모자이크는 문서의 여러 겹치는 스냅사진을 하나의 거대한 고해상도 이미지로 결합하는 기술입니다. 문서의 전체 표면이 카메라의 시야 내에 캡처될 때까지 고정된 책상 위 카메라 아래로 문서를 수동으로 밀어 넣습니다. 문서가 카메라 아래로 이동하면 비전 시스템이 문서의 움직임을 거칠게 모니터링했습니다. 주기적으로 문서의 이미지가 약 50% 겹치도록 촬영됩니다. 그런 다음 이 기술은 겹치는 쌍을 식별하고 모든 쌍이 단일 문서로 결합될 때까지 계속해서 연결합니다.

    문서 모자이크는 네 가지 기본 단계로 나눌 수 있습니다.

    추적

    기능 감지

    대응 설정

    이미지 모자이크.

    시스템은 이 절차 중에 문서가 카메라 아래로 미끄러질 때 문서의 움직임을 대략적으로 추적합니다. 단순 상관 관계 절차로 알려진 방법이 추적에 사용됩니다. 그림 1에서 볼 수 있듯이 작은 패치는 스냅샷의 첫 번째 프레임에서 상관 관계 템플릿으로 이미지 중앙에서 복구됩니다. 상관 관계 절차는 다음 프레임 패치 크기의 4배 영역에서 실행됩니다. 논문의 속도는 상관 함수의 피크로 표시됩니다. 상관 함수의 피크는 용지의 속도를 나타냅니다. 이 프레임에서 템플릿이 다시 샘플링되고 템플릿이 문서의 가장자리에 닿을 때까지 추적이 계속됩니다. 템플릿이 문서의 가장자리에 도달하면 다른 이미지가 캡처되고 전체 문서가 캡처될 때까지 추적 절차가 반복됩니다. 스냅샷은 겹치는 사진을 짝짓는 나중에 작업에 도움이 되도록 정렬된 목록에 저장됩니다.

    한 이미지를 다른 이미지에 맞추는 변환을 찾는 것이 기능 감지 프로세스입니다. 기능을 감지하는 두 가지 기본 방법이 있습니다.

    모션 파라미터는 피처 기반 방법을 사용하여 포인트 대응을 기반으로 계산됩니다. 이 방법은 안정적이고 감지 가능한 기능이 풍부할 때 적용할 수 있습니다.

    두 이미지 사이의 움직임이 보통일 때 광학 흐름 방법을 사용하여 동작 매개변수를 추정합니다. 그러나 두 그림 사이의 움직임이 상당할 때 동작 매개변수는 일반화된 상호 상관을 사용하여 계산됩니다. 그러나 이 방법을 사용하려면 계산 비용이 많이 드는 리소스가 필요합니다.

    각 이미지는 열, 선, 단어의 계층적 구조로 분할되며, 이는 이미지 전반에 걸쳐 구성된 기능 그룹에 해당합니다. 기울이기 각도를 추정하고 열, 선, 단어를 찾는 것이 특징 감지 작업의 예입니다.

    첫째, 텍스트 행과 이미지 래스터 선 사이의 각도(기울기 각도)가 추정됩니다.

    ±20° 범위에 있는 것으로 추정됩니다.

    이미지에서 작은 텍스트 패치를 무작위로 선택한 다음 래스터 라인을 따라 합산된 패치의 픽셀 강도 분산이 최대화될 때까지 ±20° 범위에서 회전합니다.

    다이어그램 2를 참조하십시오.

    계산된 기울기 각도가 정확한지 확인하기 위해 문서 모자이크 시스템은 많은 이미지 패치에 대한 계산을 수행하고 각 패치에 대한 픽셀 강도의 변화에 따라 가중치가 부여된 다양한 각도의 평균을 계산하여 최종 추정치를 도출합니다.

    꼬챙이가 제거된 원고는 이 작업 중에 직관적으로 열, 선, 단어로 나뉩니다. 기울어지지 않은 이미지에 Sobel 연산자를 적용하고 출력을 이진화하여 기울어지지 않은 이진 그라데이션, 기울어지지 않은 이미지를 생성함으로써 조명 및 페이지 색상에 대한 기울어진 문서의 민감도를 제거할 수 있습니다. 다이어그램 3을 참조하십시오.

    이 절차는 크게 열 분할, 줄 분할 및 단어 분할의 세 단계로 나눌 수 있습니다.

    그림 4는 픽셀을 세로로 추가하여 이진 그라데이션, 기울어지지 않은 이미지와 열을 얼마나 쉽게 구별할 수 있는지 보여줍니다.

    각 행의 기준선은 열 기준선과 동일한 방식으로 가로로 분할됩니다.

    마지막으로, 개별 단어는 분할된 각 행에 세로 프로시저를 적용하여 분할됩니다.

    이러한 세분화는 문서 모자이크가 겹치는 이미지에서 단어의 오른쪽 아래 모서리를 일치시켜 형성되기 때문에 매우 중요합니다. 또한 세분화 절차는 행과 열의 계층 구조 내에서 사진 목록을 안정적으로 구성할 수 있습니다.

    분할 프로세스에는 이진 기울기, 기울어지지 않은 그림에서 상당한 양의 부분 합계가 포함되며, 이는 구성원이 다음과 같이 주어지는 부분 합계 행렬을 구성하여 수행됩니다.

    {\displaystyle p_{iy}=\sum _{u=1}^{i}\sum _{v=1}^{j}b_{uv}}

    부분합 행렬은 꼬챙이가 제거된 이진 그래디언트 이미지를 한 번

    Enjoying the preview?
    Page 1 of 1