문서 모자이크: 문서 모자이크를 통해 시각적 통찰력 확보
By Fouad Sabry
()
About this ebook
문서 모자이크란 무엇인가
문서 모자이크는 문서의 여러 개의 겹치는 스냅샷 이미지를 함께 연결하여 하나의 큰 고해상도 합성물을 만드는 프로세스입니다. 문서의 모든 부분이 카메라의 시야에 의해 스냅샷으로 촬영될 때까지 문서를 손으로 책상 위에 고정된 카메라 아래로 밀어 넣습니다. 문서가 카메라 아래로 미끄러지면서 문서의 모든 움직임이 비전 시스템에 의해 대략적으로 추적됩니다. 문서는 연속적인 스냅샷이 약 50% 정도 겹치도록 주기적으로 스냅샷을 생성합니다. 그런 다음 시스템은 겹쳐진 쌍을 찾아 모든 쌍이 하나의 문서로 연결될 때까지 반복적으로 연결합니다.
당신이 얻을 수 있는 혜택
(I) 다음 주제에 대한 통찰력 및 검증:
1장: 문서 모자이크
2장: 이미지 스티칭
3장: 디모자이크
4장: 문서 레이아웃 분석
5장: 롤링 셔터
6장: 카메라 자동 보정
7장: 컴퓨터 스테레오 비전
8장: 강체 모션 분할
9장: 이미지 텍스처
10장: 이미지 수정
(II) 문서 모자이크에 관한 대중의 주요 질문에 답변합니다.
(III) 다양한 분야에서 문서 모자이크 사용에 대한 실제 사례.
이 책은 누구를 위한 책인가
전문가, 학부 및 대학원생, 열성팬, 취미생활자, 모든 종류의 문서 모자이크에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들.
Read more from Fouad Sabry
농업의 새로운 기술 [Korean]
Related to 문서 모자이크
Titles in the series (100)
인페인팅: 컴퓨터 비전의 격차 해소 Rating: 0 out of 5 stars0 ratings컴퓨터 시각 인식: 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings이방성 확산: 이방성 확산을 통한 이미지 분석 향상 Rating: 0 out of 5 stars0 ratings관절 신체 자세 추정: 컴퓨터 비전에서 인간의 움직임 잠금 해제 Rating: 0 out of 5 stars0 ratings호모그래피: 호모그래피: 컴퓨터 비전의 변화 Rating: 0 out of 5 stars0 ratings하다마드 변환: 컴퓨터 비전에서 아다마르 변환의 힘 공개 Rating: 0 out of 5 stars0 ratings레티넥스: 레티넥스 를 통해 컴퓨팅 비전의 비밀을 밝히다 Rating: 0 out of 5 stars0 ratings시각적 인식: 컴퓨터 시각적 처리에 대한 통찰력 Rating: 0 out of 5 stars0 ratings컴퓨터 스테레오 비전: 컴퓨터 비전의 깊이 인식 탐구 Rating: 0 out of 5 stars0 ratings색 공간: 컴퓨터 비전의 스펙트럼 탐색 Rating: 0 out of 5 stars0 ratings공동 사진 전문가 그룹: JPEG 표준으로 시각적 데이터의 힘 활용 Rating: 0 out of 5 stars0 ratings히스토그램 균등화: 향상된 시각적 인식을 위한 이미지 대비 향상 Rating: 0 out of 5 stars0 ratings이미지 히스토그램: 시각적 통찰력 공개, 컴퓨터 비전의 이미지 히스토그램 깊이 탐색 Rating: 0 out of 5 stars0 ratings윤곽선 감지: 컴퓨터 비전의 시각적 인식 기술 공개 Rating: 0 out of 5 stars0 ratings색상 외관 모델: 컴퓨터 비전의 인식 및 표현 이해 Rating: 0 out of 5 stars0 ratings소음 감소: 선명도 향상, 컴퓨터 비전의 노이즈 감소를 위한 고급 기술 Rating: 0 out of 5 stars0 ratings허프 변환: 컴퓨터 비전에서 Hough 변환의 마법 공개 Rating: 0 out of 5 stars0 ratings얼룩 감지: 시각적 데이터의 패턴 공개 Rating: 0 out of 5 stars0 ratings아핀 변환: 시각적 관점 잠금 해제: 컴퓨터 비전의 아핀 변환 탐색 Rating: 0 out of 5 stars0 ratings이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술 Rating: 0 out of 5 stars0 ratings라돈 변환: 시각적 데이터에 숨겨진 패턴 밝히기 Rating: 0 out of 5 stars0 ratings가장자리 감지: 컴퓨터 비전의 경계 탐색 Rating: 0 out of 5 stars0 ratings감마 보정: 컴퓨터 비전의 시각적 선명도 향상: 감마 보정 기술 Rating: 0 out of 5 stars0 ratings적응형 필터: 적응 필터링을 통해 컴퓨터 비전 향상 Rating: 0 out of 5 stars0 ratings컬러 매칭 기능: 컴퓨터 비전의 스펙트럼 감도 이해 Rating: 0 out of 5 stars0 ratings톤 매핑: 톤 매핑: 컴퓨터 비전의 관점 밝히기 Rating: 0 out of 5 stars0 ratings수중 컴퓨터 비전: 파도 밑에서 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings활성 윤곽: 능동 윤곽 기술을 통한 컴퓨터 비전의 발전 Rating: 0 out of 5 stars0 ratings컬러 모델: 컴퓨터 비전의 스펙트럼 이해: 색상 모델 탐색 Rating: 0 out of 5 stars0 ratings색상 프로필: 컴퓨터 비전의 시각적 인식 및 분석 탐구 Rating: 0 out of 5 stars0 ratings
Related ebooks
컴퓨터 비전 기본 매트릭스: '컴퓨터 비전' 영역에 '컴퓨터 비전 기본 매트릭스'라는 제목의 책 부제를 제안해주세요. 추천 자막에는 ':'이 포함되어서는 안 됩니다. Rating: 0 out of 5 stars0 ratings피라미드 이미지 처리: 시각적 분석의 깊이 탐구 Rating: 0 out of 5 stars0 ratings스케일 불변 특징 변환: 컴퓨터 비전에서 규모 불변 기능 변환의 힘 공개 Rating: 0 out of 5 stars0 ratings관절 신체 자세 추정: 컴퓨터 비전에서 인간의 움직임 잠금 해제 Rating: 0 out of 5 stars0 ratings고유면: 고유면 를 통한 시각적 인식의 깊이 탐색 Rating: 0 out of 5 stars0 ratings컴퓨터 그래픽 렌더링: 시각적 사실주의 탐구: 컴퓨터 그래픽에 대한 통찰 Rating: 0 out of 5 stars0 ratings해리스 코너 감지기: 이미지 특징 감지의 마법 공개 Rating: 0 out of 5 stars0 ratings얼룩 감지: 시각적 데이터의 패턴 공개 Rating: 0 out of 5 stars0 ratings단어 가방 모델: 단어 가방 로 시각적 지능 잠금 해제 Rating: 0 out of 5 stars0 ratings멀티뷰 3차원 재구성: 컴퓨터 비전의 공간 인식을 위한 고급 기술 Rating: 0 out of 5 stars0 ratings광학 흐름: 컴퓨터 비전의 동적 시각적 패턴 탐색 Rating: 0 out of 5 stars0 ratings보행자 감지: '컴퓨터 비전' 영역에서 '보행자 감지'라는 제목의 도서에 대한 부제를 제안해 주세요. 추천 자막에는 ':'이 포함되어서는 안 됩니다. Rating: 0 out of 5 stars0 ratings가장자리 감지: 컴퓨터 비전의 경계 탐색 Rating: 0 out of 5 stars0 ratings거리 안개: 시각적 개척지 탐험: 컴퓨터 비전의 거리 안개에 대한 통찰 Rating: 0 out of 5 stars0 ratings모션 추정: 컴퓨터 비전의 발전과 응용 Rating: 0 out of 5 stars0 ratings레이 트레이싱 그래픽: 컴퓨터 비전의 사실적 렌더링 살펴보기 Rating: 0 out of 5 stars0 ratings이미지 분할: 픽셀 정밀도 을 통해 통찰력 확보 Rating: 0 out of 5 stars0 ratings버텍스 컴퓨터 그래픽: 정점 컴퓨터 그래픽과 컴퓨터 비전의 교차점 탐색 Rating: 0 out of 5 stars0 ratings숨겨진 표면 결정: 컴퓨터 비전의 비밀 공개 Rating: 0 out of 5 stars0 ratings다각형 컴퓨터 그래픽: 다각형 컴퓨터 그래픽과 컴퓨터 비전의 교차점 탐색 Rating: 0 out of 5 stars0 ratings활성 외관 모델: 컴퓨터 비전에서 활성 외관 모델의 힘 활용 Rating: 0 out of 5 stars0 ratings메쉬 생성: 컴퓨터 비전 메시 생성의 발전과 응용 Rating: 0 out of 5 stars0 ratings컴퓨터 스테레오 비전: 컴퓨터 비전의 깊이 인식 탐구 Rating: 0 out of 5 stars0 ratings이미지 기반 모델링 및 렌더링: 시각적 현실주의 탐구: 컴퓨터 비전 기술 Rating: 0 out of 5 stars0 ratings전역 조명: 비전 발전: 글로벌 일루미네이션에 대한 통찰력 Rating: 0 out of 5 stars0 ratings상황별 이미지 분류: 효과적인 분류를 위한 시각적 데이터 이해 Rating: 0 out of 5 stars0 ratings합성 보기: 컴퓨터 비전의 관점 탐구 Rating: 0 out of 5 stars0 ratings텍스처 매핑: 컴퓨터 비전의 차원 탐색 Rating: 0 out of 5 stars0 ratings기하학적 특징 학습: 기하학적 특징 학습을 통해 시각적 통찰력 확보 Rating: 0 out of 5 stars0 ratings안티 앨리어싱: 컴퓨터 비전의 시각적 명확성 향상 Rating: 0 out of 5 stars0 ratings
Reviews for 문서 모자이크
0 ratings0 reviews
Book preview
문서 모자이크 - Fouad Sabry
1 장 : 문서 모자이크
문서 모자이크는 문서의 여러 겹치는 스냅사진을 하나의 거대한 고해상도 이미지로 결합하는 기술입니다. 문서의 전체 표면이 카메라의 시야 내에 캡처될 때까지 고정된 책상 위 카메라 아래로 문서를 수동으로 밀어 넣습니다. 문서가 카메라 아래로 이동하면 비전 시스템이 문서의 움직임을 거칠게 모니터링했습니다. 주기적으로 문서의 이미지가 약 50% 겹치도록 촬영됩니다. 그런 다음 이 기술은 겹치는 쌍을 식별하고 모든 쌍이 단일 문서로 결합될 때까지 계속해서 연결합니다.
문서 모자이크는 네 가지 기본 단계로 나눌 수 있습니다.
추적
기능 감지
대응 설정
이미지 모자이크.
시스템은 이 절차 중에 문서가 카메라 아래로 미끄러질 때 문서의 움직임을 대략적으로 추적합니다. 단순 상관 관계 절차로 알려진 방법이 추적에 사용됩니다. 그림 1에서 볼 수 있듯이 작은 패치는 스냅샷의 첫 번째 프레임에서 상관 관계 템플릿으로 이미지 중앙에서 복구됩니다. 상관 관계 절차는 다음 프레임 패치 크기의 4배 영역에서 실행됩니다. 논문의 속도는 상관 함수의 피크로 표시됩니다. 상관 함수의 피크는 용지의 속도를 나타냅니다. 이 프레임에서 템플릿이 다시 샘플링되고 템플릿이 문서의 가장자리에 닿을 때까지 추적이 계속됩니다. 템플릿이 문서의 가장자리에 도달하면 다른 이미지가 캡처되고 전체 문서가 캡처될 때까지 추적 절차가 반복됩니다. 스냅샷은 겹치는 사진을 짝짓는 나중에 작업에 도움이 되도록 정렬된 목록에 저장됩니다.
한 이미지를 다른 이미지에 맞추는 변환을 찾는 것이 기능 감지 프로세스입니다. 기능을 감지하는 두 가지 기본 방법이 있습니다.
모션 파라미터는 피처 기반 방법을 사용하여 포인트 대응을 기반으로 계산됩니다. 이 방법은 안정적이고 감지 가능한 기능이 풍부할 때 적용할 수 있습니다.
두 이미지 사이의 움직임이 보통일 때 광학 흐름 방법을 사용하여 동작 매개변수를 추정합니다. 그러나 두 그림 사이의 움직임이 상당할 때 동작 매개변수는 일반화된 상호 상관을 사용하여 계산됩니다. 그러나 이 방법을 사용하려면 계산 비용이 많이 드는 리소스가 필요합니다.
각 이미지는 열, 선, 단어의 계층적 구조로 분할되며, 이는 이미지 전반에 걸쳐 구성된 기능 그룹에 해당합니다. 기울이기 각도를 추정하고 열, 선, 단어를 찾는 것이 특징 감지 작업의 예입니다.
첫째, 텍스트 행과 이미지 래스터 선 사이의 각도(기울기 각도)가 추정됩니다.
±20° 범위에 있는 것으로 추정됩니다.
이미지에서 작은 텍스트 패치를 무작위로 선택한 다음 래스터 라인을 따라 합산된 패치의 픽셀 강도 분산이 최대화될 때까지 ±20° 범위에서 회전합니다.
다이어그램 2를 참조하십시오.
계산된 기울기 각도가 정확한지 확인하기 위해 문서 모자이크 시스템은 많은 이미지 패치에 대한 계산을 수행하고 각 패치에 대한 픽셀 강도의 변화에 따라 가중치가 부여된 다양한 각도의 평균을 계산하여 최종 추정치를 도출합니다.
꼬챙이가 제거된 원고는 이 작업 중에 직관적으로 열, 선, 단어로 나뉩니다. 기울어지지 않은 이미지에 Sobel 연산자를 적용하고 출력을 이진화하여 기울어지지 않은 이진 그라데이션, 기울어지지 않은 이미지를 생성함으로써 조명 및 페이지 색상에 대한 기울어진 문서의 민감도를 제거할 수 있습니다. 다이어그램 3을 참조하십시오.
이 절차는 크게 열 분할, 줄 분할 및 단어 분할의 세 단계로 나눌 수 있습니다.
그림 4는 픽셀을 세로로 추가하여 이진 그라데이션, 기울어지지 않은 이미지와 열을 얼마나 쉽게 구별할 수 있는지 보여줍니다.
각 행의 기준선은 열 기준선과 동일한 방식으로 가로로 분할됩니다.
마지막으로, 개별 단어는 분할된 각 행에 세로 프로시저를 적용하여 분할됩니다.
이러한 세분화는 문서 모자이크가 겹치는 이미지에서 단어의 오른쪽 아래 모서리를 일치시켜 형성되기 때문에 매우 중요합니다. 또한 세분화 절차는 행과 열의 계층 구조 내에서 사진 목록을 안정적으로 구성할 수 있습니다.
분할 프로세스에는 이진 기울기, 기울어지지 않은 그림에서 상당한 양의 부분 합계가 포함되며, 이는 구성원이 다음과 같이 주어지는 부분 합계 행렬을 구성하여 수행됩니다.
{\displaystyle p_{iy}=\sum _{u=1}^{i}\sum _{v=1}^{j}b_{uv}}부분합 행렬은 꼬챙이가 제거된 이진 그래디언트 이미지를 한 번