METAVERSE

글

라벨이 OCR(Optical Character Recognition) 광학 문자 인식이란?인 게시물 표시

OCR(Optical Character Recognition) 광학 문자 인식이란?

7월 23, 2025

1. OCR이란? **OCR(Optical Character Recognition)**은 이미지나 스캔된 문서 속의 문자(글자)를 인식하여 텍스트로 변환하는 기술 입니다. 쉽게 말해, PDF, 사진, 스캔 문서와 같은 비정형 데이터에서 글자를 추출하여 디지털 텍스트로 바꾸는 작업입니다. 2. OCR의 핵심 기능 이미지 속 글자 감지 텍스트 추출 및 변환 문서 레이아웃 분석 (표, 단락, 제목 등) 다국어 인식 및 손글씨 인식 (진보된 경우) 문서 자동 분류 및 메타데이터 추출 (AI OCR) 3. OCR의 주요 활용 분야 3-1. 비즈니스 문서 자동화 세금계산서, 영수증, 신분증 스캔 후 데이터 입력 자동화 계약서, 통장사본에서 주요 정보 추출 3-2. 금융 및 보험 보험청구서, 통장, 신분증 OCR로 자동 심사 KYC 인증 (Know Your Customer) 3-3. 공공기관 및 교육 주민등록등본, 운전면허증 스캔 정보 자동 입력 학생 시험지 채점, 설문지 처리 3-4. 헬스케어 처방전, 의료기록의 디지털화 환자정보 자동 추출 및 입력 3-5. 번역 및 접근성 향상 외국어 간판 번역 (Google Lens) 시각장애인을 위한 문서 낭독 도구 4. OCR의 동작 방식 4-1. 입력 이미지 전처리 노이즈 제거 : 불필요한 점, 선 제거 기울기 보정 : 문서가 삐뚤어진 경우 교정 이진화 : 흑백 이미지로 변환하여 문자 대비 극대화 4-2. 문자 영역 검출 페이지에서 텍스트 블록, 문단, 줄, 단어, 글자를 구분 4-3. 문자 인식 각 글자를 패턴 매칭 또는 AI 기반 알고리즘으로 인식 전통적 OCR은 Rule-based 방식, 최신 기술은 딥러닝 기반 AI OCR 4-4. 텍스트 후처리 문맥 기반 철자 교정 언어 모델로 문장 구조 보정 표, 문단 구조 복원 5. O...