이미지 글자 인식 웹툴 (OCR 프로그램)

카테고리 : 웹툴/미디어

이미지 불러오기

분석할 이미지를 끌어오거나, 선택해주세요. IE는 지원하지 않습니다.

파일을 드래그앤드롭 (Drag & Drop Here)

 

 

이미지 선택

드래그하여 분석을 원하는 부분을 선택할 수 있습니다. 선택을 안하는 경우 이미지 전체 분석을 합니다.

 

 

설정

몇 가지 설정이 가능합니다.

 

옵션
언어
검사완료후

 

 

 

 

진행 상태

분석 진행 정도를 알 수 있습니다.

준비중...

 

 

분석 결과

분석이 완료되면 이곳에 결과가 표시됩니다.
  • 빨간색 : 틀릴가능성이 매우 큼
  • 주황색 : 틀릴가능성이 큼
  • 검정색 : 맞을가능성이 큼

틀릴 가능성이 큰 항목의 경우 클릭시 재 검사를 진행할 수 있습니다.

자주 발생할 수 있는 인식오류로 글자 위치를 정확히 잡지 못하는 경우가 있는데, 이 경우 재 검사를 진행해도 인식이 안될 수 있습니다. (자동으로 글자 위치 인식이 조금 떨어집니다.)

"이미지 선택" 메뉴로 가셔서 오류가 난 글자 위치를 잡고 다시 검사해보세요. 아래의 정확도 향상 팁도 도움이 될겁니다.

 

정확도 향상 팁

  1. 글자부분만으로 찾기

    글자가 아닌 다른 이미지가 섞여있는 경우, 여백이 너무 좁거나 넓거나.. 등등 인식에 방해되는 요소가 적을수록 인식률이 오릅니다.

  2. 한 언어로만 확인

    여러 언어가 섞인경우보다 한가지 언어만 검색할때 인식률이 오릅니다.

  3. 띄어쓰기

    문자 구분이 잘 되어있어야 인식률이 좋아집니다.

  4. 한글 폰트에 따라..

    ㅇ과 ㅁ을 구분하기 어렵습니다.

  5. 단어별(작은 단위)로 선택하여 검사시 정확도가 조금 더 높아집니다.

 

 

OCR은?

이미지에서 글자를 인식하는 소프트웨어를 지칭합니다.

실생활에 사용되는 예시로는 자동차 번호판 인식같은게 있습니다.

 

카메라로 차량 번호판을 찍고, 찍힌 영상(또는 이미지)으로 부터 실제 번호를 찾아내어 주차장에 들어갈때나, 경찰의 단속장비 등에 활용되기도 합니다.

 

은행앱등에서도 신분증을 촬영하고 자동으로 인식하는데 이런 기술이 적용됩니다.

 

 

오픈소스 고지

이 웹툴은 OCR 오픈소스인 Tesseract(Apache-2.0 License)를 emscrypten로 porting하여 동작합니다.

이미지 선택에 사용한 오픈소스 konvajs(konvajs.org : MIT License)

 

저작권 보호안내
무단 전재, 재배포 행위는 금지됩니다. (글을 복사하여 게시금지)
본문의 일부(링크용 문장) 인용은 가능하지만, 출처와 링크(a 태그)를 남기셔야 됩니다.
(웹툴을 이용하고, 스크린샷/녹화하는것은 상관없습니다.)

예외적으로. 저에게 허락받은 경우에는 본문을 전재할 수 있습니다.

만약, 본문 공유를 원하신다면 링크 공유를 해주세요

저작권 정책 확인하기
링크 공유하기

 댓글 (1개)


  • hi098123 2020.11.07 13:25 신고 댓글주소수정/삭제댓글쓰기

    미리 안내드립니다.
    음성인식 기능은 지원이 어렵습니다.
    크롬, 파이어 폭스등 내장 기능이 있으나 마이크를 통한 실시간 인식만 가능하고 음성파일 인식은 불가하여 아직은 추가 계획이 없습니다.