적당한 고통은 희열이다

- 댄 브라운 '다빈치 코드' 중에서

초보 iOS 개발자의 일상/개발 업무

OCR - iOS 텍스트 인식 Firebase ML Kit와 TesseractOCR 비교 (한글)

hongssup_ 2021. 11. 22. 17:18
반응형

OCR(Optical character recognition) 광학 문자 인식

: 사람이 쓰거나 기계로 인쇄한 문자를 스캔하여 기계가 읽을 수 있는 문자로 변환하는 것. 

 

iOS에서 텍스트 인식을 하기 위해서는 다음 두가지 SDK를 생각해볼 수 있다. 

(네이버 OCR도 있지만 비싸서 패쓰.. ㅎㅎ 영수증, 명함 등 OCR 템플릿도 있으니 정확도가 크게 요구되는 프로젝트에서는 유료로 쓸만할듯)

Firebase ML Kit vs. TesseractOCR 

정확도(높은 것) : ML Kit vs. Tesseract OCR

속도(빠른 것) : ML Kit vs. Tesseract OCR

용량(작은 것) : ML Kit vs. Tesseract OCR

 

참고 : iOS 텍스트 인식 Firebase ML Kit TesseractOCR 비교

 

오호 그렇구만! 했는데 어디까지나 이건 영문 인식 결과....

한글을 테스트 해보니 tesseract 결과값은 처참했다.. ㅋㅋㅋㅋㅋ 

심지어 속도도 MLKit가 훨씬 빠름...

한글 OCR 닥 MLKit 승... 

korean 테스트 데이터가 많이 부족한 탓인지

너무나도 실망스럽고 형편없는 tesserct는 버리고 MLKit로 OCR 작업을 진행하기로 결정..

그런데 한가지 문제가 있다면 tesseract는 글자는 개발새발로 인식하지만 결과값은 한 줄을 한꺼번에 읽어들이는 형식이라면

MLKit는 띄어져 있는 글자는 세로로 읽어버려서 인식률은 높은데 결과값이 중구난방이 되어버린다는 단점? 이 있었다.

이거를 어떻게 한줄을 한꺼번에 읽어오려나.. 혹은 받아온 데이터를 어떻게 정돈?을 시킬 수 있으려나 고민을 해보아야겠다..

 

테스트 코드 참고 : ML Kit 이용하여 OCR 한글 인식 테스트

728x90
반응형