적당한 고통은 희열이다

- 댄 브라운 '다빈치 코드' 중에서

Swift iOS 앱 개발/Swift 튜토리얼

4. Swift_ Tesseract OCR Tutorial for iOS

hongssup_ 2020. 12. 14. 11:45
반응형

www.raywenderlich.com/2010498-tesseract-ocr-tutorial-for-ios

 

Tesseract OCR Tutorial for iOS

In this tutorial, you’ll learn how to read and manipulate text extracted from images using OCR by Tesseract.

www.raywenderlich.com

Optical Character Recognition (OCR)
: is the process of electronically extracting text from images.
Tesseract : open-source OCR engine maintained by Google. 

 

< 튜토리얼 순서 >

1. Cocoapods로 TesserzctOCRiOS 설치하기 (Adding the Tesseract Framework)
2. Adding Trained Data 
3. 이미지 로드 (사진찍기 / 라이브러리에서 가져오기) _ 팝업알림창 만들기
4. Implementing Tesseract OCR 
5. 비율 맞춰 이미지 크기 조정하기 (가로가 더 길 때 / 세로가 더 길 때)
6. OCR 정확도 향상 - GPUImage 사용하여 이미지 품질 향상 

 

platform :ios, '12.1'

target 'Love In A Snap' do
  use_frameworks!

  pod 'TesseractOCRiOS'

end

 

Tesseract OCR engine modes : 
- .tesseractOnly : fastest, but least accurate method
- .cubeOnly : slower, but more accurate (employs more artificial intelligence)
- .tesseractCubeCombined : (runs both .tesseractOnly and .cubeOnly) slowest, but most accurate. -> 이 튜토리얼에서 사용. 

 

< 용어정리 >

• Heuristic : 문제의 답을 시행 착오적인 방법을 사용하여 구하는 것. 즉, 알고리즘이 확립되지 않았을 때 사용되는 문제 해결의 한 방법으로 도형 인식, 학습 과정, 자기 형성 등의 기능을 이용하여 답을 구하는 방법.

 

*** 아쉬운 점이 있다면, 한글 텍스트도 추출해보려고 시도했지만, 한글은 지원이 쉽지 않은 듯 하다ㅠㅠ

예전에 파이썬으로 크롤링하고 데이터 추출할 때 tesseract OCR 사용해봤는데, Swift에서는 아직 한글 지원이 잘 되어 있지 않는 것 같다.

728x90
반응형