적당한 고통은 희열이다

- 댄 브라운 '다빈치 코드' 중에서

초보 iOS 개발자의 일상/개발 업무

[Swift iOS] Google Cloud Speech-to-Text API (한글 음성 인식)

hongssup_ 2021. 12. 27. 10:44
반응형

어렵다.. 쉽지않아...

 

구글 STT 데모 테스트

구글 STT 데모 페이지에서 구글 STT 샘플 테스트가 가능하다.

 

구글 STT 무료 체험하는 법

샘플 코드로 직접 테스트를 해볼 수도 있다.

그런데 음... 구글에서 제공하는 샘플 코드로 테스트 해봤는데 좀 이상한 부분들이 많았다. 

github - Cloud Speech Sample

우선 여기서 샘플 코드와 간략한 Cloud Speech API 사용법을 볼 수 있다. 

시작부터 까다롭다. 클라우드 계정 만들고 무료 체험이지만 카드 결제 정보도 등록을 해준다. 

어째저째 하다 얼떨결에 사용을 하긴 했는데 사실 이게 꼭 다 필요한 과정인지는 모르겠으나 

1. 구글 클라우드 플랫폼 콘솔에서 새 프로젝트를 만들어준다

2. API 사용을 위한 api key 생성 및 사용자 인증 정보를 만든다.

3. 서비스 계정을 만든다.  

뭐 대충 이렇게 했다. 

 

STT 샘플 코드를 받아서 api key만 바꿔서 테스트를 해보긴 했는데, 음... 

결과값이 왜이러쥬..? 이거 샘플 코드 맞나유..? ㅋㅋㅋㅋ

텍스트 출력하는 부분 코드는 다음과 같이 되어 있더라. 

strongSelf.textView.text = response.description

그런데 위에 보이다시피 출력값이 이상하기에..

원하는 결과 텍스트만 불러오기 위해 라이브러리를 좀 뜯어보다가 다음과 같이 설정을 해 주었더니 출력이 잘 되더라. 

if let result = result as? StreamingRecognitionResult {
    if result.isFinal {
        let trans = result.alternativesArray[0] as? SpeechRecognitionAlternative
        finished = true
        strongSelf.textView.text = trans?.transcript
    }
}

 

 

참고 : https://cloud.google.com/speech-to-text/docs/samples

https://github.com/GoogleCloudPlatform/ios-docs-samples/tree/master/speech-to-speech

728x90
반응형