#1 음성인식 기초(오디오 파일의 구조)
음성인식이란 무엇일까? 컴퓨터가 사람의 음성을 인식하고 이해하는 것이라고 볼 수 있다. 내가 다룰 내용은 음성인식의 기초이지만 궁극적으론 STT(Speech To Text)의 내용을 다룰 것이다. 요즘 회사에서 프로젝트를 하면서 가장 중요한 코어 기능이 바로 저 STT이다. 컴퓨터를 전공한 사람, 컴퓨터를 좋아하는 사람은 알것이다. 컴퓨터는 완전 바보이다. 그렇기 때문에 컴퓨터에게 사람의 언어를 가르친다는 것은 정말 어려운 일일 수 있다. 기본적으로 컴퓨터는 0과 1로 이야기를 한다. 수무히 많은 0과1로 프로토콜을 만들어서 우리가 이해하는 언어와 비슷하게 이해하고 통신하는 것이 컴퓨터이다. 자 그렇다면 이 컴퓨터에게 말소리를 들려줘 보자! 이렇게 저렇게 녹음을 한 후 컴퓨터에게 하고싶은 말을 하고 녹음..
2019. 8. 10. 00:11