#Back to basic 제로스(zeroth) 프로젝트 스크립트 분석 및 인식률 고도화 방안
기초로 돌아가서 음성인식 머신러닝 툴인 kaldi에 홈페이지에 존재한 레시피를 참고해서 zeroth 프로젝트의 스크립트를 분석해보고 이에 따라 +@로 가지고 있는 음성 데이터를 어떻게 분리해서 러닝을 시켜야 인식률이 증가할지 리서치해 보았습니다. 먼저 기본적으로 러닝 할 때 사용하고 있는 스크립트를 분석했습니다. 순서대로 흐름을 읽어가 보도록 하겠습니다. (단순 압축 해제, 다운로드 등의 스크립트는 생략하겠습니다) 압축 해제된 데이터의 모든 파일들을 local/data_prep.sh를 통해 필요한 정보를 추출해 내는 과정입니다. 제로스 데이터에 있는 젠더 정보를 추출합니다 output : spk2gender (추후 사용되지는 않는 것으로 판단됨) flac 명령어를 통해 음원을 디코딩해서 웨이브로 데이터셋..
2019. 10. 7. 00:26