'zeroth' 태그의 글 목록

#Back to basic 제로스(zeroth) 프로젝트 스크립트 분석 및 인식률 고도화 방안

기초로 돌아가서 음성인식 머신러닝 툴인 kaldi에 홈페이지에 존재한 레시피를 참고해서 zeroth 프로젝트의 스크립트를 분석해보고 이에 따라 +@로 가지고 있는 음성 데이터를 어떻게 분리해서 러닝을 시켜야 인식률이 증가할지 리서치해 보았습니다. 먼저 기본적으로 러닝 할 때 사용하고 있는 스크립트를 분석했습니다. 순서대로 흐름을 읽어가 보도록 하겠습니다. (단순 압축 해제, 다운로드 등의 스크립트는 생략하겠습니다) 압축 해제된 데이터의 모든 파일들을 local/data_prep.sh를 통해 필요한 정보를 추출해 내는 과정입니다. 제로스 데이터에 있는 젠더 정보를 추출합니다 output : spk2gender (추후 사용되지는 않는 것으로 판단됨) flac 명령어를 통해 음원을 디코딩해서 웨이브로 데이터셋..

2019. 10. 7. 00:26

#4 음성인식 KALDI 툴을 이용한 한국어 음성인식(zeroth project)

#1 음성인식 기초(오디오파일 구조) #2 음성인식 이해 #3 음성인식 KALDI 툴 설치 KALDI 툴을 설치해 보고 영어 음성인식을 테스트 해봤는데요! 이어서 우리가 사용하는! 우리에게 필요한 한국어 음성인식을 시도해보겠습니다 먼저 제로스 프로젝트에 대해서 말씀을 드릴게요 제로스 프로젝트는 KALDI 툴을 이용해서 구현된 한국어 음성 인식을 위한 오픈소스 프로젝트이며 현재는 https://www.atlaslabs.ai/ 아틀라스랩스 | Atlas Labs 아틀라스랩스는 음성인식 AI 솔루션을 통해, 기업에 맞는 제품과 서비스를 개발할 수 있도록 지원합니다. www.atlaslabs.ai 회사 형태로 운영되고 있으며 굵직한 고객을 소유하고 있습니다 오픈소스는 역시 돈이 되는군요! 저도 이 프로젝트를 통..

2019. 8. 18. 21:59

#3 음성인식 KALDI 툴 설치

#1 음성인식 기초(오디오파일 구조) #2 음성인식 이해 지난번에 소개했던 wFST 기반의 음성인식 툴 KALDI의 간략한 소개와 함께 설치 방법에 대해서 알아보자! Kaldi 이름의 유래? 칼디는 원래 커피 식물을 발견한 목사였다고 하네요 ㅎㅎ 재밌는 사실이네요 Kaldi는 C++로 작성되고 라이센스는 Apache License v2.0!!가 부여된 음성 인식 용 툴킷입니다! 이 Kaldi 프로젝트의 역사는 굉장히 긴데요! 벌써 10년이나 됬다고 합니다 Kaldi began its existence in the 2009 Johns Hopkins University workshop cumbersomely titled "Low Development Cost, High Quality Speech Recogn..

2019. 8. 18. 19:41

해커의 개발일기

해커의 개발일기

태그

최근글

댓글

공지사항

아카이브

zeroth(3)

티스토리툴바