개발 이야기/머신러닝(딥러닝)(21)
-
#1 인공신경망 동작 원리 - 예측자, 분류자
안녕하세요 요즘은 딥러닝을 공부 중인 해커의 개발일기 입니다. 딥러닝 프로젝트에 참여 예정이기 때문에 기초를 다지고자 몇일 동안 계속 책만 봤는데요 음성인식을 할 때 공부했던 이론들이 많이 나오고 틈틈히 공부했던 내용들이 많이 나와서 다시금 복습하고 되새길 수 있는 기회였습니다. 그 중에도 굉장히 간략하지만 핵심을 쏙쏙! 이해할 수 있도록 해준 책의 내용을 조금 정리해보겠습니다!! 추천하는 책은 신경망 첫걸음 입니다 간단한 예측자에 대한 소개로 시작이 되는데요 예측자는 딥러닝할 때 predict, pred, predictor 이런 단어로 줄여서 소스코드 내에 많이 삽입된 것을 볼 수 있는데요 이 책에서 좋았던 점은 소스코드에서 봤던 Keyword 들이 설명과 매핑되어 이해하기 쉬웠다는 것입니다. 예측자(..
2020.02.05 -
#6 음성인식 노이즈 제거2
#5 음성인식 노이즈 제거에 이어서 노이즈 제거에 사용했던 오픈소스들을 소개합니다! 먼저, SimpleAudioDenoise 입니다 상당히 빠른 노이즈 제거를 할 수 있지만 상당히 큰 음원 손실로 추천하지는 않지만 빠른 속력을 원하시는 분들은 사용해보세요! git clone https://github.com/cpuimage/SimpleAudioDenoise.git clone을 하게 되면 보기와 같이 파일들이 다운로드 되는데요! 보시는 바와 같이 C로 작성된 것을 확인할 수 있습니다 자! 그럼 cmake를 이용해서 빌드를 해보겠습니다. cmake CMakeLists.txt 요렇게 명령어를 치면 makefile이 생성되고 이제 make 명령어로 빌드를 해볼게요 make 명령어를 입력하면 SimpleDenoi..
2019.10.11 -
#Back to basic 제로스(zeroth) 프로젝트 스크립트 분석 및 인식률 고도화 방안
기초로 돌아가서 음성인식 머신러닝 툴인 kaldi에 홈페이지에 존재한 레시피를 참고해서 zeroth 프로젝트의 스크립트를 분석해보고 이에 따라 +@로 가지고 있는 음성 데이터를 어떻게 분리해서 러닝을 시켜야 인식률이 증가할지 리서치해 보았습니다. 먼저 기본적으로 러닝 할 때 사용하고 있는 스크립트를 분석했습니다. 순서대로 흐름을 읽어가 보도록 하겠습니다. (단순 압축 해제, 다운로드 등의 스크립트는 생략하겠습니다) 압축 해제된 데이터의 모든 파일들을 local/data_prep.sh를 통해 필요한 정보를 추출해 내는 과정입니다. 제로스 데이터에 있는 젠더 정보를 추출합니다 output : spk2gender (추후 사용되지는 않는 것으로 판단됨) flac 명령어를 통해 음원을 디코딩해서 웨이브로 데이터셋..
2019.10.07 -
#Back to basic 머신러닝이란?
음성인식을 공부하면서 잘 풀리지 않는 문제 때문에 기초로 돌아가서 뭔가 처음부터 공부를 해야겠다고 생각이 들었다. 그래서 회사에 있는 머신러닝 관련 책들을 모두 내 자리로 가져와서 읽어보고 있다. 항상 그렇듯 기초가 가장 중요하기 때문에 머신러닝에 대해 정리를 해야겠다고 생각이 들었다. 그토록 뜨거운 관심을 가지고 있는 인기의 머신러닝은 무엇인가? 머신러닝의 개요를 보면 머신러닝이란 인공지능 연구 과제 중의 하나로, 인간의 뇌가 자연스럽게 수행하는 "학습"이라는 능력을 컴퓨터로 구현하는 방법 이라고 한다. 스탠포드 대학의 온라인 학습 강의에서는 머신러닝은 개발자가 추측하기 어려운 로직을 컴퓨터 학습을 통해 구현 해주는 것 이라고 표현을 했다. 즉 우리가 챗봇을 만든다면 수 많은 분기문으로 어떤 대답이 왔..
2019.09.29 -
#5 음성인식 노이즈 제거
음성인식을 함에 있어서 굉장히 큰 딜레마에 빠지게 되었는데요.. 단순하게 생각했을 때 음성인식 결과가 좋으려면 어떻게 해야 할까요? 1. 음성인식(STT) 러닝 데이터가 많아야 한다. 2. 깨끗한 음원 파일을 이용해 음성인식(STT)을 한다. 저는 개발 중인 입장에서 이렇게 두 가지의 추론을 하고 있습니다. 하지만 현실적으로 봤을 때. 노이즈 제거는 어쨌거나 음원파일을 손실하게 되어서 음성인식에 나쁜 결과를 가져다 줄 수도 있는데요! 뭔가 가장 기능적으로 우수한 합의점을 찾는 것이 숙제인 것 같습니다. 오늘은 2에 해당하는 깨끗한 음원파일을 만들어 보려고 노력했던 결과물들을 소개할 껀데요. 바로 디노이즈(denoise) 관련 러닝 과정입니다. 몇 가지 방법들이 있었는데 음 .. 3가지 정도 추천을 해드릴..
2019.09.20 -
#4 음성인식 KALDI 툴을 이용한 한국어 음성인식(zeroth project)
#1 음성인식 기초(오디오파일 구조) #2 음성인식 이해 #3 음성인식 KALDI 툴 설치 KALDI 툴을 설치해 보고 영어 음성인식을 테스트 해봤는데요! 이어서 우리가 사용하는! 우리에게 필요한 한국어 음성인식을 시도해보겠습니다 먼저 제로스 프로젝트에 대해서 말씀을 드릴게요 제로스 프로젝트는 KALDI 툴을 이용해서 구현된 한국어 음성 인식을 위한 오픈소스 프로젝트이며 현재는 https://www.atlaslabs.ai/ 아틀라스랩스 | Atlas Labs 아틀라스랩스는 음성인식 AI 솔루션을 통해, 기업에 맞는 제품과 서비스를 개발할 수 있도록 지원합니다. www.atlaslabs.ai 회사 형태로 운영되고 있으며 굵직한 고객을 소유하고 있습니다 오픈소스는 역시 돈이 되는군요! 저도 이 프로젝트를 통..
2019.08.18