머신러닝(10)
-
STT 기술의 핵심: 음성을 텍스트로 변환하는 과정의 모든 것
음성을 컴퓨터가 텍스트로 변환하는 기술인 STT(Speech to Text)는 음성 인식 기술의 한 형태로, 인간이 말하는 소리를 기계가 이해하고 이를 문자로 바꾸는 과정을 의미합니다. 음성을 분석하고 이를 언어적 요소로 변환하는 STT는 머신러닝과 신경망, 그리고 다양한 신호처리 기법이 결합된 최첨단 기술입니다. 이번 포스팅에서는 음성을 텍스트로 변환하는 기본 원리와 머신러닝 모델을 통한 구체적인 변환 과정을 코드와 함께 살펴보겠습니다.1. 음성을 컴퓨터가 이해하는 원리컴퓨터가 음성을 이해하기 위해서는 먼저 아날로그 형태의 음성을 디지털 데이터로 변환해야 합니다. 이 변환 과정에서 샘플링과 양자화라는 과정을 거칩니다.샘플링(Sampling): 음성 신호는 아날로그로 연속적인 형태입니다. 이를 컴퓨터가 ..
2024.11.15 -
심화된 머신러닝 알고리즘과 최적화 기법
이전 포스팅에서 다양한 데이터 전처리 및 심화된 데이터 분석 기법을 살펴보았습니다. 이번 포스팅에서는 한 단계 더 나아가, 고급 머신러닝 알고리즘과 모델 성능을 극대화할 수 있는 최적화 기법들에 대해 이야기해 보겠습니다. 이를 통해 복잡한 문제를 해결할 때 활용할 수 있는 심화된 도구들을 이해하고 적용할 수 있기를 바랍니다.1. 고급 머신러닝 알고리즘1.1 XGBoost (Extreme Gradient Boosting)XGBoost는 성능과 효율성을 높이기 위해 그레이디언트 부스팅을 개선한 알고리즘으로, 많은 머신러닝 경진대회에서 자주 사용됩니다. 속도와 정확도가 높아 대용량 데이터에 적합합니다.import xgboost as xgbmodel = xgb.XGBRegressor(n_estimators=10..
2024.11.07 -
# [Lazy Predict] 분류, 회귀분석 간소화 프로젝트
안녕하세요. 해커의 개발일기 입니다. 지난 번에 회귀분석 과정을 주제로 한 글을 작성했었는데요. https://bourbonkk.tistory.com/112 [회귀분석] COVID-19 확산 지표와 교통 통계량 데이터를 이용한 회귀분석 과정 안녕하세요 해커의 개발일기 입니다. 오랫만에 글을 쓰게 되었는데요. 요즘은 경제학 공부에 빠져있는 관계로 .. 다른 것들이 아무것도 눈에 들어오지가 않았습니다 ㅜㅜ.. 죄책감에 이번주에는 bourbonkk.tistory.com 관련해서 머신러닝의 일부인 회귀분석(Regression)과 분류(Classification)의 기초적인 내용을 다뤄보려고 합니다. 회귀분석과, 분류는 지도학습에 포합되는 기계학습의 과정인데요 사전적 정의는 아래와 같습니다. 회귀분석(Regres..
2021.07.13 -
# 데이터 분석&머신러닝 플랫폼 - RapidMiner(래피드마이너)
안녕하세요. 데이터 과학에 빠진 해커의 개발일기 입니다. 오늘은 데이터 분석 툴이자 최고의 머신러닝 플랫폼인 RapidMiner에 대해서 알아보도록 하겠습니다. 저는 대학원에서 데이터 사이언스/인공지능을 전공하고 있는데요, 대학원 수업 중 알게 된 데이터 분석 && 머신러닝 플랫폼인 RapidMiner를 알게 되었습니다. 이 툴은 무엇을 하는 툴일까요? 머신러닝을 이용해서 수많은 데이터를 이용해 예측하거나 분류를 함에 있어서 결과를 추출해내기 위해서는 소스코드로 짜서 머신러닝 후에 확인을 해야만 합니다. 하지만 결과가 매번 좋은 것은 아니죠? 일 년에도 수십수백의 알고리즘이 개발되고 논문이 나오고 있는 실정이기 때문에 최신의 트렌드를 쫓기 위해서는 정말 문서만 읽다가 코드는 짜보지도 못하고 일 년, 이년..
2020.04.22 -
#1 인공신경망 동작 원리 - 예측자, 분류자
안녕하세요 요즘은 딥러닝을 공부 중인 해커의 개발일기 입니다. 딥러닝 프로젝트에 참여 예정이기 때문에 기초를 다지고자 몇일 동안 계속 책만 봤는데요 음성인식을 할 때 공부했던 이론들이 많이 나오고 틈틈히 공부했던 내용들이 많이 나와서 다시금 복습하고 되새길 수 있는 기회였습니다. 그 중에도 굉장히 간략하지만 핵심을 쏙쏙! 이해할 수 있도록 해준 책의 내용을 조금 정리해보겠습니다!! 추천하는 책은 신경망 첫걸음 입니다 간단한 예측자에 대한 소개로 시작이 되는데요 예측자는 딥러닝할 때 predict, pred, predictor 이런 단어로 줄여서 소스코드 내에 많이 삽입된 것을 볼 수 있는데요 이 책에서 좋았던 점은 소스코드에서 봤던 Keyword 들이 설명과 매핑되어 이해하기 쉬웠다는 것입니다. 예측자(..
2020.02.05 -
#6 음성인식 노이즈 제거2
#5 음성인식 노이즈 제거에 이어서 노이즈 제거에 사용했던 오픈소스들을 소개합니다! 먼저, SimpleAudioDenoise 입니다 상당히 빠른 노이즈 제거를 할 수 있지만 상당히 큰 음원 손실로 추천하지는 않지만 빠른 속력을 원하시는 분들은 사용해보세요! git clone https://github.com/cpuimage/SimpleAudioDenoise.git clone을 하게 되면 보기와 같이 파일들이 다운로드 되는데요! 보시는 바와 같이 C로 작성된 것을 확인할 수 있습니다 자! 그럼 cmake를 이용해서 빌드를 해보겠습니다. cmake CMakeLists.txt 요렇게 명령어를 치면 makefile이 생성되고 이제 make 명령어로 빌드를 해볼게요 make 명령어를 입력하면 SimpleDenoi..
2019.10.11