Machine Learning/Audio Feature
-
MFCC(Mel-Frequency Cepstral Coefficient) 이해하기Machine Learning/Audio Feature 2019. 7. 12. 03:57
이 글은 음성/음악 등 오디오 신호 처리 분야에서 널리 쓰이는 특징값(Feature) 중 하나인 MFCC(Mel-Frequency Cepstral Coefficient)에 대해 정리한 글입니다. 알고리즘 구현보다는 MFCC의 전반적인 이해와 실제 활용에 초점을 맞춰 정리했습니다 :) MFCC란? MFCC는 오디오 신호에서 추출할 수 있는 feature로, 소리의 고유한 특징을 나타내는 수치입니다. 주로 음성 인식, 화자 인식, 음성 합성, 음악 장르 분류 등 오디오 도메인의 문제를 해결하는 데 사용됩니다. 먼저 MFCC를 쉽게 이해하기 위해 MFCC의 실제 사용 예시를 들어보겠습니다. 1) 화자 검증(Speaker Verification) 화자 검증이란 화자 인식(Speaker Recognition)의 ..