- O que é MFCC no reconhecimento de fala?
- Para que é usado o MFCC para?
- Quais são os recursos do MFCC?
- Por que o MFCC é tão popular?
O que é MFCC no reconhecimento de fala?
Coeficientes de cepstrum de Mel-Frequência (MFCC)
No modelo de fala do filtro de origem, o MFCC é entendido como representar o filtro (trato vocal). A resposta de frequência do trato vocal é relativamente suave, enquanto a fonte de fala de voz pode ser modelada como um trem de impulso.
Para que é usado o MFCC para?
Os MFCCs são comumente usados como recursos em sistemas de reconhecimento de fala, como os sistemas que podem reconhecer automaticamente os números falados em um telefone. Os MFCCs também estão cada vez mais encontrando usos em aplicativos de recuperação de informações musicais, como classificação de gênero, medidas de similaridade de áudio, etc.
Quais são os recursos do MFCC?
A técnica de extração do recurso MFCC inclui basicamente a janela do sinal, a aplicação da DFT, pegando o tronco da magnitude e, em seguida, distorce as frequências em uma escala MEL, seguida pela aplicação do DCT inverso. A descrição detalhada de várias etapas envolvidas na extração do recurso MFCC é explicada abaixo.
Por que o MFCC é tão popular?
A técnica do MFCC é a mais popular, tem uma grande conquista e amplamente usada nos sistemas de reconhecimento de falantes e fala [35, 36]. Ele é baseado em uma escala logarítmica e é capaz de estimar a resposta auditiva humana de uma maneira melhor do que as outras técnicas de extração de recursos cepstrais [37,38]. ...