Usando o MFCC para um sistema de reconhecimento de fala da Ann

Como o MFCC é usado no reconhecimento de fala?
As redes neurais podem ser usadas para reconhecimento de fala?
Para que é usado o MFCC para?

Como o MFCC é usado no reconhecimento de fala?

MFCC são recursos populares extraídos de sinais de fala para uso em tarefas de reconhecimento. No modelo de fala do filtro de origem, o MFCC é entendido como representar o filtro (trato vocal). A resposta de frequência do trato vocal é relativamente suave, enquanto a fonte de fala de voz pode ser modelada como um trem de impulso.

As redes neurais podem ser usadas para reconhecimento de fala?

As redes neurais são muito poderosas para o reconhecimento da fala. Existem várias redes para este processo. RNN, LSTM, Rede Neural Profunda e HMM-LSTM híbrido são usados para reconhecimento de fala.

Para que é usado o MFCC para?

Os MFCCs são comumente usados como recursos em sistemas de reconhecimento de fala, como os sistemas que podem reconhecer automaticamente os números falados em um telefone. Os MFCCs também estão cada vez mais encontrando usos em aplicativos de recuperação de informações musicais, como classificação de gênero, medidas de similaridade de áudio, etc.