Discurso

Usando o MFCC para um sistema de reconhecimento de fala da Ann

Usando o MFCC para um sistema de reconhecimento de fala da Ann
  1. Como o MFCC é usado no reconhecimento de fala?
  2. As redes neurais podem ser usadas para reconhecimento de fala?
  3. Para que é usado o MFCC para?

Como o MFCC é usado no reconhecimento de fala?

MFCC são recursos populares extraídos de sinais de fala para uso em tarefas de reconhecimento. No modelo de fala do filtro de origem, o MFCC é entendido como representar o filtro (trato vocal). A resposta de frequência do trato vocal é relativamente suave, enquanto a fonte de fala de voz pode ser modelada como um trem de impulso.

As redes neurais podem ser usadas para reconhecimento de fala?

As redes neurais são muito poderosas para o reconhecimento da fala. Existem várias redes para este processo. RNN, LSTM, Rede Neural Profunda e HMM-LSTM híbrido são usados ​​para reconhecimento de fala.

Para que é usado o MFCC para?

Os MFCCs são comumente usados ​​como recursos em sistemas de reconhecimento de fala, como os sistemas que podem reconhecer automaticamente os números falados em um telefone. Os MFCCs também estão cada vez mais encontrando usos em aplicativos de recuperação de informações musicais, como classificação de gênero, medidas de similaridade de áudio, etc.

Como fazer modulação e plotar o diagrama de constelação para um sinal complexo (i+jq)?
O que é o diagrama de constelação de Qam?Como você gera modulação QAM?Como realizar modulação QAM no MATLAB?Como plotar o diagrama de constelação no ...
Quais são os resultados da transformação bidimensional de Fourier da imagem?
O que é a transformação de Fourier 2D no processamento da imagem?O que é transformada bidimensional de Fourier?O que a transformação de Fourier de um...
É f/fl Um filtro de passagem alta, onde FL é uma versão passa-baixa de f?
O que é um filtro de passagem alta versus filtro passa -baixo?O que é FFT Low Pass Filter?Onde estão usados ​​filtros de passagem baixa?Filtro de pas...