MFCC

Problema com o MFCC e GMM para reconhecimento de áudio

Problema com o MFCC e GMM para reconhecimento de áudio
  1. Por que o MFCC é importante no reconhecimento de fala?
  2. Como os recursos do MFCC são extraídos para o reconhecimento de fala?
  3. Por que o MFCC é tão popular?
  4. Quais são as vantagens do MFCC?

Por que o MFCC é importante no reconhecimento de fala?

MFCC são recursos populares extraídos de sinais de fala para uso em tarefas de reconhecimento. No modelo de fala do filtro de origem, o MFCC é entendido como representar o filtro (trato vocal). A resposta de frequência do trato vocal é relativamente suave, enquanto a fonte de fala de voz pode ser modelada como um trem de impulso.

Como os recursos do MFCC são extraídos para o reconhecimento de fala?

A técnica de extração do recurso MFCC inclui basicamente a janela do sinal, a aplicação da DFT, pegando o tronco da magnitude e, em seguida, distorce as frequências em uma escala MEL, seguida pela aplicação do DCT inverso.

Por que o MFCC é tão popular?

A técnica do MFCC é a mais popular, tem uma grande conquista e amplamente usada nos sistemas de reconhecimento de falantes e fala [35, 36]. Ele é baseado em uma escala logarítmica e é capaz de estimar a resposta auditiva humana de uma maneira melhor do que as outras técnicas de extração de recursos cepstrais [37,38]. ...

Quais são as vantagens do MFCC?

A vantagem do MFCC é que ele é bom na redução de erros e capaz de produzir um recurso robusto quando o sinal é afetado pelo ruído. A técnica SVD/PCA é usada para extrair os recursos importantes da representação da distribuição B.

Tentando implementar um LPF digital
Como você implementa um filtro de passes baixos digitais?O que é LPF na comunicação digital? Como você implementa um filtro de passes baixos digitai...
Transformação de Fourier de funções periódicas
Qual é a transformação de Fourier de uma função periódica?O que é série de Fourier para sinais periódicos?É a série de Fourier apenas para funções pe...
Como a máxima verossimilhança do log é calculada para BPSK?
Como é calculada a probabilidade de log?O que é LLR em LTE?Qual é a importância da probabilidade de log? Como é calculada a probabilidade de log?Uso...