MFCC

Reconhecimento de voz - MFCC

Reconhecimento de voz - MFCC
  1. O que é MFCC no reconhecimento de fala?
  2. Para que é usado o MFCC para?
  3. Quais são os recursos do MFCC?
  4. Por que o MFCC é tão popular?

O que é MFCC no reconhecimento de fala?

Coeficientes de cepstrum de Mel-Frequência (MFCC)

No modelo de fala do filtro de origem, o MFCC é entendido como representar o filtro (trato vocal). A resposta de frequência do trato vocal é relativamente suave, enquanto a fonte de fala de voz pode ser modelada como um trem de impulso.

Para que é usado o MFCC para?

Os MFCCs são comumente usados ​​como recursos em sistemas de reconhecimento de fala, como os sistemas que podem reconhecer automaticamente os números falados em um telefone. Os MFCCs também estão cada vez mais encontrando usos em aplicativos de recuperação de informações musicais, como classificação de gênero, medidas de similaridade de áudio, etc.

Quais são os recursos do MFCC?

A técnica de extração do recurso MFCC inclui basicamente a janela do sinal, a aplicação da DFT, pegando o tronco da magnitude e, em seguida, distorce as frequências em uma escala MEL, seguida pela aplicação do DCT inverso. A descrição detalhada de várias etapas envolvidas na extração do recurso MFCC é explicada abaixo.

Por que o MFCC é tão popular?

A técnica do MFCC é a mais popular, tem uma grande conquista e amplamente usada nos sistemas de reconhecimento de falantes e fala [35, 36]. Ele é baseado em uma escala logarítmica e é capaz de estimar a resposta auditiva humana de uma maneira melhor do que as outras técnicas de extração de recursos cepstrais [37,38]. ...

Como você pode obter o comprimento de onda/frequência média de uma transformação discreta de Fourier (DFT)?
Qual é a fórmula DFT?O que é frequência DFT?Como você encontra a resolução de frequência no DFT? Qual é a fórmula DFT?xn = n1k = 0∑n - 1xke2πikn/n. ...
Como obter treliça de modulação com código de trellis após o conjunto de partições?
O que é codificação de treliça?Por que a modulação codificada para treliça é necessária?Quais são as vantagens dos códigos de treliça? O que é codif...
Como implementar um bloco de python incorporado básico no GNU Radio FlowGraph?
O que são blocos de rádio GNU? O que são blocos de rádio GNU?Muitos aplicativos de rádio GNU não contêm nada além de um gráfico de fluxo. Os nós des...