Modelo de classificação MFCC

Por que o MFCC é usado na classificação de áudio?
O que é o algoritmo MFCC?
Quais são os 39 recursos do MFCC?
O que é MFCC no aprendizado de máquina?

Por que o MFCC é usado na classificação de áudio?

Observa -se que extrair recursos do sinal de áudio e usá -lo como entrada para o modelo base produzirá um desempenho muito melhor do que considerar diretamente o sinal de áudio bruto como entrada. MFCC é a técnica amplamente usada para extrair os recursos do sinal de áudio.

O que é o algoritmo MFCC?

Os MFCCs são comumente usados como recursos em sistemas de reconhecimento de fala, como os sistemas que podem reconhecer automaticamente os números falados em um telefone. Os MFCCs também estão cada vez mais encontrando usos em aplicativos de recuperação de informações musicais, como classificação de gênero, medidas de similaridade de áudio, etc.

Quais são os 39 recursos do MFCC?

Portanto, os 39 recursos do MFCC são 12 coeficientes de cepstrum, mais o termo de energia. Em seguida, temos mais 2 conjuntos correspondentes ao delta e aos valores duplos delta. Em seguida, podemos executar a normalização do recurso. Normalizamos os recursos com sua média e a dividimos por sua variação.

O que é MFCC no aprendizado de máquina?

Esses coeficientes, chamados coeficientes cepstrais de Frequência Mel (MFCCs), são os recursos finais usados em muitos modelos de aprendizado de máquina treinado em dados de áudio!