- Quantos coeficientes de MFCC devo usar?
- Qual é a saída do MFCC?
- Qual é o comprimento do salto no MFCC?
Quantos coeficientes de MFCC devo usar?
Na prática, os primeiros 8 a 13 coeficientes de MFCC são usados para representar a forma do espectro. No entanto, algumas aplicações exigem mais coeficientes de ordem superior para capturar informações de tom e tonalidade. Por exemplo, no reconhecimento de fala chinesa de até 20 coeficientes cepstrais podem ser benéficos [130].
Qual é a saída do MFCC?
A saída após a aplicação do MFCC é uma matriz com vetores de características extraídos de todos os quadros. Nesta matriz de saída, as linhas representam os números e colunas de quadros correspondentes representam coeficientes de vetor de características correspondentes [1-4]. Finalmente, esta matriz de saída é usada para o processo de classificação.
Qual é o comprimento do salto no MFCC?
O MFCC tem dois argumentos (que realmente passam para o STFT subjacente). win_length é o número de amostras incluídas em cada período; Padrão para 2048, ou ~ 93ms a 22 kHz SR. hop_length é o número de amostras entre janelas sucessivas; Seu padrão é 512, ou os 23 ms que você calculou.