- O que é DCT no MFCC?
- Como você explica o MFCC?
- Qual é a saída da extração do recurso MFCC?
- Por que usamos transformação discreta de cosseno?
O que é DCT no MFCC?
DCT é a última etapa do processo principal de extração de recursos do MFCC. O conceito básico de DCT está correlacionando o valor do espectro MEL, de modo a produzir uma boa representação do local espectral. Basicamente, o conceito de DCT é o mesmo que a transformação inversa de Fourier.
Como você explica o MFCC?
Os coeficientes cepstrais de frequência MEL (MFCCs) de um sinal são um pequeno conjunto de recursos (geralmente cerca de 10-20) que descrevem concisa a forma geral de um envelope espectral. Em mir, é frequentemente usado para descrever o timbre.
Qual é a saída da extração do recurso MFCC?
A saída após a aplicação do MFCC é uma matriz com vetores de características extraídos de todos os quadros. Nesta matriz de saída, as linhas representam os números e colunas de quadros correspondentes representam coeficientes de vetor de características correspondentes [1-4]. Finalmente, esta matriz de saída é usada para o processo de classificação.
Por que usamos transformação discreta de cosseno?
A transformação de cosseno discreto é usada na compressão de imagem com perdas porque tem uma compactação de energia muito forte, i.e., Sua grande quantidade de informação é armazenada em componente de frequência muito baixa de um sinal e repouso em outra frequência com dados muito pequenos que podem ser armazenados usando muito menos número de bits (geralmente, no máximo 2 ...