Qual é o significado do MFCC?
Os MFCCs são comumente usados como recursos em sistemas de reconhecimento de fala, como os sistemas que podem reconhecer automaticamente os números falados em um telefone. Os MFCCs também estão cada vez mais encontrando usos em aplicativos de recuperação de informações musicais, como classificação de gênero, medidas de similaridade de áudio, etc.
Por que usamos o DCT no MFCC?
DCT é a última etapa do processo principal de extração de recursos do MFCC. O conceito básico de DCT está correlacionando o valor do espectro MEL, de modo a produzir uma boa representação do local espectral. Basicamente, o conceito de DCT é o mesmo que a transformação inversa de Fourier.