- Quais são os recursos do MFCC?
- Quais são os 39 recursos do MFCC?
- O que o MFCC mede?
- Para que é usado o MFCC para?
Quais são os recursos do MFCC?
A técnica de extração do recurso MFCC inclui basicamente a janela do sinal, a aplicação da DFT, pegando o tronco da magnitude e, em seguida, distorce as frequências em uma escala MEL, seguida pela aplicação do DCT inverso. A descrição detalhada de várias etapas envolvidas na extração do recurso MFCC é explicada abaixo.
Quais são os 39 recursos do MFCC?
Portanto, os 39 recursos do MFCC são 12 coeficientes de cepstrum, mais o termo de energia. Em seguida, temos mais 2 conjuntos correspondentes ao delta e aos valores duplos delta. Em seguida, podemos executar a normalização do recurso. Normalizamos os recursos com sua média e a dividimos por sua variação.
O que o MFCC mede?
Os coeficientes cepstrais de frequência MEL (MFCCs) de um sinal são um pequeno conjunto de recursos (geralmente cerca de 10-20) que descrevem concisa a forma geral de um envelope espectral. Em mir, é frequentemente usado para descrever o timbre.
Para que é usado o MFCC para?
Os MFCCs são comumente usados como recursos em sistemas de reconhecimento de fala, como os sistemas que podem reconhecer automaticamente os números falados em um telefone. Os MFCCs também estão cada vez mais encontrando usos em aplicativos de recuperação de informações musicais, como classificação de gênero, medidas de similaridade de áudio, etc.