- Como é a magnitude das frequências representadas em um espectrograma?
- O que é um espectrograma de magnitude?
- Por que usaríamos um espectrograma STFT para analisar a fala humana?
- Como você analisa um espectrograma?
Como é a magnitude das frequências representadas em um espectrograma?
Em um gráfico de representação do espectrograma - um eixo representa o tempo, o segundo eixo representa frequências e as cores representam magnitude (amplitude) da frequência observada em um determinado momento.
O que é um espectrograma de magnitude?
O espectrograma de magnitude log é definido como o espectro de magnitude escalonado logaritmicamente de um sinal ao longo do tempo. A vantagem do espectrograma de magnitude log é que ele mostra como a distribuição de energia evolui. A desvantagem é que ela representa apenas informações de magnitude.
Por que usaríamos um espectrograma STFT para analisar a fala humana?
O STFT é uma das ferramentas mais usadas na análise e processamento de fala. Ele descreve a evolução dos componentes de frequência ao longo do tempo. Como o próprio espectro, um dos benefícios dos STFTs é que seus parâmetros têm uma interpretação física e intuitiva.
Como você analisa um espectrograma?
Na visão do espectrograma, o eixo vertical exibe frequência em Hertz, o eixo horizontal representa o tempo (assim como a exibição da forma de onda) e a amplitude é representada pelo brilho. O fundo preto é o silêncio, enquanto a curva laranja brilhante é a onda seno.