Tempo

Dinâmico de deformação de tempo para reconhecimento de voz

Dinâmico de deformação de tempo para reconhecimento de voz
  1. O que é DTW no reconhecimento de fala?
  2. Por que o tempo dinâmico é útil?
  3. Como funciona o algoritmo DTW?

O que é DTW no reconhecimento de fala?

DTW é um método para medir a semelhança de um padrão com diferentes fusos horários. Quanto menor a distância produzida, mais semelhante entre os dois padrões de som. Ambos os padrões de som são semelhantes, portanto as duas vozes são as mesmas.

Por que o tempo dinâmico é útil?

A deformação dinâmica do tempo é usada para comparar a similaridade ou calcular a distância entre duas matrizes ou séries temporais com comprimento diferente. Como fazer isso? Uma maneira óbvia é combinar A e B de 1 a 1 e resumir a distância total de cada componente.

Como funciona o algoritmo DTW?

Dynamic Time Deforping (DTW) é um algoritmo de alinhamento de séries temporais desenvolvido originalmente para reconhecimento de fala(1). O objetivo é alinhar duas sequências de vetores de características, distorcendo o eixo do tempo iterativamente até que uma correspondência ideal (de acordo com uma métrica adequada) entre as duas seqüências seja encontrada.

Objetivo da equalização do histograma
A equalização do histograma é um método para processar imagens para ajustar o contraste de uma imagem modificando a distribuição de intensidade do his...
Estimativa de erro, estimativa de parâmetros
O que é estimativa de estimativa de parâmetros?O que é erro de estimativa?Quais são os dois tipos de estimativa de parâmetros?Quais são as duas fonte...
Como faço para estimar possíveis frequências de alias na amostragem de medições limitadas?
O que é o alias na amostragem?Como um sinal limitado de banda pode ser amostrado sem alias?Como você encontra a frequência mínima de amostragem?O que...