- O que é x vetor no reconhecimento de fala?
- O que é i-vetor e D-vetor?
- O que é o IVECTORS?
- O que é modelo de fundo universal?
O que é x vetor no reconhecimento de fala?
Vetores X são as incorporações extraídas da primeira camada de nível de segmento do DNN. Eles são uma representação do segmento de áudio e representam um orador quando são calculados em média sobre diferentes segmentos de áudio do mesmo orador.
O que é i-vetor e D-vetor?
D-vetor é a ativação média da última camada oculta deste DNN. Então, diferentemente da estrutura do vetor I, isso não tem nenhuma suposição sobre a distribuição do recurso (a estrutura do vetor I pressupõe que o vetor I, ou a variável latente tenha uma distribuição gaussiana).
O que é o IVECTORS?
seu ivector [1], um vetor de baixa dimensão indicando o coordenado desse enunciado em um modelo acústico de subespaço. Nós mostramos. que a distribuição dos ivectores pode caracterizar um conjunto de dados e. permite distinguir subconjuntos de enunciados de diferentes do-
O que é modelo de fundo universal?
Um modelo de fundo universal (UBM) é um modelo usado em um sistema de verificação biométrica para representar características gerais e independentes da pessoa a serem comparadas com um modelo de características de recursos específicas da pessoa ao tomar uma decisão aceita ou rejeição.