La voz es una característica personal única, diferente para cada uno de nosotros. Con sólo escuchar una palabra podemos distinguir sin problemas la voz de nuestros familiares o amigos. Esto es así porque al hablar hacemos vibrar las cuerdas vocales generando una onda sonora que se va a ver modificada, en su camino al exterior, por el denominado tracto vocal: (garganta, cavidad buconasal, lengua, dientes…). Esta modificación depende de parámetros fisiológicos, como la longitud del cuello o la posición de los dientes, y por tanto es única para cada persona. Esto es lo que le da a cada voz sus características peculiares, y nos permite distinguirla de la demás.

Y, sin embargo, sabemos que la voz cambia. Sabemos que nuestra voz no suena igual al levantarnos por la mañana que unas horas después, si estamos tranquilos que si gritamos alterados… Esto hace que la biometría de voz sea mucho más difícil que, por ejemplo, la de huella dactilar; la huella dactilar es siempre esencialmente la misma.

Mediante un modelado estadístico, sin embargo, somos capaces de separar esta parte variable de la parte fija que nos identifica, nos distingue.

Durante la fase de registro o entrenamiento, tomamos una o varias muestras de voz de la persona, por ejemplo diciendo una frase o código personal, y analizamos estas muestras para aislar aquellas características que la hacen única y la distinguen de la de cualquier otra persona. Esto es lo que constituye la huella vocal, que queda almacenada desde ese momento.

entrenamiento-biometria-voz

Durante la fase de test, podemos comparar una muestra de voz con una huella vocal y saber si corresponden o no a la misma persona (esto se llama verificación), o compararla con varias huellas vocales y saber a quién pertenece (esto se llama identificación).

verificacion-biometria-voz