FAQ. Preguntas frecuentes sobre el reconocimiento de voz

reconocimiento de voz

¿Qué es el reconocimiento de voz?

El reconocimiento de voz es un sistema basado principalmente en inteligencia artificial que permite identificar qué es lo que se dice y quién es la persona que lo dice. El proceso de identificación, en el caso de que considere parámetros biométricos del hablante, tiene un alto nivel de confiabilidad.
Además, al ser sistemas de fácil integración a distintos tipos de dispositivos, gozan de gran aceptación y popularidad en muy diversos sectores.

¿Cuál es la diferencia entre los términos reconocimiento de voz, reconocimiento del habla y reconocimiento del hablante?

El término ‘reconocimiento de voz’ se utiliza comúnmente para hacer referencia a los otros dos, esto es: reconocimiento del habla y reconocimiento del hablante. No obstante, técnicamente no son lo mismo. Reconocimiento del habla es la tecnología que detecta el lenguaje, qué es lo que se dice. El reconocimiento del hablante, por su parte, detecta quién es la persona que lo dice.

¿Cómo funciona el reconocimiento de voz?

Para el correcto funcionamiento del sistema es necesaria una fase previa de toma de muestras. En este punto, se obtienen los patrones biométricos vocales de cada individuo entre los que se encuentran parámetros como la forma, el tamaño de las cuerdas vocales, la velocidad o el acento del hablante, entre otros.
A partir de todos estos datos, se genera una huella vocal única de cada hablante que es almacenada y custodiada en una base de datos.
Durante la identificación, el sistema contrasta la muestra de voz con el modelo tomado y averigua si efectivamente se trata de esta persona.

¿Qué tecnología que utilizan los asistentes virtuales (Siri, Alexa, Google Assistant)?

Los asistentes virtuales utilizan las conocidas como tecnologías de reconocimiento del discurso o del habla, que lo que hacen no es reconocer al hablante sino lo que dice. Reconocen, por lo tanto, el lenguaje.

¿Cómo se comprueba la identidad?

La identidad de los usuarios se puede comprobar de dos formas distintas:

  1. Verificando
  2. La muestra de voz se compara con la huella vocal del hablante. En este caso se comprueba que la identidad de la persona corresponde con la de quien dice ser.

  3. Identificando

La voz del hablante se compara con todos los usuarios del sistema y se identifica quién es la persona que habla. En este caso la identificación consiste en saber quién es el que habla dentro de un conjunto de personas.
Además, tanto la identificación como la verificación pueden ser dependientes o independientes del texto

  • Es dependiente del texto cuando el sistema sabe de antemano lo que va a expresar el hablante. Es decir, se pide una frase previamente especificada.
  • Es independiente cuando el usuario puede decir cualquier cosa. Por ejemplo, se puede verificar la identidad de una persona mientras se mantiene una conversación espontánea.

¿En qué sectores se puede utilizar el reconocimiento de voz?

Las biometrías de reconocimiento de voz se pueden utilizar en prácticamente cualquier tipo de sector. Su aplicabilidad es tan variada y trasversal que resulta útil para el sector industrial, agrícola, servicios, transporte, sanitario, banca o seguros, entre muchos otros.
Hoy en día, por ejemplo, ya se está utilizando para evitar el fraude en entidades de crédito ya que imposibilita la usurpación de identidad. Por otro lado también se utiliza en muchas organizaciones ya para el control de presencia y de horario de los trabajadores.
Si aún tenéis alguna duda, en CheckVox podéis encontrar mucha más información sobre el reconocimiento de voz.

2018-09-26T10:55:55+00:00 viernes, 21 septiembre 2018|Biometría de voz, CheckVox|