Publicaciones y trabajos científicos

A la vanguardia de la I+D en biometría de voz.

En Biometric Vox diseñamos soluciones basadas en la biometría de voz, como la verificación/identificación, firma electrónica avanzada por voz y transcripción de voz a texto.

Apostamos firmemente por innovar en nuestro productos y estar a la vanguardia de la investigación. Esta sección es una muestra de las investigaciones y trabajos científicos publicados, así como los trabajos fin de grado o máster que han sido tutelados y apoyados por nuestro equipo de I+D.

Publicaciones científicas realizadas:

2023

Grau, T., Hernández, J.M. (2023) The Biometric Vox System Description for VoxCeleb Speaker Recognition Challange 2023. Enlace a paper

2021

Cáceres, J., Font, R., Grau, T., Molina, J. (2021) The Biometric Vox System for the ASVspoof 2021 Challenge. Proc. 2021 Edition of the Automatic Speaker Verification and Spoofing Countermeasures Challenge, 68-74, doi: 10.21437/ASVSPOOF.2021-11
R. Kamble, J. A. Gonzalez-Lopez, T. Grau, J. M. Espin, L. Cascioli, Y. Huang, A. Gómez-Alanis, J. Patino, R. Font, A. M. Peinado, A.M. Gómez, N. Evans, M. A. Zuluaga, M. Todisco, PANACEA Cough Sound-Based Diagnosis of COVID-19 for the DiCOVA 2021 Challenge. Proc. Interspeech 2021, 906-910, doi: 10.21437/Interspeech.2021-1062
Font, T. Grau, The Biometric Vox System for the Albayzin-RTVE 2020 Speaker Diarization and Identity Assignment Challenge. Proc. IberSPEECH 2021, 86-89, doi: 10.21437/IberSPEECH.2021-18
Font, T. Grau, The Biometric Vox System for the Albayzin-RTVE 2020 Speech-to-Text Challenge. Proc. IberSPEECH 2021, 99-103, doi: 10.21437/IberSPEECH.2021-21
J. Cáceres, R. Font, T. Grau, J. Molina, The Biometric Vox System for the ASVspoof 2021 Challenge. Proc. ASVspoof 2021 Workshop. doi: https://doi.org/10.21437/ASVSPOOF.2021-11

2019

R. Font, “A Denoising Autoencoder for Speaker Recognition. Results on the MCE 2018 Challenge,” ICASSP 2019 – 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brighton, United Kingdom, 2019, pp. 6016-6020, doi: 10.1109/ICASSP.2019.8683525.

2018

Espín, J.M., Font, R., Inglés-Romero, J.F., Vicente-Chicote, C. (2018) Towards the Application of Global Quality-of-Service Metrics in Biometric Systems. Proc. IberSPEECH 2018, 159-160. PDF
Inglés-Romero, J.F., Espín, J.M., Jiménez-Andreu, R., Font, R., & Vicente-Chicote, C. (2018). Towards the use of Quality-of-Service Metrics in Reinforcement Learning: A Robotics Example. MODELS Workshops. PDF
J. M. Espín, R. Font, J. G. Marín-Blazquez and F. Esquembre, “Logical access attacks detection through audio fingerprinting in automatic speaker verficaction,” 2018 IEEE 28th International Workshop on Machine Learning for Signal Processing (MLSP), Aalborg, 2018, pp. 1-6, doi: 10.1109/MLSP.2018.8517013.
Vicente-Chicote, C., Berrocal, J., García-Alonso, J., Hernández, J., Bandera, A., Martínez, J., Romero-Garcés, A., Font, R., & Inglés-Romero, J.F. (2018). RoQME : Dealing with Non-Functional Properties through Global Robot QoS Metrics.JISBD 2018 – XXIII Jornadas de Ingeniería del Software y Bases de Datos. Sevilla (Spain). handle: 11705/JISBD/2018/047

2017

Font, R., Espín, J.M., Cano, M.J. (2017) Experimental Analysis of Features for Replay Attack Detection — Results on the ASVspoof 2017 Challenge. Proc. Interspeech 2017, 7-11, DOI: 10.21437/Interspeech.2017-450.

Trabajos tutelados:

2020

TFM.- Sistema de identificación de distorsión de audio mediante red neuronal. Joaquín Cáceres Galán, Antonio Miguel Peinado Herreros

Ángel Manuel Gómez García, Alejandro Gómez Alanís. Ingeniería de Telecomunicación. Escuela Técnia Superior de Ingenierías Informática y de Telecomunicación. Universidad de Granada.

2018

TFG.- Evaluación de técnicas de clasificación supervisada en la autenticación por voz. Álvaro García Ródenas, Manuel Franco Nicolás, Juana María Vivo Molita. Grado en Matemáticas. Facultad de Matemáticas. Universidad de Murcia
TFG.- Aplicación de Denoising Autoencoders para el reconocimiento de hablantes. Álvaro García Ródenas, Jesualdo Tomás Fernández Breis, Manuel Franco Nicolás. Grado en Ingeniería Informática. Facultad de Informática. Universidad de Murcia

2017

TFM.- Reconocimiento automático de locutor a través de aprendizaje automático mediante redes neuronales empleando el paquete de software libre Kaldi. Rubén Jiménez Andreu, Francisco Periago Esparza, Roberto Javier Font Ruiz. Máster en Ingeniería industrial. Universidad Politécnica de Cartagena.