Pasar al contenido principal
ekaia
2024 | 16 Octubre

Síntesis del habla ética

Existe un creciente interés en los sistemas text-to-speech (TTS) con voces de género ambiguo, debido a su capacidad para evitar sesgos de género y estereotipos en asistentes virtuales y altavoces inteligentes.

 

Hemos publicado el artículo titulado "Síntesis del habla de género ambiguo en euskera a través de la manipulación de los vectores de hablantes" en la revista de ciencia y tecnología Ekaia de la UPV/EHU. Aplicamos nuevas técnicas de conversión de voz a los vectores de hablantes para obtener sistemas TTS en euskera de género ambiguo, basados en redes neuronales. Los vectores de hablantes se obtienen mediante el entrenamiento de Tacotron 2 multispeaker. Hemos comparado la normalización de los vectores de hablantes y los sistemas que utilizan y no utilizan un parámetro de escala, evaluando la calidad de las voces sintéticas generadas, tanto normales como transformadas. Los resultados demuestran que los métodos presentados son efectivos para generar voces de género ambiguo y que los niveles de calidad alcanzados son aceptables.