Mejora de la frecuencia fundamental en la conversión de texto a voz
- Vallejo Pinto, José Angel
- José Manuel Pardo Muñoz Director/a
Universidad de defensa: Universidad Politécnica de Madrid
Año de defensa: 1999
- Andrés de Santos Lleó Presidente/a
- Ricardo De Córdoba Herralde Secretario/a
- Emilia V. Enríquez Carrasco Vocal
- Juan Antonio Álvarez González Vocal
- José Carlos González Cristobal Vocal
Tipo: Tesis
Resumen
El principal objetivo de este trabajo ha sido, como su título indica la mejora de la frecuencia fundamental en la conversión de texto a voz, buscando no solo la obtención de un sistema que genere curvas de frecuencia fundamental de mayor calidad, sino también la definición de una metodología de trabajo que permita la obtención de modelos de entonación de nuevos locutores de forma sencilla y practicamente automática, El trabajo ha constado de las siguientes fases: 1) Definición y creación de una base de datos apta para el estudio de los fenómenos prosódicos. 2) Experimentación con redes neuronales como método de generación de curvas de frecuencia fundamental. Se ha centrado en la determinación y codificación de los parámetros más relevantes así como en la optimización de la topología y de los parámetros de entrenamiento de las redes neuronales utilizadas. 3) Concepción de un sistema de evaluación que permita la comparación de distintos sistemas de generación de curvas de frecuencia fundamental.