Mejora de la frecuencia fundamental en la conversión de texto a voz

  1. Vallejo Pinto, José Angel
Dirigida por:
  1. José Manuel Pardo Muñoz Director/a

Universidad de defensa: Universidad Politécnica de Madrid

Año de defensa: 1999

Tribunal:
  1. Andrés de Santos Lleó Presidente/a
  2. Ricardo De Córdoba Herralde Secretario/a
  3. Emilia V. Enríquez Carrasco Vocal
  4. Juan Antonio Álvarez González Vocal
  5. José Carlos González Cristobal Vocal

Tipo: Tesis

Teseo: 73304 DIALNET

Resumen

El principal objetivo de este trabajo ha sido, como su título indica la mejora de la frecuencia fundamental en la conversión de texto a voz, buscando no solo la obtención de un sistema que genere curvas de frecuencia fundamental de mayor calidad, sino también la definición de una metodología de trabajo que permita la obtención de modelos de entonación de nuevos locutores de forma sencilla y practicamente automática, El trabajo ha constado de las siguientes fases: 1) Definición y creación de una base de datos apta para el estudio de los fenómenos prosódicos. 2) Experimentación con redes neuronales como método de generación de curvas de frecuencia fundamental. Se ha centrado en la determinación y codificación de los parámetros más relevantes así como en la optimización de la topología y de los parámetros de entrenamiento de las redes neuronales utilizadas. 3) Concepción de un sistema de evaluación que permita la comparación de distintos sistemas de generación de curvas de frecuencia fundamental.