Mejora de la frecuencia fundamental en la conversión de texto a voz

  1. Vallejo Pinto, José Angel
Dirigida per:
  1. José Manuel Pardo Muñoz Director/a

Universitat de defensa: Universidad Politécnica de Madrid

Any de defensa: 1999

Tribunal:
  1. Andrés de Santos Lleó President/a
  2. Ricardo De Córdoba Herralde Secretari/ària
  3. Emilia V. Enríquez Carrasco Vocal
  4. Juan Antonio Álvarez González Vocal
  5. José Carlos González Cristobal Vocal

Tipus: Tesi

Teseo: 73304 DIALNET

Resum

El principal objetivo de este trabajo ha sido, como su título indica la mejora de la frecuencia fundamental en la conversión de texto a voz, buscando no solo la obtención de un sistema que genere curvas de frecuencia fundamental de mayor calidad, sino también la definición de una metodología de trabajo que permita la obtención de modelos de entonación de nuevos locutores de forma sencilla y practicamente automática, El trabajo ha constado de las siguientes fases: 1) Definición y creación de una base de datos apta para el estudio de los fenómenos prosódicos. 2) Experimentación con redes neuronales como método de generación de curvas de frecuencia fundamental. Se ha centrado en la determinación y codificación de los parámetros más relevantes así como en la optimización de la topología y de los parámetros de entrenamiento de las redes neuronales utilizadas. 3) Concepción de un sistema de evaluación que permita la comparación de distintos sistemas de generación de curvas de frecuencia fundamental.