Ayuda
Ir al contenido

Dialnet


Nuevas aproximaciones al reconocimiento automático del habla mediante grafos de palabras y técnicas de aprendizaje no supervisado

  • Autores: Jon Ander Gómez
  • Directores de la Tesis: Emilio Sanchís Arnal (dir. tes.), María José Castro Bleda (codir. tes.)
  • Lectura: En la Universitat Politècnica de València ( España ) en 2004
  • Idioma: español
  • Tribunal Calificador de la Tesis: Antonio José Rubio Ayuso (presid.), Isabel Galiano Ronda (secret.), Eduardo Lleida Solano (voc.), Pablo Aibar (voc.), Ferrán Pla (voc.)
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • El habla es uno de los medios más naturales para el intercambio de información entre humanos. Esto ha despertado un crecimiento interés en construir máquinas que puedan aceptar la señal vocal como entrada y actuar en función de la información transmitida. La cantidad de aplicaciones en las que utilizar máquinas que fueran capaces de entender la voz humana es considerable.

      El propósito de un sistema de reconocimiento del habla continua es proporcionar un mecanismo eficiente y preciso para transcribir la señal vocal a texto.

      Empezando por el nivel más bajo, para el reconocimiento del habla mediante computadoras debemos asignar una unidad lingüística a cada trozo de señal vocal, y a partir de ahí combinar dichas unidades para formar palabras, frases, acciones, instrucciones, etc.

      En la mayoría de los sistemas estas unidades son los fonemas, los sonidos básicos de una lengua.

      Para pasar de las unidades básicas a las frases pronunciadas un sistma de reconocimiento del habla ha de combinar distintas fuentes de conocimiento: acústico, fonético, léxico y sintáctico.

      Si además, quiere ampliarse a comprensión del habla ha de aplicar conocimiento semántico.

      La aproximación estándar, ampliamente utilizada en nuestros días y que aporta mejores resultados, integra todas las fuentes de conocimiento en una sola etapa de reconocimiento.

      El trabajo presentado en esta tesis propone un sistema de Reconocimiento Automático del Habla desacoplado donde las distintas fuentes de conocimiento intervienen de manera secuencial.

      Frente a un único módulo nuestro sistema se compone de varios módulos dispuestos en serie.

      Cada módulo trabaja a un nivel de conocimiento diferente, desde el acústico-fonético hasta el semántico pasando por el léxico y el sintáctico.

      Uno de los puntos más importantes y delicados ha sido el diseño de las interfaces entre módulos, donde debía prevalecer un objetivo: transferir únic


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno