El reconocimiento automático de habla consiste, en su acepción más general, en la trasncripción de voz a texto, Es una de las áreas más importantes del aprendizaje automático, por la gran cantidad de aplicaciones que pude tener en todos los ámbitos de la vida cotidiana. A la vez, es una de las áreas que presenta mayor dificultad debido principalmente a la gran variabilidad del habla, de los locutores y de las tareas abordar. En las dos últimas décadas la comunidad científica ha invertido un enorme esfuerzo en este campo de investigación y se han diseñado sistemas que en la actualidad alcanzan alrededor de un 90% de procentaje de palabras correctamente reconocidas en tareas de dominio restringido. La metodología más utilizada a la hora de abordar este problema es la basada en la utilización de modelos ocultos de Markov.
Recientemente se han propuesto modelos acústicos híbridos para tareas de reconocimiento automático del habla: sistemas basados en la combinación de modelos ocultos de Markov y redes neuronales. En este trabajo se investigan modelos híbridos de estas características y también se proponen otros sistemas que combinan autómatas inferidos con metodologías de inferencia gramatical con redes neuronales.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados