Información detallada Tesis (Metadatos y Resúmenes)

Título:
Sistema de reconocimiento de voz para activación de dispositivos electrónicos, implementado con redes neuronales
Autor:
Mansilla Vidal, Sergio Eduardo
Profesor Patrocinante:
Morales Vilugrón, Jorge Antonio
Grado a Optar:
Ingeniero Electrónico - Licenciado en Ciencias de la Ingeniería
Materia:
reconocimiento automático de la voz - redes neuronales; dispositivos de entrada activada de voz
Universidad:
Universidad Austral de Chile
Facultad:
Facultad de Ciencias de la Ingeniería
Escuela:
Escuela de Electricidad y Electrónica
Año de Aceptación:
2007
Resumen:
Este trabajo consiste en el desarrollo de un sistema capaz de reconocer palabras pronunciadas por un locutor y a partir de ello realizar una acción determinada. Para este propósito se recurrió al recurso tecnológico enmarcado en lo que es la inteligencia artificial denominado redes neuronales artificiales, caracterizadas por su capacidad de generalizar y reconocer patrones en informaciones cuyo conocimiento no está formalizado, y que en la voz humana es complicado de modelar debido a la aleatoriedad de su forma. En este sentido las redes neuronales artificiales surgen como una solución a este problema y muestran mejores prestaciones que otras tecnologías. El sistema será capaz de reconocer palabras aisladas independientes del locutor, lo que significa que cualquier persona podrá utilizar el sistema sin modificarlo. Los fonemas identificados serán usados como comandos que ordenen realizar una acción de control sobre un dispositivo eléctrico. Para esto se desarrollará un software basado en redes neuronales, utilizando VISUAL BASIC e instalado en un PC siendo este último quien se comunique con el dispositivo a controlar por medio de sus puertos. La implementación del sistema involucrará el diseño de la red neuronal, la creación de los set de entrenamiento y el entrenamiento mismo, presentando un detalle de los resultados obtenidos en este trabajo. Además, se desarrollará un sistema de comando que permita una fácil operación y visualización de los eventos. Asimismo se construirán algunos dispositivos electromecánicos que permitan su manipulación desde el PC a través de los comandos de voz reconocidos por el sistema. Finalmente se mostrarán los resultados conseguidos realizando un análisis d estos en las conclusiones del trabajo, donde se tratarán los puntos altos y bajos de este, así como algunas propuestas para mejorar el sistema.
Abstract:
This research involves the development of a system capable of recognizing words pronounced by a speaker and from that performing a determined action. For this purpose, within the framework of the artificial intelligence, a technological resource, named Artificial Neural Network was utilized. This technology is characterized by its ability of generalizing and recognizing patterns in pieces of information whose knowledge is not formalized, and in the human voice is difficult to model them due to their random shape. In this sense, Artificial Neural Networks emerge as a solution of this problem and they show better performance than other technologies. The system will be able to recognize isolated words, independently from its speaker, which means that any person could use the system without modifying it. The identified phonemes will be used as commands that order to perform a control action over an electrical device. For this matter, a software based on neural networks installed in a PC will be developed, using VISUAL BASIC. The PC will be in charge of communicating with the controlling device through its ports. The system implementation will involve the neural network design, the creation of the training sets and the training itself, presenting a detailed description of the results obtained in this work. Besides that, a control system that allows its easy display and operation of the events will be developed. Moreover, some electrical-mechanical devices will be built which will allow their operation from the PC through voice commands recognized by the system. Finally, the obtained results will be shown in the conclusions of this work, carrying out a deeper analysis of them. Here, some advantages and disadvantages of the system, likewise, some answers to improve it will be explained.
Palabras Clave:
reconocimiento automático de la voz - redes neuronales; dispositivos de entrada activada de voz
Editor:
Universidad Austral de Chile - Sistema de Bibliotecas - Programa Cybertesis
Formato:
text/pdf
Idioma:
es
Copyright:
Mansilla Vidal, Sergio Eduardo
Dirección Electrónica:
http://cybertesis.uach.cl/tesis/uach/2007/bmfcim288s/doc/bmfcim288s.pdf