Resumen
En este trabajo se presenta un nuevo enfoque para el reconocimiento de expresiones faciales en imágenes mediante el uso de bosquejos (o bocetos, aunque no son exactamente sinónimos, los términos se usarán indistintamente en esta trabajo) y el descriptor denominado Histograma de Gradientes Orientados, combinado con una Red Neuronal Artificial usada como clasificador. El objetivo principal de esta investigación es desarrollar un sistema preciso y eficiente, capaz de reconocer expresiones en rostros humanos, posibilitando aplicaciones significativas en campos como el análisis del comportamiento humano, las interfaces hombre- máquina y los sistemas de vigilancia emocional.
En el desarrollo de esta propuesta, se utilizó la base de datos conocida como “FACES” en su versión de libre uso, la cual consta de un total de 72 imágenes faciales divididas en seis expresiones distintas: Enojo, Disgusto, Miedo, Felicidad, Neutralidad y Tristeza. Las imágenes fueron preprocesadas realizando un cambio de escala y convirtiéndolas a escala de grises para posteriormente efectuar la detección facial y la estimación de los puntos de referencia faciales (landmarks) y con éstos dibujar el bosquejo de las cejas, ojos y boca. Finalmente se aplicó una corrección de ángulo y una normalización para mejorar la consistencia del conjunto de datos.
El Histograma de Gradientes Orientados fue aplicado para extraer un vector de características de 81 datos, mediante el cálculo de los gradientes, la división de celdas y la construcción de histogramas de orientación de dichos gradientes. El modelo de reconocimiento utilizado fue una Red Neuronal Artificial tipo Perceptrón Multicapa, la cual se construyó con 3 capas constituidas de la siguiente manera: con un total de 81 neuronas en su capa de entrada, 163 en su capa intermedia y 6 en la capa de salida, realizando el entrenamiento de la Red Neuronal mediante el algoritmo de Retro-propagación.
Para evaluar el desempeño del modelo se utilizaron métricas de evaluación comúnmente empleadas en problemas de clasificación, tales como la exactitud, precision y la F1-score. Los resultados obtenidos fueron altamente satisfactorios, demostrando la efectividad del enfoque propuesto, donde el modelo alcanzó una exactitud del 97.22% en el reconocimiento de expresiones, además de mostrar valores elevados en las métricas calculadas, lo que respalda la precisión y la robustez del modelo.
En conclusión, el enfoque basado en los bocetos, el Histograma de Gradientes y la Red Neuronal Artificial ha demostrado ser una estrategia efectiva para la detección de emociones en imágenes faciales. Los resultados obtenidos sugieren que este sistema podría ser aplicado en diversas áreas, como interfaces interactivas más intuitivas, detección de estados emocionales en tiempo real y análisis de comportamiento humano. No obstante, es importante señalar que aún existen desafíos y oportunidades para mejorar el modelo, incluyendo la expansión del conjunto de datos y la exploración de arquitecturas de redes neuronales más complejas.
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.