Clasificación de reseñas de Amazon utilizando NLP y Random Forest
PDF (Español (España))

How to Cite

Ruvalcaba García, M., López Ramírez, M., Cabal Yépez, E., & Guzmán Cabrera, R. (2024). Clasificación de reseñas de Amazon utilizando NLP y Random Forest. Jóvenes En La Ciencia, 25, 1–6. Retrieved from https://www.jovenesenlaciencia.ugto.mx/index.php/jovenesenlaciencia/article/view/4215

Abstract

En este trabajo se realizó el análisis y clasificación de reseñas de productos de Amazon contenidas en un conjunto de datos. Primeramente, fue necesario llevar a cabo un preprocesamiento a dichas opiniones, con la finalidad de aplicarles una depuración previo a la clasificación. Las variables que se tomaron en cuenta para la depuración fueron: eliminación de palabras de parada o “stop words”, lematización, eliminación de palabras de poca frecuencia y ganancia de información. La clasificación de las reseñas se efectuó mediante el método de aprendizaje Random Forest, para esto se utilizó la herramienta de software Weka. Se eligió esta herramienta debido a que es ampliamente utilizada para minería de datos, aprendizaje automático y diversas tareas relacionadas con el análisis de datos. Los resultados obtenidos en la clasificación fueron muy alentadores sobrepasando el 80% de precisión para el método de aprendizaje seleccionado.

PDF (Español (España))
Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.