Clasificación de reseñas de Amazon utilizando NLP y Random Forest
PDF

Cómo citar

Ruvalcaba García, M., López Ramírez, M., Cabal Yépez, E., & Guzmán Cabrera, R. (2024). Clasificación de reseñas de Amazon utilizando NLP y Random Forest. JÓVENES EN LA CIENCIA, 25, 1–6. Recuperado a partir de https://www.jovenesenlaciencia.ugto.mx/index.php/jovenesenlaciencia/article/view/4215

Resumen

En este trabajo se realizó el análisis y clasificación de reseñas de productos de Amazon contenidas en un conjunto de datos. Primeramente, fue necesario llevar a cabo un preprocesamiento a dichas opiniones, con la finalidad de aplicarles una depuración previo a la clasificación. Las variables que se tomaron en cuenta para la depuración fueron: eliminación de palabras de parada o “stop words”, lematización, eliminación de palabras de poca frecuencia y ganancia de información. La clasificación de las reseñas se efectuó mediante el método de aprendizaje Random Forest, para esto se utilizó la herramienta de software Weka. Se eligió esta herramienta debido a que es ampliamente utilizada para minería de datos, aprendizaje automático y diversas tareas relacionadas con el análisis de datos. Los resultados obtenidos en la clasificación fueron muy alentadores sobrepasando el 80% de precisión para el método de aprendizaje seleccionado.

PDF
Creative Commons License

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.