Clasificación de reseñas de Amazon utilizando NLP y Random Forest

Marcos Ruvalcaba García; Misael López Ramírez; Eduardo Cabal Yépez; Rafel Guzmán Cabrera

Vol. 25 (2024), Artículos

Vol. 25 (2024)

Clasificación de reseñas de Amazon utilizando NLP y Random Forest

Artículos

Publicado 2024-01-10

Marcos Ruvalcaba García⁺⁻
Misael López Ramírez⁺⁻
Eduardo Cabal Yépez⁺⁻
Rafel Guzmán Cabrera⁺⁻

Marcos Ruvalcaba García

Universidad de Guanajuato

Misael López Ramírez

Universidad de Guanajuato

Eduardo Cabal Yépez

Universidad de Guanajuato

Rafel Guzmán Cabrera

Universidad de Guanajuato

PDF

Cómo citar

Clasificación de reseñas de Amazon utilizando NLP y Random Forest. (2024). JÓVENES EN LA CIENCIA, 25, 1-6. https://www.jovenesenlaciencia.ugto.mx/index.php/jovenesenlaciencia/article/view/4215

Resumen

En este trabajo se realizó el análisis y clasificación de reseñas de productos de Amazon contenidas en un conjunto de datos. Primeramente, fue necesario llevar a cabo un preprocesamiento a dichas opiniones, con la finalidad de aplicarles una depuración previo a la clasificación. Las variables que se tomaron en cuenta para la depuración fueron: eliminación de palabras de parada o “stop words”, lematización, eliminación de palabras de poca frecuencia y ganancia de información. La clasificación de las reseñas se efectuó mediante el método de aprendizaje Random Forest, para esto se utilizó la herramienta de software Weka. Se eligió esta herramienta debido a que es ampliamente utilizada para minería de datos, aprendizaje automático y diversas tareas relacionadas con el análisis de datos. Los resultados obtenidos en la clasificación fueron muy alentadores sobrepasando el 80% de precisión para el método de aprendizaje seleccionado.

PDF

Referencias

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.

Clasificación de reseñas de Amazon utilizando NLP y Random Forest

Cómo citar

Descargar cita

Resumen

Referencias