Resumen
En este trabajo se realizó el análisis y clasificación de reseñas de productos de Amazon contenidas en un conjunto de datos. Primeramente, fue necesario llevar a cabo un preprocesamiento a dichas opiniones, con la finalidad de aplicarles una depuración previo a la clasificación. Las variables que se tomaron en cuenta para la depuración fueron: eliminación de palabras de parada o “stop words”, lematización, eliminación de palabras de poca frecuencia y ganancia de información. La clasificación de las reseñas se efectuó mediante el método de aprendizaje Random Forest, para esto se utilizó la herramienta de software Weka. Se eligió esta herramienta debido a que es ampliamente utilizada para minería de datos, aprendizaje automático y diversas tareas relacionadas con el análisis de datos. Los resultados obtenidos en la clasificación fueron muy alentadores sobrepasando el 80% de precisión para el método de aprendizaje seleccionado.
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.