Abstract
En este trabajo se presenta el preprocesamiento y análisis de la base de datos Intel Lab Data, un registro público de observaciones de variables ambientales recolectadas por cincuenta y cuatro sensores distribuidos en el laboratorio de Intel en Berkeley, el cual tiene por objetivo su uso en aplicaciones de redes inalámbricas de sensores. Se realizó una limpieza profunda de los datos, incluyendo la eliminación de valores faltantes y atípicos, corrección de inconsistencias temporales y tratamiento del jitter mediante interpolación inteligente. Además, se aplicó un análisis de clustering con técnicas estadísticas y aprendizaje no supervisado, destacando la relevancia de los métodos del codo y Silhouette para determinar el número adecuado de grupos. Los resultados permitieron identificar claramente patrones espaciales y temporales en el comportamiento de los sensores, facilitando la interpretación de las condiciones ambientales dentro del laboratorio.

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.