Resumen
Mediante la captura de imágenes es posible encontrar patrones repetitivos, que a simple vista es sencillo distinguirlos como sentarse en una silla, sin embargo, una máquina no puede hacer este proceso de distinción tan fácilmente. Un sensor Kinect brinda la posibilidad de observar el entorno mediante la extracción de características de las imágenes RGB y de profundidad que adquiere. Las características calculadas mediante una computadora permiten detectar las actividades que una persona realiza. Así en este trabajo se capturan las acciones realizadas para su procesamiento, destacando la necesidad de encontrar las distancias entre 8 principales articulaciones del ser humano con respecto a una articulación de referencia, en nuestro caso la espina. De estas distancias y velocidades de las distancias se obtienen medias y desviaciones estándar para generar una clasificación mediante el clasificador de vecino más cercano (KNN). Además, se genera un módulo programado el cual es embebido a un sistema autónomo para en un futuro obtener una interacción real de un humano-máquina. Los resultados obtenidos presentan un asertividad de 74% para una base de datos capturada durante el desarrollo de este proyecto, que contiene 10 actividades realizadas por 27 personas y con 3 repeticiones de cada actividad.Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivadas 4.0 Internacional.