Descubre las claves para supervisar de manera eficiente el proceso de análisis de datos, desde la selección de fuentes de información hasta la interpretación de los resultados. Aprende a identificar y solucionar posibles obstáculos y a maximizar los beneficios de tus proyectos de análisis de datos con esta guía práctica.
Muchas veces, dependiendo del tamaño de la organización, el líder de las áreas de análisis o quien los supervisa, puede que no sea experto en análisis o tenga tiempo limitado entre las diferentes tareas de rol.
Lo primero que hay que entender es que la analítica o el hecho de querer transformar los datos en nuevo conocimiento de valor para la organización es un proceso, con una serie de pasos a ejecutar, con un orden bastante específico. Lo que también es cierto, que debes contar con una caja de herramientas en donde tiene diferentes instrumentos que aplicas en función de las necesidades del caso, sin perder de vista que lo importante es el beneficio que se obtiene para la organización del proceso.
Para dar seguimiento y ver los avances del proceso de analítica, seas líder o parte del equipo, lo que me funciona es listar las tareas que se requieren realizar y asignar una ventana de tiempo a cada etapa (suena lógico), pero a veces se comete el error de profundizar o entender la información (y se invierte mucho tiempo en ello) sin una ventana específica de análisis o los resultado esperados, y quien supervisa no tiene control alguno sobre los avances.
Hay 5 grandes grupos de actividades:
Limpieza o preparación de los datos | Preparación para el modelo | El modelado y su validación en sí | La comunicación del resultado y cómo impacta en la organización | La operativización y actualización |
Comprende todo el proceso de “combinar” las diferentes tablas, “data frames” o grupos de información. | Es organizar los datos para ser incluidos en el modelo | Seleccionar los modelos de análisis | Evaluar con la capacidad de predicción como puedo generar valor | Implementar el modelo en producción, automatizado o no. |
Organizarlos, entenderlos, categorizarlos (o entender su tipo), romper la caja negra (saber que significan), y como pueden impactar en el resultado esperado. | Separar los datos entrenamiento y prueba. | Correr los resultados para identificar las capacidades de predicción | Identificar el proceso de implementación del nuevo modelo o el conocimiento generado. | Definir responsables y documentación del proceso |
Entender los valores atípicos. | Realizar el Balance de datos. | Ajustar el modelo en función de los resultados (nuevos datos, ajustes, transformaciones, exclusión de variables) | Iniciar proceso de prueba con la realidad | Establecer calendario de actualización del modelo (usualmente 1 vez al año) |
Completar los valores faltantes y definir el tipo de análisis a realizar. | Reducir el tamaño para correr más eficientemente los modelos, con la selección de variables. (Feature Selection). | Aplicar pruebas de errores, por ejemplo, para determinar que la varianza del error no distribuye aleatoriamente. | ||
Si alguien va a supervisar un equipo, ya sea que tiene limitaciones de tiempo o no es experto en analítica, el enfoque debe ser en:
1. Revisar los resultados del análisis exploratorio (ver cantidades, medias, modas, promedios, identificar problemas).
2. Comprender a profundidad los datos atípicos, que es un elemento que puede cambiar rotundamente un modelo o generar sesgos. Dar opinión en la forma como se van a manejar los datos atípicos. El manejo de datos atípicos tiene que ser antes de tratar los datos en blanco.
3. Entender el mecanismo de manejo de los datos en blancos, hay que considerar que más del 10% de los datos en blanco, dentro de un atributo, quizás lo mejor es descartarlo.
Si quieres obtener mas información sobre el tema o deseas una asesoría personalizada, contáctanos.
Tenemos las herramientas y conocimientos necesarios para ayudarte a lograr tus objetivos.
Suscríbete para recibir más noticias!