Continuando con la entrega de las actividades del científico de datos (La fase de transformación de datos), durante esta entrega se desarrolla la tercera fase de análisis y modelación de datos, que toma como insumos los datos previamente transformados de la Fase 2.
Fase 3: Análisis y modelación de datos
Es la fase que toma los datos limpios, transformados y listos para trabajar los análisis y modelos, donde intervienen los analistas de datos y programadores especializados en modelos matemáticos.
En esta fase es donde es utilizado el instrumental estadístico intermedio avanzado, matemático, uso de herramientas tecnológicas de análisis de datos, así como la programación, además es necesario el conocimiento del negocio, todo esto de forma intensiva para lograr obtener la información relevante y presentar los principales resultados en la cuarta y última fase.
Algunas de las principales actividades realizadas en esta fase son:
- Generar indicadores: por medio del análisis de datos se desarrollan indicadores estadísticos descriptivos e inferenciales, muchos de los cuales alimentan los modelos matemáticos.
- Interpretar los datos: por medio de los conocimientos del negocio y el instrumental técnico de estadística y matemática, se logra determinar cuáles de indicadores obtenidos son relevantes para atender la tarea que se está trabajando.
- Preparar datos para modelos matemáticos: por medio del análisis de los datos, existen también algunas transformaciones y preparaciones de los datos para poder correr (realizar) efectivamente los modelos de predicción o pronóstico (se verifica la consistencia y realizan calibración de los datos para los modelos propuestos).
- Modelar los datos: Se hace la modelación estadístico-matemático de los datos para descubrir patrones (comportamientos) en ellos que con métodos estadísticos básicos no se logran apreciar.
- Automatizar soluciones: por medio del uso de la programación se pueden generar soluciones automáticas a problemas particulares de esta fase.
- Documentación: se debe realizar reportes y documentos para registrar los hallazgos, permitiendo así sintetizar el trabajo de análisis y modelación efectuado.
- Presentaciones: es necesario preparar las presentaciones o visualizaciones de los datos para mostrarlos a los directivos o autoridades de la organización y todos los interesados en los resultados obtenidos y divulgarlos en la Fase 4.
En esta fase 3 de análisis y modelación de datos, el científico de datos, al utilizar todas las herramientas técnicas de estadísticas y matemáticas avanzadas, se convierte en un generador de conocimiento nuevo, riguroso y evidenciado científicamente, que permite una orientación profesional en la toma de decisiones a las empresas, organizaciones e instituciones, algo que cada vez es más solicitado y donde más promociones deben realizarse para motivar a formar esta espacialidad. Con los avances tecnológicos y disposición de datos actuales (que se incrementarán a futuro) se debe procurar tener estos perfiles y motivar estas acciones, por encima de los juicios de valor que tradicionalmente se utilizaron antes, las mejores organizaciones ya trabajan de esa manera. En la siguiente entrega terminaremos con la Fase 4 y última de esta sería de entregas.