Principales programas informáticos utilizados en la ciencia de datos

Fotografía de fauxels.

En esta ocasión presentaremos algunos de los programas informáticos más utilizados en la ciencia de datos según la fase de la cadena de valor donde es utilizado.

Aclaración. La siguiente lista no pretende ser exhaustiva sino más bien un punto de partida para tomar en cuenta para inversiones en infraestructura y en formación requerida del capital humano. La misma fue elaborada a partir del conocimiento y consultas realizadas por el autor, algunos otros científicos de datos pueden tener distintas apreciaciones sobres el principal uso de unos u otros programas en las distintas fases de la cadena.

La lista indicada en la tabla 1 utiliza como referencia lo más utilizado en Costa Rica a inicios de la década del 2020, y para confeccionarla se consultó a profesionales de datos con distintos roles dentro de la cadena de valor y diversas carreras universitarias.

Como se aprecia en la última fila del total, de un total de 18 herramientas mostradas en ella, la transformación de datos es la fase de la cadena que más herramientas distintas utiliza con un total de 15, seguido de la fase de análisis y modelación con 13. De tercero se ubica la fase de comunicación con 8 y por último la fase de creación con solamente 5.

Que más del 80% de estos programas se utilicen en la transformación de datos y solamente menos del 30% de ellos en creación tiene mucho que ver son los aspectos en los cuales se concentran las labores del Científico de Datos.

Como se ha mencionado, hoy en día existen muchas formas automáticas de crear datos gracias a los avances tecnológicos que hoy se tienen, pero dichos datos primarios requieren de procesos importantes de transformación para convertirse en información relevante. Esto depende de varios aspectos y tres de los más importantes son a) el conocimiento de las herramientas que se tenga, b) la experiencia y conocimiento del negocio y c) la formación profesional base del científico de datos. Un mismo conjunto de datos puede arrojar información distinta si es transformada por economistas, estadísticos, sociólogos, actuarios o matemáticos, cada uno de ellos verá y priorizará transformaciones distintas dependiendo de lo que se le solicite o los conocimientos técnicos y prácticos (de formación y herramientas) que tenga.

Sin duda la cantidad de programas que se pueden utilizar en la ciencia de datos es bastante amplia, sin embargo, la lista mostrada puede ser el punto de partida para conversar sobre el tema. Cabe recalcar que una de las herramientas más difundidas y utilizadas son las hojas de cálculo como Excel y las automatizaciones que de ellas se pueden realizar por medio de las macros (programación en Visual Basic para Aplicaciones, “VBA”), la colocan como una de las principales utilizadas a lo largo de todas las fases de la cadena de valor, su disponibilidad, flexibilidad y adaptabilidad la hacen una de las pocas con esa opción.

En próximas entregas conoceremos más sobre el científico de datos.

“Ciencia de Datos para Todos” es un espacio creado para presentar de forma clara y concisa todo lo que necesitas saber sobre el perfil más demandado en el ámbito laboral. 

Cada semana, exploraremos herramientas, consejos laborales y tendencias para estudiantes, profesionales y empresas que buscan crecer en un entorno impulsado por datos, invitaremos a expertos en el tema para que brinden sus aportes y logremos aprender entre todos.

Contáctanos al correo cienciadedadatos@elmundo.cr