Roles en Ciencia de datos

Al mal tiempo, buena data
3 min readOct 31, 2020

Cuando iniciamos en el mundo de los datos es común pensar que solo hay un rol que se encarga de realizar un sin fin de labores que comprenden análisis de datos, visualización, aplicación de modelos de machine learning, entre otras, como una especie de Frankenstein. Ciencia de datos abarca muchos conceptos, herramientas y habilidades, es por esto que se crean varios roles, cada uno de ellos tiene funciones específicas que van de la mano con habilidades y herramientas necesarias para llevarlas a cabo.

Para iniciar, una breve definición de ciencia de datos:

Ciencia de datos es un campo que comprende conceptos, herramientas y tecnologías enfocadas a la extracción, análisis y presentación de información, donde se genera valor mediante el uso de los datos.

A continuación, mencionaré algunos roles en ciencia de datos, habilidades que se requieren y herramientas utilizadas.

Científico de datos (Data scientist)

Se encargan de analizar e interpretar datos complejos y de gran tamaño con el fin de ayudar a una organización a tomar decisiones a futuro basadas en datos. Son los encargados de recopilar datos, procesarlos, implementar modelos e interpretar sus resultados para encontrar soluciones enfocadas en el negocio.

Habilidades y herramientas:

  • Análisis estadístico con herramientas como SAS
  • Optimización de datos
  • Visualización de datos
  • Herramientas para big data como Hadoop
  • Manejo de datos estructurados y no estructurados
  • Lenguajes de programación como Python, R, Java
  • Procesamiento de datos
  • Conocimiento de modelos de machine learning y deep learning
  • A/B Testing
  • SQL y NoSQL

Ingeniero de datos (Data Engineer)

También conocidos como arquitectos de datos, se encargan de diseñar, desarrollar, monitorear y mantener en funcionamiento la arquitectura necesaria para el almacenamiento de datos, el análisis de los mismos y posterior implementación de modelos de machine learning - deep learning. Su principal propósito es permitir que los datos estén disponibles para su uso.

Habilidades y herramientas:

  • Data pipeline
  • Automatización de entrenamiento de modelos de machine learning
  • Lenguajes de programación como Python, R, C, Java
  • Herramientas de big data como Hadoop
  • Bases de datos relacionales y no relacionales (SQL y NoSQL)
  • Procesamiento de datos
  • Arquitectura de bases de datos
  • Preparación de datos para su posterior análisis
  • Monitoreo y mantenimiento de los sistemas
  • Data Wharehouse y Data Lake

Analista de datos (Data Analyst)

Este rol es el encargado del análisis de datos e interpretación de resultados para ayudar a las organizaciones a tomar mejores decisiones. Son los encargados de extraer información de los datos aplicando limpieza de datos y análisis de datos. Son responsables de tomar acciones que afecten el alcance actual de una organización. Los informes que generan van dirigidos a los clientes o son de uso interno y suelen presentarse en periodos frecuentes para realizar un seguimiento al comportamiento de la organización.

Habilidades y herramientas:

  • Estadística
  • Analítica
  • Inteligencia de negocios (BI)
  • Proceso de ETL
  • Excel
  • Visualización de datos con herramientas como Power BI, Tableau, Qlik
  • Análisis e interpretación de datos
  • Google Analytics
  • Manejo de SQL/NoSQL

Como herramientas transversales Anaconda Navigator, Jupyter notebook y Google Colab son muy usadas en ciencia de datos para el ámbito educativo y laboral. Y finalmente, no olvides trabajar en las habilidades blandas, estas se convierten en una herramienta principal al momento de comunicar lo que los datos nos quieren decir.

Ciencia de datos se aplica en diferentes áreas como medicina, educación, agroindustria, legislación, entre muchas más. Todos los roles son necesarios e importantes; identifica los conceptos, habilidades y herramientas con los que te sientas a gusto y da el primer paso para iniciar en el mundo de los datos.

Si te apasionan los datos es momento de poner tu granito de arena y empezar a transformar el mundo con soluciones basadas en datos.

--

--

No responses yet