La profesión de data scientist: el nuevo oro son los datos

01 jul 2019

4 min

La profesión de data scientist: el nuevo oro son los datos
autor
Javier Lacort

Redactor freelance especializado en tecnología y startups

Cuando Anna Via comenzó a estudiar el Grado en Matemáticas en 2011, la profesión de ‘data scientist’ prácticamente no existía. Ocho años después, este oficio es su pan de cada día en la consultora SDG Group. Dentro de otros ocho años, es posible que los avances tecnológicos hayan seguido transformando la profesión y esta sea muy distinta a lo que es hoy. Tal y como nos cuenta Anna, “es un mundo muy cambiante, salen métodos nuevos y mejores prácticamente cada día, nuevas problemáticas que resolver… Requiere un reciclaje constante, has de aprender cada día”.

La profesión de data scientist

Para Anna Via, la profesión del data scientist se basa en tres aspectos fundamentales:

  • El análisis de datos
  • Modelaje de la información obtenida
  • Construcción de un modelo predictivo con datos obtenidos

Pero, ¿de dónde vienen esos datos? Así lo explica Anna: “Recolectamos muchísimos datos de muchísimos lugares diferentes, normalmente para entender el negocio y lo que esos datos representan. Usamos muchas variables de distintas áreas de la empresa para obtener un modelo con el que intentar mejorar procesos que hasta ahora se hacían a ojo, bajo el criterio de la experiencia personal de los responsables del departamento que toma las decisiones”.

“Usamos muchas variables para obtener un modelo con el que intentar mejorar procesos que hasta ahora se hacían a ojo”

¿Por qué recuperar y analizar tantos datos?

“Hasta hace poco, en data science había una gran corriente que se centraba en modelar el pasado y entender lo que ya había ocurrido, pero ahora el sector está mucho más centrado en predecir el futuro”, explica Anna.

Por ejemplo: supongamos que el objetivo es predecir las ventas que una tienda efectuará la semana que viene. En este caso, se analizarían variables como la época del año, el clima previsto en esa zona, la proximidad de días festivos o fechas especiales como la Navidad, la posición que ocupa esa semana dentro del mes (generalmente, a principios de mes hay mayor consumo, puesto que se acaba de cobrar la nómina), etc. Con esa previsión, el negocio puede anticiparse mucho mejor y planificar la contratación de más o menos gente, en función de las necesidades, y a la vez gestionar de forma óptima las existencias en la tienda, entre otros aspectos.

“Hasta hace poco, en data science había una gran corriente que se centraba en modelar el pasado, pero ahora el sector está mucho más centrado en predecir el futuro”

image

¿Para qué sirven estos datos?

Con la intención de extraer un modelo para mostrar las tendencias y anticiparse al futuro, Anna maneja ingentes cantidades de datos y trata de darles una estructura, para poderlos presentar de manera clara. Ese es, precisamente, el aspecto más complicado de su trabajo, según Anna: conseguir transmitir de forma eficaz todas esas conclusiones a quienes toman las decisiones finales.

“Tú aplicas métodos estadísticos muy avanzados, pero luego son los responsables del negocio quienes deben tomar decisiones. Debes convencerles de que lo que propones está respaldado por un análisis bien realizado, un proyecto bien ejecutado… Eso es complicado, hay que simplificar al máximo la explicación para poder transmitirlo”, añade.

¿Qué herramientas utiliza un data scientist?

En su día a día, Anna usa:

  • Para la programación: lenguaje R, muy especializado en estadística y machine learning, y Python, cuyo uso es más general pero que está conquistando una importancia creciente en este sector.
  • Para la recolección de datos: bases de datos en SQL (Structured Query Language, en español “lenguaje de consulta estructurada”), que permiten obtener todas las variables.
  • Para las visualizaciones: una vez ya se han obtenido los resultados, se emplean herramientas como Tableau, una plataforma que permite importar enormes cantidades de datos de orígenes muy diferentes −desde tablas de Excel hasta archivos .txt o ficheros .csv− y trabajar a fondo con ellos.

¿Qué sectores utilizan la data science?

Al preguntarle a Anna por los sectores que alcanza su trabajo, su respuesta es clara: “Uf, prácticamente todos”. “Estamos en un momento en que se está produciendo una revolución en el uso de los datos. Todos los sectores se están iniciando en este ámbito, si es que no llevan ya un tiempo con proyectos de este tipo. En mi caso, trabajo en una consultora que aplica la data science a sectores de todo tipo: consumo, banca, farmacéutico… En todos los sectores hay posibilidades de llevar a cabo proyectos interesantes, hay buena disposición”.

“Todos los sectores se están iniciando en este ámbito. En todos los sectores hay posibilidades de llevar a cabo proyectos interesantes”

image

Formación para convertirse en data scientist

Aunque Anna llegó al puesto de data scientist a través de las Matemáticas, esta no es la única vía formativa para ello. “Hay muchos matemáticos, sí, pero también muchos estadísticos. Son estudios que te dan esa habilidad de entender, sacar conclusiones, analizar… También hay quien proviene del mundo de la Informática, ya que hay una parte muy importante de programación. La gente que procede de la Informática con buen nivel de probabilidad y estadística, tiene muy buena base”.

Es por ello que Anna considera que las competencias más importantes en este oficio son:

  • el análisis matemático y estadístico
  • la capacidad de extraer conclusiones
  • un buen nivel de programación

Y si eres de los que te planteas aprender código por tu cuenta, Anna matiza que considera muy difícil aprender de manera autodidacta: “Puede hacerse, pero es complicado, ya que hay una parte muy teórica que requiere un gran esfuerzo”.

Y aunque el día a día de este trabajo no se entiende sin la formación ya comentada para poder dominar todas esas facetas, con la estadística y la programación a la cabeza, según Anna, hay habilidades que solo se aprenden con la experiencia. “La capacidad de analizar bien, sacar buenas conclusiones… Eso te lo da la experiencia, el hecho de ir haciendo tú mismo el trabajo”.

La profesión de data scientist hoy y mañana

Ya en 2012, Forbes publicó un artículo titulado The Age of Big Data en la que se hablaba de cómo este campo de trabajo estaba llegando para quedarse y aseguraba que su influencia iría en aumento con el paso del tiempo. También The New York Times publicó un artículo similar en el que hacía especial hincapié en el fantástico porvenir laboral que aguardaba a todo aquel que se iniciara en el oficio de data scientist.

“Hay muchos datos que hasta hace poco no se explotaban y ahora sí. El Big Data es capaz de procesar cosas que antes eran impensables. En muchos sectores se puede procesar la información al segundo, en tiempo real. Y nos dirigimos hacia un futuro con volúmenes de datos muchísimo mayores y mayor velocidad, lo cual redundará en tomas de decisiones mucho más rápidas. Cuando algo no esté funcionando de forma óptima, se sabrá, y su responsable podrá corregirlo de la forma que mejor crea gracias a toda esta información”, remata Anna.

¡Sigue a Welcome to the Jungle en Facebook y abónate a nuestra newsletter para recibir nuestros mejores artículos!

Las temáticas de este artículo