Demetrio Carmona - Mié, 24/02/2021 - 09:50
Infografía sobre números big data construyendo una ciudad.
Serie:'A vueltas con la economía' (LII)
Cada vez es más difícil encontrar un dispositivo que no genere datos y disponga de algún tipo de conexión a la red. Los coches, los teléfonos móviles, las televisiones o los relojes son sólo algunos ejemplos de objetos cotidianos que generan información constantemente. Además, los métodos para analizar estos datos son cada vez más rápidos y precisos. Por ejemplo, durante el confinamiento domiciliario a causa de la pandemia, algunos países decidieron usar la localización GPS de los smartphones de sus habitantes para saber el grado de desobediencia a las restricciones de movilidad.
Esta forma de aproximarse a la realidad a través de la ciencia de datos ha sido implementada con entusiasmo por las empresas desde hace al menos dos décadas, pero no siempre se ha entendido correctamente su función. Los primeros pasos en este campo se dieron con la creación de bases de datos. No era suficiente cualquier tipo de datos, éstos debían contener información útil, veraz y completa sobre las operaciones que realizaba la empresa y el trabajo de cada departamento.
El objetivo, llevar la realidad a las bases de datos, pero una vez más, todo el valor que podría extraerse mediante un análisis adecuado se quedaba en el aire. El resultado, una fuerte inversión en construir entornos informatizados que generaran datos que no llegaba a materializarse en mejores decisiones, puesto que en la mayoría de los casos no se practicaba ningún tipo de análisis.
Actualmente el panorama es muy distinto. Cada vez es más frecuente encontrar equipos dedicados al análisis de datos en cualquier organización, incluso en aquellas con un tamaño reducido. Abordaremos, a lo largo de varias publicaciones, algunos de los retos a los que se enfrenta una organización actualmente a la hora de implementar soluciones basadas en ciencia de datos, y daremos respuesta, en primera instancia, al interrogante sobre la composición debe tener un equipo dedicado a generar soluciones de ciencia de datos.
Son dos los roles que vertebran estos equipos: el científico de datos y el ingeniero de datos. El científico de datos se encarga de elaborar modelos predictivos haciendo uso de los datos que les proporcionan los ingenieros. Su función principal es apoyar la toma de decisiones con los resultados de sus análisis. Por su parte, la principal diferencia entre los ingenieros de datos y el rol anterior es que los ingenieros se ocupan de crear las estructuras que recopilan, almacenan, limpian, testan y dan garantía de la fiabilidad de los datos. También se encargan de implementar y optimizar algoritmos de aprendizaje automático y de elaborar soluciones de negocio combinando las tecnologías y los entornos que sean necesarios. Por tanto, su función no solo es fundamental para que el científico de datos pueda realizar sus análisis, sino que también es la piedra angular que debe velar por la persistencia, la escalabilidad y la seguridad del proyecto.
No son los únicos componentes de un equipo dedicado a elaborar soluciones basadas en ciencia de datos, pero ambos son necesarios para poder generar soluciones de negocio aplicadas en cualquier organización. No obstante, actualmente el mercado demanda muchos más perfiles asociados a la ingeniería de datos y estos puestos no se cubren fácilmente en muchos casos. Por esta razón el primer reto al que se enfrenta una organización radica en hacerse con ingenieros experimentados que aporten valor al equipo.
Roles de ciencia de datos demandados por empresas desde 2012. (Fuente: adaptado de mihaileric.com)
La mayor demanda de perfiles orientados a la ingeniería de datos puede deberse a que hay una menor cantidad de profesionales especializados en esta rama. A pesar de que los roles descritos no son compartimentos estancos, las funciones principales de ambos están claramente definidas y suponen el núcleo duro del equipo, por lo que es necesario realizar una selección de personal atendiendo a estas diferencias. Además, es necesario considerar que es mucho más frecuente suplir las necesidades de la organización a la hora de buscar científicos de datos que cuando se trata de ingenieros.
A partir de aquí se pueden plantear otros interrogantes. ¿A qué clase de problemas se enfrenta una organización cuando trata de trasladar su solución basada en datos a la toma de decisiones? ¿Qué clase de tecnologías son las más adecuadas para el trabajo en equipo y cómo se deben usar para evitar bloqueos entre departamentos? Estas cuestiones se abordarán con mayor profundidad en próximas entradas.
Editor: Universidad Isabel I
Burgos, España
ISSN: 2659-3971
Añadir nuevo comentario