Los datos recopilados en las empresas —incluidas las dedicadas al cuidado de la salud— se consideran cada vez más una ventaja que un dolor de cabeza. Actualmente, es muy alto el valor de la información que llega a las organizaciones desde fuentes externas. Lo mismo de la proveniente de las personas, los procesos y las tecnologías dentro de una organización. Por ello, es una importante desventaja competitiva no recopilar, procesar y analizar activamente la mayor cantidad de datos posible.

Con las nuevas y estrictas normativas de protección de datos en varios territorios y las violaciones de datos que aparecen en las noticias casi semanalmente, las consecuencias de no gestionar estos datos adecuadamente se han convertido en un campo minado para los CIO y los profesionales de TIC.

Los datos a los que nos referimos se conocen como “no estructurados”. En los primeros tiempos de la digitalización, la mayoría de los datos eran generados por los sistemas y almacenados en bases de datos estructurados, con un crecimiento predecible. Los miembros de TIC y finanzas eran los únicos con el interés o los conocimientos necesarios para trabajar directamente con una base de datos.

Hoy en día, una proporción mucho mayor de los datos de una empresa se crea fuera de la base de datos tradicional y en una variedad de formatos. Documentos, fotos, vídeos e información de sensores, tienen una tasa de crecimiento exponencial.

El panorama de los datos no estructurados es intrínsecamente caótico. Para empezar, está disperso en una multitud de sistemas y no es inmediatamente predecible o controlable. Esto hace que muchas empresas no examinen ni extraigan valor de ninguno de los datos a los que tienen acceso, o peor aún, que simplemente no sepan que existen o dónde residen exactamente.

Visibilizar los datos

Dark data: la importancia de convertirlo en ventaja

Ahí radica uno de los mayores problemas. Los activos de información que las organizaciones recogen, procesan y almacenan durante las actividades habituales, pero que generalmente no utilizan para otros fines, también se conocen con el término dark data. Es muy fácil acabar infringiendo la normativa de protección de datos con el dark data. Esto es porque un requisito fundamental es saber qué datos se tienen, cuáles constituyen información personal identificable (IPI) relativa a las personas, y protegerlos. Si no sabe lo que tiene o dónde está (dark data), ¿cómo se puede protegerlos?

El primer paso más importante es asegurarse de que se tiene una visibilidad del 100% de todas las fuentes de datos. También de que se comprenden los datos (lo que es necesario y lo que no). Todo esto está muy bien, por supuesto, pero el objetivo debería ser obtener un valor competitivo de los datos, no sólo estar a la defensiva.

La frase “impulsada por los datos” se ha convertido en algo más que un dicho de moda. No son sólo las organizaciones con más datos las que cruzarán la línea de meta en primer lugar. Aquellas que identifican, analizan y actúan sobre los datos son las que verán las mayores recompensas.

Aprovechar el dark data

Dark data: la importancia de convertirlo en ventaja

Obtener un control básico sobre el dark data es importante, pero igual de importante es decidir qué datos recoger, analizar y almacenar. Es importante alinear los objetivos de la empresa con las fuentes de datos de las que se dispone. Luego, hay que embarcarse en el siguiente paso: dar sentido a los propios datos y prepararlos para el análisis.

En conclusión: las organizaciones del presente y futuro se toman en serio la extracción de valor de los datos no estructurados que conforman el dark data. Invierten en las herramientas adecuadas para poder integrarlos con las fuentes más tradicionales. También para que se utilicen de la forma más sencilla y rápida posible antes de que se queden obsoletos.

Si los analistas se ven obligados a moverse con lentitud, corren el riesgo de llegar demasiado tarde. Es decir, se dejan de capitalizar transacciones, inversiones, oportunidades con clientes o eventos de redes sociales potencialmente rentables. Dotar a los analistas de datos de una herramienta estandarizada para automatizar la preparación de los datos les deja más tiempo para trabajar y analizarlos de forma que beneficien activamente al negocio.