Mantener los datos seguros pero accesibles ha sido un reto para las empresas desde que se crearon los primeros archivos en papel. En los últimos 20 años, con la creciente digitalización, eso se ha vuelto mucho más complejo. Y la tendencia se aceleró con la adopción generalizada de la inteligencia artificial (IA), que plantea nuevos retos para lograr la ciberseguridad de los datos.
Los gobiernos de todo el mundo buscan mantenerse al día expidiendo regulaciones año con año. Ello significa más presión para determinadas empresas, como las de atención sanitaria. Deben garantizar la resiliencia de los datos en esta nueva era de la IA generativa (GenAI). Es decir, deben asegurarse de que la información sea utilizable mientras se mantiene la ciberseguridad de los datos, en línea con las regulaciones.
Gracias a la IA las demandas sobre los datos son más grandes que nunca. Y aunque la euforia por la GenAI parece amainar, muchas empresas buscan utilizarla para extraer mayor valor de los datos existentes. De acuerdo con el informe The state of AI in early 2024: GenAI adoption spikes and starts to generate value, de McKinsey, 65% de los encuestados afirmaron que sus organizaciones la usan con regularidad. Pero, ¿qué significa esto para la ciberseguridad de los datos?
No es secreto que la IA depende de los datos. Algunos dirían que cuanto más, mejor. Sin embargo, la expresión más sensata sería que cuanto más precisos y relevantes sean los datos, mejor.
Es posible que algunas aplicaciones de IA sólo necesiten entrenarse una vez. Pero la mayoría requieren acceso en vivo a conjuntos de datos para analizar y reaccionar a los cambios en tiempo real. Cualquier inexactitud o inconsistencia en dichos datos puede hacer que los resultados de la IA sean inútiles.
Normatividad para la ciberseguridad de los datos
Nuevas regulaciones como la europea NIS2 —que exigen más resiliencia y responsabilidad sobre los datos— pueden contribuir a evitar tales inconsistencias al profundizar las obligaciones de las empresas para garantizar la ciberseguridad de los datos. Las normas ahora se enfocan en ampliar la cadena de custodia que las organizaciones tienen sobre sus datos; esto es, les exigen considerar cómo los protegerán cuando se conecten a la IA y a otras nuevas tecnologías.
Aunque esa clase de disposiciones involucran sobre todo a los equipos de gobernanza de la información, requieren un esfuerzo de toda la empresa. Y deben procurar la ciberseguridad de los datos mientras se garantiza el acceso necesario para innovar y crecer.
Si bien esto puede parecer una tarea titánica, es un problema que las organizaciones han abordado por años. Sólo que ahora abarca con un nuevo conjunto de sistemas y nuevas circunstancias. Es decir, los principios siguen siendo los mismos, pero la tecnología, entornos y escala siguen evolucionando.
Según el Reporte de Tendencias de Protección de Datos 2024, de Veeam, 76% de las empresas reconocen una “brecha de protección” entre la cantidad de datos que se pueden permitir perder y la frecuencia con la que éstos se protegen. Parece una brecha grande, pero se ha ido reduciendo en los últimos años. Sin embargo, como la IA crea y necesita más datos conforme evoluciona, la brecha podría ensancharse, a menos de que se tomen medidas.
La sensatez de respaldar
Ahora bien, las organizaciones no deberían depender de nuevas regulaciones para impulsar la ciberseguridad de los datos. El monitoreo y ajuste de los niveles de riesgo debería ser un proceso regular y continuo, en especial cuando la IA entra en escena.
Colaborar entre equipos, desde la gobernanza de datos hasta la seguridad informática y la producción, es esencial para mantenerse a la vanguardia de la ciberseguridad de los datos. Crear evaluaciones de riesgos empresariales marcará el camino a seguir para las compañías que trabajan con datos en modelos de IA.
Al cabo, como en tantos casos, todo se reduce al respaldo de datos. Éste ya es un aspecto clave de la regulación moderna de datos. En el futuro, tendrá un rol aún más importante en la regulación específica de la IA en el futuro. Así, brindará a los equipos que desarrollan IA y modelos de lenguaje grande o amplio (LLM) un ancla muy necesaria en un entorno cambiante.
Por otra parte, los respaldos no sólo garantizan que los datos permanezcan precisos, seguros y utilizables en todo momento; también pueden proveer un registro completo para que las organizaciones demuestren su cumplimiento regulatorio. Son una fuente invaluable de verdad cuando se trata de IA. Debido a la propia naturaleza de esta tecnología es difícil saber con exactitud cómo usa los datos con los que se alimenta o entrena. Por ello, al tomar ventaja de los respaldos, las organizaciones pueden dar cuenta de la ciberseguridad de los datos en cualquier momento, sin importar dónde se usen.
Por supuesto, nunca se puede lograr una seguridad total cuando se trata de datos. En consecuencia, las organizaciones siempre habrán de sopesar los riesgos y recompensas. Con todo, con respaldos de calidad, se puede tender una red de seguridad a la cual recurrir en caso necesario.