Las universidades buscan aprovechar de manera eficaz las herramientas analíticas que ofrece la inteligencia artificial (IA). Esta tendencia se fortaleció con la llegada de la IA generativa (GenAI). Para ello, se requieren datos claros y organizados. Es decir, las universidades deben asegurarse de lograr una buena calidad de los datos antes de alimentarlos a la IA. De lo contrario, sin importar cuán potente sea o qué tan bien preentrenado esté el modelo, si éste recibe datos “basura” arrojará resultados erróneos.

Ahora bien, para asegurar la buena calidad de los datos deben considerarse tanto su origen, como su actualización y su relevancia. Esto cobra relevancia dado que los datos recopilados por las instituciones de educación superior pueden perder relevancia con rapidez.

Dado el gran caudal de información y la frecuencia con que esta cambia en las universidades, no es raro que los datos se vuelvan redundantes, obsoletos o triviales. A ello, debe sumarse que no pocos de esos datos son no estructurados, lo cual dificulta su clasificación; eso, a su vez, dificulta mantener la buena calidad de los datos.

Gobernanza para la buena calidad de los datos

Una manera de atemperar el problema de la buena calidad de los datos consiste en entrenar a los modelos de GenAI para filtrar datos antiguos y redundantes. Esto es, se debe automatizar la discriminación de datos para dejar a disposición de la IA la información más reciente y precisa. Por supuesto, eso no elimina el factor humano: se requiere la supervisión humana para evitar que la IA cometa errores que luego se amplifiquen sin controles para evitarlo.

Sin embargo, la mejor manera de procurar la buena calidad de los datos consiste en implementar una buena gobernanza para una gestión eficiente. El objetivo es garantizar que los datos estén estandarizados, sin valores redundantes ni otras inconsistencias antes de ser alimentados a la IA. Para ello se requieren auditorias periódicas de las fuentes de datos para identificar y corregir sesgos. Ahora bien, eso puede complicarse dado que la infraestructura de datos suele no estar estandarizada en las instituciones educativas.

A lo anterior se añaden las dificultades para equilibrar la accesibilidad de los datos con las restricciones impuestas por las leyes de privacidad aplicables. Las limitaciones presupuestarias y la falta de recursos humanos y tecnológicos también complican lograr una buena calidad de los datos. Sin embargo, existen opciones para conseguirlo.

Una manera de facilitar el establecimiento de una gobernanza suficiente pasa por la formación de los interesados en la gestión de los datos. Eso abarca tanto al personal administrativo como a los profesores y los alumnos. Y el estímulo es claro: alimentar con datos de buena calidad a los modelos de IA contribuye a mejorar el funcionamiento de las universidades.