Inicio Educación Big Data y analítica Integrar datos para aprovechar el big data

Integrar datos para aprovechar el big data

Por

27 octubre, 2023

311

Las universidades generan, reciben y procesan una gran cantidad de información, pero a menudo queda distribuida entre diferentes sistemas aislados. Por ello es necesario que, de manera regular, procedan a integrar datos para aprovechar lo mejor posible su creciente big data.

El objetivo general es proporcionar una vista completa de la información de los estudiantes para optimizar el aprendizaje. Esto implica gestionar datos personales, académicos y bancarios, entre otras fuentes. Por supuesto, es menester garantizar su privacidad y mantener el cumplimiento de las leyes aplicables.

Existen diferentes formas de integrar datos. Una de ellas es la denominada “extraer, transformar y cargar”, conocida como ETL por sus iniciales en inglés (Extract, Transform, Load). Combina los datos en un almacén único y consistente donde se puede acceder a ellos para utilizarlos de manera eficiente. El integrar datos y ETL son conceptos estrechamente relacionados; de hecho, el segundo proceso puede considerarse como un subconjunto del primero, que es más amplio.

Ahora bien, ETL se puede utilizar para migrar datos de un sistema a otro, como cuando se reemplaza software heredado. Los datos se extraen del sistema antiguo, se transforman para que coincidan con el esquema del nuevo sistema y se cargan en él. Un ejemplo práctico es el reemplazo de los sistemas SRM (Student Relationship Management, gestión de la relación con el estudiante). Otro caso es el de los sistemas CRM (Customer Relationship Management, gestión de la relación con el cliente).

Integrar datos en múltiples nubes

Sin embargo, al integrar datos, ETL es útil para algo más que para moverlos entre sistemas. Un aspecto particularmente importante es su utilidad para garantizar que se carguen en el sistema datos de buena calidad. Esto es, que sean precisos, completos y oportunos.

También sirve para lograr una adecuada definición de datos maestros de referencia. Se refiere a establecer una fuente única para crear los nombres y códigos de procesos y servicios. También abarca las identificaciones de estudiantes, personal y proveedores, por lo que los datos deben ser fácilmente interoperables con las herramientas de gestión de identidades utilizadas por la universidad.

Por supuesto, esto implica definir reglas precisas para integrar datos de la mejor manera. Un aspecto muy importante para ello es evitar que se usen palabras distintas para describir de varias maneras la misma información. Por ejemplo, cuando una base de datos usa la palabra “mujer”, mientras que otra simplemente usa la letra “M”.

Por otra parte, las soluciones utilizadas para integrar datos en la educación superior deben ser escalables y compatibles con múltiples nubes. Es por ello que, para conseguirlo, las universidades recurren cada vez más a los servicios administrados por proveedores externos. Así obtienen la flexibilidad y escalabilidad requeridas para mantener el paso ante el aumento a futuro del big data.