Las universidades generan y recopilan datos a partir de muchas fuentes diferentes. Esa multiplicidad puede generar discrepancias en la información y evitar que se obtengan datos de buena calidad. Esto, a su vez, repercute en el funcionamiento de las instituciones y genera problemas, sobre todo si se trata de basar decisiones en datos. Se puede decir que el principal desafío de las universidades referente a la calidad de los datos es que éstos son difíciles de administrar y mantener.
Ahora bien, cuando se tienen datos de buena calidad, éstos contribuyen a mejorar al buen funcionamiento de la universidad. Es decir, para extraer información confiable y útil de de ellos, deben estar tan limpios y libres de errores como sea posible.
El problema de calidad de datos más frecuente en las instituciones de educación superior son los datos incompletos o faltantes. Le sigue de cerca la información desactualizada. Además, este tipo de datos suelen residir en silos, sin una propiedad o responsabilidad sobre ellos bien definida.
Lo anterior puede resultar en ineficiencia en varios campos: en la operación diaria de la universidad; al evaluar la experiencia de los estudiantes, o bien, al no poder identificar a quienes están en riesgo para brindarles la asistencia adecuada.
Asegurar datos de buena calidad
Una manera de obtener datos de buena calidad consiste en dar seguimiento a métricas precisas para evaluar de manera constante el estado del big data.
●Disponibilidad y accesibilidad: Los datos son fácilmente accesible cuando se les necesita.
○Fiabilidad: Los datos corresponden fielmente con la información real de los estudiantes, profesores y empleados.
●Formatos correctos: Los datos están registrados en los campos pertinentes y con el formato adecuado.
○Completitud: Los datos son tan completos como debe ser.
●Actualidad: Los datos están lo más actualizados posible.
○Unicidad: Los datos corresponden a registros únicos, sin duplicados para el mismo usuario.
●Procedencia: Los datos se guardan con sus metadatos (origen e historial de actualizaciones).
○Seguridad y confidencialidad: Los datos están salvaguardados para evitar que accedan a ellos personas no autorizadas.
●Portabilidad: La información puede ser trasladada de un sistema a otro sin que se afecte su buena calidad.
○Recuperabilidad: En caso de desastres, es posible usar datos de buena calidad para una recuperación fiable y adecuada.
Dado que las universidades confían cada vez más en los datos para la toma de decisiones, deben asegurarse de que éstos sean precisos. Pero la mayoría de las instituciones no tienen recursos, experiencia o tiempo para gestionar y mantener datos de buena calidad. Ante ello, pueden invertir en software, contratar personal especializado o bien, tercerizar el trabajo a un proveedor externo.