Taxonomía de errores en las bases de datos cubanas

Beatriz López Porrero, Ramiro Pérez Vázquez

Resumen


La limpieza de datos, proceso que se caracteriza por detectar y corregir los errores en los datos, es muy usado en los ambientes donde la información se integra desde diferentes fuentes, aunque también se aplica en ficheros o bases de datos operacionales. La primera tarea dentro del proceso de limpieza de datos es la detección de los errores, y por tanto debe conocerse a qué se denomina error. Una dirección importante de trabajo en la limpieza de datos es el establecimiento de qué constituye una anomalía o error en los datos; en general esto depende del contexto que se esté analizando y de las reglas del negocio específicas para el universo de trabajo en cuestión. En este artículo se presenta el análisis realizado sobre varias bases de datos y se propone una taxonomía de errores en las bases de datos en Cuba,  lo cual permitirá el desarrollo de herramientas dirigidas a limpiar estos tipos de anomalías en los datos.


Palabras clave


taxonomías; taxonomías de errores; detección de errores; definición de errores; limpieza de errores; análisis de bases de datos

Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.




_________________________________________________________________________________________________________

La Universidad de las Ciencias Informáticas (UCI), a través del sello editorial Ediciones Futuro, publica los contenidos de la Revista Cubana de Ciencias Informáticas (RCCI) bajo licencia Creative Commons de tipo Atribución 4.0 Internacional (CC BY 4.0). Esta licencia permite a otros distribuir, mezclar, ajustar y construir a partir de su obra, incluso con fines comerciales, siempre que le sea reconocida la autoría de la creación original. Saber más
_________________________________________________________________________________________________________

 INDEXACIÓN