Está en la página 1de 3

PROCESAMIENTO DE LA

D ATA
Debido a que el big data presenta nuevas características, su calidad de datos también se
enfrenta a muchos desafíos. Las características del big data se reducen a las 4Vs:
Volumen, Velocidad, Variedad y Valor.

Criterios jerárquicos:

1. Disponibilidad:
o Accesibilidad:
 Si se proporciona una interfaz de acceso a datos
 Los datos pueden hacerse fácilmente públicos o fáciles de adquirir
o Oportunidad:
 Dentro de un tiempo dado, si los datos llegan a tiempo
 Si los datos se actualizan regularmente
 Si el intervalo de tiempo entre la recopilación y el procesamiento de los
datos hasta la liberación cumple los requisitos
2. Usabilidad:
o Credibilidad:
 Los datos provienen de organizaciones especializadas de un país,
campo o industria
 Expertos o especialistas auditan regularmente y comprueban la
exactitud del contenido de los datos
 Los datos existen en el rango de valores conocidos o aceptables
3. Confiabilidad:
o Exactitud
 Los datos proporcionados son precisos
 La representación de datos (o valor) refleja bien el estado real de la
información de origen
 La representación de información (datos) no causará ambigüedad
o Consistencia:
 Después de procesar los datos, sus conceptos, dominios de valor y
formatos todavía coinciden como antes de procesar
 Durante un cierto tiempo, los datos permanecen consistentes y
verificables
 Todos los datos son consistentes o verificables
o Integridad:
 El formato de los datos es claro y cumple los criterios
 Los datos son consistentes con la integridad estructural
 Los datos son consistentes con la integridad del contenido
o Completitud:
 Si una deficiencia de un componente afectará el uso de los datos para
datos con componentes múltiples
 Si una deficiencia de un componente afectará la precisión y la
integridad de los datos
4. Pertinencia:
o Conveniencia:
 Los datos recogidos no coinciden completamente con el tema, pero
exponen un aspecto
 La mayoría de los conjuntos de datos recuperados están dentro del
tema de recuperación que los usuarios necesitan
 El tema de la información proporciona coincidencias con el tema de
recuperación de los usuarios
5. Calidad de presentación:
o Legibilidad:
 Los datos (contenido, formato, etc.) son claros y comprensibles
 Es fácil juzgar que los datos facilitados satisfacen las necesidades
 La descripción de los datos, la clasificación y el contenido de
codificación satisfacen la especificación y son fáciles de entender

Ventajas:

 Minimizar los riesgos en sus proyectos, especialmente en los relacionados con


Tecnologías de la Información.

 Ahorro de tiempo y recursos, haciendo un mejor uso de la infraestructura tecnológica y


sistemas para explotar su información.

 Toma de decisiones de negocio oportunas, en base a información confiable, validada y


limpia.

 Adaptación a estándares o regulaciones internacionales sobre el manejo de


información, permitiendo facilidad al momento de ejecutarlas.

 Mejorar la confianza, buenas relaciones e imagen de la empresa antes sus clientes


frente a la competencia.

PERFILAMIENTO DE DATOS (DATA PROFILING)

- Proceso de reconstruir el conjunto de rasgos particulares que caracterizan los datos.

Descubrimiento: Se revelas las características de los datos a partir de los mismos.

Pruebas asertivas: Se formulan condiciones verdaderas (Reglas) y se prueban sobre los datos.

También podría gustarte