Documentos de Académico
Documentos de Profesional
Documentos de Cultura
básicos de Sistemas de
Información y Bases de
Datos
Paula Andrea Forero Delgadillo
Jerarquía del conocimiento
Conocimiento
Información
Dato
Dato-Concepto
Conjunto de hechos discretos y objetivos sobre un evento.
Semánticamente es la unidad mínima que puede comunicarse o
almacenarse.
Representación: Símbolo o conjunto de símbolos (alfabéticos,
numéricos, gráficos, etc) utilizados para describir un valor.
Ejemplos:
-2007 “El 90% de los datos generados históricamente, se
crearon en los últimos dos años.”
-443
-DE
Tipos de datos
• Caracteres: Dígitos individuales que se pueden representar mediante
datos numéricos (0-9), letras (a-z) u otros símbolos.
Ejemplo: Nombres de ciudades
Ejemplo:
-El año del establecimiento de la empresa fue 2007
-La altura del edificio Empire State es 443 metros
-DE es el código ISO que identifica al idioma alemán.
Transformación de datos a información:
• Contextualización: Conocer el propósito del dato obtenido.
• Categorización: Conocer la unidad de medida y los componente del
dato.
• Cálculo: Realizar una operación matemática sobre el dato.
• Corrección: Eliminar errores del dato
• Agregación: Resumir o minimizar un dato de forma más concisa.
Conocimiento
Combinación de información contextualizada, experiencia, valores e
intuición. Así como la información se genera a partir de los datos, el
conocimiento surge de la agregación de información.
Métodos de conversión:
-Comparación: Relación entre información obtenida en distintas
experiencias.
-Repercusión: Implicación de la información en decisiones y acciones.
-Conexión: Relación entre tipos de información.
-Conversación: Opinión de otras personas sobre la información.
Recapitulando
Evaluación de calidad
Las métricas o dimensiones utilizadas para describir la calidad de un
conjunto de datos pueden agruparse en base a los actores que
interactúan con los otros datos.
El último actor que interactúa con los datos es el usuario final, es decir
quien utilizara los datos presentados para crear un conclusión o tomar
una decisión.
• Completitud (o cobertura): Describe el porcentaje de datos
disponibles respecto a la población total que representan dichos
datos.
Ejemplo: Un conjunto de datos con información de 90 de 100
tratamientos médicos representan la cobertura de 90%.
Perfume NA 200.000 -
Fuentes de información
Se clasifican en base a las características del elemento que genera el
conjunto de datos.
• Captura manual: Uso de encuestas y mediciones a través de
observaciones, para el proceso de digitalización y almacenamiento se
necesita de tecnología.
Colombia: https://www.datos.gov.co/
https://www.dane.gov.co/
Medellín: http://medata.gov.co/
Organización de datos
1. Ficheros planos: Los archivos
planos son una colección de
información que está
almacenada y es accedida de
forma organizada en una base
de datos.
Entre los mas comunes se
encuentran las CSV, JSON y
XML.
Formato CSV (Comma Separated Values-valores separados por coma):
-Cada registro se delimita por un cambio de línea.
-Los valores de cada registro se separan mediante el uso de comas.
-Opcionalmente, puede incluir una primera línea con los nombres de
los campos que se incluyen en el fichero.
CSV JSON Formato XML
Nombre, Edad, Cargo [{ <empleados>
Juan, 45, Director “Nombre”: “Juan”, <empleado>
Antonio, 35, “Gestor de “Edad”: 45, <Nombre>Juan</Nombre>
proyectos” “Cargo”: “Director”}, { <Edad>45</Edad>
Pablo, 34, “Analista” “Nombre”: “Antonio”, <Cargo>Director</Cargo>
Pedro, 32, “Administrador “Edad”: 35, </empleado>
de bases de datos” “Cargo”: “Gestor de <empleado>
proyectos”}] <Nombre>Antonio</Nombre>
<Edad>35</Edad>
<Cargo>Gestor de
proyectos</Cargo>
</empleado>
<empleados>
• JSON (JavaScript Object Notation-Notación de objetos
en JavaScript): Se basa en el lenguaje de programación
JavaScript y basa su notación en dos estructuras:
-Un objeto o registro, definido como un conjunto de pares
nombre/valor.
-Un array o lista ordenada de valores