Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4 Lab - Basic Data Analytics
4 Lab - Basic Data Analytics
Objetivos
Use métodos muy simples para describir los datos existentes, completar los valores de datos faltantes y
hacer predicciones sencillas.
Parte 1: Aprenda cómo utilizar datos como información
Parte 2: Realice un diagrama de los datos y prediga los valores
Información básica/situación
Los datos carecen de sentido por sí mismos. La información es significativa y útil. Los datos se convierten en
información sólo cuando se usan en contexto para responder preguntas específicas. En esta práctica de
laboratorio, utilizará gráficos de datos existentes para crear valores faltantes y para predecir los valores
basados en las tendencias.
Recursos necesarios
Computadora o dispositivo móvil con acceso a Internet
Navegador capaz de reproducir un video de Internet.
Capacidad de audio de escuchar la narración de video.
Página 1 de 11
Práctica de laboratorio: explore las fuentes de Open Data
25
20
15
10
0
1880 1900 1920 1940 1960 1980 2000 2020
Es un modelo de regresión lineal entre dos variables, es un modelo probabilistico, se usa una simple
liena para describir alguna tendencia en los datos.
El instructor del video enseña los procesos de interpolación y extrapolación como herramientas para calcular
o predecir datos en un modelo lineal. Defina cada término.
Página 2 de 11
Práctica de laboratorio: explore las fuentes de Open Data
interpolación
La idea de la interpolación es poder estimar f(x) para un x arbitrario, a partir de la construcción
de una curva o superficie que une los puntos donde se han realizado las mediciones y cuyo
valor si se conoce.
extrapolación
La extrapolación es el proceso de estimar más allá del intervalo de observación original, el valor de
la variable con base en su relación con otra variable, también es ver como se vería la tendencia.
¿Cuáles son las dos observaciones interesantes que el instructor del video hace respecto de las
tendencias en la edad mediana del matrimonio y la edad de los hombres y las mujeres que se casan?
La edad media del matrimonio de los hombres es de 25.9 en los años 1900 y de la mujer es de 21.9.
____________________________________________________________________________________
1970
1980
1990
Página 3 de 11
Práctica de laboratorio: explore las fuentes de Open Data
c. Extrapole los valores para el año 2020 mediante la creación de una línea que resuma mejor los valores
de los cinco períodos anteriores.
Año Horas por Horas por semana de Horas de las mujeres -
semana de trabajo doméstico : Horas de los hombres
trabajo Mujeres
doméstico :
Hombres
1965 4.4 31.9 27.5
1970 5.2 27.75 22.55
1975 6 23.6 17.6
1980 8.1 22.15 14.05
1985 10.2 20.7 10.5
1990 10.2 19.8 9.6
1995 10.2 18.9 8.7
2000 10 18.6 8.6
Página 4 de 11
Práctica de laboratorio: explore las fuentes de Open Data
El valor del 2020 Hombres = (10 +X) /2 = 9.8 => 10 + X = 9.8*2 => X= 9.6
d. Otro tipo de información que puede derivarse de estos datos se trata de la brecha entre la cantidad de
horas de quehacer doméstico para los hombres contra la cantidad de horas de quehacer doméstico para
las mujeres. Esto mostrará otra tendencia con respecto a la igualdad entre los hombres y las mujeres
durante este período. Complete la siguiente tabla; para ello, complete la cantidad de tiempo que las
mujeres realizan quehaceres domésticos y réstela de la cantidad de tiempo que los hombres realizan
quehaceres domésticos.
Página 5 de 11
Práctica de laboratorio: explore las fuentes de Open Data
e. Dibuje los valores calculados en el gráfico proporcionado en la planilla de trabajo 3 al final de esta
práctica de laboratorio.
Hombres-Hora; Mujeres-Hora
35
30
25
20
15
10
0
1960 1970 1980 1990 2000 2010 2020 2030
¿Cuál fue la tendencia para la igualdad entre los hombres y las mujeres en la realización del quehacer
doméstico?
Para los años del 2020 las horas domesticas del hombre fue creciendo del valor de 1965 de 4.4 a
un 9.6 al 2020.
Y para las mujeres de 31.9 horas del año 1965 fue decreciendo al año 2020 a 18.2
____________________________________________________________________________________
Si los hombres y las mujeres fueran completamente equivalentes en la cantidad de quehacer doméstico
que hacen por semana, en 2020, ¿dónde se trazaría el siguiente punto de datos?
Horas por
semana Horas por
Horas de las
de semana de
mujeres -
trabajo trabajo
Horas de los
doméstic domestico :
hombres
o: Mujeres
Año Hombres
196
27.5
5 4.4 31.9
197
22.55
0 5.2 27.75
Página 6 de 11
Práctica de laboratorio: explore las fuentes de Open Data
197
17.6
5 6 23.6
198
14.05
0 8.1 22.15
198
10.5
5 10.2 20.7
199
9.6
0 10.2 19.8
199
8.7
5 10.2 18.9
200
8.6
0 10 18.6
200
9.9
5 9.2 19.1
201
7.4
0 10 17.4
201
8
5 9.8 17.8
202
0
0 19 19
Hombres-Hora; Mujeres-Hora
35
30
25
20
15
10
0
1960 1970 1980 1990 2000 2010 2020 2030
Horas por semana de trabajo domestico : Hombres Horas por semana de trabjo domestico : Mujeres
Horas de las mujeres - Horas de los hombres
Página 7 de 11
Práctica de laboratorio: explore las fuentes de Open Data
En IdC, los datos masivos provienen de muchas fuentes. A veces faltan valores porque un sensor perdió
temporalmente conectividad o los puntos de datos se perdieron en la transmisión. La interpolación puede
funcionar como una estrategia para reemplazar datos faltantes. La extrapolación se utiliza para predecir los
valores de los eventos que aún no han ocurrido. Debido a que IdC genera tantos datos, pueden construirse
modelos analíticos predictivos que predigan de manera confiable el futuro, extrapolando así las tendencias
de datos históricos.
Página 8 de 11
Planilla de trabajo 1
25
20
Edad mediana
15
10
0
1890 1910 1930 1950 1970 1990 2010
Año
Página 9 de 11
Práctica de laboratorio: explore las fuentes de Open Data
Planilla de trabajo 2
35
30
25
20
15
10
0
1960 1970 1980 1990 2000 2010 2020
Página 10 de 11
Práctica de laboratorio: explore las fuentes de Open Data
Planilla de trabajo 3
Hombres-Hora; Mujeres-Hora
30
25
20
15
10
0
1960 1970 1980 1990 2000 2010 2020
Página 11 de 11