Documentos de Académico
Documentos de Profesional
Documentos de Cultura
𝑋𝑖 − 𝑋ത
𝑍𝑖 =
𝑆
Punto Z
Número de Desviación
estudiantes respecto de Puntos Z
en un grupo la media 𝑥𝑖 − 𝑥ҧ
(𝑥𝑖 ) 𝑥𝑖 − 𝑥ҧ 𝑠
46 2 2/8= 0.25
54 10 10/8= 1.25
42 -2 -2/8= -0.25
46 2 2/8= 0.25
32 -12 -12/8= -1.50
Teorema de Chebyshev
• Establece qué proporción de los
valores de un conjunto debe
estar dentro de un número de
desviaciones estándar de la Por lo menos (1 – 1/z2) de los
valores que se tienen en los
media. datos, deben encontrarse
dentro de z desviaciones
estándar de la media, donde z
es cualquier valor mayor que 1
Teorema de Chebyshev
82−70
𝑧82 = = +2.4
5
Se aplica el teorema: Se puede concluir que
1 el 82.6% de las AGEBs
1 − 2.42 =0.826 tienen una densidad
de entre 58 y 62
Hab/HA
Regla empírica
Se utiliza para determinar el porcentaje de los
valores de los datos que deben encontrarse
dentro de un número determinado de
desviaciones estándar de la media si la
distribución de los datos presenta forma de
campana:
Regla empírica
1. Cerca del 68% de los
valores están a no mas
de una desviación
estándar de la media
2. Aproximadamente el
68%
95% de los valores de
los datos están a no
más de 2 desviaciones 95%
estándar de la media
3. Casi todos los valores 99.7%
están a no más de tres
desviaciones estándar Z= -3 -2 -1 0 +1 +2 +3
de la media.
Regla empírica
EJEMPLO
Según datos del censo de INEGI, existen en promedio 160 personas
mayores de 60 años por AGEB en la ciudad de Cuernavaca, si
sabemos que la desviación estándar en el área de estudio es de 2.5
personas, utilizando la regla empírica, se pude saber que:
1. Aproximadamente el 68% de los AGEBs en el área de estudio
tendrán entre 157.5 y 162.5 personas mayores de 60 años. (están
a no mas de una desviación estándar de la media)
2. Cerca del 95% de los AGEBs tienen entre 155 y 165 personas
mayores de 60 años (están a no más de dos desviaciones
estándar de la media)
3. Casi todos los AGEBs tienen entre 152.5 y 167.5 personas
mayores de 60 años. (están a no más de 3 desviaciones estándar
de a media)
Detección de observaciones
atípicas
Z= -3 -2 -1 0 +1 +2 +3
Análisis exploratorio de datos
Análisis exploratorio de datos
Resumen de cinco números
60
Viviendas sin Drenaje (%)
55
50
45
40
35
0 1000 2000 3000 4000 5000 6000
Distancia del centro (metros)
Medidas de asociación entre dos
variables
Covarianza
• Para medir la fuerza de la relación lineal entre
la distancia que tienen las manzanas respecto
al centro y el porcentaje de viviendas sin
drenaje.
• Se emplea la fórmula para concer la
covarianza:
Medidas de asociación entre dos
variables
Covarianza
xi yi
Manzana Distancia del Viviendas sin
centro (m) drenaje (%)
ҧ
𝑥=3000 ത
𝑦=51 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
1 2000 50 -1000 -1 1000
2 5000 57 2000 6 12000
3 1000 41 -2000 -10 20000
4 3000 54 0 3 0
5 4000 54 1000 3 3000
6 1000 38 -2000 -13 26000
7 5000 63 2000 12 24000
8 3000 48 0 -3 0
9 4000 59 1000 8 8000
10 2000 46 -1000 -5 5000
Totales 30000 510 0 0 99000
99000
𝑠𝑥𝑦 = = 11000
10 − 1
¿Cómo se interpreta el valor de
la covarianza?
𝑥=3000
ҧ
Viviendas sin drenaje con relación a su distancia del centro de la ciudad
65
60
II I
Viviendas sin Drenaje (%)
55
50
𝑦=51
ത
45
III IV
40
35
0 1000 2000 3000 4000 5000 6000
Distancia del centro (metros)
¿Cómo se interpreta el valor de
la covarianza?
𝑠𝑥𝑦 11000
𝑟𝑥𝑦 = = = +0.93
𝑠𝑥 𝑠𝑦 (1490.71)(7.93)
Interpretación del coeficiente
de correlación