Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas Numéricas
3-1
Datos en Información
Descripción Gráfica, diagramas y tablas
3-3
Técnicas Descriptivas
Centro y Ubicación
xi XW
wx
i i
x i1
n
w i
N
Punto medio Punto de mayor
W
wx
i i
x i
frecuencia
w i
i1 Punto de
N equilibrio
3-5
Media (Promedio Aritmético)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Media = 3 Media = 4
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5
3-6
Media (Promedio Aritmético)
(continuación)
La Media es el promedio aritmético de los
valores de los datos
Media poblacional N = Tamaño de la Población
N
x
x1 x 2 xN
i
i1
N N
Media muestral
n = Tamaño de la Muestra
n
x i
x1 x 2 x n
x i1
n n
3-7
Mediana
En un arreglo ordenado (de menor a mayor), la
mediana es el número “medio”, es decir, el número
que parte numéricamente a la distribución por la
mitad
50% de los datos están arriba de la mediana, 50% están
debajo
Se representa como Md
La mediana no está afectada por valores extremos
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Mediana = 3 Mediana = 3
3-8
Mediana
(continuación)
3-9
Mediana: Ejemplo
Arreglo ordenado de datos:
4, 4, 5, 5, 9, 11, 12, 14, 16, 19, 22, 23, 24
Observe que n = 13
Busque la ubicación = (1/2)n:
i = (1/2)(13) = 6.5
Desde que 6.5 no es un entero, redondea
hacia arriba (7)
La mediana es el valor en la 7ma ubicación:
Md = 12
3-10
Forma de una Distribución
Describir cómo los datos están distribuídos
Simetrica or asimétrica
A mayor diferencia entre la media y la mediana, mayor es la
asimetría de la distribución
3-11
Mediana vs Media
Arreglo ordenado de datos:
4, 4, 5, 5, 9, 11, 12, 14, 16, 19, 22, 23, 24
Se tenía: Md = 12
De otro lado, se puede verificar que la media es: 12.9. Se tiene un
sesgo hacia la derecha.
Considere que los datos corresponden a niveles de salarios
mensuales en miles de dólares. Suponga que en lugar del salario de
24 se tiene 200. La media pasa a ser 26.5, más del doble, por la
variación de un solo salario. Aún más la media es más grande que
todos los valores, excepto el más alto.
Sin embargo, se puede verificar que este cambio no afecta la
mediana que sigue siendo 12. La mediana no se ve afectada por
valores extremos, a diferencia de la media.
3-12
Moda
Una medida de ubicación
El valor que ocurre con mayor frecuencia
No está afectado por valores extremos
Usado para datos numéricos y categóricos
Podría no haber moda
Podría haber varias modas (2 modas = bimodal)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
Ejemplo: Muestra de 26
proyectos de reparación
Media Ponderada de
Días para Frecuencia Días para Culminar
Culminar
5 4 XW wx
i i
(4 5) (12 6) (8 7) (2 8)
6 12 w i 4 12 8 2
7 8 164
6.31 días
8 2 26
3-15
Ejemplo
Precios de las
casas (Dólares):
2,000,000
500,000
300,000
100,000
100,000
3-16
Estadísticos de Resumen
Precios de las
casas (Dólares): Media: ($ 3,000,000/5)
2,000,000 = $ 600,000
500,000
300,000
100,000 Mediana: Valor medio de los datos
100,000
Suma 3,000,000 ordenados
Md = $ 300,000
3-18
Resumen
Tipo de Método de cálculo Nivel de Ventajas y desventajas
medida medida
central de los
datos
Suma de valores dividida Ratio • Centro numérico de los datos.
Media entre número de valores Intervalo • Suma de desviaciones respecto
de la media es cero.
• Sensible a valores extremos
Percentiles Cuartiles
El pmo percentil en un
arreglo ordenado de datos: 1er cuartil = 25to percentil
3-21
Percentiles
El pmo percentil en un arreglo ordenado de n valores es
el valor en la ubicación ima, donde
Si i no es un entero,
Índice de
redondear hacia arriba
Ubicación p
del
Percentil
i (n) Si i es un entero, considerar
100 el promedio del imo y del
(i+1)mo valor.
p 60 Usar el valor de
i (n) (19) 11.4
100 100 ubicación i = 12do
3-22
Percentiles: Ejemplo
Salarios mensuales en miles de una muestra de 30 ejecutivos:
13.5 8.6 16.2 21.4 21.0 23.7 4.1 13.8 20.5 9.6
11.5 6.5 5.8 10.1 11.1 4.4 12.2 13.0 15.7 13.2
13.4 13.1 21.7 14.6 14.1 12.4 24.9 19.3 26.9 11.7
Q1 Q2 Q3
3-24
Cuartiles
Redondear a 3
25
Q1 = 25to percentil. Encontrar i : i = 100 (9) = 2.25 dado que no es
un entero
3-25
Gráfico de Caja y Bigote
Valores átipicos
* *
Valores “Valor más pequeño” 1er Mediana 3er “Valor más grande”
Atípicos (Límite Inferior) Cuartil Cuartil (Límite Superior)
3-27
Construcción de un Gráfico de
Caja y Bigote
* *
Valores “Valor más pequeño” 1er Mediana 3er “Valor más grande”
Atípicos (Límite Inferior) Cuartil Cuartil (Límite Superior)
3-28
Forma de un Gráfico de Caja y
Bigote
La caja y la línea central están centrados entre los
valores extremos si los datos son simétricos respecto
a la mediana
3-29
Forma de una Distribución y de
su Gráfico de Caja y Bigote
Asimétrica a Asimétrica a
la Izquierda Simétrica la Derecha
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
3-30
Construcción de un Gráfico de
Caja y Bigote
3-31
Gráfico de Caja y Bigote:
Ejemplo
Acontinuación se presenta un arreglo ordenado de datos y
su gráfico de caja y bigote:
Min Q1 Q2 Q3 Max
0 2 2 2 3 3 4 5 6 11 27
*
0 2 3 6 11 27
3-34
Variación
Valor pequeño
Menos variación
Valor grande
Más variación
Mismo centro,
diferente variación
3-35
Rango
Medida más simple de variación
Diferencia entre la observación más grande y la
más pequeña:
Rango = xmáximo – xmínimo
Ejemplo:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Rango = 14 - 1 = 13
3-36
Desventajas del Rango
Ignora la distribución de los datos
7 8 9 10 11 12 7 8 9 10 11 12
Rango = 12 - 7 = 5 Rango = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Rango = 120 - 1 = 119
3-37
Rango Intercuartílico
3-38
Rango Intercuartílico: Ejemplo
Ejemplo:
Mediana X
X Q1 Q3 máximo
mínimo (Q2)
25% 25% 25% 25%
12 30 45 57 70
Rango intercuartílico:
57 – 30 = 27
3-39
Medidas de Variación
Rango Considera solo dos valores de la data
Sensible a valores extremos
Varianza poblacional: i
(x μ) 2
σ
2 i1
N
Varianza muestral: i
(x x ) 2
s
2 i1
n -1
3-41
Desviación Estándar
σ i1
N
n
s i1
n -1
3-42
Desviación Estándar
Muestral: Ejemplo
Datos muestrales (Xi) : 10 12 14 15 17 18 18 24
n=8 Media = x = 16
(10 x ) 2 (12 x ) 2 (14 x ) 2 (24 x ) 2
s
n 1
130
4.3095
7
3-43
Comparación de Desviaciones
Estándar
Misma media pero diferentes
desviaciones estándar:
Datos A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 3.338
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
3-44
¿Qué datos tienen mayor variabilidad?
Datos A: SA = 100
Datos B: SB = 1
Población Muestra
σ s
CV 100% CV 100%
μ x
3-48
Comparación de Coeficientes
de Variación
Acción A:
Precio promedio del año pasado = $50
Desviación estándar = $5
s $5
CVA *100% *100% 10%
x $50 Ambas acciones
tienen la misma
Acción B: desviación
estándar, pero la
Precio promedio del año pasado = $100 Acción B es
Desviación estándar = $5 menos variable
relativo a su
s $5 precio
CVB *100% *100% 5%
x $100
3-49
Regla Empírica
Si la distribución de los datos tiene forma de
campana, entonces el intervalo ( μ 1σ )
contiene alrededor del 68% de los valores
de la población:
68%
μ
μ 1σ
La media y la mediana son iguales
3-50
Regla Empírica
μ 2σ contiene alrededor del 95% de los
valores de la población
μ 3σ contiene alrededor del 99.7% de los
valores de la población
95% 99.7%
μ 2σ μ 3σ
3-51
Teorema de Tchebysheff
Ejemplos:
Al menos Dentro
(1 - 1/12) = 0% ……..... k=1 (μ ± 1σ)
(1 - 1/22) = 75% …........ k=2 (μ ± 2σ)
(1 - 1/32) = 89% ………. k=3 (μ ± 3σ)
3-52
Valores Estandarizados
3-53
Valores Estandarizados
Poblacionales
x μ
z
σ
Donde:
x = valor original del dato
μ = media poblacional
z = valor estandarizado
3-54
Valores Estandarizados
Muestrales
xx
z
s
Donde:
x = valor original del dato
x = media muestral
z = valor estandarizado
(número de desviaciones estándar en que x difiere de x )
3-55
Valor Estandarizado: Ejemplo
Los puntajes de CI en una población tienen
distribución en forma de campana con media
μ = 100 y desviación estándar σ = 15
Encontrar el valor estandarizado (z-score)
para una persona con un CI de 121.
Respuesta: x μ 121 100
z 1.4
σ 15
Alguien con CI de 121 está a 1.4 desviaciones
estándar sobre la media
3-56
Usando Excel
Seleccione:
Datos / Análisis de datos / Estadística
descriptiva
3-57
Usando Excel
(continuación)
Seleccionar:
Datos / Análisis de datos / Estadística descriptiva
3-58
Usando Excel
(continuación)
Diligenciar el
cuadro de diálogo
Seleccionar
“Resumen de
estadísticas”
Click en “Aceptar”
3-59
Resultado del Excel
Estadísticas descriptivas
de los precios de las
casas (usando Excel):
Precios de las
casas:
$2,000,000
500,000
300,000
100,000
100,000
3-60
Resumen
3-61
Resumen
(continuación)
3-62