Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MEDIDAS DE DISPERSION.
Hasta ahora hemos aprendido a organizar los datos en tablas de distribución de frecuencias y a determinar la medida de tendencia
central de los datos, que consiste en resumir en un solo valor los diferentes valores que toma la variable.
Las medidas de dispersión son una información complementaria para poder describir el comportamiento de los datos, porque solo los
valores de las medidas de posición central no son suficientes para su completa caracterización.
Las medidas de dispersión nos permiten cuantificar el grado de dispersión o concentración de los datos alrededor del valor promedio
de la distribución, así:
1. Medidas de distancia.
● Coeficiente de variabilidad.
● Coeficiente de desviación cuartil.
1. Medidas de Distancia.
R = Xmáximo - Xmínimo
A pesar de que nos brinda una primera idea de la heterogeneidad, tiene el inconveniente de considerar solo los
valores extremos, descuidando el conjunto de valores intermedios. Puede suceder que uno de los valores
extremos se encuentre accidentalmente desplazado y contribuya al valor representativo en este caso el rango o
medida de dispersión sería exagerado.
Para el análisis es conveniente considerar el recorrido pero de ningún modo suficiente. Para subsanar este
inconveniente se utiliza el intervalo intercuartíl.
RI = Q3 - Q1
Donde: Q1 Q2 Q3
Intervalo Intercuartíl
La ventaja del rango intercuartíl es que evita los valores extremos utilizados únicamente la mitad intermedia de
los datos; es decir sin considerar el 25% mas bajo y el 25% mas alto de los valores del conjunto de datos.
Esta medida se basa en la posición ocupada por el 50% de los valores centrales de la distribución , esta dado
por:
IS_I =
RP = Pgo – P10
Se define como la media de los valores absolutos de las desviaciones de los valores observados respecto a la
media aritmética.
; para no tabulados
Se la define como el promedio de los valores absolutos de las desviaciones de los valores observados respecto
de la mediana.
3
Ejemplo 1:
Xi Xi ordenado
15 + 1.9 10 6.5
12 + 4.9 10 6.5
10 + 6.9 12 4.5
18 + 1.1 14 2.5
14 + 2.9 15 1.5
22 + 5.1 18 1.5
27 + 10.1 20 3.5
20 + 3.1 21 4.5
10 + 6.9 22 5.5
21 + 4.1 27 10.5
1.- Los pesos de 10 niños en Kg. Son: 15, 12, 10, 18, 14, 22, 27, 20, 10 y 21. Determine la desviación media y la
desviación mediana.
Ejemplo 2:
Intervalos de yi ni ni yi Ni
ni (yi- )
clases
27 - 29 28 1 28 9 1
30 - 32 31 10 310 60 11
33 - 35 34 14 476 42 25
36 - 38 37 33 1221 0 58
39 - 41 40 14 560 42 72
42 - 44 43 7 301 42 79
45 - 47 40 3 138 27 82
82 3034 222
La varianza y desviación estándar son medidas de variabilidad más frecuentemente empleadas. Por desgracia
ninguna tiene una interpretación intuitivamente obvia. Cuando comparamos dos o más conjuntos de datos cuyas
unidades de medición son idénticas podemos decir que una muestra tienen un menor grado de dispersión que otra si
la primera tiene una menor varianza o desviación típica. Sin embargo dudaríamos en hacer una en hacer una
declaración precisa acerca de un conjunto específico de datos cuando se da un valor específico de una u otra medida.
⮚ Varianza o Variancia.
Se define como la media aritmética del cuadrado de las desviaciones de las observaciones con respecto a su
media.
La Varianza de la población se simboliza por
observación:
6
La desviación estándar o típica de la muestra es nada mas que la raíz cuadrada de la Varianza. Así:
Ejemplo 3 :
Frecuencia cardiaca
(Xi)
127 -3 9
129 -1 1
130 0 0
132 2 4
132 2 4
7
Ejercicio 4.
Intervalo
20 – 25 4 22.5 90 -15 225 900
25 – 30 8 27.5 220 -10 100 800
30 – 35 9 32.5 292.5 -5 25 225
35 – 40 10 37.5 375 0 0 0
40 – 45 7 42.5 297.5 5 25 175
45 – 50 6 47.5 285 10 100 600
50 – 55 6 52.5 312 15 225 350
50 1875 4050
Donde:
n = n 1 + n2
La media global :
8
De manera general para K submuestras de tamaños n 1, n2, ....nk tal que y son las
medias aritméticas; son las varianzas de las submuestras entonces la Varianza de la muestra de
tamaño n es.
ENTRE DENTR
O
Nota: Cada submuestra o estrato tiene una media aritmética, una Varianza y un número de observaciones que
expresa la importancia de cada submuestra. En este caso la variabilidad total S 2 puede deberse tanto a la
variabilidad dentro de cada submuestra como la variabilidad entre estratos.
Ejercicio 5:
Se clasificaron los trabajadores de una mina en 2 categorías, mayores y menores de 25 años y se extrajo la siguiente
información.
Propiedades de la varianza:
4. Si cada valor del conjunto X1, X2, ...Xn se multiplica por una constante k, la varianza del nuevo conjunto
de valores y1, y2, ...yn donde y = Xk, para todo i = 1,2,....n, es igual a la varianza del conjunto original
multiplicado por el cuadrado de la cte.
5. La varianza del cociente de una variable sobre una cte. Es igual a la varianza de la variable sobre el cuadrado
de la constante.
La desviación estándar nos permite determinar con mayor grado de precisión, donde se sitúan los valores de
una distribución de frecuencia en relación con la media. Y esto podemos hacerlo por el teorema formulado
por el matemático Ruso Cheby Shev (1821 - 1894).
El teorema de Chebyshev establece que cualquiera que sea la forma de la distribución, por lo menos 75% de
los valores caerán dentro de dos desviaciones estándar positivas y negativas. Respecto de la media de la distribución, y
un mínimo de 89% de los valores se hallará a 3 desviaciones estándar positivas y negativas con respecto a la media.
Se puede medir con mayor precisión aún el % de elementos que caen dentro de los intervalos específicos bajo la curva
simétrica en forma de campana:
1. Cerca del 68% de los valores de la población caerán dentro de 1 desviación estándar + o – respecto de la media.
3. Cerca del 99% de los valores se encontrarán en un intervalo que fluctúa en 3 desviaciones estándar bajo la media y
3 desviaciones estándar por encima de la media.
99 %
95 %
68 %
2 +
1 +1+2
10
Ejemplo 6:
Si tenemos una población de 15 frascos de un compuesto producidos en un día, si probamos cada uno para cuantificar
su pureza, tenemos los siguientes datos:
% observado de
impureza Xi
0.04 -0.126 0.015876
0.06 -0.106 0.011236
0.12 -0.046 0.002116
0.14 -0.026 0.000676
0.14 -0.026 0.000676
0.15 -0.016 0.000256
0.17 0.004 0.000016
0.17 0.004 0.000016
0.18 0.014 0.000196
0.19 0.024 0.000576
0.21 0.044 0.001936
0.21 0.044 0.001936
0.22 0.054 0.002916
0.24 0.074 0.005476
0.25 0.084 0.007056
249 0.05096
El teorema de Chebyshev dice que por lo menos el 75% de los valores observados se encuentran entre:
La desviación estándar es útil para describir cuanto se aparta de la media de la distribución los elementos individuales
de la observación.
La medida puntuación estándar nos da el número de desviaciones estándar a que determinada observación se encuentra
por debajo o encima de la media.
Xi = Observación i ∇ i= 1, 2, 3 .........n
Zi = Puntuación estándar (variable tipificada).
Como se puede observar la puntuación estándar mide las desviaciones de la variable con respecto a la media en
unidades de desviación estándar.
Ejemplo 7:
Hallar los valores de la variable tipificada Y2 tipificada, si Xi esta tomando los siguientes valores. 2, 4, 6, 8, 10.
2 4 -1.2649
4 16 -0.6324
6 36 0
8 64 0.6324
10 100 1.26449
30 220
o Es una medida de dispersión que posee mayor estabilidad frente a las fluctuaciones de la muestra tomada.
o Se basa en todos los valores de la variable tanto atendiendo su magnitud como su signo.
o Su estudio es indispensable cuando se trata de interpretar datos con relación a la distribución normal.
La desviación estándar es una medida de dispersión absoluta porque depende de la magnitud de las observaciones y se
utiliza para comparar la la variación de dos distribuciones siempre y cuando las variables se expresen en las mismas
unidades de mediada y sean aproximadamente del mismo tamaño promedio.
La medida de dispersión relativa es la dispersión absoluta dividida por su media, es decir el número de veces que la
dispersión contiene a la medida aritmética.
La medida de dispersión relativa es adimensional y sirve para hacer comparaciones de la dispersión entre distribuciones
que están en diferentes unidades las cuales no son comparables.
Coeficiente de variación
“CV”
Generalmente el CV es expresado en %, de ahí que se llame % en lugar de las unidades de los datos originales.
Es especialmente apropiado cuando la distribución contiene extremos abiertos, o cuando hay valores extremos, o
cuando se desea hacer una rápida estimación de la dispersión y la media de la dispersión no se necesita para aplicar el
cálculo u otros objetos.
Ejercicio 8:
De las calificaciones de exámenes de los grupos A y B se obtuvo la siguiente información. Para el grupo A la media de
calificaciones fue de 72 puntos con una desviación típica de 9 puntos, mientras que para el grupo B la media aritmética
fue de 52 puntos con una desviación de 6 ¿Diga en cual de los grupos de prueba hubo mayor variación?
Grupo A Grupo B
13
Ejercicio 9:
Sabemos que la (SM = 1500) la desviación estándar de los médicos es SM = 1500 dólares, en tanto que para los
profesores universitarios es SP = 1000 dólares.
a) ¿ Demuestra esto que la variación de los ingresos de los médicos es 50 % mayor que la variación de los ingresos de
los profesores? La respuesta por supuesto depende de los ingresos medios de los dos grupos de personas.
Si el ingreso medio de los médicos es de 20000 y de los profesores es de 12000.
b) ¿Que podemos decir del grado de dispersión de los ingresos?
Esto revela que los ingresos recibidos por los médicos son mas uniformes que el de los profesores.
Ejercicio 10:
Un conjunto de 20 valores tiene una media igual a 50, otro conjunto de 20 valores tiene una media de 30, la desviación
estándar de los 40 valores considerados es igual a 10 ¿Calcular el coeficiente de variación del conjunto de 40 números?.
Ejercicio 11:
La media y la varianza de un colectivo se han hallado respectivamente, los valores son 4 y 25 ¿Que opinión merece la
media aritmética?.
La media no tiene representatividad alguna, puesto que es muy grande la dispersión de los valores alrededor de ella.
Ejercicio 12:
14
Los ingresos anuales de cuatro personas es : 60000, 75000, 65000 y 150000 ¿La media de estos cuatro valores puede
ser representativa?
En este caso la media aritmética no carece de representatividad pero tampoco posee plenamente, dicha propiedad.
Ejercicio 12:
Las secciones A, B y C de la signatura de Estadística I rinde el mismo examen parcial los resultados obtenidos se
registraron en las siguiente tablas:
a) El profesor de la sección A sostiene que la suya es mejor ¿Es correcta esta afirmación del profesor? ¿Porque?
b) ¿En cual de las secciones las notas son más homogéneas?
Ejercicio 13:
Se mide la resistencia a la rotura de probetas de hormigón armado proveniente de dos empresas constructoras A y B se
tiene que el promedio de la resistencia a la rotura de las probetas de la empresa A fue de 240 Kg/cm 2 con una
desviación típica de 12 Kg/cm2 y la resistencia promedio a la rotura del as probetas provenientes de la empresa B fue
250 Kg/cm2 con una desviación típica de 12Kg/cm2 . Determinar
a) En que prueba hubo mayor dispersión absoluta
b) En que prueba hubo mayor dispersión relativa
15
Algunas aplicaciones.
Sabemos que:
Si los datos son escasos (10 a 20 datos) el calculo se lo hace por interpolación lineal. Entre los puntos.
Ejemplo.
Recolección de datos por lectura de “copas” mezcladas. Para diversos intervalos de tiempo se colecciona el fluido
que sale del recipiente en pequeñas “copas”, se agita para uniformizarlo y entonces se analiza.
C
Curva real
20
15
10 Lectura de
copia
5
2 20 t
17
Ejercicio.
Se recoleccionan datos mediante lecturas instantáneas, en este caso se lee la concentración de trazador a la salida
del recipiente para diversos tiempos. Ejemplo:
t(seg) C(mol/l)
2 0
5 3
6 15
8 24
12 9
15 8
20 4