Está en la página 1de 17

1

MEDIDAS DE DISPERSION.

Hasta ahora hemos aprendido a organizar los datos en tablas de distribución de frecuencias y a determinar la medida de tendencia
central de los datos, que consiste en resumir en un solo valor los diferentes valores que toma la variable.
Las medidas de dispersión son una información complementaria para poder describir el comportamiento de los datos, porque solo los
valores de las medidas de posición central no son suficientes para su completa caracterización.
Las medidas de dispersión nos permiten cuantificar el grado de dispersión o concentración de los datos alrededor del valor promedio
de la distribución, así:

Una alta dispersión implica una baja concentración


Una baja dispersión implica una alta concentración

Las medidas de dispersión son útiles para:


● Verificar la confiabilidad de los promedios
● Para que sirva como base para el control de la variación misma

Entre las medidas de dispersión tenemos:

1. Medidas de distancia.

● Intervalo, rango o recorrido de la variable.


● Intervalo intercuartílico.
● Recorrido semintercuartilico
● Intervalo percentílico.

2. Medidas de dispersión promedio absoluta.

● Desviación media absoluta.


● Desviación mediana absoluta
● Varianza y desviación típica..

3. Medidas de dispersión relativa.

● Coeficiente de variabilidad.
● Coeficiente de desviación cuartil.

1. Medidas de Distancia.

1.1 Intervalo, rango o recorrido de la variable “R”.


Se lo define, como la diferencia entre el mayor y el menor valor observado.

R = Xmáximo - Xmínimo

Cuando los datos estan tabulados

R= Limite superior de la clase mas alta - Limite inferior de la primer clase.

A pesar de que nos brinda una primera idea de la heterogeneidad, tiene el inconveniente de considerar solo los
valores extremos, descuidando el conjunto de valores intermedios. Puede suceder que uno de los valores
extremos se encuentre accidentalmente desplazado y contribuya al valor representativo en este caso el rango o
medida de dispersión sería exagerado.
Para el análisis es conveniente considerar el recorrido pero de ningún modo suficiente. Para subsanar este
inconveniente se utiliza el intervalo intercuartíl.

1.2 Intervalo intercuartíl.


2

RI = Q3 - Q1

Donde: Q1 Q2 Q3

Observación másbaja Observación másalta

Intervalo Intercuartíl

La ventaja del rango intercuartíl es que evita los valores extremos utilizados únicamente la mitad intermedia de
los datos; es decir sin considerar el 25% mas bajo y el 25% mas alto de los valores del conjunto de datos.

1.3 Intervalo semi-intercuartilico.

Esta medida se basa en la posición ocupada por el 50% de los valores centrales de la distribución , esta dado
por:

IS_I =

1.4 Intervalo percentílico.

RP = Pgo – P10

2. Medidas de desviación promedio absoluta.

2.1 Desviación media absoluta.

Se define como la media de los valores absolutos de las desviaciones de los valores observados respecto a la
media aritmética.

; para no tabulados

;para datos tabulados.

2.2 Desviación mediana absoluta.

Se la define como el promedio de los valores absolutos de las desviaciones de los valores observados respecto
de la mediana.
3

, para datos no tabulados

; para datos tabulados

Ejemplo 1:

Xi Xi ordenado

15 + 1.9 10 6.5
12 + 4.9 10 6.5
10 + 6.9 12 4.5
18 + 1.1 14 2.5

14 + 2.9 15 1.5
22 + 5.1 18 1.5

27 + 10.1 20 3.5
20 + 3.1 21 4.5
10 + 6.9 22 5.5

21 + 4.1 27 10.5
1.- Los pesos de 10 niños en Kg. Son: 15, 12, 10, 18, 14, 22, 27, 20, 10 y 21. Determine la desviación media y la
desviación mediana.

Kg es el peso promedio de los niños

Kg se desvia en promedio cada peso observado respecto del peso promedio

Kg es el peso superior del 50 % de pesos mas pequeños o es


el valor por debajo del cual se encuentra el 50% de pesos
más pequeños

Kg se desvia en promedio cada peso respecto del peso mediana


4

Ejemplo 2:

Halle las desviaciones medias y medianas de las siguientes distribuciones:

Intervalos de yi ni ni yi Ni
ni (yi- )
clases
27 - 29 28 1 28 9 1
30 - 32 31 10 310 60 11
33 - 35 34 14 476 42 25
36 - 38 37 33 1221 0 58
39 - 41 40 14 560 42 72
42 - 44 43 7 301 42 79
45 - 47 40 3 138 27 82
82 3034 222

3. Varianza y Desviación típica.

La varianza y desviación estándar son medidas de variabilidad más frecuentemente empleadas. Por desgracia
ninguna tiene una interpretación intuitivamente obvia. Cuando comparamos dos o más conjuntos de datos cuyas
unidades de medición son idénticas podemos decir que una muestra tienen un menor grado de dispersión que otra si
la primera tiene una menor varianza o desviación típica. Sin embargo dudaríamos en hacer una en hacer una
declaración precisa acerca de un conjunto específico de datos cuando se da un valor específico de una u otra medida.

⮚ Varianza o Variancia.
Se define como la media aritmética del cuadrado de las desviaciones de las observaciones con respecto a su
media.
La Varianza de la población se simboliza por

y para los tabulados seria:


5

La desviación estándar de la población es simplemente la raíz cuadrada de la Varianza de la población.

y para datos tabulados seria:

La Varianza de la muestra esta dado por:

Para datos no tabulados.

Para datos tabulados

Para el cálculo de la variancia;

Para muestras grandes n =>60.

observación:
6

Pero para muestras pequeñas el denominador será siempre (n-1) porque:

Cuando las muestras son grandes.

La desviación estándar o típica de la muestra es nada mas que la raíz cuadrada de la Varianza. Así:

Para datos no agrupados:

Para datos agrupados.

Ejemplo 3 :

1. Halle la desviación estándar de la serie de datos:

Frecuencia cardiaca
(Xi)
127 -3 9
129 -1 1
130 0 0
132 2 4
132 2 4
7

Ejercicio 4.

En el siguiente cuadro se nuestra la distribución de acuerdo a su peso expresado en Kg. De 50 escolares.

Intervalo
20 – 25 4 22.5 90 -15 225 900
25 – 30 8 27.5 220 -10 100 800
30 – 35 9 32.5 292.5 -5 25 225
35 – 40 10 37.5 375 0 0 0
40 – 45 7 42.5 297.5 5 25 175
45 – 50 6 47.5 285 10 100 600
50 – 55 6 52.5 312 15 225 350
50 1875 4050

Halle la Varianza y la desviación estándar.

⮚ Varianza calculada a partir de sub muestras.

Si y son las medias aritméticas de dos submuestras de tamaños n1 y n2 respectivamente y y


son sus varianzas de la muestra de tamaño n será:

Donde:

n = n 1 + n2

Estadígrafo que mide la variabilidad dentro de los estratos y se llama intravarianza

Estadígrafo que mide la variabilidad entre estratos y se llama intravarianza

La media global :
8

De manera general para K submuestras de tamaños n 1, n2, ....nk tal que y son las

medias aritméticas; son las varianzas de las submuestras entonces la Varianza de la muestra de
tamaño n es.

ENTRE DENTR
O
Nota: Cada submuestra o estrato tiene una media aritmética, una Varianza y un número de observaciones que
expresa la importancia de cada submuestra. En este caso la variabilidad total S 2 puede deberse tanto a la
variabilidad dentro de cada submuestra como la variabilidad entre estratos.

Ejercicio 5:

Se clasificaron los trabajadores de una mina en 2 categorías, mayores y menores de 25 años y se extrajo la siguiente
información.

Nro de Productivida Varianza


Muestras obreros d media xi S2
Mayores de 25 200 40 4900
Menores de 25 300 60 1600

¿Calcule la varianza total?


9

Propiedades de la varianza:

1. La varianza de un conjunto de observaciones X1, X2, ...Xn. siempre es un número no negativo.


2. La varianza de una constante es cero. Esto significa que si X1, X2, ...Xn = k entonces: V(X)=0.
3. Si a cada observación X1, X2, ...Xn, ,se le adiciona o resta una constante k mayor que cero (k >0) la varianza del
nuevo conjunto de valores y1, y2, ...yn donde y1 = X k para todo i=1, 2, ..k, coincide con la varianza del
conjunto original.

4. Si cada valor del conjunto X1, X2, ...Xn se multiplica por una constante k, la varianza del nuevo conjunto
de valores y1, y2, ...yn donde y = Xk, para todo i = 1,2,....n, es igual a la varianza del conjunto original
multiplicado por el cuadrado de la cte.

5. La varianza del cociente de una variable sobre una cte. Es igual a la varianza de la variable sobre el cuadrado
de la constante.

Usos de la desviación Estándar.

La desviación estándar nos permite determinar con mayor grado de precisión, donde se sitúan los valores de
una distribución de frecuencia en relación con la media. Y esto podemos hacerlo por el teorema formulado
por el matemático Ruso Cheby Shev (1821 - 1894).
El teorema de Chebyshev establece que cualquiera que sea la forma de la distribución, por lo menos 75% de
los valores caerán dentro de dos desviaciones estándar positivas y negativas. Respecto de la media de la distribución, y
un mínimo de 89% de los valores se hallará a 3 desviaciones estándar positivas y negativas con respecto a la media.

Se puede medir con mayor precisión aún el % de elementos que caen dentro de los intervalos específicos bajo la curva
simétrica en forma de campana:

1. Cerca del 68% de los valores de la población caerán dentro de 1 desviación estándar + o – respecto de la media.

2. 95% de los valores se encontrarán dentro de 2 desviaciones estándar + o – respecto de la media.

3. Cerca del 99% de los valores se encontrarán en un intervalo que fluctúa en 3 desviaciones estándar bajo la media y
3 desviaciones estándar por encima de la media.

99 %
95 %
68 %

 2  +
 1 +1+2
10

Ejemplo 6:
Si tenemos una población de 15 frascos de un compuesto producidos en un día, si probamos cada uno para cuantificar
su pureza, tenemos los siguientes datos:

Porcentaje observado de pureza


0.4 0.14 0.17 0.19 0.22
0.6 0.14 0.17 0.21 0.24
0.12 0.15 0.18 0.21 0.25

¿Calcular la desviación estándar?


Analizar los datos a la luz del teorema de Chebyshev

% observado de
impureza Xi
0.04 -0.126 0.015876
0.06 -0.106 0.011236
0.12 -0.046 0.002116
0.14 -0.026 0.000676
0.14 -0.026 0.000676
0.15 -0.016 0.000256
0.17 0.004 0.000016
0.17 0.004 0.000016
0.18 0.014 0.000196
0.19 0.024 0.000576
0.21 0.044 0.001936
0.21 0.044 0.001936
0.22 0.054 0.002916
0.24 0.074 0.005476
0.25 0.084 0.007056
249 0.05096

75% = 0.75 (15) = 11.25


95% = 0.95 (15) = 13.95 = 14

El teorema de Chebyshev dice que por lo menos el 75% de los valores observados se encuentran entre:

Dentro de estos límites


se encuentra po lo
menos el 75% de los
datos
11

Y que un mínimo de 89% de los valores observados se encuentran entre:

Dentro de estos límites se


encuentra como mínimo el
89% de los datos
Concepto de puntuación estándar o (variable tipificada)

La desviación estándar es útil para describir cuanto se aparta de la media de la distribución los elementos individuales
de la observación.
La medida puntuación estándar nos da el número de desviaciones estándar a que determinada observación se encuentra
por debajo o encima de la media.

Xi = Observación i ∇ i= 1, 2, 3 .........n
Zi = Puntuación estándar (variable tipificada).

Como se puede observar la puntuación estándar mide las desviaciones de la variable con respecto a la media en
unidades de desviación estándar.

Ejemplo 7:

Hallar los valores de la variable tipificada Y2 tipificada, si Xi esta tomando los siguientes valores. 2, 4, 6, 8, 10.

2 4 -1.2649
4 16 -0.6324
6 36 0
8 64 0.6324
10 100 1.26449
30 220

Ventajas de la desviación típica.


12

o Es una medida de dispersión que posee mayor estabilidad frente a las fluctuaciones de la muestra tomada.
o Se basa en todos los valores de la variable tanto atendiendo su magnitud como su signo.
o Su estudio es indispensable cuando se trata de interpretar datos con relación a la distribución normal.

3. Medidas de dispersión relativa.

La desviación estándar es una medida de dispersión absoluta porque depende de la magnitud de las observaciones y se
utiliza para comparar la la variación de dos distribuciones siempre y cuando las variables se expresen en las mismas
unidades de mediada y sean aproximadamente del mismo tamaño promedio.
La medida de dispersión relativa es la dispersión absoluta dividida por su media, es decir el número de veces que la
dispersión contiene a la medida aritmética.

La medida de dispersión relativa es adimensional y sirve para hacer comparaciones de la dispersión entre distribuciones
que están en diferentes unidades las cuales no son comparables.

Coeficiente de variación
“CV”

Se lo define como el cociente de la desviación típica o estándar entre su media.

Generalmente el CV es expresado en %, de ahí que se llame % en lugar de las unidades de los datos originales.

Coeficiente de desviación cuartel

Es especialmente apropiado cuando la distribución contiene extremos abiertos, o cuando hay valores extremos, o
cuando se desea hacer una rápida estimación de la dispersión y la media de la dispersión no se necesita para aplicar el
cálculo u otros objetos.

Ejercicio 8:

De las calificaciones de exámenes de los grupos A y B se obtuvo la siguiente información. Para el grupo A la media de
calificaciones fue de 72 puntos con una desviación típica de 9 puntos, mientras que para el grupo B la media aritmética
fue de 52 puntos con una desviación de 6 ¿Diga en cual de los grupos de prueba hubo mayor variación?

Grupo A Grupo B
13

El grupo A tiene mayor variación respecto de su media, que el grupo B.

Ejercicio 9:

Sabemos que la (SM = 1500) la desviación estándar de los médicos es SM = 1500 dólares, en tanto que para los
profesores universitarios es SP = 1000 dólares.
a) ¿ Demuestra esto que la variación de los ingresos de los médicos es 50 % mayor que la variación de los ingresos de
los profesores? La respuesta por supuesto depende de los ingresos medios de los dos grupos de personas.
Si el ingreso medio de los médicos es de 20000 y de los profesores es de 12000.
b) ¿Que podemos decir del grado de dispersión de los ingresos?

Esto revela que los ingresos recibidos por los médicos son mas uniformes que el de los profesores.

Ejercicio 10:

Un conjunto de 20 valores tiene una media igual a 50, otro conjunto de 20 valores tiene una media de 30, la desviación
estándar de los 40 valores considerados es igual a 10 ¿Calcular el coeficiente de variación del conjunto de 40 números?.

Ejercicio 11:

La media y la varianza de un colectivo se han hallado respectivamente, los valores son 4 y 25 ¿Que opinión merece la
media aritmética?.

La media no tiene representatividad alguna, puesto que es muy grande la dispersión de los valores alrededor de ella.

Ejercicio 12:
14

Los ingresos anuales de cuatro personas es : 60000, 75000, 65000 y 150000 ¿La media de estos cuatro valores puede
ser representativa?

En este caso la media aritmética no carece de representatividad pero tampoco posee plenamente, dicha propiedad.

Ejercicio 12:
Las secciones A, B y C de la signatura de Estadística I rinde el mismo examen parcial los resultados obtenidos se
registraron en las siguiente tablas:

Sección A Sección B Sección C


Xi ni Xi ni Hi hiX2
2.5 3 2 - 6 0.1 2.5
7.5 8 6 - 10 0.2 10.0
12.5 22 10 - 14 0,8 86.4
17.5 30 14 - 18 1.00 45
18 - 20
Número de alumnos de
la sección C= 60

a) El profesor de la sección A sostiene que la suya es mejor ¿Es correcta esta afirmación del profesor? ¿Porque?
b) ¿En cual de las secciones las notas son más homogéneas?

Ejercicio 13:

Se mide la resistencia a la rotura de probetas de hormigón armado proveniente de dos empresas constructoras A y B se
tiene que el promedio de la resistencia a la rotura de las probetas de la empresa A fue de 240 Kg/cm 2 con una
desviación típica de 12 Kg/cm2 y la resistencia promedio a la rotura del as probetas provenientes de la empresa B fue
250 Kg/cm2 con una desviación típica de 12Kg/cm2 . Determinar
a) En que prueba hubo mayor dispersión absoluta
b) En que prueba hubo mayor dispersión relativa
15

Algunas aplicaciones.
Sabemos que:

a) Para datos abundantes (con intervalos de t desigual)

b) Para datos abundantes (con intervalos de t igual)


16

Si los datos son escasos (10 a 20 datos) el calculo se lo hace por interpolación lineal. Entre los puntos.

a) Para datos escasos (con intervalos de t desigual)

b) Para datos escasos (con ) solo se elimina

Ejemplo.
Recolección de datos por lectura de “copas” mezcladas. Para diversos intervalos de tiempo se colecciona el fluido
que sale del recipiente en pequeñas “copas”, se agita para uniformizarlo y entonces se analiza.

Intervalo de tiempo Tiempo promedio Concentración C


en el intervalo
0–2 1 0
2–5 3.5 1
5–6 5.5 9
6–8 7.0 20
8 – 12 10 17
12 – 15 13.5 8
15 - 20 17.5 6

C
Curva real
20

15

10 Lectura de
copia
5

2 20 t
17

Ejercicio.
Se recoleccionan datos mediante lecturas instantáneas, en este caso se lee la concentración de trazador a la salida
del recipiente para diversos tiempos. Ejemplo:

¿Calcular y la desviación estándar?

t(seg) C(mol/l)
2 0
5 3
6 15
8 24
12 9
15 8
20 4

También podría gustarte