Está en la página 1de 40

MEDIDAS DE DISPERSION O DE VARIABILIDAD

GRUPO B

¿Qué grupo es mas disperso?

GRUPO A

Menor dispersión = más homogéneo


Mayor dispersión = menos homogéneo
Menor dispersión = menos heterogéneo
Mayor dispersión = más heterogéneo
1. Variación, se refiere a la cantidad en que
los datos u observaciones varían entre si,
esta variación puede medirse.

2. Los datos que están relativamente


cercanos entre si, tienen bajas medidas de
variabilidad, mientras que los que están
mas alejados entre si tienen medidas de
variación mas grandes,
MEDIDAS DE DISPERSIÓN

Como su mismo nombre lo indica miden la dispersión o


variabilidad de los datos u observaciones en la muestra.
“Las medidas de dispersión son necesarias para
ampliar la descripción de la distribución, ya que
valores promedio similares son producidos por
distribuciones con recorrido diferente”
Ejemplo
GRUPO 1

¿Qué grupo presenta mayor variabilidad?

GRUPO 2
Ejemplo
EXACTITUD Y PRECISION
EJEMPLO:Se tienen datos de resistencia(en
libras por pulgada cuadrada) al estallamiento
obtenidos de dos muestras de seis botellas cada
una:
M1: 230 250 245 258 265 240
M2:190 228 305 240 265 260
MEDIDAS DE DISPERSION ABSOLUTAS

a) Rango (R).- Se define como la diferencia entre


el valor máximo y mínimo .

R=V.max - V.min.

Ejemplo: A continuación se presentan los datos de


consumo de O2 (oxígeno) por un salmón (mm3/h).
• 95 94 94 93 94 94 93 95 93
Determine la amplitud.
A = 95 - 93 = 2 mm3/h
1,0
EJEMPLO
1,3
Los siguientes datos representan la 2,2
2,2
pérdida de peso en Kg, en un grupo de
1,6
personas que se sometieron a un 2,3
tratamiento durante el último año 2,3
2,3
2,1
R = V.max - V.min
2,2
R = 2,3 - 1
R= 1,3 Kg 2,1
2,2
2,3
2,3
2,1
2,1
2,0
2,0
2,1
b) Desviación Media (DM).- Medida de dispersión que
se puede utilizar en aquellas distribuciones en las que
la medida de tendencia central más significativa haya
sido la media.

b1) Para datos sin agrupar b2) Para datos agrupados

n m

x
_


_ - x fi
i
xi - x
DM = i 1

DM = i 1
m

n f
i=1
i
Ejemplo. Los pesos de una muestra de cajas con frenos
en un taller son (en Kg.)
103, 97, 101, 106 y 103.

103  102  97  102  101  102  106  102  103  102


DM   2,4 kg
5
Ejemplo: Del ejemplo medidas de resistencia a rompimiento en onzas,
Calcule la desviación media.

| 17,1  27,36 | 2 | 20,9  27,36 | 7  ......... | 36,1  27,36 | 3


DM   3,82 onzas
40
C) Varianza.- se define como la media de las diferencias cuadráticas
de n observaciones con respecto a su media aritmética
Varianza

Poblacional Muestral

c1)Para datos sin agrupar c2)Para datos agrupados

n n m

(x  (x
_ _
2
2 ( xi  x)  x) 2 f i
i - ) i
S2 i 1
 2 i 1 =
S2 = i 1
= n 1
N n 1
n _2

m _2
x
2
x i  nx 2
Donde: i fi  n x
S 2
= i 1
:Media n 1 S 2 = i 1
n 1
poblacional Donde:
Donde:
_
xi: Observación x :Media muestral _
x :Media muestral
N: Población xi : Observación i
xi:Marca de clase i
n : tamaño de muestra
n: tamaño de muestra

fi; Frecuencia absoluta simple


d) Desviación Estándar o Desviación Típica.- A la raíz cuadrada
(positiva) de la varianza se le denomina desviación estándar o
desviación típica o desviación estándar

Desviación Estándar

d1)Para datos sin agrupar d2)Para datos agrupados

n m

  i
_
( xi  x) 2 ( x  x ) 2
fi
S = i 1
n 1 s i 1
n 1
m

x f n x
n 2 2
_2

i i
x2 i  n x
i 1 s i 1
S =
n 1 n 1
Ejemplo

Determine la varianza y desviación típica


de las siguientes cantidades medidas en
metros:
3,3,4,4,5
Ejemplo.
De las siguientes determinaciones en porcentaje de humedad (H2O):
Calcule e interprete:
a)El promedio aritmético
b)La desviación estándar

0,48 0,37 0,47 0,40 0,44 0,46 0,43


Ejemplo: Consideremos la siguiente tabla para ilustrar el cálculo de la varianza
y desviación estándar

17,12
.2  20,9 2
.7  ....  36,12
.3  40( 27,36 2
)
s2   23,84 onzas 2
39
s  4,88 onzas
e)Recorrido Intercuartílico
Es la diferencia entre el cuartil superior (Q3) y
cuartil inferior (Q1). Cuanto mayor sea RI, mayor
será la dispersión.
RI = Q3 – Q1

Ej. Si en una distribución de


frecuencias de los pesos de 100
estudiantes los cuartiles superior e
inferior son 62 kg y 70 kg
respectivamente, tenemos que:
RI= 70-62 = 8 kg
Coeficiente de variación (CV).- Es una medida de
dispersión relativa, está exenta de unidades y se expresa
en %. Se usa para comparar las dispersiones de dos
distribuciones diferentes.

S
CV = . 100
_
x
Así, si por ejemplo tenemos dos grupos de mujeres de 11 y 25 años
con medias y desviaciones típicas dadas por la tabla siguiente:

Peso Desviación 2
Medio Típica cv  .100  5% (11 años)
40
11 años 40 Kg. 2 Kg.
2
25 años 50 Kg. 2 Kg. cv  .100  4% (25 años)
50
Puede parecernos, al observar en ambos grupos una
desviación típica igual, que ambos grupos de datos tienen la
misma dispersión. No obstante, como parece lógico, no es lo
mismo una variación de dos kilos en un grupo de elefantes que
en uno de conejos. El coeficiente de Variación elimina esa
posible confusión al ser una medida de la variación de los
datos pero en relación con su media. Al grupo de mujeres de 11
años le corresponde un coeficiente de variación de Pearson del
5% y al grupo de mujeres de 25 años le corresponde un coeficiente de
variación de Pearson del 4%

Lo que indica una mayor dispersión en el grupo de mujeres de 11


años.
Ejemplo:
A continuación se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
análisis clínicos. El laboratorio I tiene sus tarifas en
soles y el laboratorio II en dólares ¿Cuál de ellos
tiene un plan tarifario más homogéneo o estable?.

Laboratorio I (soles) Laboratorio II (dólares)


40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar por


cada una de los laboratorios
Laboratorio I
n
 Xi 393
x  i 1
  56.14
n 7
x Xi  x Xi  x  2

40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
 X  393  Xi  x   0  Xi  x 
2
 632,86
Si  Xi  x   632.86
2

n
 i
( X  x )
2
632.86
S i 1
  10.27
n 1 7 1

S
CV  100
x

10.27
CV  100  18.29%
56.14
Laboratorio II n

 Xi 847
x  i 1   105.87
n 8
x Xi  x Xi  x  2

70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
 X  847  
 Xi  x  0,04 
 Xi  x 
2
 11372,88

n
Si  Xi  x 
2
 11372.88
i 1

n
x)
2
 (X i 11372,88
S i 1
  40.30
n 1 8 1

S 40,30
CV  100 CV  100  30,06%
x 105,87

El Laboratorio II presenta una mayor variabilidad


en el plan tarifario.
Ejemplo.
Se han registrado durante 20 días, el número de viajeros que
hacen reservaciones en una agencia de viajes :

Número de
viajeros: xi fi
12 3
13 3
14 6
15 3
16 5
70 20

Calcule e interprete la desviación estándar


EJEMPLO
Las secciones A, B, y C de la asignatura de Estadística del Instituto ALFA ,
rinden el mismo examen parcial. Los resultados obtenidos se muestran en las
siguientes tablas:
Sección A Sección B Sección C
yi fi Intervalos yi*fi Fi fi*yi2
2,5 3 [2 6> 16 6 150
7,5 8 [6 10> 144 12 600
12,5 22 [10 14> 240 48 5184
17,5 30 [14 18> 32 60 2700

a)El profesor de la Sección A sostiene que su sección es la mejor. ¿Es


correcta la afirmación del profesor? Justifique
b)¿En cuál de las secciones las notas son más homogéneas?
c)Justifique el uso de la medida de dispersión de la parte b.
PROPIEDADES DE LA VARIANZA

Donde: k es una constante


X y Y variables
Medidas de Forma de la Distribución
Medidas de Asimetría.- Las medidas de asimetría indican la
deformación horizontal de las distribuciones de frecuencia.


x  Me  Mo

asimetría negativa
asimetría positiva

x  Me  Mo

x  Me  Mo
distribución simétrica
Se concluye que cuando la población tiene un sesgo, la
mediana es la mejor medida de posición, ya que
siempre se encuentra entre la moda y la media
aritmética.
El coeficiente de asimetría se puede calcular de la
siguiente manera:

3( x  Me)
CAs 
s
Si:
CAs = 0 La distribución es simétrica
CAs < 0 La distribución es asimétrica
negativa o sesgada a la Izquierda
CAs > 0 La distribución es asimétrica positiva
o sesgada a la derecha
Medidas de Apuntamiento o Curtosis .- Una medida de
curtosis indica la deformación vertical de una distribución de
frecuencias.
( P75  P25 )
K1   0,5
P90  P10

Distrib. platicurtica
Distrib. leptocúrtica Distrib. mesocúrtica

K--> 0,5
K--> -0,5
También podemos hacer uso de la siguiente fórmula, si los datos
Están agrupados:

k1 
 f ( x  x)
i i
4
/n m4
3  4 3
4
s s
Si:
k1 > 0 La curva es Leptocúrtica

k1 < 0 La curva es Platicúrtica

k1 = 0 La curva es Mesocúrtica
REFERENCIAS BIBLIOGRAFICAS
CORDOVA ZAMORA, Manuel. “ESTADÍSTICA”. EDITORIAL LIBRERÍA MOSHERA.
QUINTA EDICIÓN. 2003.
JAYL. DEVORE. “PROBABILIDAD Y ESTADÍSTICA PARA INGENIERIA Y
CIENCIAS”
INTERNATIONAL THOMSON EDITORES, S.A de C.V . 1998.
RICHARD A JOHNSON. “ PROBABILIDAD Y ESTADISTICA PARA INGENIEROS DE
MILLER Y FREUND”. Ed. PRENTICE – HALL HISPANOAMERICANAS. SA. 1997
MEXICO.
MOYA CALDERON RUFINO. “ESTADÍSTICA DESCRIPTIVA”. CONCEPTO Y
APLICACIONES. EDIT. SAN MARCOS S.A. 1991.
Cuestionario

1. Cuando calculamos la mediana, consideramos a todo el conjunto de


observaciones.
2. Cuando la población esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posición, debido a
que siempre se encuentra entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones están dispersas

4. Las medidas de tendencia central explican la variabilidad de un


conjunto de observaciones
5. La moda es la categoría de mayor frecuencia absoluta acumulada.

6. Si organizamos las observaciones de un conjunto de datos en orden


descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos
7. Cuando se trabaja con datos agrupados, podemos calcular una media
aproximada si suponemos que cada valor de una clase dada es igual a su
punto medio

8. El valor que más se repite en un conjunto de datos se conoce como moda

9.Para un arreglo de datos con 51 observaciones, la mediana será el valor de


la observación numero 26 del conjunto de observaciones.

10.La desviación estándar se mide en las mismas unidades que las


observaciones del conjunto de datos
11. Si la curva de una cierta distribución tiene el extremo mas largo
hacia la izquierda de la escala de medición del eje horizontal, se dice que
la distribución esta negativamente sesgada
12.Después de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero
de observaciones

13.Una mediana calculada a partir de un conjunto de datos en el que se


evidencian datos extremos es una buena estimación del valor real.

14.Podemos calcular una media para cualquier conjunto de datos, si se nos


da su distribución de frecuencias

15.La variable género (femenino, masculino) es dicotómica.

16. El numero de elementos de una población se denota con n


17.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana

18.La diferencia entre las observaciones mas alta y mas baja de un conjunto
de datos se conoce como media geométrica

19.La medidas dispersión cuantifican la variabilidad de un conjunto de datos


.

20.La desviación estándar es igual a la raíz cuadrada positiva de la varianza

21. .La diferencia entre las observaciones mas alta y mas baja de un
conjunto de datos se conoce como el recorrido intercuartílico.

22. El recorrido intercuartílico es la diferencia del cuarto superior y cuarto


inferior.
23.Un percentil es una medida de posición relativa que divide a la
distribución en 100 partes iguales.

24.La varianza es igual a la desviación estándar elevada al cuadrado.

25. .El coeficiente de variación es una medida de dispersión relativa

26. La medida de dispersión que con mas frecuencia utilizan los


especialistas en estadística es la desviación estándar

27.Una de las ventajas de la mediana es que no se ve afectada por


observaciones extremas
28. Una desventaja de la media aritmética es que se ve afectada por datos
extremos.
30. Cada población tiene una varianza que se simboliza con S2

31. Marca de clase es el resultado de medir una característica de


una unidad estadística o elemental.

32.Cuando la población tiene un sesgo, la media resulta ser la


mejor medida de posición

33. Los gráficos circulares son recomendables para representar


variables cuantitativas continuas

34. El cuartil 3 (Q3) es equivalente al percentil 75 (P75) y decil 3


(D3)

También podría gustarte