Está en la página 1de 11

Separata de ayuda 04 Mg.

Héctor Basilio Marcelo

ESTADÍSTICA Y
PROBILIDADES

SEMANA 04

DISPERSIÓN

DOCENTE:

Mg. HÉCTOR BASILIO MARCELO

Huancayo – 2016

Estadística y Probabilidades 1
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

CUANTILES
Se denomina cuantiles a los valores que dividen a los datos ordenados en 100, o 10, o 4 partes iguales.
Percentil o centil. Se denomina centil o percentil k(k = 1, 2, 3, …, 99) al valor numérico que
denotaremos por Pk, que deja por debajo de si el K por 100 de los datos ordenados. Así el percentil 25,
P25, deja por debajo de si el 25% de datos de la serie que se trate. El percentil 50, P50, deja por debajo
de si el 50% de datos. El percentil 75, P75, deja por debajo de si el 75% de datos de la serie que se trate.
Observar que el percentil 50, P50, es igual a la mediana.
Decil. Se denomina decil a cada uno de los nueve percentiles P10, P20, P30,…P90
Cuartil (Q) son estadígrafos de posición que dividen al total de las observaciones, debidamente
ordenadas, en cuatro partes de igual tamaño. P25, P50, P75.
El Q1 es igual al P25
El Q2 es igual a la mediana y es igual a al P50

Esto significa que entre dos cuartiles consecutivas se encuentran no más del 25 % del total de las “n”
observaciones

Xmin Q1 Q2=Me Q3 Xmáx


______________________________________________
n/4 2n/4=n/2 3n/4

El percentil Pk, k = 1,2,3, …,99, de n datos tabulados por intervalos, se deduce por interpolación,
resultando:

 N(k/100) - Fi-1 
Pk  LPk  A 
 fi 
Ejemplo :
Ingresos Número de Frecuencia
Ii personas acumulada
fi Fi
[26, 34> 1 1
[34, 42> 2 3
[42, 50> 4 7
[50, 58> 10 17
[58, 66> 16 33
[66, 74> 8 41
[74, 82> 3 44
[82, 90] 1 45
Total 45

En la tabla:
Calcular, P10, P25, P50, P75, P90
D1, Q1 Me, Q3, D9

MEDIDAS DE DISPERSION
¿POR QUÉ ESTUDIAR LA DISPERSIÓN?

 Un promedio como la media y la mediana solamente localiza el centro de los datos, pero un
promedio no dice nada a cerca de la dispersión de los datos.
 Si las observaciones están alrededor de su media, se dice que la media es representativa de
esos datos, pero si están muy alejados, la media no es confiable.

Estadística y Probabilidades 2
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

 Las medidas de dispersión nos ayudan a comparar dos o más distribuciones.

RANGO:
Es la longitud del alcance.
Si A= a;b R= 1(A)= b – a
Donde
a= es el dato de menor valor
b= es el dato de mayor valor, nos proporciona la magnitud global.
Ejemplo:
Si las calificaciones del curso de Matemática tiene un alcance de 02; 09 y la de Geometría 04; 19. ¿Cuál
de los cursos tiene mayor rango?

DESVIACIÓN MEDIA

 Desviación media: Es la desviación promedio de los valores del conjunto de datos con respecto
a la media.
Es la suma d los valores absolutos de las desviaciones de los datos o marcas de clase con respecto
a la media aritmética. ( X )
DESVIACIÓN MEDIA PARA DATOS NO AGRUPADOS

 Xi - X
Donde: DM  i 1

Xi= Marca de clase N


X = Media aritmética
N= número de observaciones
Ejemplo:
Los pesos de una muestra de cajas con libros en una librería son (en lb) 103, 97, 101, 106 y 103.
Hallar la D.M.

X = 510/5 = 102 lb DM= (1 + 5 + 1 + 4 + 1)/5 DM= 12/5 = 2,4

Por lo general los pesos de las cajas están a 2,4 lb del peso promedio de 102 lb.

DESVIACIÓN MEDIA PARA DATOS AGRUPADOS


n

 mi - X fi
DM  i 1
N
Nota: La desviación media respecto a la mediana es mínima.
Ejemplo: Para calcular la desviación media de los 45 ingresos quincenales en dólares,
tabulados en una distribución de frecuencias de 8 intervalos se dispone del siguiente cuadro.
Ingresos mi. fi I mi – X I fiI mi – X I
Ii
[26 – 34> 30 1 30,04 30,04
[34 – 42> 38 2 22,04 44,08
[42 – 50> 46 4 14,04 56,16
[50 – 58> 54 10 6,04 60,4
[58 – 66> 62 16 1,96 31,36

Estadística y Probabilidades 3
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

[66 – 74> 70 8 9,96 79,68


[74 – 82> 78 3 17,96 53,88
[82 – 90> 86 1 25,96 25,96
total 45 381,56
La media es 60,04 La desviación media = 8,48
LA VARIANZA
Es un estadígrafo de dispersión absoluta cuyo valor es igual al promedio de los cuadrados de los desvíos
de los valores de la variable con respecto a la media.
La varianza se expresa en unidades cuadradas, pero es muy útil e importante n el análisis estadístico.
VARIANZA PARA DATOS NO AGRUPADOS
n

 (Xi - X) 2 N
S 2 x  �xi2 - N X
2
S  2
X
i 1
i 1
N
VARIANZA PARA DATOS AGRUPADOS
n

 (mi - X) 2
fi K �K
N �fimi2 - �
2

�fimi �
K
2
S 
2
X
i 1
� � S 2 x  �fi mi2 - N X
S2x  i 1 i 1
N 2
i 1
N

Si n<30 se usa varianza corregida de Cochran para conseguir un buen estimado del parámetro
poblacional (  2 )

PARA DATOS AGRUPADOS


n

 (mi - X) 2
fi
S 
2
X
i 1
n -1

Donde (n – 1) son grados de libertad

Ejemplo : Para calcular la varianza de los 45 ingresos quincenales en dólares, tabulados


en una distribución de frecuencias de 8 intervalos se dispone del siguiente cuadro.
Ingresos
mi. fi fi mi. fi.(mi)2
Ii
[26 – 34> 30 1 30 900
[34 – 42> 38 2 76 2888
[42 – 50> 46 4 184 8464
[50 – 58> 54 10 540 29160
[58 – 66> 62 16 992 61504
[66 – 74> 70 8 560 39200
[74 – 82> 78 3 234 18252
[82 – 90> 86 1 86 7396
total 45 2702 167764
La media es 60,04

K 2
�K �
N� fimi2 -� �fimi �
i 1 � i 1
2
�  45(167 764) - (2702)  248 576 = 122,75
S2x 
N2 452 2 025

Estadística y Probabilidades 4
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

Calculo de la varianza utilizando un punto arbitrario:


mk : el punto medio de uno de los intervalos de clase elegido arbitrariamente

mi - mk
ui 
C
K 2
�K �
N �fiui2 - � �i i �
f u
S 2x 
i 1 � i 1 � .C 2
N 2
Ejemplo: Calcula la varianza de los 45 ingresos quincenales en dólares, tabulados en una distribución de
frecuencias de 8 intervalos utilizando un punto arbitrario. mk = 62
Ingresos
mi. ui fi fi ui. fi.(ui)2
Ii
[26 – 34> 30 -4 1 -4 16
[34 – 42> 38 -3 2 -6 18
[42 – 50> 46 -2 4 -8 16
[50 – 58> 54 -1 10 -10 10
[58 – 66> 62 0 16 0 0
[66 – 74> 70 1 8 8 8
[74 – 82> 78 2 3 6 12
[82 – 90> 86 3 1 3 9
total 45 -11 89

K 2
�K �
N �fiui2 - ��i i f u � 2
� � 2 45(89) - �
�-11�
� 2
Sx2  i 1 i 1
.A  .8  122,754
N2 452

DESVIACIÓN ESTANDAR (TÍPICA) (Sx)


Es la raíz cuadrada positiva de la varianza
D. ESTANDAR PARA DATOS NO AGRUPADOS.

Sx  Var
N
2
Sx  �xi2 - N X
i 1

D. ESTANDAR PARA DATOS AGRUPADOS

n
2
 (mi - X) 2
fi K �K
N �fimi2 - �

�fimi �
SX  i 1
Sx  i 1 � i 1 �
N N 2

Para calcular la desviación típica de los 45 ingresos quincenales en dólares, tabulados en una distribución
de frecuencias de 8 intervalos.
S x  122,754 =11,08

Estadística y Probabilidades 5
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

Nota: Supongamos que dos conjuntos de N1 y N2 números (frecuencias totales de dos


muestras)
Tienen varianzas dadas A1 y A2 respectivamente, y tienen la misma media aritmética. Entonces
la varianza común será.

N1A1  N2 A2
S 2x 
N1  N2

INTERPRETACIÓN Y USO DE LA DEVIACIÓN ESTÁNDAR

La desviación estándar se usa como una medida para comparar la dispersión en dos o más conjuntos de
observaciones
Una desviación estándar pequeña para un conjunto de valores indica que éstos se encuentran localizados
cerca de la media.
Por el contrario, un valor grande revela que las observaciones están lejos de la media.

COEFICIENTE DE VARIACIÓN

Es una medida de dispersión relativa que cuantifica el grado de variabilidad con respecto a la media,
generalmente se expresa en porcentaje.

Sx
CV  (100%)
X

El valor obtenido mediante la fórmula anterior, se compara con el valor convencional de 33% que indica el
límite de homogeneidad (menor o igual que 33%) o de heterogeneidad (mayor a 33%). Esto es, cuando
menor es el valor del C.V. mayor es la homogeneidad.

OBSERVACIONES:
Las medidas de dispersión son los que cuantifican el grado de concentración o de dispersión de los
valores de la variable entorno de un promedio o valor central de la distribución. Por lo cual a las medidas
de dispersión se le necesita por dos razones:
 Verificar la confiabilidad de los promedios.
 Sirva de base de control de la variación de los promedios.
Alta dispersión – baja concentración
Baja dispersión – Alta concentración
EJEMPLO: Un estudio de las calificaciones obtenidas en un curso arroja un promedio de 200 y una
desviación estándar de 40. La media del número de años de servicios fue de 20 y la desviación estándar
fue de 2 años.
Compare ambas dispersiones.
40
CV  (100%)  20%
200
2
CV  (100%)  10%
20
Al observar los resultados se puede interpretar que existe mayor dispersión relativa con respecto a la
media en la distribución de las calificaciones que en la distribución de los años de servicio.

Ejemplo 2:
Calcular el coeficiente de variación de los 45 ingresos quincenales en dólares, tabulados en una
distribución de frecuencias de 8 intervalos.

Estadística y Probabilidades 6
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

Sx 11,08
CV  (100%)  (100%)  18,45%
X 60,04

INDICE DE ASIMETRIA:

f f f

X  Mo  Me
Mo < Me < X
X < Me < Mo
X > Me > Mo
Fig 1 (As = 0) Fig. 2 (As > 0) Fig. 3 (As < 0)
Asimetría positiva Asimetría negativa
Si las distribuciones representan al rendimiento de una prueba de examen diríamos que la
distribución:
(1) Representa un rendimiento normal o aceptable
(2) Representa un rendimiento pésimo
(3) Representa un buen rendimiento

En distribuciones asimétricas se verifica que:


X - Mo �3( X - Me)
El índice de asimetría de Pearson As, se define como el cociente de la media menos la moda sobre
la desviación estándar:
X - Mo
As 
S
3(X - Me)
As 
S
Interpretación:
Si la distribución es simétrica, entonces, As = 0
Ejemplo :
Calcular el índice de asimetría de los 45 ingresos quincenales en dólares, tabulados en una distribución
de frecuencias de 8 intervalos.
3(60,04 - 60,75)
As   -0,192
11,08
Practica 1
1. Halla el Rango de cada una de las series de números:
a) 12, 6, 7, 3, 15, 10, 18, 5
b) 9, 3, 8, 8, 9, 8, 9, 18
2. Hallar el rango de las series de los números:
a) 5, 3, 8, 4, 7, 6, 12, 4, 3.
b) 8,7772; 6,453; 10, 624; 8,628; 9,434; 6,351
3. Hallar la desviación media de las alturas de las 100 estudiantes de la universidad Inca Garcilazo

Estadística y Probabilidades 7
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

Alturas (pulg) Frecuencias


Absolutas
60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
72 – 74 8
4. Hallar la desviación media de las series de números:
a) 3, 7, 9, 5
b) 2, 4, 1, 6, 3, 8, 4, 1, 3, 4
5. Hallar la desviación media de los máximos de carga de la siguiente tabla:

Máximo de carga Frecuencia absoluta


(toneladas cortas)
9,3 – 9,7 2
9,8 – 10,2 5
10,3 – 10,7 12
10,8 – 11,2 17
11,3 – 11,7 14
11,8 – 12,2 6
12,3 – 12,7 3
12,8 – 13,2 1
Total= 60

6. Hallar la desviación típica de cada una de las dos series de números del ejercicio 1

7. Hallar la desviación típica de los números:


a) 3, 6, 2, 1, 7, 5
b) 3, 2; 4,6; 2,8; 5,2; 4,4

8. a) Sumando 5 a cada uno de los números 3, 6, 2, 1, 7, 5 Demostrar que las dos series tienen las
mismas desviaciones típicas, pero diferentes medias. ¿Cómo son las medias entre sí?

b) Multiplicando cada uno de los números 3, 6, 2, 1, 7, 5 por 2 y después sumando 5. ¿Cuáles son
las relaciones entre las desviaciones típicas y las medias de las dos series?

9. Hallar la desviación típica para las distribuciones de:


Máximo de carga Frecuencia
(toneladas cortas) absoluta
9,3 – 9,7 2
9,8 – 10,2 5
10,3 – 10,7 12
10,8 – 11,2 17
11,3 – 11,7 14
11,8 – 12,2 6
12,3 – 12,7 3
12,8 – 13,2 1
Total= 60

Calificación Número de
estudiantes
90 – 100 9
80 – 89 32
70 – 79 43

Estadística y Probabilidades 8
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

60 – 69 21
50 – 59 11
40 – 49 3
30 – 39 1
Total= 120

10. Hallar la varianza de las series de números del problema 1

11. Hallar la desviación típica de las alturas de los 100 estudiantes de la universidad Inca Garcilazo
(problema 3)

12. Hallar la varianza para los datos del problema 3

13. Probar si cumple o no:


Desviación media = 4/5 (desviación típica)
Rango semi-intercuartil= 2/3 (desviación típica)
Para la distribución de las alturas de los estudiantes en la Universidad Inca Garcilazo.(Problema 3)
Sugerencia:
Rango semi-intercuartil: RI Es la diferencia entre sus cuartiles tercero y primero.
RI = Q3 – Q1
14. Hallar la Desviación media y la Desviación típica para la distribución de los salarios de los 65
empleados de la compañía P y R .

Salarios(dólares) Número de
empleados
50 – 59,99 8
60 – 69,99 10
70 – 79,99 16
80 – 89,99 14
90 – 99,99 10
100 – 109,99 5
110 – 119,99 2

15. La siguiente tabla muestra el cociente de inteligencia de 480 alumnos de una cierta escuela
elemental. Hallar la media y la desviación típica.

Marcas de
70 74 78 82 86 90 94 98 102 106 110 114 118 122 126
clase
Frecuencias 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2

16. Sea la distribución de frecuencias de las notas de Análisis Matemático I . Hallar la varianza, la
desviación típica y el coeficiente de variación
Yi-1 – Yi fi
00 – 02 3
02 – 04 5
04 – 06 2
06 – 08 12
08 – 10 8
10 – 12 3
12 – 14 7
14 – 16 10

Estadística y Probabilidades 9
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

17. En un test aplicado a 100 personas se obtuvo la siguiente información los puntajes se tabularon
en una distribución de frecuencias de 5 intervalos de amplitudes iguales, siendo el puntaje mínimo de
40 y el máximo de 90. La frecuencia absoluta del intervalo central fue de 40 y del quinto de 10. La
frecuencia relativa del primer intervalo fue de 0,05 y la del cuarto de 0,15.
a) Calcular la varianza y el índice de asimetría
b) Calcular la varianza si a cada persona se bonifica con 10 puntos

18. Una prueba de conocimientos A, se calificó sobre 20 puntos dando una media de 12 y una
desviación estándar de 2 puntos, Mientras que una prueba B, se calificó sobre 100 puntos, dando
una media de 70 y una desviación estándar de 5.
a) ¿En cuál de las dos pruebas los puntajes son mas homogéneos?
b) Si Juan tiene 14 en A y Luis 73 en B ¿quién tiene mejor rendimiento?

19. Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variación del 5% en el
mes de agosto. Para el mes de setiembre hay un aumento a cada trabajador del 20% de su sueldo
mas una bonificación de 60$ y el coeficiente de variación baja al 4%
a) Calcular la media y la desviación estándar de los sueldos del mes de agosto
b) ¿cuánto dinero adicional necesita la empresa para pagar todos los sueldos del mes de setiembre?

20. La distribución de los sueldos (en dólares) de los empelados de dos empresas A y B se tabularon
en 3 intervalos de igual amplitud en cada caso; siendo las frecuencias absolutas del primero al
tercero de 10, 30, 30 y de 30, 50, 20 respectivamente en A y B. si los sueldos mínimo y máximo son
de 50 y 200 en A y de 60 y 240 en B
a) En que empresa los sueldos son más homogéneos

21. Las notas de un examen se tabularon en una distribución de frecuencias de cuatro intervalos de
amplitudes iguales a cuatro, siendo el dato mínimo igual a cuatro y las frecuencias relativas primera y
tercera respectivamente 0,15 y 0,35. Calcule la varianza de la distribución si la media aritmética es
12,4

22. El costo en dólares por operación en una clínica depende del tiempo X en horas, que esta dure y
es igual a C(X) = 50 + 100X +250X 2 , calcular el costo promedio de 30 operaciones si su media y su
desviación estándar es igual a 2 horas.

23. Los sueldos en dólares de 50 empleados de una empresa se dan en la siguiente tabla:

Sueldos 60 – 100 100 – 140 140 – 180 180 – 220 220 – 260
Empleados 8 10 20 7 5

Se plantea dos alternativas de aumento: La primera. Consiste en un aumento general de $50. La


segunda consiste en una aumento general del 30% del sueldo. Además una bonifación de $10.
¿Cuál de las dos propuestas conviene a los trabajadores si el interés es:
a) Subir la media de los sueldos?
b) Bajar la dispersión de los sueldos?

24. Al calcular la media y la desviación estándar de 80 datos, resultaron 30 y 4 respectivamente. Un


chequeo mostró que en lugar del valor 1,7 se introdujo 17. Corregir la media y al desviación estándar.

25. Los porcentajes de objetos defectuosos encontrados en un número de cajas revisadas, se


tabularon en una distribución de frecuencias de seis intervalos de amplitudes iguales, con frecuencias
relativas del primero al sexto: 0,15; 0,25; 0,3; 0,2; 0,05; y 0,05. Calcular su varianza, si se sabe que
su media es 27 y que el punto medio del tercer intervalo es 27,5.

Estadística y Probabilidades 10
Separata de ayuda 04 Mg. Héctor Basilio Marcelo

26. Verificar que si dos series de datos tiene respectivamente tamaños n1 , n2, medias x1 , x 2 y
varianzas S12 , S22 , entonces la varianza (total) de las dos series en conjunto está dada por:

n1n2
(n1S12 +n2S 22 )+ ( x 1-x 2 )2
n1+n2
S2t 
n1  n2

Estadística y Probabilidades 11

También podría gustarte