Está en la página 1de 21

INSTITUCION UNIVERSITARIA “ANTONIO JOSÉ CAMACHO”

Temas: I. MEDIDAS DE DISPERSIÒN EN DATOS SIN AGRUPAR.........................................................2


1.1 RANGO.......................................................................................................................................................2
1.2 DESVIACIÓN MEDIA...............................................................................................................................3
1.3 VARIANZA..................................................................................................................................................4
1.3.1 Varianza muestral................................................................................................................................................................4

1.4 DESVIACIÒN ESTANDAR (x )..............................................................................................................6


1.4.1 Regla empírica......................................................................................................................................................................7
1.4.2 Teorema de Chebyshev......................................................................................................................................................8
1.5 COEFICIENTE DE VARIACIÒN............................................................................................................9
II. MEDIDAS DE DISPERSIÒN EN DATOS AGRUPADOS......................................................................10
2.1 VARIANZA PARA DATOS AGRUPADOS........................................................................................10
III. MEDIDAS DE POSICIÒN...........................................................................................................................13
PERCENTILES..................................................................................................................................................13
3.1 CÀLCULO DE PERCENTILES EN DATOS NO AGRUPADOS....................................................14
3.2 CÁLCULO DE PERCENTILES EN DATOS AGRUPADOS...........................................................17
IV EJERCICIOS PROPUESTOS....................................................................................................................19
V BIBLIOGRAFIA..............................................................................................................................................22

I. MEDIDAS DE DISPERSIÒN EN DATOS SIN AGRUPAR

1.1 RANGO

1
Definición y consideraciones: o El rango es la medida de dispersión más sencilla de
calcular e interpretar puesto que simplemente es la distancia entre los valores extremos
(máximo y mínimo) en una distribución.
o La principal desventaja del recorrido es que sólo está influenciado por los valores
extremos, puesto que no cuenta con los demás valores de la variable. Por tal razón,
siempre existe el peligro de que el rango ofrezca una descripción distorsionada de la
dispersión.

Rxmax xmin

Ejemplo

Para una muestra (21, 45, 50, 55, 100, 88, 76, 37), el dato menor es 21 y el dato mayor es 100. Sus
valores se encuentran en un rango de:

Rango = 100 -21 =79

1.2 DESVIACIÓN MEDIA

La desviación media es el promedio de los valores absolutos de las desviaciones respecto de la


media o promedio aritmético. Tiene como fórmula:

Donde:

xi :Representa el valor que toma la variable aleatoria en la i-ésima observación. x

: Representa la Media muestral.

Ejemplo

Calcular la desviación media para el siguiente conjunto de valores: (8, 9, 12, 25, 26, 10,
15, 20).

Este conjunto tiene como media x 15,625

2
Dm  8156,25  9 15,625 ..... 20 15,625  48,250  6,031
8 8

Dm 6,031. Lo que indica que en promedio los datos se alejaron de la media en


6,031 unidades.

Nota: La desviación media presenta un uso limitado debido a las dificultades de manejo algebraico
que muestra su fórmula, por tal razón suelen utilizarse con mayor frecuencia otras medidas de
dispersión presentadas a continuación.

1.3 VARIANZA

Se define como el promedio de los cuadrados de las desviaciones respecto de su media µ. La


varianza de una población se denota por:

(x ) i
2

2  i1 ;
N

xi :Representa el valor que toma la variable aleatoria en la i-ésima observación.


: Representa la media poblacional.
N: Representa el tamaño de la población.

Propiedades de la varianza:

= V(a x +b) = a La varianza es invariable y la varianza de una constate es cero.

1.3.1 Varianza muestral

En el caso de una muestra la expresión para estimar la varianza comúnmente empleada es:
n

(x x)
i
2

3
s2  i1
; Cuasivarianza muestral la cual se convierte en un estimador insesgado para la
n1
varianza poblacional.

Otra expresión para la cuasivarianza que facilita los cálculos:


n 2

 
x
n i 

2  i1 (xi2)  i1n 


s
n1

n: Representa el tamaño de la muestra. xi :Representa el valor que toma la


variable aleatoria en la i-ésima observación. x : Representa la media Muestral.

Ejemplo.

Los siguientes valores corresponden a las edades de un grupo de estudiantes de la UNIAJC que
por primera vez solicitaron créditos académicos.

22, 19, 23, 26, 20, 27, 24, 18 y 23. Con una media x 22.44

Aplicando la primera expresión:

2
(22  22.4)  (19  22.4) ......(23 22.4)
2 2 2
74,22  9,2778 s 

9 1 8

Con la otra forma derivada para obtener la varianza:

i) En primer lugar calculamos las sumas de los x i y xi2.

4
xi xi2 ii) Después reemplazamos los valores en la expresión:
22 484
19 361 
n 2

23 529

x
26 676

s2  i1 (xi2)  i1n   4608  2029   4608 


20 400
n i  2

27 729
4533,77  74,22  9,27 n1 9 1 8 8
24 576

18 324

23 529

202 4608

S2 9,27. La varianza es un indicador difícil de interpretar por encontrarse en unidades


cuadráticas. A continuación se encuentran algunas sugerencias sobre la interpretación de la
dispersión a partir de la desviación estándar.

1.4 DESVIACIÒN ESTANDAR (x )

La desviación estándar se calcula extrayendo la raíz cuadrada de la varianza:


N
( xi   ) 2
2 
i 1
    x
N x ; En el caso de una población.

Para una muestra:

n
( xi  x ) 2
s  s2  
i 1 
n 1
5
Ejemplo:
Para el caso anterior en que: S2 9,27
Entonces s2  9,27  3,04
La desviación indica que en promedio los datos se alejaron de la media en 3,04 unidades.

Otra forma de interpretar la desviación es a partir de la regla empírica la cual aplica cuando se
puede asumir la normalidad de los datos de la población, o su histograma de frecuencias describe
una forma de campana. El teorema de Chebyshev también puede ser utilizado para la
interpretación de la desviación estándar cuando se desconoce la forma de la distribución de los
datos o no es posible asumir la normalidad.

1.4.1 Regla empírica.

Para una población normalmente distribuida, se tiene la siguiente regla empírica:

• El intervalo () contiene aproximadamente el 68% de las observaciones.


• El intervalo ( 2) contiene aproximadamente el 95% de las observaciones
• El intervalo ( 3)contiene aproximadamente el 99,7% de las observaciones

Ejemplo

El tiempo promedio para una transacción rápida en una entidad Bancaria XXXX es de 4.5 minutos
y se distribuye normal con una desviación de 1.2.Describa los datos mediante la distribución
empírica.

() = 3.51.2 = (3.3 - 5.7)


(2)= 3.5 2(1.2) = (2.1 - 6.9)
( 3)= 3.5 3(1.2) = (0.9 -8.1)

3,3 5,7
2,1 6,9
0,9 8,1

INTERPRETACIÒN

El 68% de las transacciones bancarias se realizaron entre (3.3 - 5.7) minutos.


6
El 95% de las transacciones bancarias realizadas estuvieron entre (2.1 - 6.9) minutos.
El 99,7% de las transacciones bancarias realizadas estuvieron entre (0.9-8.1) minutos .
1.4.2 Teorema de Chebyshev

Cuando en un conjunto de datos no se puede asumir normalidad en su distribución, se


emplea el teorema de Chebyshev para realizar interpretaciones sobre la desviación
estándar, el cual sigue el siguiente enunciado:

Dado un número K 1 en un conjunto de n mediciones,

Por lo menos 1(1/ K ) 2


de las mediciones está dentro de K desviaciones de su media.

Tabulando los valore de K

1(1/ K
K

) 2

1 01

2 ¾

3 8/9

De acuerdo con lo anterior el teorema de Chebyshev expresa que:

• Ninguna de las observaciones queda en el intervalo () .


• Por lo menos el 75% de las observaciones quedan en el intervalo ( 2)
• Por lo menos el 89% de las observaciones quedan en el intervalo ( 3)

El teorema de Chebyshev proporciona un límite inferior para la fracción de mediciones que se


encuentra en el intervalo (K), por lo cual se considera muy conservador al indicar la
menor fracción contenida en el intervalo situado a K desviaciones de la media.

Ejemplo

La unidad de recuperación de cartera de una empresa de productos de aseo recolecta


semanalmente un promedio 400 dólares, con una desviación de 50. De acuerdo con la
información anterior, determine entre ¿qué valores se encuentran las cuotas semanales que
pagan los clientes?

Siguiendo enunciado del teorema de Chebyshev, para K=2 y K=3.


1 Cuando K=1 no se considera, por no ofrecer ninguna interpretación en términos de la desviación.
7
• Al menos 75% de los clientes cancelan cuotas semanalmente entre 400 2(50)= (300-500)
dólares.
• Por lo menos el 89% de los clientes pagan cuotas semanales entre 400 3(50)= (250550)
dólares.

1.5 COEFICIENTE DE VARIACIÒN

Se utiliza cuando se requiere realizar la comparación entre dos medidas de dispersión de variables
que representan distintas unidades. El coeficiente de variación es la razón entre la desviación
estándar y la media.

s
CV=
x
 Para expresarlo en términos porcentuales se multiplica por 100.

Ejemplo

Se desea comparar los ingresos promedio de los ejecutivos de una empresa con los ingresos del
personal auxiliar. Para una muestra, los ingresos de medios de los ejecutivos fueron de 700 dólares
la semana, con una desviación estándar de 80. Para los empleados auxiliares la media fue de 200
dólares con una desviación 30. ¿Cuál de las dos poblaciones presenta una mayor dispersión en
sus ingresos semanales?

Para los ejecutivos: CV=


(80/700) *100  11%

Para los empleados auxiliares:


CV= (30/200) *100 = 15%

De acuerdo con el coeficiente de variación los salarios semanales promedio de los auxiliares
presentan mayor dispersión que los de los ejecutivos.
II. MEDIDAS DE DISPERSIÒN EN DATOS AGRUPADOS

2.1 VARIANZA PARA DATOS AGRUPADOS

n (x )
i i
2

8
2  i1
; En una
población N

Para el caso de una muestra:

n (x x)
i i
2

s2  i1
; Donde
n1

xi :Representa la marca de clase (punto medio) del intervalo i. xi  ni :


Representa la frecuencia absoluta para clase i (intervalo i). x : Representa la
Media muestral.

Ejemplo

La siguiente tabla muestra los salarios en dólares por hora para un grupo de enfermeras que
laboran en un centro hospitalario de los Estados Unidos. Para ellas determine la desviación
estándar e interprete.

Frecuencia
salario x hora (ni)
6a8 18
8 a 10 36
10 a 12 2
12 a 14 6
Total 62

Primero
Calculamos las marcas de clase (xi ) para cada intervalo. xi 
Frecuencia xi
salario x hora (ni)
6a8 18 7
8 a 10 36 9
10 a 12 2 11
12 a 14 6 13
Total 62
68
x 7
Para el primer intervalo: i 2

9
Segundo

Posteriormente calculamos los cuadrados de las desviaciones de los puntos medios respecto de la
media. (x 8,87)
Frecuencia xi (xi x)2
salario x hora (ni)
6a8 18 7 3,50
8 a 10 36 9 0,02
10 a 12 2 11 4,54
12 a 14 6 13 17,06
Total 62 25,1076

Tercero

Realizamos el producto entre el cuadrado de las desviaciones y las frecuencias y lo totalizamos,


con lo cual completamos el término del numerador de la fórmula de s 2.

Frecuencia xi (xi x)2 ni (xi x)2


salario x hora (ni)
6a8 18 7 3,50 62,9442
8 a 10 36 9 0,02 0,6084
10 a 12 2 11 4,54 9,0738
12 a 14 6 13 17,06 102,3414
Total 62 25,1076 174,9678

n (x x)
i i
2

s2  i1 n1

Luego dividimos el total de la columna ni (xi x)2 entre n-1 y obtenemos la varianza.

2
174,9678
2,87
S 
61

10
INTERPRETACION
Ahora para calcular la desviación extraemos la raíz cuadrada de la varianza.
S 1,7

Empleando el teorema de Chebyshev se tiene:

• Al menos 75% de las enfermeras del centro hospitalario devengan salarios entre (5,5 y
12,3) dólares la hora.
• Por lo menos el 89% de las enfermeras del centro hospitalario devengan salarios desde
3,8 hasta 14 dólares la hora.

11
III. MEDIDAS DE POSICIÒN
PERCENTILES

Percentiles. Son valores que dividen a la población en cien partes iguales. Los representamos por
PK. Evidentemente los percentiles 25, 50 y 75 coinciden con los cuartiles. Y los percentiles 10, 20,...,
90 coinciden con los deciles.

12
3.1 CÀLCULO DE PERCENTILES EN DATOS NO AGRUPADOS

Para el cálculo de las tres mediadas de posición se recomienda la siguiente fórmula de posición:

P
Pk  (n1) la cual debe de adaptarse a la medida de posición a calcular: 100

13
Ejemplo (percentiles.)

Para los siguientes valores calcule el percentil 25, percentil 42 y percentil 70.

P
4 6 14 15 19 10 8 15 17 Pk  (n1)
100
Percentil 25 P25 Primer

paso:

Ordenar los datos.

4 6 8 10 14 15 15 17 19

Segundo paso:

P 25
 P1  (n1)= (91)= 2.5
100 100

De acuerdo con el resultado de la fórmula para la posición del P 1, localizamos primero el


segundo valor en el conjunto ordenado y después nos movemos 0.5 unidades de la distancia
entre la segunda y tercera observaciones ordenadas: (8-8) 0.5= 0

P1= 6 + (8-6) 0.5 =8 + (2) 0,5= 8 + 1= 9

P1=9 es el valor del percentil 25, lo que significa que el 25% de los elementos toman valores por
debajo de 9 unidades.

Nota:

I. Siempre que la fórmula de posición arroje un valor entero no será necesario


realizar la aproximación por distancia.
II. El valor de las medidas de posición no necesariamente debe de coincidir con
alguno de los valores del conjunto.

Percentil 42 P42

14
P42

Segundo paso (4 6 8 10 14 15 15 17 19)

Al encontrarse los datos ordenados proseguimos al segundo paso, para el cálculo del percentil
42:

P 42
*P42  (n1)= (9 1) = 4.2
100 100

De acuerdo con la fórmula para la posición del P 42 será igual al valor del dato que ocupa la
cuarta posición más 0.2 unidades de la distancia (diferencia) entre las observaciones cuarta y
quinta:

P42= 10+ (14-10) 0.2= 10+0.8=10.8, entonces P 42=10.8.

El 42% de los valores se encuentran por debajo de 10.8 unidades.

Percentil 70 P70

Segundo paso (4 6 8 10 14 15 15 17 19)

Al encontrarse los datos ordenados proseguimos al segundo paso para el cálculo del percentil
70. Recordemos que el percentil 70, es valor por debajo del cual se encuentran el 70% de las
observaciones, por eso reemplazamos P por 70.

P 70
*P70  (n1)= (91) = 7
100 100

Como el resultado de la fórmula de posición para el percentil 70 dió un número entero, entonces
el valor del percentil 70, será el elemento que ocupe esta posición.

P70=15. El 70% de los valores se encuentran por debajo de 15 unidades.


3.2 CÁLCULO DE PERCENTILES EN DATOS AGRUPADOS

La fórmula es parecida a la empleada en el cálculo de la mediana para datos agrupados y se


generaliza como se hizo en el caso de los percentiles en datos sin agrupar.

pn
Ni1
Pk=Linf 100 amp; donde:
ni
15
Linf : Representa el límite inferior del intervalo que contiene al percentil deseado. n:

número de datos en la muestra.

Ci: Amplitud del intervalo que contiene al percentil.

Ni1 : Frecuencia absoluta acumulada de la clase anterior a la que contiene el percentil deseado.

ni: Frecuencia absoluta de la clase que contiene al percentil.

Ejemplo.

Remitiéndose al ejemplo de los salarios de las enfermeras que trabajan en centro hospitalario.

Calcule los percentiles 75 y 60.

PERCENTIL 75

Primer paso: Calculamos las frecuencias acumuladas: absolutas y relativas.


Ni Fi
salario x hora Frecuencia (ni) Frecuencia absoluta acumulada Frecuencia Relativa acumulada
6a8 18 18 0,29
8 a 10 36 54 0,87
10 a 12 2 56 0,9
12 a 14 6 62 1
Total 62

Segundo paso: como el percentil 75 es el valor por debajo del cual se encuentran el 75% de los
datos, observamos en la columna de la frecuencia relativa acumulada y encontramos que el
75% de los datos se ubican en el segundo intervalo.

Entonces aplicando la fórmula para éste intervalo.

Fórmula general del percentil Pk

pn
Ni1
PK=Linf 100 amp;
ni

75(62)
16
18
P75=8 100 2=8 28,5 2 81.599.59
36 36

Interpretación del percentil 75.

P759.59. Tenemos que el 75% de las enfermeras reciben salarios por debajo de 9.59 dólares la
hora.

PERCENTIL SESENTA

Para calcular el percentil sesenta que representa el valor debajo del cual se encuentran el 60%
de los datos, observamos la columna de las frecuencias relativas acumuladas y notamos que el
intervalo que lo contiene es el segundo, coincidiendo para este ejemplo con el intervalo que
contiene al percentil 75, de ahí que lo único que cambia en la fórmula es P=60.

Fórmula general del percentil Pk.

pn
Ni1
Pk=Linf 100 amp
ni

60(62)
18
P60=8 100 2=8 19 .2 281.079.07.
36 36

Interpretación del percentil 60.

P609.07 el 60% de las enfermeras reciben salarios por debajo de 9.07 dólares la hora.

EJERCICIOS PROPUESTOS
EJERCICIO #1
La siguiente tabla muestra la información de los salarios por semana de un grupo de 30
enfermeras en una institución de salud, complete la tabla y responda las siguientes preguntas
17
clase ni fi Ni Fi xi
0 entre 5 2 0,07 2 0,07 2,5

5 entre 10 7 0,23 9 0,3 7,5

10 entre 15 12 0,4 21 0,7 12,5

15 entre 20 6 0,2 27 0,9 17,5

20 entre 25 3 0,1 30 1 22,5

total 30 1

1. F3 representa:
a. El 7% de las enfermeras devengaron salarios inferiores a 5 dólares por semana.
b. Doce enfermeras obtuvieron salarios entre 10 y 15 dólares por semana.
c. El 70 % de las enfermeras devengaron salarios por debajo de 15 dólares semanales
d. El 40% de las enfermeras recibieron salarios entre 5 y 10 dólares por semana
e. Siete enfermeras recibieron salarios entre 0 y 15 dólares por semana.

2. De acuerdo con la tabla no es correcto afirmar que:


a. El 23% de las enfermeras de las enfermeras obtuvieron salarios entre 5 y 10 dólares por
semanas F
b. Dos enfermeras presentaron salarios que no sobrepasan los 5 dólares por semana F
c. El 90 % de las enfermeras obtuvieron salarios por debajo de 20 dólares por semana. F
d. El 40% de las enfermeras devengaron salarios entre 10 y 15 dólares por semana .F
e. El 10% de las enfermeras obtuvieron salarios por debajo de 25 dólares semanales V

3 El promedio salarial aproximadamente fue de:


a. 12,66 b. 10.25 c. 15.4 d. 12.5 e. 10.75

4 La mediana del conjunto aproximadamente fue de:


a. 12,66 b. 10.25 c. 15.4 d. 12.5 e. 15.00

5 la varianza aproximadamente fue de


a. 28.41 b. 26.98 c. 22.5 d. 31.6 e. 9.48

EJERCICIO #2
El siguiente esquema muestra la dispersión de los salarios de gerentes en salud ocupacional, en
millones de pesos para dos empresas del mismo sector.

Compañía A

Compañía B

18
Frente a la dispersión de los salarios clasifique como falso o verdadero cada una en las siguientes
afirmaciones:
a. El promedio salarial de los empleados de la compañía B es mayor que el de la compañía A.

b. La mediana del grupo B es mayor que la del grupo A.

c. Los salarios de grupo A están más dispersos que los de la compañía B

EJERCICIO #3
En un proceso de producción de bombillos se seleccionaron 10 unidades y se llevó a cabo una
prueba con ellos para Determinar la duración. A continuación se describe los tiempos de duración en
meses. (Datos no agrupados)

50 43,3 22,9 34,5 34,8


43,7 39,7 50 39,7 42,4

Para este conjunto de valores la media o promedio aproximadamente es


a) 43.49 b)42,3 c)39,15 d)40.0 e)40,1

Para este conjunto de valores la varianza aproximadamente es


a) 64,45 b)43,3 c)52,06 d)50,01 e)45.82

EJERCICIO #4
La siguiente tabla los días de incapacidad de un grupo de empleados de una empresa del sector
de la construcción en el año 2014.
ni (xi x)2 ni
salario x hora fi Ni Fi Xi Xi n i
2-4 18
4 -6 15
6-8 6
8- 10 11
Total 50
a. Para los valores de la tabla anterior, calcule e interprete la media aritmética. b.
Calcule la varianza.
c. Calcule e interprete la dispersión a partir del coeficiente de variación.

19
20
V BIBLIOGRAFIA
1. Texto Guía, ESTADÍSTICA DESCRIPTIVA, Rubén Darío Corrales V., Publicación ITM AJC, 2ª edición,
2007
2. LINCOYAN PORTUS Govinden, CURSO PRÁCTICO DE ESTADÍSTICA, Editorial Mc Graw Hill.
3. MENDENHALL Reinmuth Y Terry Sincich, 1997 ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA,
Editorial Iberoamericana, Sta fe de Bogotá.
4. KINNEAR/TAYLOR. INVESTIGACIÓN DE MERCADOS. Mc Graw Hill. 2000
5. DOUGLAS A. Lind, WILLIAM G. Marchal, SAMUEL A. Wathen. ESTADÍSTICA APLICADA A LOS
NEGOCIOS Y A LA ECONOMÍA. Editorial Mc Graw – Hill. 12ª. Edición. 2005..
6. WEBSTER A. ESTADÍSTICA APLICADA A LOS NEGOCIOS Y A AL ECONOMÍA. Tercera edición.
McGraw Hill.
7. BERENSON L.,Levine D., Krehbiel T. ESTADÍSTICA PARA ADMINISTRACIÓN. Segunda edición.
Prentice Hall.
8. CEBALLOS R. Argemiro. ESTADISTICA DESCRIPTIVA, Un Enfoque Didáctico Segunda Edición 1992.
9. MARTINEZ CADENA, Luis Fernando. ESTADISTICA DESCRIPTIVA. Primera Edición 1994
10. MURRAY R. Spiegel. ESTADISTICA. Primera Edición. 1987. Editorial McGraw Hill. 11. PERIÓDICOS,
REVISTAS, BASE DE DATOS

21

También podría gustarte