P. 1
Medidas de dispersion y ejercicios

Medidas de dispersion y ejercicios

1.0

|Views: 59.025|Likes:
Publicado porGabriel Matos
Guia didactica para la resolucion de ejercicios de medidas de dispersion con la inclusion de ejercicios propuestos.
Guia didactica para la resolucion de ejercicios de medidas de dispersion con la inclusion de ejercicios propuestos.

More info:

Published by: Gabriel Matos on Feb 25, 2010
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

11/17/2015

pdf

text

original

MEDIAS DE DISPERSION VARIANZA s La varianza es una medida de variabilidad que utiliza todos los datos.

s Esta basada en la diferencia entre los valores de cada observación (xi) y la media. (x para una muestra, m para una población). s La varianza es el promedio de las diferencias al cuadrado entre cada valor de dato y la media. s Si el conjunto de DATOS ES UNA MUESTRA, la varianza se denota por s2.

CUANDO LOS DATOS SON AGRUPADOS  Si el conjunto de DATOS ES UNA MUESTRA, la varianza es:

∑( xi −x ) 2 s = n −1
2

s

2

∑ f (X =
i

i

− x)2

s Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza se denota por σ 2.

n −1

∑ ( xi − µ ) 2 σ = N CUANDO LOS DATOS SON AGRUPADOS

σ2

2

 Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza es:

σ2 =

fi ( X i − µ )2 N

DESVIACION ESTANDAR s La desviación estándar de un conjunto de datos es la raíz cuadrada positiva de la varianza. s Se mide en las mismas unidades que los datos, haciéndola mas comparable, que la variancia, a la media. s Si el conjunto de DATOS ES UNA MUESTRA, la desviación estándar se denota por s.

s = s2
s Si el conjunto de DATOS ES UNA POBLACIÓN, la desviación estándar se denota por σ (sigma).

σ = σ2
COEFICIENTE DE VARIACION s El coeficiente de variación indica que tan grande es la desviación estándar rn relación al promedio.
Prof. Gabriel Matos Estadística Aplicada.

s Si un conjunto de datos es una muestra, el coeficiente de variación se calcula como sigue:

s (100 ) x

s Si un conjunto de datos es una población, el coeficiente de variación se calcula como sigue:

σ (100 ) µ
 Mide la variación relativa de la variable con respecto a su promedio.  Cuando deseamos comparar la dispersión de dos distribuciones, necesitamos medir la magnitud de la desviación estándar en relación con la magnitud de la media  Expresa a la variación de los datos como porcentaje de su promedio. Las medidas de forma son:  Sesgo  Es el grado de asimetría que tiene la distribución  Una curva insesgada tiene sesgo cero  Medimos en cuánto se aleja la distribución de una insesgada:  Si el polígono de frecuencias tiene la mayor acumulación a la izquierda, tiene sesgo positivo o a la derecha.  Si el polígono de frecuencias tiene la mayor acumulación a la derecha, tiene sesgo negativo o a la izquierda Coeficiente de Asimetría =0 >0 <0 Sesgo No hay sesgo. La distribución es insesgada La distribución tiene sesgo positivo o a la derecha. La distribución tiene sesgo negativo o a la izquierda.

 Curtosis  Mide qué tan “puntiaguda” es una distribución, con respecto a la Normal.  La distribución Normal se considera mesocúrtica, es el término medio.  Las distribuciones mas puntiagudas que la Normal se llaman leptocúrticas  Las distribuciones menos puntiagudas que la Normal se conocen como platocúrticas

Prof. Gabriel Matos Estadística Aplicada.

Leptocúrtica Mesocúrtica P latocúrtica

Función Curtosis =3 >3 <3

Curtosis Mesocúrtica Leptocúrtica Platocúrtica

TEOREMA DE CHEBYSHEV Al menos (1 - 1/k2) de los elementos en un conjunto de datos estará dentro de las k desviaciones estándar del promedio donde k es cualquier valor mayor que 1. • Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la media. • Al menos 89% de los elementos deben estar entre k = 3 desviaciones estándar de la media. Al menos 94% de los elementos deben estar entre k = 4 desviaciones estándar de la media. Cualquiera que sea la forma de la distribución de los datos:  al menos el 75% de los valores (población) caerán dentro de 2 desviaciones estándar respecto de la media de la distribución:

( X ± 2S)

 al menos el 89% de los valores (población) caerán dentro de 3 desviaciones estándar respecto de la media de la distribución:

( X ± 3S)
1) EJEMPLO RESUELTO
Prof. Gabriel Matos Estadística Aplicada.

El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda, varianza y desviación típica.
SOLUCIÓN: La media: suma

de todos los valores de una variable dividida entre el número total de datos de los que se

dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana. La moda: el valor de la variable que presenta una mayor frecuencia es 60 La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Sx2= La desviación típica S: es la raíz cuadrada de la varianza.

S = √ 427,61 = 20.67 El rango: diferencia entre el valor de las observaciones mayor y el menor 80 - 15 = 65 días El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética
CV = 20,67/52,3 = 0,39

2) EJEMPLO
El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras y el diagrama de caja. SOLUCIÓN: (Utilizar la calculadora de debajo)

Prof. Gabriel Matos Estadística Aplicada.

3) EJERCICIO RESUELTO Obtener la varianza y desviación estándar de la siguiente muestra, que nos indica el número de cigarros que son consumidos en promedio al día por un conjunto de 20 encuestados. 2 10 4 2 10 4 6 2
x=

0 3

4 2
i

1 5

0 5

3 8

6 0

∑x
n

La media es igual a

=

77 = 3.85 20

a continuación reportamos la tabla de la diferencia de cuadrados
3.4225
Prof. Gabriel Matos Estadística Aplicada.

( xi − x ) 2 :
14.8225 0.7225 4.6225

0.0225

37.8225

4.6225

14.8225

0.0225

8.1225

37.8225

3.4225

0.0225

3.4225

0.7225

3.4225

1.3225

1.3225

17.2225

14.8225

Por lo que

S

2

∑( x =

i

− x)

2

n

=

171.83 = 8.5915 20

por lo para determinar la desviación estándar basta con obtener la raíz cuadrada, con lo que finalmente la desviación estándar es igual a:

S = 0.6554 cigarros.
4) EJERCICIO RESUELTO A continuación se le dan los resultados de una evaluación de Química aplicada a un grupo de alumnos de 9no grado. Encuentre: a) la Media Aritmética (Promedio) b)la Varianza c) la Desviación Típica 9 14 18 20 13 14 11 10 10 15 9 15 12 11 10 19 12 12 15 16 12 7 13 13 17 16 14 15 17 11 PASO 1: Sume todos los valores y divida entre el número de sumandos: X = 400 / 30= 13,333... INTERVALO DE CLASE 18 - 20 15 – 17 12 - 14 9 - 11 6-8

PASO A REALIZAR 2) Elabore una Distribución Agrupada de frecuencias con una amplitud de 3 (por ejemplo) para cada intervalo.

PASO A REALIZAR 3) Agregue la columna de la marca de clase

INTERVALO DE CLASE 18 - 20 15 – 17 12 – 14 9 - 11 6-8 Xi 19

Xi 19 16 13 10 7 fi 3

PASO A REALIZAR 4) Agregue la
Prof. Gabriel Matos Estadística Aplicada.

INTERVALO DE CLASE 18 - 20

columna de las frecuencias y efectúe la sumatoria

15 – 17 12 – 14 9 - 11 6-8

16 13 10 7

8 10 7 2 = 30


Xi 19 16 13 10 7

PASO A REALIZAR 5) Calculemos la Media Aritmética. Revisa la lección correspondiente a Media aritmética de datos agrupados

INTERVALO DE CLASE 18 - 20 15 – 17 12 – 14 9 - 11 6-8

fi 3 8 10 7 2 30

Xi*fi 57 128 130 70 14 399

=

X = 399 / 30= 13,3. Observa que el Resultado obtenido difiere del resultado exacto (13.3333...) Recuerda: Al menos que sea necesario, nunca agrupes para calcular la media aritmética: PASO A REALIZAR INTERVALO DE CLASE 18 - 20 15 – 17 12 – 14 9 - 11 6-8 Xi 19 16 13 10 7 fi 3 8 10 7 2 = 30 Xi*fi 57 128 130 70 14 399 fi*(x – xi)2 97,47 58,32 0,9 76,23 79,38 312,3

6) Construyamos la columna fi*(x – xi)2

Dividamos la sumatoria de esta última columna entre la sumatoria de fi: s2 = 312,3/30 La Varianza vale s2 = 10,41; Para la Desviación Típica (s), sacamos la raíz cuadrada de la varianza: La Desviación Típica vale s = 3,2265 EJERCICIOS MEDIDAS DE DISPERSIÓN PARA RESOLVER 1) La siguiente tabla presenta el tiempo (en minutos) que se demora un fiscalizador del S.I.I en resolver inconsistencias en los formularios de la declaración de la Renta. Intervalo 40 - 45 45 – 50 50 - 55 55 - 60 60 - 65
Prof. Gabriel Matos Estadística Aplicada.

Fi 7 10 15 13 18

65 - 70 70 - 75 75 - 80

21 16 10

a) Calcule el tiempo medio que se demoran los fiscalizadores. b) Calcule la varianza de los tiempos y su desviación típica. c) Se implementa un software que promete reducir en un 25% los tiempos de las declaraciones. ¿Cuál es el nuevo promedio y la nueva varianza de los tiempos? 1) La varianza de dos números es 1 y su media aritmética es 8. Calcule los números. 2) En una empresa donde los salarios por hora tienen una media de $70 y una desviación estándar de $15, el sindicato solicita que cada salario xi se transforme en yi mediante la siguiente relación. yi = 1,3xi + 10 El directorio acoge parcialmente la petición, rebajando los salarios resultantes yi en un 10%, lo que es aceptado por el sindicato. Se pide calcular la media aritmética y la varianza de la distribución final de los salarios. 6) La siguiente distribución, corresponde a las notas finales obtenidas por un curso de 30 personas en un curso de estadística: Xi 1 2 3 4 5 6 7
Fi

3 6 7 7 3 0 4

Calcule: a) Varianza, desviación estándar y coeficiente de dispersión de las notas b) Cuantifique la simetría en la distribución de las notas 8) Los ingresos mensuales en miles de pesos de un grupo de personas son los siguientes: Ingresos 200-250 250-300 300-350 350-400 400-450 450-500 500-550 a) Coloque las cifras que faltan
Prof. Gabriel Matos Estadística Aplicada.

Fi 2 12 4

Fabac 22 29 34

b) Calcule la media aritmética de los ingresos. 12) La siguiente tabla presenta las notas obtenidas en una prueba por un curso de 20 personas 4,0 3,0 3 2,7 4,3 4,5 3,1 3,4 3,9 4,2 4,5 2,5 4,8 1,9 3,6 4,3 2,1 3,6 4,5 1,1

a) Determine la media y la mediana de las notas del curso (3,45 pts.; 3,6pts) b) El profesor considera que las notas son demasiado bajas y por ello propone elevarlas mediante la siguiente función: y i = 1,2 xi + 0,5 Determine el nuevo promedio de notas: (4,64 pts.) 13) La siguiente tabla muestra el salario de 100 trabajadores en miles de pesos SALARIO 100 – 110 110 – 120 120 – 130 130 – 140 140 - 150
Fi

8 22 40 18 12

a) Calcule el salario promedio de los trabajadores. b) Calcule la varianza de los salarios c) Si la empresa donde trabaja, les ofrece un aumento de remuneraciones que permitirán a ellos $10.000 más o un aumento del 10% d) Recalcule la varianza en razón a los aumentos expuestos 14) La siguiente tabla muestra la distribución de las edades según el sexo de los trabajadores de una empresa EDAD 21 – 25 25 – 35 35 – 45 45 - 60 HOMBRE 2 53 60 25 MUJER 3 60 37 18

a) Calcule el promedio ponderado del hombre y la mujer b) Calcule la varianza y desviación estándar de ambos 15) En una clase hay 35 estudiantes varones con una edad media de 17. 5 años y 15 estudiantes mujeres las que en promedio son 12% más Jóvenes. ¿Cuál es la edad media de la clase?

Prof. Gabriel Matos Estadística Aplicada.

16) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que ambos conjuntos de números tienen la misma desviación típica pero diferentes medias ¿Cómo están relacionadas las medias? 17) El retraso en la entrega de los últimos 100 pedidos de material informático en una empresa se ha agrupado en 4 intervalos, recordándose solo los siguientes datos de la distribución: • • • • a) b) c) d) e) El primer intervalo tiene 6 días como extremo superior, una frecuencia relativa de 0,2 y una amplitud de 4 días. En el segundo intervalo se acumulan 60 entregas retrasadas. Las marcas de clases del segundo y cuarto intervalo son 8 y 50 días, respectivamente. El tercer intervalo presenta una frecuencia de 30 entregas retrasadas y una amplitud de 30 días. Construya la tabla de distribución de frecuencia del tiempo de retraso en las entregas. ¿Cuál es el tiempo medio de demora en las entregas? Calcular la mediana, moda, varianza, desviación estándar, el coeficiente de variación ¿Entre qué valores se encuentra el 50% central del tiempo de retraso en las entregas? Si descontamos el 15% del tiempo de retraso menos en las entregas y el 15% del tiempo de retraso máximo en las entregas. ¿ En qué intervalo de puntuaciones se encuentran los restantes?

Prof. Gabriel Matos Estadística Aplicada.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->