Está en la página 1de 18

ESTADÍSTICA APLICADA I

Medidas de Dispersión
Logro de la sesión

• Al término de la sesión, el estudiante analiza los


datos usando las medidas de tendencia central,
dispersión, posición y asimetría, siendo riguroso en
el cálculo.
Producción diaria de atún

Local A Local B

ഥ𝑨 = 2500 und.
𝒙 ഥ𝑩 = 2500 und.
𝒙

Conservas de atún producidas diariamente según local de producción.

Local A

Local B

Producción de atún

¿En cuál de los dos locales la producción es más


dispersa?
1

Medidas de Dispersión
Medidas de dispersión
Es la medida de dispersión más simple
usada especialmente para pocos datos no
1. Rango: R = Xmáx - Xmín agrupados. Mide la dispersión del 100%
de datos

Usado especialmente en el caso de


2. Rango Intercuartílico:
datos con valores extremos. Mide la
RIC = P75 – P25 dispersión del 50% de datos centrales

Es el más conocido con propiedades


3. Varianza: 𝜎 2 o S2 y usadas en Estadística Inferencial.
Desviación Estándar:  o S

4. Coeficiente de Mide la dispersión relativa respecto a la


variación: CV media aritmética.
Rango ( R ) R = x (máximo) - x (mínimo )

Ejemplo 2:
Se ha medido la resistencia a la deformación de tubos circulares de dos
marcas A y B. Las primeras mediciones obtenidas son las siguientes:

Marca Resistencia a la deformación (kN)


Marca A 96 102 104 108 126 128 150 156
Marca B 114 111 128 114 83 125 121 121

Descriptivo Marca A Marca B


Mínimo
Máximo
Rango

Interpretación: El 100% de las observaciones presenta una variación de …..


RANGO INTERCUARTÍLICO (RIC)

Es la diferencia entre el Cuartil 3 (Q3 = P75 ) y el Cuartil 1 (Q1= P25).

RIC = Q3 – Q1

Como se puede observar este valor considera la variación del 50% de las
observaciones centrales.
La Varianza:
Esta medida es la más utilizada porque considera al total de datos de la
muestra.
Se define como el promedio de los cuadrados de las distancias de cada dato a
la media aritmética.
PARA DATOS SIN AGRUPAR:
Parámetro: N

 Xi   
2

Varianza Poblacional: σ2
V X  2  i 1

PARA DATOS SIN AGRUPAR:


Estadístico: n

 Xi  X 
2
Varianza Muestral: S2
S2  i 1

n 1

Esta varianza la que se va utilizar en el curso


Varianza y desviación estándar para datos agrupados

Datos cuantitativos
Datos discretos continuos o agrupados en
intervalos
2
𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑓𝑖
𝑛 2 /
2
σ σ𝑛𝑖=1 𝑥î − 𝑥ҧ 𝑓𝑖
Muestral 𝑆 =
𝑛−1 𝑆2 =
𝑛−1

2
𝑖=1 𝑥𝑖 − 𝜇 𝑓𝑖
σ𝑁 2 /
2 σ𝑁
𝑖=1 𝑥î −𝜇 𝑓𝑖
Poblacional 𝜎 =
𝑁 𝜎2 =
𝑁
Ejemplo 3:
Para la siguiente tabla de frecuencias calcular: varianza, desviación
estándar y coeficiente de variación:
X : Tiempo utilizado para ensamblar un componente electrónico
(50 ensambles)
Usar la calculadora científica Casio - Natural

HORAS Xi fi
2,8 – 3,3 3,05 2
3,3 – 3,8 3,55 6
3,8 – 4,3 4,05 10
4,3 – 4,8 4,55 17
4,8 – 5,3 5,05 8
5,3 – 5,8 5,55 5
5,8 – 6,3 6,05 2
TOTAL 50

https://www.youtube.com/watch?v=9ql-vTM6gq0
Propiedades de la varianza

Si K es una constante, X e Y son variables:

1. V(X)  0

2. V(K ) = 0

3. V(K X ) = K2 V(X)

4. V(K ± X) = V(X)

5. V( X + Y) = V(X) + V(Y) Si X e Y son variables


V( X - Y) = V(X) + V(Y) independientes
COEFICIENTE DE VARIACIÓN:

Es una medida de dispersión relativa, sirve para comparar las dispersiones


de dos o más grupos de datos. Normalmente se da en porcentaje.

S
CV(X)  x100%
X

El C.V. es útil para comparar dos o mas grupos de datos con diferente
media e inclusive con diferentes unidades de medida, como ejemplo
valores monetarios en soles y dólares.
Aplicación:
Analizar comparativamente los sueldos de los trabajadores
de una empresa de según su categoría.

Desv. Estándar
Categoría Media X C.V
(S)
Directivos 820 3500,0
Empleados 630 2100,0
Operarios 980 1050,0

Se oberva:
CV(direc.) < CV(empl) < CV (operar.)
Los sueldos de los operarios son los más heterogéneos.
Ejemplo 4:
Se tiene cuatro marcas de bombillas A, B, C y D. Se presenta a continuación
la duración (en días) registrada de cierto número de bombillas de cada
marca.
Marca A: duración registrada en días: 5; 10; 12; 13; 18

Marca B Marca C
Duración No. de Duración No. De
(días) bombillas (días) bombillas
3 2 0–5 4
11 4 5 – 10 8
15 3 10 – 15 12
20 1 15 – 20 2

Marca D: duración registrada en días: 11; 12; 12; 13; 14; 15; 15; 15; 15; 16
a. ¿Qué marca compraría usted y por qué? Sustente su respuesta a
base del análisis de las medidas de tendencia central y de
dispersión de los datos presentados.
b. Calcule para las marcas B y D: P25 P75. Interprete estos valores.
Ejercicio:
La siguiente tabla corresponde a los pesos en gramos de dos muestras tomadas
aleatoriamente de cierto embutido que es elaborado por dos máquinas distintas (1
y 2). El muestreo se realizó dado que últimamente se han detectado ciertos
problemas por la diferencia del peso de los embutidos entre las dos máquinas, lo
que ha causado malestar entre los consumidores del producto.
Pesos (g) x´ f máquina A f máquina B
208,0 - 210,7 209,4 0 4
210,7 - 213,4 212,1 1 13
213,4 - 216,1 214,8 8 19
216,1 - 218,8 217,5 17 26
218,8 - 221,5 220,2 30 14
221,5 - 224,2 222,9 17 4
224,2 - 226,9 225,6 7 0
a. Calcule las medidas de dispersión de cada muestra.
b. Se considera que el peso de los embutidos es aceptable si su promedio es de 220
gramos y si la desviación estándar no supera los 3,1 gramos. Si sólo hay discrepancias
con el peso promedio se puede solucionar fácilmente pues las máquinas pueden
regularse desde su tablero de control. En cambio, si los pesos tienen valores muy
dispersos, es necesario reparar la máquina pues la causa es un excesivo desgaste.
Con estos criterios y los datos de las muestras, ¿qué le recomendaría hacer?
Autoevaluación:

Enunciado Verdadero Falso

Cuando el número de datos es grande se usa el


Rango.

La medida estadística que permite comparar la


dispersión de dos o mas grupos de datos es el
coeficiente de variación.

La varianza poblacional se define como la suma


de las diferencias al cuadrado de cada valor
respecto a su media entre el número de datos.

Dispersión es equivalente a valores extremos.


Bibliografía

 Enlace encuestas.com
http://www.encuestas.com.pe/encuesta-aprobacion-presidencial-gfk-abril-2014/
 Diario Gestión
http://gestion.pe/economia/cajamarca-y-su-debil-entorno-economico-2073242
 Publicación digital INEI
http://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1157/libro.pdf
 Cuaderno de Trabajo del curso
Material producido para el curso de coloque aquí el nombre del curso
Autor: Profesores del curso

CE86 ESTADÍSTICA APLICADA 1- EPE


COPYRIGHT © UPC 2018

También podría gustarte