Está en la página 1de 31

Ingeniería de Minas

SESIÓN N° 5

MEDIDAS DE
DISPERSIÓN

Mag. Elizabeth Zambrano Lázaro


PLAN DE CLASE

Inicio Construcción Cierre


Cierre

• Motivación • Rango • Retroalimentació


• Competencias • Desviación n
• Saberes previos media • Autoevaluación
• Varianza y
coeficiente de
variación
MOTIVACIÓN

En la siguiente figura se muestra gráficas de puntos de tres


muestras con las mismas media y mediana igual a 50. ¿Qué
pueden observar? ¿Para comparar las tres muestras es suficiente
la media?
COMPETENCIAS

Calcula e interpreta
las medidas de
dispersión para datos
no agrupados

Calcula e interpreta
Realiza ejercicios
Medidas de las medidas de
aplicados a su
dispersión dispersión para
carrera.
datos agrupados

Calcula e interpreta
las medidas de
forma y
concentración
SABERES PREVIOS

 ¿Qué es una varianza?

 ¿Qué es una desviación estándar?

 ¿Cuál es el uso de estas medidas de dispersión?


LAS MEDIDAS DE DISPERSIÓN

Las medidas de dispersión o variabilidad miden el grado


de concentración de los datos con respecto a un valor
central. Para medir el grado de concentración de los
datos se tienen en cuenta las desviaciones.

• El rango
• La varianza
• Desviación estándar
• Coeficiente de variación.
EL RANGO
El rango se define como la diferencia entre los dos valores extremos que
de los datos. Es la medida de dispersión más sencilla y también, por tanto,
la que proporciona menos información.
Comparemos, por ejemplo, estas dos series ambas con 50 observaciones

R=18-1=17

R=18-1=17
LA VARIANZA (NO AGRUPADOS)
Es una medida muy usada para el estudio de la dispersión o variabilidad
de los datos.
EJEMPLO 1
Se determinó el valor del módulo de Young (GPa) de placas fundidas
compuestas de ciertos sustratos intermetálicos y se obtuvieron las
siguientes observaciones muestrales:
116.4 115.9 114.6 115.2 115.8
Calcule la varianza.

Solución:

Media aritmética ͞x = 115.58 placas fundidas

Varianza
Xi (Xi-͞x )^2
116.4 (116,4 - 115.58)^2
115.9 (115.9 - 115.58)^2
2
114.6 (114.6 - 115.58)^2   ( 𝑥 ) = 66,795.61 − 5∗ ( 115.58 ) = 0.694
𝑉
115.2 (115.2 - 115.58)^2 5 −1
115.8 (115.8 - 115.58)^2
LA VARIANZA (AGRUPADOS)
 𝜎 2 =
Población ∑ ¿¿¿
𝑖=1

Muestra   𝑛
2
𝑆 =∑ ¿ ¿ ¿
𝑖=1

donde:
xi Son los diferentes valores (en el caso discreto) o las marcas de
clase (en el caso continuo),
fi Son las frecuencias absolutas de una tabla de frecuencia.
EJEMPLO 2
FACULTAD DE CIENCIAS SOCIALES
Los resultados de un test de habilidades sociales aEDUCACION
los 45 trabajadores de una empresa
Y DE LA COMUNICACIÓN
de la ciudad de Huaraz se muestran a continuación. Calcular la varianza

Puntaje de
Xi
habilidades
marca de clase
fi *fi
sociales   ∑ 𝑥 𝑖 ∗ 𝑓𝑖
𝑖= 1
[26 - 34[ 30 1 900 900 µ=
𝑁
[34 - 42[ 38 2 1444 2888
 𝜎 2 =
[42 - 50[
[50 - 58[
46
54
4
10
2116
2916
8464
29160
∑ ¿¿¿
𝑖=1
[58 - 66[ 62 16 3844 61504
[66 - 74[ 70 8 4900 39200
[74 - 82] 78 4 6084 24336
TOTAL N=45 166452 
EJEMPLO 2
FACULTAD DE CIENCIAS SOCIALES
Solución EDUCACION Y DE LA COMUNICACIÓN

1. Hallando la
media:

 µ= = = = 59.86

2. Hallando la varianza:


PROPIEDADES DE LA VARIANZA

 La varianza es siempre un número no negativo; es decir:


V(X)≥0.
 La varianza de una constante es igual a cero; es decir: V(k)=0, k
es una constante.

Nuevo Nueva desviación


Nueva varianza
dato estándar

X±b s2 s
cX c2 s 2 cs
cX±b c2s2 cs
LA DESVIACIÓN ESTÁNDAR

Nos informa sobre la dispersión de los datos respecto al


valor de la media.
Es igual a la raíz cuadrada de la varianza.

Desviación estándar de la muestra

Desviación estándar de la población


 σ= 2
√𝜎
COEFICIENTE DE VARIACIÓN

 El Coeficiente de variación es una medida de dispersión relativa que nos


permite comparar la variabilidad de dos o más conjuntos de datos que se
encuentran en unidades de medidas diferentes.

Para tener en cuenta:

Casos: Conclusión:
CV ≤ 10% El conjunto de datos es homogéneo.
10% < CV ≤ 30% El conjunto de datos es variable.
CV > 30% El conjunto de datos es heterogéneo.
EJEMPLO 3

Del ejemplo 2 calcular la desviación estándar,


coeficiente de variación e interpretar

=
  14.134

Interpretación:
La variabilidad promedio de los puntajes del test de los
trabajadores respecto al puntaje promedio es igual a
14.134 puntos.
Calculando el coeficiente de variación
 

Interpretación:
La variabilidad de los puntajes respecto al promedio es
igual a 23.6%. Se observa que los puntajes son variables
EJEMPLO 04:
Los datos que se muestran a continuación se refieren a la distribución de
40 constructoras de la ciudad de Huaraz que ganaron licitaciones por
montos en dólares durante el año 2019. Determinar la desviación estándar
y el coeficiente de variación.

Nº de
Marca de Clase Xi 2 * fi
MONTOS $ Constructora Xi * fi
mi (Xi)
s fi
300 – 350 325 8 2600 845000
350 – 400 375 9 3375 1265625
400 – 450 425 6 2550 1083750
450 – 500 475 7 3325 1579375
500 – 550 525 4 2100 1102500
550 – 600 575 6 3450 1983750
TOTAL 40 17400 7860000

 𝜎 2 =   𝑛 𝑺
∑ ¿¿¿   2
𝑆 =∑ ¿ ¿𝑪𝑽
¿ =
𝒙
´
𝒙 𝟏𝟎𝟎
𝑖=1 𝑖= 1

104,67 CV=19,6%
SOLUCIÓN:
Promedio:
x  17400 / 40  435

Varianza: 𝑘
 
2
𝑆 =∑ ¿ ¿ ¿
𝑖=1

  2= 7860000 − 4 352 =12313, 461 54


S
40 − 1

Desv. Estándar:

S=
 
√12313,46154=110,97
SOLUCIÓN:
Coef. Var.:

  𝑆 109,67
CV= ∗100%= 𝑥 100=25,51 %
´𝑋 435
Casos: Conclusión:
CV ≤ 10% El conjunto de datos es homogéneo.
10% < CV ≤ 30% El conjunto de datos es variable.
CV > 30% El conjunto de datos es heterogéneo

Interpretación: los datos son variables.


DIAGRAMA DE CAJAS
 Es una representación gráfica que se construye en base a la mediana y
los cuartiles Q1 y Q3.
 Se traza un rectángulo con los extremos correspondientes al primer y
tercer cuartil.
 Dentro de la caja se traza una línea horizontal en el lugar de la
mediana.
 Se ubican los límites mediante el rango intercuartil: RI = Q3 – Q1
 Límite inferior : LI = Q1 – 1.5 RI

 Límite superior: LS = Q + 1.5 RI


3
 Se trazan líneas verticales desde los extremos de la caja hasta el valor
máximo y mínimo dentro de los límites (bigotes de la caja).
 Se marcan con asterisco (*) las localizaciones de los valores atípicos
(outliers).
EJEMPLO 4
El diagrama de caja muestra:
 La puntuación mediana es de
22,5. 12,95.
 El rango intercuartílico esta entre
Q1 = 10,575 a Q3 = 17,24.
Q3 = 17,24  No hay valores atípicos.
 El rango de los datos están entre
el valor Mínimo = 7,03 y
Mediana: 12,95. Máximo=22,5.
Q1 = 10,575
 El hecho de que el área mas
grande de la caja estén por
encima de la Mediana indica que
7,03 los datos tienen un sesgo
ligeramente positivo. Esto es, la
cola derecha de la distribución es
más larga que la cola izquierda.
EJEMPLO 5

Media= 8,54 Media= 10,88


Mediana=8 Mediana=12
MEDIDAS DE ASIMETÍA

Se dice que una distribución de medidas es simétrica cuando valores de la variable


equidistantes, a uno y otro lado, del valor central tienen la misma frecuencia. García
J. (2011)

Tipos de Asimetría

X̅ > Me > Mo X̅ = Me = Mo X̅ < Me < Mo


- Figura (a). Distribución con asimetría hacia la
derecha, positiva.
- Figura (b). Distribución Simetría.
- Figura (c). Distribución con asimetría hacia la
izquierda, negativa.
Moda Media Media Media Moda
Mediana
Moda
Mediana Mediana
Coeficiente de Asimetría de FISHER

Para datos sin agrupar se Para datos agrupados en tablas de


emplea la siguiente frecuencias se emplea la siguiente
fórmula: fórmula:

  𝑛
𝑛 3
  ( 𝑥 𝑖 − ´𝑥 ) 𝐴 𝑠= ∑ ¿ ¿ ¿ ¿
𝐴 𝑠=∑ 3 𝑖=1
𝑖=1 𝑛∗𝑆
 Donde:
Interpretación:
() Representa el coeficiente de
 • Si > 0: asimétrica positiva
asimetría.
• Si = 0: simétrica
(xi) cada uno de los valores,
• Si < 0: asimétrica negativa
(X̅) la media aritmética de la muestra,
(fi) la frecuencia de cada valor
(n) el numero total de valores y
(s) la deviación estándar
MEDIDAS DE CURTOSIS

Medida de deformación vertical de una distribución de frecuencias, es decir la medida de


apuntamiento o achatamiento de una distribución, indicando la mayor o menor altura del
máximo central con respecto a la altura de la curva normal. Moya (2010)

Tipos de Curtosis

K>0
•  Si > 0: la distribución es Leptocúrtica.
K=0 • Si = 0: la distribución es Mesocúrtica.
• Si < 0: la distribución es Platicúrica.
K<0

Leptocúrtica Mesocúrtica
Platicúrtica
Coeficiente de Curtosis

Para datos sin agrupar Para datos agrupados en tablas


se emplea la siguiente de frecuencias se emplea la
fórmula: siguiente fórmula:
 
 

Donde:
 
Interpretación:

() Representa el coeficiente de asimetría.


• Si K > 0: Leptocúrtica
(xi) cada uno de los valores, • Si K = 0: Mesocúrtica
(X̅) la media aritmética de la muestra, • Si K< 0: Platicurtica
(fi) la frecuencia de cada valor
(n) el numero total de valores y
(s) la deviación estándar
EJEMPLO 04:
 Los directores de escuela de las facultades de la UNASAM, están interesado en
averiguar si los estudiantes asisten con regularidad o no a sus clases virtuales, por lo
que encarga el estudio a un equipo de especialistas, quienes deciden seleccionar una
muestra aleatoria de 40 alumnos para analizar los reportes de monitoreo registrados
en la OGE, para resolver sus inquietudes se pide calcular e interpretar, el
N° Institución Faltas de Alumnos
21 Diseños experimentales 2 31
1 Matemática 1 42
2 Dibujo técnico 1 44 22 Contabilidad 186
Dibujo técnico 2 23 Teoría de decisiones 0
3 159
Física 1 24 Introducción a la ingeniería 180
4 Estadística 402 25 Estudios de mercados 50
5 Contabilidad 97 26 Muestreo 116
6 Economía 40 27 Gestión de la calidad 58
7 Métodos Estadísticos 288
28 Tesis 2 720
8 Proceso estocásticos 73
9 Estructuras 29 29 Metodología de la investigación 341
10 Estructura de datos 10 30 Ciencia de los datos 23
Física 2 31 Minería y explotación de la información 81
11 140
Diseños experimentales 32 Electivo 1 660
12 Resistencia de materiales 30 33 Electivo 2 188
13 Electricidad 86 34 Demografía 274
14 Termodinamica 142
35 Probabilidades 65
15 Biología 247
16 Química 11 36 Inferencia estadística 424
17 Geoestadística 6 37 Practicas pre profesionales 24
18 Probabilidades 20 38 Matemática 2 179
19 Leguaje 524 39 Métodos numéricos 152
20 Tesis 568 40 Matemática 4 30
Solución

De forma Manual Excel - MegaStat

  Faltas de Alumnos
1.  
25 count 40
mean 169.25
sample variance 35,087.22
sample standard deviation 187.32

2.  𝑴𝒆=𝟗𝟏. 𝟓𝟎 minimum 6
maximum 720
range 714
median 91.50
32
 
3. mode 30.00
4. Calculando el coeficiente de A. FISHER, utilizando;

𝑛 3
  ( 𝑥 𝑖 − ´𝑥 ) As
  + … = 1.57
𝐴 𝑠= ∑ 3
𝑖=1 𝑛 ∗ 𝑆

5. Calculando el coeficiente K de FISHER, utilizando;

 
K
  + … = 1.77

6. Representación Gráfica; 7. Interpretación;

• Si As > 0: la distribución es asimétrica Positiva.


Histogram
M
   • Si > 0: la distribución es Leptocúrtico.
Por lo tanto; >
  Me > Mo
𝑥
´
M
  e
LA FORMA DE DISTRIBUCION DE LAS FALTAS DE LOS
ESTUDIANTES ES ASIMETRICA POSITIVA, ES DECIR
QUE SE CUMPLE QUE LOS ESTUDIANTES ESTAN
Faltas de Alumnos
FALTANDO MENOS POR LO QUE LA DECISIÓN DEL
DIRECTOR ES TOMAR MEDIDAS CORRECTIVAS
PARA QUE LAS IE HAGAN UN SEGUIMIENTO A LOS
ESTUDIANTES QUE NO RECIBEN LAS CLASES
VIRTUALES.
Autoevaluación
Del libro Probabilidades y
Estadística (Jay Devore,
2008) , resolver los
ejercicios de las pagina 39:
Los ítems del 44 al 46 y del
80 al 81

TAREA 4:

Elegir 03 y subir al SVA.

También podría gustarte