Está en la página 1de 44

UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN

Dpto. de Matemática y Estadística

Capítulo III

Medidas Estadísticas

Estadística y
Docente: Ing. César Meléndez
Probabilidades
Población (N) Muestra (n)
CENSO Muestreo

Observaciones

Organización Gráficas Resumen

Barras Medidas de Tendencia Central


Tablas de Frecuencias Media, mediana, moda
Pie
Varas
Histogramas Medidas de Dispersión
BoxPlot Variancia. Desviación Estándar, CV

Medidas de Asimetría
Coeficiente de Asimetría

2
Objetivos del capítulo
Reconocer las características básicas de
una distribución de datos a través de las
principales medidas de tendencia central,
de variabilidad y asimetría.

3
Medidas estadísticas
 Medidas de Tendencia central: media
aritmética simple, media aritmética
ponderada, media, mediana y moda.
Cuantiles o Fractiles: Cuartiles, Deciles y
Percentiles.
Diagrama de Tallos y Hojas.
 Medidas de Variabilidad: Rango, rango
intercuartil, variancia, desviación estándar,
coeficiente de variabilidad,.
 Medidas de Asimetría: coeficiente de asimetría
de Pearson.
Diagrama de Cajas (Boxplot)
4
El promedio de notas es importante La media, el mejor dato

Preferencia por un sabor de helados

coco
15, 21.1%
vainilla
22, 31.0%

fresa
5, 7.0%

naranja
7, 9.9% lúcuma
14, 19.7%
maracuy a
8, 11.3%

Moda : Vainilla es el sabor más preferido


5
¿CÓMO SE CALCULA CON …?
SPSS MINITAB

6
MEDIDAS DE TENDENCIA

CUARTILES: Q1 = 2 Q2 = 2.5 Q3 = 3

MODA = 2
MEDIANA = 2.5
MEDIA = 2.9

9
8
8

7
Número de trabajadores

5
4
4
3
3
2 2
2
1
1

0
1 2 3 4 5 6
Número de Hijos

7
Medidas de tendencia central

8
Media Aritmética Simple (Datos no agrupado)
La media aritmética de un conjunto de observaciones es igual a la
suma de sus valores dividido entre el número de observaciones
1 N
Media Poblacional   Xj
N j 1
1 n
Media Muestral X  Xj
n j 1
Ejemplo 1 Suponga que se tiene los datos de las ventas semanales
(en dólares) de una muestra de 8 vendedores.
150, 120, 300, 280, 350, 250, 160, 280
8

x i
150  120  300  280  350  250  160  280 1890
x i 1
   236.3
8 8 8
9
Ejercicio 1 (Pág. 38)
Los siguientes datos corresponden a una
muestra de 12 auditores sobre los gastos de
viáticos (soles) realizados en un mes. Halle e
interprete la media.

250.5 420.0 345.5 560.4


458.2 268.5 380.1 510.2
630.4 580.3 610.3 720.1

10
Propiedades de la media aritmética

1. Está afectada por valores extremos (altos


“Max” o pequeños “Min”).
2. Localiza la parte central de un conjunto de
observaciones.
3. Para un conjunto de observaciones la media es
única.
4. Si la media sustituye a cada observación, la
suma total no cambia.
10, 13, 14, 11, 16, 18
σ 𝑋𝑖 10+13+14+11+16+18
𝑋ത = = =13.6
𝑛 6
σ 𝑋𝑖 13.6+13.6+13.6+13.6+13.6+13.6
𝑋ത = = =13.6
𝑛 6
11
Propiedades de la media aritmética
5. La suma de las desviaciones de las
observaciones con respecto al promedio es
igual a cero

 X 
n n

j  X  Xj n X  n X  n X  0
j 1 j 1
6. La suma de los cuadrados de las desviaciones
de las observaciones con respecto a la media
es mínima.

 X    X  c  , donde c  R
n 2 n
2
j X j
j 1 j 1
12
Media Aritmética Ponderada
k

x w
j 1
j j
x1w1  x2 w2  ...xk wk
xp  
k
w1  w2  ...  wk
w
j 1
j

La media ponderada se usa en aquellos casos


donde las observaciones tienen diferente
importancia “Ponderación” dentro de una
población o muestra.

13
Ejemplo
En una empresa se tiene la siguiente información
Peso Variable
Número de Tiempo promedio
Turno Empleados de tardanza 𝑋ത = 12
(minutos)
Día 40 8.5
Tarde 25 12.0
Noche 15 15.5

El tiempo promedio de tardanza de los trabajadores


para los tres turnos será:

14
Las notas del Alumno Carlos Manuel Azañero en el curso de estadística y
probabilidad Fueron las siguientes:
% Notas
Asistencia 10% 16
1=100%
Participaciones 15% 10
Evaluación Práctica 25% 08
Evaluación Teórica 25% 12
Trabajo final 25% 09
Peso Variable

σ 𝑋𝑖∗𝑊𝑖 16∗0.10+10∗0.15+08∗0.25+12∗0.25+09∗0.25
𝑋𝑝 = σ 𝑊𝑖
= =10.35
1

σ 𝑋𝑖∗𝑊𝑖 16∗10%+10∗15%+08∗25%+12∗25%+09∗25%
𝑋𝑝 = σ 𝑊𝑖
= = 10.35
100%

σ 𝑋𝑖 16+10+08+12+09
𝑋ത = = =11
𝑛 5

15
Ejemplo:(Pág. 40) (datos agrupados)
En la siguiente tabla se presenta la distribución de
número de viajes realizados en un mes para una muestra
de auditores de una entidad financiera.
Número de viajes al Número de 𝑋𝑖 ∗ 𝑓𝑖
𝑋ത = ෍
mes auditores 𝑛
Xi fi
0 10 0 ∗ 10 + 1 ∗ 15 + ⋯ 4 ∗ 5
𝑋ത =
1 15 45
2 9
3 6 𝑋ത = 1.6
4 5
Total 45

Halle e interprete el número de viajes promedio


mensual por cada auditor.
16
σ 𝑋𝑖∗𝑓𝑖 0∗10+1∗15+2∗9+3∗6+4∗5
𝑋ത = = = 1.58
𝑛 45

El número de viajes promedio es de 1.58 por auditor.

Muestreo

Recomendación sería que Marcell use otro tipo de muestreo.

Auditores Sede Departamento ¿Le es suficiente su sueldo


Tacna. mensual para cubrir sus
Tacna Ciudad 0 necesidades básicas?.
Jorge Basadre 2 Principales S/8000 120
Tarata 3 Asociados S/5200 150
Candarave 4 auxiliares S/3800 300
Contratados S/2500 100


𝑋= S/4875 17
Mediana (50%) “Datos no agrupados”
La mediana es el valor que ocupa la posición
central de un conjunto de datos, previamente
ordenados (Ascendente o descendente).

La mediana paramétrica se simboliza con Me y


la mediana muestral con me.
Cálculo de la mediana 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 =
𝑛+1
2
 n  1  
 100   50  Entero E   me  x E  
  
𝑉𝑎𝑙𝑜𝑟 = Si  
  
  50  Decimal E.d   me  x E   0.d  x E 1  x E  
n 1

 100  

18
Ejemplo 5 (Pág. 41)
Los siguientes datos corresponden a los pesos (en Kg.) de
10 personas elegidas al azar.

1°Ordenar 50, 77, 53, 76, 63, 64, 75, 54, 52, 80
1 2 3 4 5 6 7 8 9 10=n
50 52 53 54 63 64 75 76 77 80
10+1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = =5.5
2

El valor----me=(63+64)/2=63.5 Kg.
Interpretación: Un 50% de las personas pesan menos de
63.5 Kg. y el otro 50% pesan más de 63.5 Kg. 19
Mediana (50%) “Datos agrupados”
Posición
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∗𝐴
𝑓𝑖

1° Ordenar “ no es necesario, porque los datos ya están ordenados en la


tabla de frecuencia”.

𝑛
2° calcular la posición =
2

3° el valor= con la formula anteriormente dada

20
Ingreso Xi fi hi Fi
[1.99 - 3.90) 2.95 11 24% 11
[3.90 - 5.81) 4.86 20 44% 31
[5.81 - 7.72) 6.77 10 22% 41
45
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = = 22.5
[7.72 - 9.63) 8.68 1 2% 42 2
[9.63 - 11.54) 10.59 2 4% 44
[11.54 - 13.45] 12.50 1 2% 45
Total 45 100.0%

𝑛
− 𝐹 𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∗𝐴 A= 5.81-3.90=1.91
𝑓𝑖
45
−11
2
𝑀𝑒 = 3.90 + ∗ 1.91 =4.99
20

𝑀𝑒 = 𝑛𝑜 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜 =4.70

21
𝑋𝑖 ∗𝑓𝑖 2.95∗11+4.86∗20+⋯..+12.50∗1 239.49

𝑋= σ = = =5.322
𝑛 45 45

𝑋 3.00+1.99+⋯….+6.70+2.58 240.77
𝑋ത = σ 𝑖 = = =5.35
𝑛 45 45

22
Ejercicio 4 (Pág. 41)
En un estudio del medio ambiente para evaluar la calidad
de aire, se registró el número de microgramos de partículas
en suspensión por mt2 de aire para muestras evaluadas en
dos zonas.

Zona A 38 32 45 30 24 45 42 18 28

Zona B 25 28 25 32 26 35 54 38

Halle e interprete la mediana del número de


microgramos de partículas en suspensión por mt2 de
aire para cada zona. 23
Propiedades de la mediana
1. La mediana divide a las n observaciones
previamente ordenadas, en dos partes
iguales. El 50% con valores menores a la
mediana y el otro 50% con valores mayores
a la mediana.
2. La suma de las desviaciones absolutas de las
observaciones con respecto a la mediana es
un valor mínima.
n n

X
j 1
j  me   X j  c , donde c  R
j 1

3. No está influenciada por valores extremos.


24
Moda
La moda de un conjunto de datos es el valor o
atributo que ocurre con mayor frecuencia.

La moda paramétrica se representa por Mo y la


moda muestral por mo.
Propiedades
1. Puede no existir o puede haber más de una
moda en un conjunto de datos.
2. No es afectada por valores extremos.
3. Se aplica tanto para información cualitativa
como cuantitativa.
25
Notas:

11, 13, 15, 14, 10 ---mo= no hay

11, 14, 14, 15, 16 ---mo=14

11, 14, 15, 14, 15 ---mo=14 y 15

26
Ingreso Xi fi hi Fi
[1.99 - 3.90) 2.95 11 24% 11
[3.90 - 5.81) 4.86 20 44% 31 Identificar el mayor
[5.81 - 7.72) 6.77 10 22% 41
valor
[7.72 - 9.63) 8.68 1 2% 42
[9.63 - 11.54) 10.59 2 4% 44 De las fi
[11.54 - 13.45] 12.50 1 2% 45
Total 45 100.0%

𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∗𝐴
𝑓𝑖 − 𝑓𝑖−1 + (𝑓𝑖 − 𝑓𝑖+1 )

20−11
𝑀𝑜 = 3.90 + ∗ 1.91 =4.80
20−11 +(20−10)

𝑀𝑜 = 𝑛𝑜 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜 =6.6

27
Ejercicio 5 (Pág. 42)
Se tiene una muestra de los niveles de ozono
alrededor de una ciudad (220 partes por
billón). Halle e interprete la moda.

160 124 156 164 178 163 163 178 164


185 196 164 170 145 164

28
Ejemplo
Se tiene longitudes (en cm.) de las truchas de
tres muestras extraídas de una pozas de
crianza

Muestra de la poza 1 Muestra de la poza 2 Muestra de la poza 3


4.0 4.3 4.6 4.0 4.1 4.4 4.0 4.1 4.3
4.1 4.4 4.7 4.1 4.2 4.5 4.1 4.2 4.3
4.2 4.5 4.8 4.1 4.3 4.6 4.1 4.3 4.5
No hay moda mo= 4.1 mo1 = 4.1 mo2 = 4.3

29
Usos de las Medidas de Tendencia Central

 La media aritmética se usa:


Cuando no hay valores extremos
Cuando se tenga que calcular otras medidas
estadísticas como la desviación estándar.
 La mediana se usa:
Cuando se desea conocer el valor que ocupa la
posición central=50%=Q2=D5=P50.
Cuando hay valores extremos que afectan la
media.
 La moda se usa:
Cuando se desea conocer la observación más
frecuente
Cuando se trabaja con variables cualitativas.
30
Propiedades de Transformación
Si Y = a ±bX, entonces:

Y  a  bX
meY  a  bmeX
moY  a  moX

31
Ejercicio 8 (Pág. 44)
La gerencia de marketing ha decidido aumentar 10%
los precios de los ternos en la sucursal Sur pero
restando 90 soles, mientras que en la sucursal Norte
disminuir en 4.5% los precios de los ternos y en la
sucursal Centro aumentar 125 nuevos soles cada
terno. A continuación se presenta las medidas
estadísticas de los precios de las sucursales obtenidas
con MINITAB.
N para
Variable N N* Media Mínimo Mediana Máximo Moda moda
Sucursal Sur 15 0 450,5 345,0 450,0 650,0 450 3
Sucursal Norte 15 0 582,3 320,0 580,0 910,0 600 2
Sucursal Centro15 0 500,3 310,0 550,0 810,0 550 3

32
Tercio, Quinto y Décimo Superior
Asumiendo una promoción de 30 egresados

6 6 6 6 6
20% 20% 20% 20% 20%

Xmin X Xmax

80% 20%

P80
33
Definición
CUARTILES,
 Son indicadores que permiten
 dividen el
dividir a un conjunto de datos
previamente ordenados, en conjunto de datos en 4
“p” partes, donde todas las partes iguales (25% cada
partes poseen el mismo una). Son representados
porcentaje de observaciones. también como:
25%=Q1=P25, 50%=Q2=P50=me=D5

 DECILES, dividen el  PERCENTILES, dividen


conjunto de datos en 10 el conjunto de datos en 100
partes iguales (10% cada partes iguales (1% cada
una). Son representados una). Son representados
también como: también como P1, P2 , …, P99.
D1=P10, D2=P20 ,…, D9=P90
34
Percentiles
El percentil Pq divide a un conjunto ordenado de
observaciones en un q% menores que Pq y un
(100 – q)% mayores que Pq. El percentil Pq es un
valor expresado en las mismas unidades que la
variable en estudio.
A todos los cuantiles también se les denomina
percentiles Pq.

Observaciones
P25 = percentil 25 = primer cuartil = Q1=25%
P50 = percentil 50 = segundo cuartil = Q2 = me= D5
P75 = percentil 75 = tercer cuartil = Q3 =75%
35
Cálculo del Percentil
Posición Valor

 n  1 
 100   q  Entero  E   Pq  x E 
𝐶𝑘 =
 
Si 
q E 
 n  1   q  Decimal  E.d   P  x  0.d  x  x
 100   E 1 E 
𝑛+1
∗ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑙𝑐𝑢𝑙𝑜
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑎𝑟𝑡𝑒𝑠

36
Ejemplo 9 (Pág. 47)
Los siguientes datos corresponden a los pesos,
en Kg. de n=10 personas: 1° Ordenar

50, 52, 53, 54, 63, 64, 75, 76, 77, 80

P25  x 101   x2.75   x2   0.75  x3  x2    52  0.75  53  52  52.75 Kg
 25
 100 
3°Valor
2°Posición

P75  x 101   x8.25   x8   0.25  x9   x8    76  0.25  77  76  76.25 Kg
 75
 100 

P3= Posición=0.33
0.33*1=0.33
33%*100%=33%
37
Demostrar con el ejercicio anterior que P75 = Q3

P75  x 101   x8.25   x8   0.25  x9   x8    76  0.25  77  76  76.25 Kg
 75
 100 

10+1
Q3= ( )*3=8.25
4

Demostrado

38
Ejercicio 10 (Pág. 46)
 Se tienen las notas de los promedios ponderados
de los estudiantes graduados en el último ciclo.
Halle el promedio ponderado mínimo para que un
alumno sea considerado dentro del quinto
superior.
10.5, 10.9, 11.2, 11.3, 11.5, 11.5, 11.7, 12.8, 12.9, 13.6, 13.7, 13.9, 14.0, 15.6

80% 20%

P80= X12=13.9
39
Cuartil, Decil y Percentil para datos agrupados

𝑘𝑛
− 𝐹𝑖−1
𝑞
𝐶𝑘 = 𝐿𝑖 + ∗𝐴
𝐹𝑖 − 𝐹𝑖−1

𝑘𝑛
𝐷𝑜𝑛𝑑𝑒 𝑒𝑠 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
𝑞

40
Ingreso Xi fi hi Fi
[1.99 - 3.90) 2.95 11 24% 11
[3.90 - 5.81) 4.86 20 44% 31 25 ∗ 45
[5.81 - 7.72) 6.77 10 22% 41 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = = 11.25
[7.72 - 9.63) 8.68 1 2% 42 100
[9.63 - 11.54) 10.59 2 4% 44
[11.54 - 13.45] 12.50 1 2% 45 45
Total 45 100.0% = 11.25
4
𝑘𝑛
− 𝐹𝑖−1
𝑞
𝑃25 = 𝐶𝑘=25 = 𝐿𝑖 + ∗𝐴 A= 5.81-3.90=1.91
𝐹𝑖 − 𝐹𝑖−1
99 ∗ 45
25 ∗ 45 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = = 44.55
− 11 100
𝑃25 = 3.90 + 100 ∗ 1.91 = 3.92
31 − 11
43 ∗ 45
− 11 43 ∗ 45
𝑃43 = 3.90 + 100 ∗ 1.91 = 4.697 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 = = 19.35
100
31 − 11
41
Diagrama de Tallos y hojas
“Stem and Leaf”
Es un artificio que ofrece una representación
parecida a un histograma.

La ventaja es que no sólo muestran las


frecuencias sino que contienen los valores
reales.

A diferencia de las tablas de frecuencias con


este procedimiento los datos no se pierden
(hay excepciones).
42
PASOS:
1. Se ordenan los datos, en forma
ascendente.
2. Se forman los Tallos.
3. Se forman las Hojas.
4. Luego, se forma la Profundidad.

43
Ejemplo
 Los siguientes datos corresponden a la estatura de una muestra de
30 alumnos.
 158, 159, 161, 161, 163, 163, 164, 166, 166, 167, 168, 168, 168,
169, 170, 170, 170, 171, 171, 171, 172, 173, 174, 174, 174, 174,
174, 177, 182, 191
Profundidad

Stem-and-leaf of Estatura n = 30 Tallo

Unidad de hoja = 1.0

2 15 89
7 16 11334
14 16 6678889
(13) 17 0001112344444
3 17 7 Hojas
2 18 2
1 18
1 19 1 44

También podría gustarte