Está en la página 1de 45

CURSO: CULTURA ESTADISTICA

PARA LA INVESTIGACIÓN

SESION 09
MEDIDAS ESTADISTICAS
• MEDIDAS DE RESUMEN QUE SE CALCULAN A PARTIR DE UNA
MUESTRA Y QUE DESCRIBEN CIERTOS ASPECTOS DE UNA SERIE
O DISTRIBUCIÓN DE DATOS PARA PODER TENER UN MEJOR
CONOCIMIENTO DE LA POBLACIÓN.

Estos indicadores, llamados también medidas de resumen o


Estadígrafos, permiten hallar un solo valor numérico, el mismo que
representa a toda la población o muestra en estudio.
CLASIFICACIÓN DE LAS MEDIDAS
ESTADÍSTICAS

Media aritmética
Medidas de
Tendencia Mediana
central:
Moda

Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles

Rango o recorrido
Medidas de Desviación media
dispersión: Varianza
Desviación típica
MEDIDAS DE TENDENCIA CENTRAL
¿Alrededor de qué valor se agrupan los datos?

Son estadígrafos que permiten hallar un solo valor numérico e indican el “centro”
de un conjunto de datos.
Entre las medidas de tendencia central más útiles y conocidas se tienen a:

MUESTRA POBLACION

• MEDIA ARITMÉTICA SIMPLE X 


• LA MEDIANA me Me
• LA MODA mo Mo
MEDIDAS
DE
TENDENCIA
CENTRAL LA MEDIANA
MEDIA ARITMÉTICA Divide la serie de
datos en dos partes
Es el valor promedio iguales 50%
de la distribución superior y 50%
inferior

LA MODA
Es el valor que más
se repite en la
distribución
1. LA MEDIA ARITMÉTICA:

• DEFINICIÓN.- LA MEDIA ARITMÉTICA, PROMEDIO O SIMPLEMENTE


MEDIA, SE DEFINE COMO LA DIVISIÓN DE LA SUMA DE TODOS LOS
VALORES ENTRE EL NÚMERO DE VALORES.

POBLACION (N) MUESTRA (n)

Datos sin Xi Xi
μ= 𝑥=
Agrupar N n

Y𝑖. 𝑓𝑖 Y𝑖. 𝑓𝑖
Datos μ= y=
N n
Agrupados* fi
PROPIEDAD IMPORTANTE DE LA MEDIA
SI A TODOS LOS VALORES DE UN CONJUNTO
DE DATOS SE LES SOMETE A UNA MISMA
MODIFICACIÓN, SU PROMEDIO SUFRIRÁ LA
MISMA MODIFICACIÓN.
2. MEDIANA (Me)

• ES EL ESTADÍGRAFO QUE
REPRESENTA EL PUNTO MEDIO DE
LOS DATOS, EN EL CUAL CAE EL
50% DE LAS PUNTUACIONES.

¿Qué niño tiene la talla mediana?


LA MEDIANA (Me)
VALOR QUE DIVIDE EN DOS PARTES IGUALES UN CONJUNTO DE
DATOS
n es impar n es par

Datos no agrupados
Ordenar los datos en forma creciente Me = dato Me= Promedio de
o decreciente central los dos datos
centrales

n 
2  F i 1 
Datos Agrupados
Me  Li   * A
(TABLAS) fi
 
 
MODA

¿Qué color
de vehículo
está de
moda?
3. MODA (MO)
• ES UN ESTADÍGRAFO QUE NOS INDICA EL VALOR QUE SE PRESENTA
CON MÁS FRECUENCIA DENTRO DE UNA VARIABLE.
• AMODAL sino tiene ninguna moda,
• UNIMODAL si tiene una moda,
• BIMODAL si tiene dos modas
• MULTIMODAL si tiene tres o más modas.

PARA DATOS AGRUPADOS EN INTERVALOS

 f i  f i 1 
Mo  Li   * A
  f i  f i 1    f i  f i 1 
EJEMPLO 1:
Los precios (en soles) de cemento “Sol” en 10 depósitos en la ciudad Huaraz fueron
registrados de la forma siguientes
20, 20, 21, 22, 19, 21, 22, 21, 18, 21
Determinar e interpretar el precio promedio, la mediana y la moda de los precios del producto.

Solución
Media: 𝑥𝑖 20 + 20+. . . +21 205
𝑥= = = = 20,5 soles
𝑛 10 10

El precio promedio del cemento en los 10 depósitos es de 20.5 soles


MEDIANA (Me)
Ordenando los datos en forma creciente tenemos:
18; 19; 20 ; 20; 21; 21; 21; 21;22 ;22 , ubicamos los dos datos centrales y calculamos el promedio,

21  21
Me   21 soles
2
Me= 21 soles es el precio que divide en dos mitades iguales al grupo de precios en análisis, significa
el 50% de los precios del producto son menores o iguales a 21 soles y el otro 50% de los precios son
mayores o iguales a 21soles.
MODA (Mo)
Se observa que el precio del producto que mas veces se presenta es 21 soles, por lo tanto la moda es:
Mo= 21 soles
Ejemplo 2:
Hallar la media, mediana y moda de las edades de 11 personas:
38, 43, 51, 37, 41,39, 19, 24, 27, 50, 80 AÑOS.

EJEMPLO 3: CALCULAR LA MODA DEL COEFICIENTE INTELECTUAL DE UN GRUPO DE ALUMNOS


100, 95, 105,100, 110,100
MO = 100
LA MAYORÍA DE ALUMNOS TIENE UN CI DE 100 PUNTOS
Ejemplo 4:
El siguiente conjunto de valores se refiere al número de lotes urbanizados
vendidos por cada 5 manzanas que han tenido 20 corredores.
8, 9, 10, 11, 12, 13, 14, 15, 8, 9, 10, 12, 15, 8, 9, 16, 9, 14, 15, 8.

4 corredores han vendido 8 lotes


4 corredores vendieron 9 lotes
Se puede apreciar en este ejemplo que hay 2 modas:

ES BIMODAL
La mayoría de los corredores tuvieron 8 y 9 lotes vendidos por cada
5 manzanas.
LA MODA TAMBIÉN ES ÚTIL CUANDO LA VARIABLE DE ESTUDIO
ES CUALITATIVA NOMINAL.

• EJEMPLO: HALLAR LA MODA PARA LA SIGUIENTE INFORMACIÓN QUE CONSISTE EN UNA


MUESTRA DE CONSUMIDORES SEGÚN PREFERENCIAS POR MARCA DE MANTEQUILLA:

MARCA DE CONSUMIDORES
MANTEQUILLA
ASTRA 20
DORINA 32
CREMA DE ORO 18
LAIVE 12
NINGUNO 5
TOTAL 87
SOLUCIÓN:

• OBSERVAMOS QUE LA MARCA DE


MANTEQUILLA DE MAYOR PREFERENCIA ES
DORINA.

POR TANTO:
EJEMPLO 5:
• Una fábrica de calzado cuenta con, 28 máquinas perfiladoras que tienen 5 años
de duración , 16 máquinas que tienen 10 y 11 máquinas que tienen 15. hallar el
tiempo promedio de duración (vida útil) de las maquinas, la Mediana y la Moda

Tiempo de Número de Media • INTERPRETACIÓN:


duracion maquinas
(Xi) (fi) Fi Xifi EL TIEMPO DE VIDA ÚTIL
n


PROMEDIO DE
5 28 28 140
X i fi LAS MÁQUINAS
10 16 44 160
PERFILADORAS DE
X  i 1
465
15 11 55 165   8.45 años CIERTA FÁBRICA
n 55
n=55 465 ES DE 8,45 AÑOS.

Mediana Moda
Me= 5 Años Mo = 5 años
EJEMPLO 6:
• Se ha organizado en una tabla de distribución
de frecuencias el consumo mensual de
energía eléctrica de 80 los hogares en la
Nº de
ciudad de Huaraz.
Consumo(kw familia
h/mes) Yi s (fi) Fi xifi
• Determinar el consumo promedio mensual de
20 - 40 30 15 15 450
energía
40 - 60 50 26 41 1300
• Determinar El consumo mediana de energía. 60 - 80 70 20 61 1400
80 - 100 90 13 74 1170
• Determinar el consumo modal de energía en 100 - 120 110 6 80 660
los 80 hogares en estudio. Total n=80 4980
Media
n El consumo Mensual promedio de
Y f i i
4980 energía de las 80 familias de la ciudad
Y  i 1
  62,25 Kwh / mes de Huaraz es de 62.25 kwh/ mes.
n 80
Mediana

n / 2  80 / 2  40
 n / 2  Fi 1  El consumo del 50% de los hogares
Me  Li   * A en estudio es menor o igual a
 fi 
59,23Kw/mes y el consumo del otro
 40  15  50 % es superior a 59,23Kw/mes
Me  40    * 20
 26 
Me  40  19.23  Me  59, 23Kw / Mes
Moda
 f i  f i 1 
Mo  Li   * A
 f i  f i 1  f i  f i 1 
 26  15 
Mo  40    * 20
 26  15  26  20 
Mo  40  12,94
Mo  52,94 Kw / Mes

El consumo que con mayor frecuencia tienen los 80


hogares mensualmente es de 52,94 KW/mes
EJEMPLO 7: PROBLEMA DE ANÁLISIS
• Una empresa debido al alza de
costo de vida está planificando un
Sueldo mensual Yi Nº
aumento a sus 40 trabajadores a
(Soles) trabajadores
partir del mes de julio, para lo cual (fi)
está evaluando 2 alternativas:
400-800 600 12
800-1200 1000 19
ALTERNATIVA I : Un aumento
de 300 soles a cada uno de los 1200-2000 1600 6
trabajadores. 2000-4000 3000 3
ALTERNATIVA II: Un aumento n = 40
del 20% a cada uno de los
trabajadores.
a. Calcular el sueldo promedio, sueldo mediana, sueldo
modal actual de los trabajadores

b. ¿cuál sería el nuevo sueldo promedio de seguirse la


alternativa i?
c. ¿cuál sería el nuevo sueldo promedio de seguirse la
alternativa ii?
d. ¿cuál de las 2 alternativas conviene más a la empresa?
e. ¿cuál conviene más a los trabajadores?
• EJEMPLO 8:
• SE TIENE LA DISTRIBUCIÓN DE LOS INGRESOS MENSUALES DE UN GRUPO DE TRABAJADORES
DE LA ADMINISTRACIÓN PUBLICA EN HUARAZ,

Ingreso mensual Fi
fi hi Con los datos adjuntos
(Miles de soles)
calcular e interpretar:
0.8 – 1.0 6 6 0.08 • Media
• Mediana
1.0 – 1.2 14 20 0.19 • Moda
1.2 – 1.5 24 44 0.32
1.5 – 1.7 18 62 0.25
1.7 – 2.1 8 70 0.11
2.1 – 2.5 3 73 0.04
73
• EJEMPLO 9:

• Distribución de 200 personas de acuerdo al monto en soles que obtuvieron en un


último préstamo en la caja municipal, calcular la mediana y la moda de la
distribución.

Número de
Montos Personas
Soles
[Li-Ls>
1000-1500 18
1500-2000 32
(2000-2500) x
2500-3000 40
3000-3500 38
3500-4000 22

200
MEDIDAS DE LOCALIZACION
MEDIDAS DE POSICIÓN O LOCALIZACIÓN (CUARTILES - PERCENTILES).

LAS MEDIDAS DE POSICIÓN, PERMITEN IDENTIFICAR UNA DISTRIBUCIÓN MIDIENDO EL


VALOR QUE TOMA LA VARIABLE EN DIVERSAS POSICIONES SINGULARES DE LA MISMA.
MEDIDAS DE POSICIÓN – PERCENTILES
• SE DENOTAN POR P1, P2 …Y P99

• SON LOS VALORES QUE DIVIDEN A UN CONJUNTO DE DATOS ORDENADOS EN FORMA


ASCENDENTE O DESCENDENTE EN CIEN PARTES IGUALES.
PARA CALCULAR
IDENTIFICAR LA CLASE QUE CONTIENE A PK DETERMINANDO LA MENOR DE LAS
FRECUENCIAS ABSOLUTAS ACUMULADAS FI QUE SUPERA A K(N/100).

  n  
FORMULA
 k  100   Fi 1 
Pk  Li     * A
 fi 
 
• DONDE:

LI = LIMITE INFERIOR DEL INTERVALO DE INTERÉS


A = AMPLITUD INTERVÁLICA
K = NÚMERO DE PERCENTIL.
FI-1 = FRECUENCIA ABSOLUTA ACUMULADA ANTERIOR QUE CONTIENE A PK
FI = FRECUENCIA SIMPLE QUE CONTIENE A PK
Ejemplo datos agrupados Hallar P80 de la siguiente información.

Gasto Familiar en Soles de 80 familias en la provincia de   n  


Huaraz
 k  100   Fi 1 
LI LS fi Fi hi% Hi% Pk  Li     * A
500 700 12 12 15% 15%  fi 
700 900 7 19 9% 24%  
900 1,100 6 25 8% 31%
1,100 1,300 22 47 28% 59%
1,300 1,500 18 65 23% 81%
1,500 1,700 9 74 11% 93%
1,700 1,900 5 79 6% 99%
1,900 2,100 1 80 1% 100%
TOTAL 80 100%
Fuente: Encuesta Aplicada a las familias de la provincia de Huaraz.

1er Paso : Identificamos el intervalo percentil P80= 80(n/100) = 80(80/100) = 64


2do Paso : Calculamos P80= 1300 + [(64 – 47)/18] 200 = 1 489 soles

P80: El 80% de las gastos familiares alcanzaron un valor máximo de 1 489 soles
Indican como los datos se dispersan alrededor de su punto central
(la media). Miden la variabilidad o la distancia promedio de
separación de los datos a su valor central.

Cuanto mayor sea ese valor mayor será la variabilidad, cuanto menor
sea, más homogénea será a la media.
Las medidas de dispersión o variabilidad se usan para:

• Verificar la confiabilidad de los promedios.


• Establecer como base para el control de la variable.

Alta dispersión (medida de dispersión alta) --- baja


concentración alrededor del promedio. DATOS
HETEROGENEOS

Baja dispersión (medida de dispersión baja) --- alta


concentración alrededor del promedio. DATOS
HOMOGENEOS
Recorrido
(Rango)

Absolutas Varianza

Medidas de Desviación
Estándar
Dispersión

Coeficiente de
Relativas
Variación
ES LA MEDIDA DE DISPERSIÓN MÁS SENCILLA. SE DETERMINA RESTANDO ,
EL VALOR MÁXIMO DEL VALOR MÍNIMO , DE LOS DATOS.

R = valor máx. – valor mín.

Ejemplo: Se tiene el registro de una semana, acerca


del tiempo en segundos, que demora una máquina
procesadora de alimentos en envasar. Los datos son:
15’, 14.5’, 12.5’, 22’, 20’. Encontrar el rango del
tiempo de demora de esta máquina.

R = 22 – 12.5 = 9.5’
 La varianza mide la mayor o menor dispersión de los valores de la
variable respecto a la media aritmética. La varianza se expresa en las
mismas unidades que la variable analizada, pero elevadas al cuadrado.
 Por lo tanto no se interpreta.

Formalmente se expresa:

Varianza poblacional
 N 2 
  Yi f i  Ny 2

2   i 1 
 N 
 
 
Varianza Muestral

PARA DATOS NO AGRUPADOS PARA DATOS AGRUPADOS

 n 2 
  Xi  nx 2
  n 2
  Yi f i  ny 2 

 
s  i 1 s 2   i 1 
2
 n 1   n 1 
   
   
DESVIACIÓN ESTÁNDAR
• Conocida también como la desviación típica y es la medida que nos indica cuánto
tienden a alejarse los datos del promedio. Se calcula sacando la raíz cuadrada de la
varianza.

• esta medida si se interpreta.

Población

  
2

Muestra

S
2
s
S
CV  100
x

•Si el CV ≤ 30% el conjunto de datos tiene un comportamiento homogéneo.


•Si el CV > 30% el conjunto de datos tiene un comportamiento heterogéneo.
Ejemplo 01: Determinar la Varianza, Desviación Estándar y Coeficiente de Variación en los
siguientes conjuntos de datos que corresponden a las edades de un grupo de universitarios:
17 19 18 18 16 20

Determinar el Promedio X = (17+19+18+18+16+20) / 6 = 18

Determinar la Varianza
n


i 1
Xi
2
 17 2  19 2  18 2  18 2  16 2  20 2  1954

 n 2 
  Xi  nx 2

 2
s 2   i 1   s2  1954 6 * 18 10
  s 2  2 años 2
 n 1  6 1 5
 
 
Determinar la Desviación estándar

S  2  1.4 años “Las edades presentan una variabilidad de


1.41años respecto a la edad promedio que
es18
EJEMPLO 02: LOS ESTADOS DE CUENTA MENSUALES POR CONSUMO ELÉCTRICO
PARA UNA FAMILIA PROMEDIO RESIDENTE DE TRUJILLO, SE REGISTRARON DURANTE 12
MESES CONSECUTIVOS EMPEZANDO DE ENERO 2016. ENCONTRAR EL RANGO Y LA
DESVIACIÓN ESTÁNDAR DEL CONSUMO DE ELECTRICIDAD EN SOLES PARA ESTA
FAMILIA.
Rango:
Mes Cantidad S/. Mes Cantidad S/. R = 293 - 112
R = 180 Soles
Ene-16 Jul-16
S/ 216 S/ 256
Feb-16 Ago-16 Desviación Estándar:
S/ 113 S/ 285
1° Hallamos el Promedio:
Mar-16 Sep-16 𝑋 = 194.5 Soles
S/ 169 S/ 293
2° Varianza:
Abr-16 Oct-16
S/ 112 S/ 176 S2 = 3946.09
3°Desviación Estándar
May-16 Nov-16
S/ 137 S/ 158 S = 62.82 Soles
Jun-16 Dic-16
S/ 239 S/ 180

Entre el mayor y el menor mes de consumo eléctrico del 2016, hay una diferencia de S/ 180.
Los consumos mensuales eléctricos en el 2016, presentan una variabilidad de S/62.82, respecto al
consumo promedio de S/ 194.5
Ejemplo 03: Los siguientes datos corresponden a los montos en miles de soles
ganados por licitación de 40 empresas constructoras en la región Ancash en
el año 2016

DISTRIBUCION DE 40 EMPRESAS CONSTRUCTORAS DE LA REGION ANCASH QUE


GANARON LICITACIONES POR MONTOS EN MILES DE SOLES DURANTE EL AÑO
2016.
MONTOS Marca de Nº de
2
Promedio:
(Miles de Clase Constructora
Yi * fi Yi * fi
soles) Yi s fi x  17400 / 40  435 mil soles
300 – 350 325 8 2600 845000 Varianza:
350 – 400 375 9 3375 1265625
7860000
400 – 450 425 6 2550 1083750 S2   435^ 2  7275
40
450 – 500 475 7 3325 1579375
Desv. Stand.:
500 – 550 525 4 2100 1102500
550 – 600 575 6 3450 1983750 S  7275  85.294 mil soles
TOTAL 40 17400 7860000
Coef. Var.:
Fuente: Departamento de Investigación- 2016
85.294
CV  x100  19.6%
435
“la variabilidad en los montos por licitaciones ascienden a 85.29 mil soles con respecto al promedio correspondiente al
año 2016. Además existe homogeneidad relativa en los datos”
EJEMPLO N°04
COMPARAR LA ESTATURA EN CM Y EL PESO EN KG. DE LOS 20 NIÑOS SELECCIONADOS
DE GIMNASIA ARTÍSTICA Y DETERMINE QUE MEDIDA ES MÁS HOMOGÉNEA O ESTABLE.

Estatura (X) Peso (Y)


𝑋 = 128.5 Y = 36.4
Sx = 8.4 SY = 4.9

8.4 4.9
CV  100  6.5% CV  100  13.5%
128.5 36.4

La medida referente a la altura tiene menor variabilidad , por lo tanto sus datos son más
homogéneos a su promedio.
EJEMPLO 05: A continuación se presentan los tiempos de espera (en minutos) de 10 clientes del
banco bcp (donde todos los clientes se forman en una sola fila) y de 10 clientes del banco interbank
(donde los clientes esperan en filas individuales, en tres ventanillas diferentes). compare la variación
de los conjuntos de datos.

BCP 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7

Interbank 3.8 4.2 5.4 6.2 7.1 7.7 8.5 9.3 9.3 10

SOLUCIÓN:

• PROMEDIO:
BCP 𝑋1 =7.15 minutos

Interbank 𝑋2 =7.15 minutos

BCP R1 = 7.7 – 6.5 = 1.2


• RANGO: Interbank R2= 10 – 3.8 = 6.2
• Varianza:

BCP
𝑆12 = 0.23
Interbank 𝑆22 = 4.82
• Desviación Estándar:
BCP 𝑆1 = 0.48 minutos

Interbank 𝑆2 = 2.20 minutos

• Coeficiente de Correlación:
𝑆1 𝑥 100 0.48 𝑥 100
BCP 𝐶𝑉1% = = = 6.7%
𝑋1 7.15

𝑆2 𝑥 100 2.20 𝑥 100


𝐶𝑉2% = = = 30.7%
Interbank 𝑋2 7.15

SE APRECIA QUE LOS PROMEDIOS DE ESPERA SON IGUALES EN AMBOS BANCOS, SIN EMBARGO
EN EL BANCO BCP LA VARIACIÓN DEL TIEMPO DE ESPERA ES MENOR Y ES MAS ESTABLE.

También podría gustarte