Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas Estadísticas - I Parte v6
Medidas Estadísticas - I Parte v6
Solución
• Linealidad
Ejemplo
Solución
Ejemplo
Solución
Ejemplo
Xi ni
Calcular la media de la siguiente distribución. 38432 4
38434 8
38436 4
38438 3
Si efectuamos un cambio de variable 38440 8
x i − 38436
yi =
2
tomando como nueva variable el valor más centrado, tendremos::
xi ni yi yi ni
38432 4 (38432 - 38436)/2 = -2 -8
38434 8 (38434 - 38436)/2 = -1 -8
38436 4 (38436 - 38436)/2 = 0 0
38438 3 (38438 - 38436)/2 = 1 3
38440 8 (38440 - 38436)/2 = 2 16
n = 27 3
Medidas de Centralización
Mediana: La mediana es el valor central de la variable, es
decir, supuesta una muestra ordenada en orden creciente o
decreciente, es el valor que divide en dos partes a dicha
muestra. Para calcular la mediana debemos tener en cuenta
si la variable es discreta o continua.
Ventajas
• Representativa para datos en escala ordinal.
• Influenciada por valores centrales y es insensible a los
valores extremos u “outliers ”.
• No tiene en cuenta todas las observaciones.
• Depende de la posición relativa de los datos, no de sus
valores.
• Es función de los intervalos escogidos.
Propiedades
• Si una población está formada por 2 subpoblaciones de
medianas Med1 y Med2, sólo se puede afirmar que la mediana,
Med, de la población está comprendida entre Med1 y Med2.
n
N i −1 ≤ < Ni ⇒
2
Ejemplo:
Intervalo mediano
Ventajas y Desventajas
• Pueden existir varias modas (distrib.
bimodales, trimodales,...)
• No tiene en cuenta todas las
observaciones.
• Es menos representativa que la media.
• Se puede calcular para características
cualitativas y cuantitativas.
• Es función de los intervalos elegidos a través de su
amplitud, número y límites de los mismos.
• Aunque el primero o el último de los intervalos no
posean extremos inferior o superior
respectivamente, la moda puede ser calculada.
• La moda también es menos afectada por unas
pocas observaciones atípicas.
• Si el conjunto de datos es bimodal, su uso puede
ser confuso.
Figura: Cálculo geométrico de la moda
A.- Cálculo de la moda (caso discreto):
X: nº hijos fi hi %
0 15 15/100 15
Mayor
Moda 1 31 31/100 31 frecuencia
2 50 50/100 50
3 2 2/100 2
>4 2 2/100 2
B.- Cálculo de la moda (caso continuo)
= Li −1 + n −n i i −1
Mo (n − n ) + (n − n )
•a i
i i −1 i i +1
Intervalo modal
Relación entre media, mediana y moda
• En el caso de distribuciones unimodales, la mediana está con
frecuencia comprendida entre la media y la moda (incluso más
cerca de la media).
• En distribuciones que presentan cierta inclinación, es más
aconsejable el uso de la mediana. Sin embargo en estudios
relacionados con propósitos estadísticos y de inferencia suele
ser más apta la media.
Ejemplo
Ejemplo: n = 12
111222334567
kn
N i −1 ≤ < Ni ⇒
4
kn
N i −1 ≤ < Ni ⇒
10
kn
N i −1 ≤ < Ni ⇒
100
Medidas de Localización
Ejemplo:
Cuartiles, Deciles y Percentiles: Caso continuo
Intervalo cuartílico
para Q1
Ejercicios
1. Supóngase que un estudiante tiene las siguientes notas en cuatro cursos
matriculados un cuatrimestre: 67, 82, 90, 71. El número de créditos que
vale cada curso es, respectivamente: 3, 2, 2, 4. Calcule un promedio
adecuado.
*
4. Según la distribución de las notas (en una escala de 1 a 10), ¿cómo
crees que es la prueba A?
a. Fácil *
b. Normal, ni fácil ni difícil
c. Difícil
A B
100 80
80
60
Frecuencia
Frecuencia
60
40
40
20
20
0 0
2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00
A B
5. La tabla presentada a continuación representa el consumo de energía
eléctrica de 80 usuarios en el primer mes del 2005:
Consumo Número de
(Kwh) usuarios
5 – 25 04
25 – 45 06
45 – 65 14
65 – 85 26
85 – 105 14
105 – 125 08
125 – 145 06
145 – 165 02
Total 80
li ls fi Yi
1 5 25 4 15
2 25 45 6 35
3 45 65 14 55
4 65 85 26 75
5 85 105 14 95
6 105 125 8 115
7 125 145 6 135
8 145 165 2 155
a. Limited to first 100 cases.
Statistics
Yi
N Valid 80
Missing 0
Mean 79.50
Median 78.00a
Mode 75
Percentiles 25 58.00b
50 78.00
75 100.45
a. Calculated from grouped data.
b. Percentiles are calculated from grouped data.
Solución con Casio fx-9860
Media
Moda
Mediana
Cuartiles, deciles y percentiles
Ejercicio 3: Nº de
Salarios empleados
La distribución de los costes salariales de 0-15000 2145
los 10000 empleados de una multinacional
15000-20000 1520
se presenta en la tabla siguiente:
20000-25000 840
Calcular el salario medio por trabajador, el
25000-30000 955
salario típico y el salario central. Calcular
también el primer cuartil salarial y el 30000-35000 1110
percentil 75. Interpretar. 35000-40000 2342
40000-50000 610
50000-100000 328
100000-300000 150
Solución :
La tabla siguiente contiene los elementos relativos a la distribución de
frecuencia de la variable salario (X) necesarios para realizar los
cálculos pedidos en el problema.
Nº de
empleado Marcas =
Salarios s (ni) xi xi* ni Ni ci di= ni/ ci
0-15000 2145 7500 16087500 2145 15000 0,143
15000-20000 1520 17500 26600000 3665 5000 0,304
20000-25000 840 22500 18900000 4505 5000 0,168
25000-30000 955 27500 26262500 5460 5000 0,191
30000-35000 1110 32500 36075000 6570 5000 0,222
35000-40000 2342 37500 87825000 8912 5000 0,4684
40000-50000 610 45000 27450000 9522 10000 0,061
50000-100000 328 75000 2460000 9850 50000 0,0056
100000-300000 150 200000 30000000 10000 200000 0,00075
10000 293800000
Para hallar el salario medio por trabajador calculamos la media de la
variable X.
A partir de los datos se observa que en el caso de los ateos hay mas
probabilidad de que los matrimonios acaben en divorcio 28.17%. En la
religión musulmana ocurrirá justo lo contrario con solo un 2% de divorcios.
b) Obtener las frecuencias marginales absolutas y relativas de la
variable divorcio.