Documentos de Académico
Documentos de Profesional
Documentos de Cultura
10 - 20 2 10 - 20 2 15 30 -9 -18
20 - 30 4 20 - 30 4 25 100 +1 +4
30 - 40 3 30 - 40 3 35 105 +11 +33
n=10
Solución
• Linealidad
Ejemplo
Solución
Ejemplo
Solución
Ejemplo
Xi ni
Calcular la media de la siguiente distribución. 38432 4
38434 8
38436 4
38438 3
Si efectuamos un cambio de variable 38440 8
y i x i 38436
2
tomando como nueva variable el valor más centrado, tendremos::
xi ni yi yi ni
38432 4 (38432 - 38436)/2 = -2 -8
38434 8 (38434 - 38436)/2 = -1 -8
38436 4 (38436 - 38436)/2 = 0 0
38438 3 (38438 - 38436)/2 = 1 3
38440 8 (38440 - 38436)/2 = 2 16
n = 27 3
Medidas de Centralización
Mediana: La mediana es el valor central de la variable, es decir, supuesta una
muestra ordenada en orden creciente o decreciente, es el valor que divide en dos
partes a dicha muestra. Para calcular la mediana debemos tener en cuenta si la
variable es discreta o continua.
Ventajas
• Representativa para datos en escala ordinal.
•Influenciada por valores centrales y es insensible a los valores extremos
u “outliers ”.
• No tiene en cuenta todas las observaciones extremas.
•Por consiguiente será recomendable su utilización cuando los datos son
irregulares, es decir, aparecen observaciones anormalmente bajas o altas.
• Depende de la posición relativa de los datos, no de sus
valores.
• Es función de los intervalos escogidos.
Propiedades
• Si una población está formada por 2 subpoblaciones de
medianas Med1 y Med2, sólo se puede afirmar que la mediana,
Med, de la población está comprendida entre Med1 y Med2.
n
N i1 2 Ni
Ejemplo:
Intervalo mediano
Ventajas y Desventajas
• Pueden existir varias modas
(distrib. bimodales, trimodales,...)
• No tiene en cuenta todas
las observaciones.
• Es menos representativa
que la media.
• Se puede calcular para características
cualitativas y cuantitativas.
• Es función de los intervalos elegidos a través de su amplitud,
número y límites de los mismos.
• Aunque el primero o el último de los intervalos no posean
extremos inferior o superior respectivamente, la moda puede
ser calculada.
• La moda también es menos afectada por unas pocas
observaciones atípicas.
• Si el conjunto de datos es bimodal, su uso puede ser confuso.
• Para conjuntos pequeños de datos su valor no tiene casi
utilidad, si es que de hecho existe. Solo tiene significado en el
caso de una gran cantidad de datos.
Figura: Cálculo geométrico de la moda
A.- Cálculo de la moda (caso discreto):
X: nº hijos fi hi %
0 15 15/100 15
Mayor
Moda 1 31 31/100 31 frecuencia
2 50 50/100 50
3 2 2/100 2
>4 2 2/100 2
B.- Cálculo de la moda (caso continuo)
Mo L i1
ni ni1 •a i
(n n )(n n )
i i1 i i1
Intervalo modal
Relación entre media, mediana y moda
• En el caso de distribuciones unimodales, la mediana está con
frecuencia comprendida entre la media y la moda (incluso más
cerca de la media).
• En distribuciones que presentan cierta inclinación, es más
aconsejable el uso de la mediana. Sin embargo en estudios
relacionados con propósitos estadísticos y de inferencia suele
ser más apta la media.
Moda Media
Mediana
Comparación entre media, mediana y moda
Ejemplo
Ejemplo: n = 12
111222334567
Promedio
simple
Statistica 6.0
Ejemplo
Ejemplo
Solución
Tenemos i = 0.25*12 = 3
Q1 = (1 + 2) / 2 = 1.5 111222334567
kn
N i1 4 N i
N i1 kn N i
10
N i1 kn Ni
100
Medidas de Localización
Ejemplo:
Cuartiles, Deciles y Percentiles: Caso continuo
Intervalo cuartílico
para Q1
Ejemplo:
Si se tiene una distribución de frecuencias simétrica con
seis intervalos de amplitud constante, y los siguientes datos:
Solución:
Ejercicios
1. Supóngase que un estudiante tiene las siguientes notas en cuatro cursos
matriculados un cuatrimestre: 67, 82, 90, 71. El número de créditos que
vale cada curso es, respectivamente: 3, 2, 2, 4. Calcule un promedio
adecuado.
*
4. Según la distribución de las notas (en una escala de 1 a 10), ¿cómo
crees que es la prueba A?
a. Fácil *
b. Normal, ni fácil ni difícil
c. Difícil
A B
100 80
80
60
Frecuencia
Frecuencia
60
40
40
20
20
0 0
2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00
A B
5. La tabla presentada a continuación representa el consumo de energía
eléctrica de 80 usuarios en el primer mes del 2005:
Consumo Número de
(Kwh) usuarios
5 – 25 04
25 – 45 06
45 – 65 14
65 – 85 26
85 – 105 14
105 – 125 08
125 – 145 06
145 – 165 02
Total 80
Statistics
Yi
N Valid 80
Missing 0
Mean 79.50
Median 78.00a
Mode 75
Percentiles 25 58.00b
50 78.00
75 100.45
a. Calculated from grouped data.
b. Percentiles are calculated from grouped data.
Solución con Casio fx-9860
Media
Moda
Mediana
Cuartiles, deciles y percentiles
Ejercicio 3: Nº de
Salarios empleados
La distribución de los costes salariales de 0-15000 2145
los 10000 empleados de una multinacional 15000-20000 1520
se presenta en la tabla siguiente:
20000-25000 840
Calcular el salario medio por trabajador, el
25000-30000 955
salario típico y el salario central. Calcular
30000-35000 1110
también el primer cuartil salarial y el
percentil 75. Interpretar. 35000-40000 2342
40000-50000 610
50000-100000 328
100000-300000 150
Solución :
La tabla siguiente contiene los elementos relativos a la distribución de
frecuencia de la variable salario (X) necesarios para realizar los
cálculos pedidos en el problema.
Nº de
empleado Marcas =
Salarios s (ni) xi xi* ni Ni ci di= ni/ ci
0-15000 2145 7500 16087500 2145 15000 0,143
15000-20000 1520 17500 26600000 3665 5000 0,304
20000-25000 840 22500 18900000 4505 5000 0,168
25000-30000 955 27500 26262500 5460 5000 0,191
30000-35000 1110 32500 36075000 6570 5000 0,222
35000-40000 2342 37500 87825000 8912 5000 0,4684
40000-50000 610 45000 27450000 9522 10000 0,061
50000-100000 328 75000 2460000 9850 50000 0,0056
100000-300000 150 200000 30000000 10000 200000 0,00075
10000 293800000
Para hallar el salario medio por trabajador calculamos la media de la
variable X.
A partir de los datos se observa que en el caso de los ateos hay mas
probabilidad de que los matrimonios acaben en divorcio 28.17%. En la
religión musulmana ocurrirá justo lo contrario con solo un 2% de divorcios.
b) Obtener las frecuencias marginales absolutas y relativas de la
variable divorcio.