Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 4 y 5
Cuartiles.
Los cuartiles son los tres valores que dividen una serie de datos ordenada en
cuatro porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los
datos. El segundo (Q2) deja a izquierda y derecha el 50% y coincide con la
mediana. El tercero (Q3) deja a la derecha el 25% de valores.
Deciles.
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el
10% de los resultado.
Cuando n es impar:
Ana Ivelisse García 100353145
es par:
Cuando n es impar:
Deciles
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
Cuando n es par:
Cuando n es impar:
Siendo A el número del decil.
Percentiles
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo A, el número del percentil.
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil
con el percentil 50 y el tercer cuartil con el percentil 75.
Datos Agrupados}
Cuartiles
Ana Ivelisse García 100353145
Deciles
k= 1,2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
Ana Ivelisse García 100353145
fk = Frecuencia de la clase del decil k c =
Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
Percentiles
En otras palabras, las medidas de dispersión son números que indican si una
variable se mueve mucho, poco, más o menos que otra. La razón de ser de este
tipo de medidas es conocer de manera resumida una característica de la variable
estudiada. En este sentido, deben acompañar a las medidas de tendencia central.
Juntas, ofrecen información de un sólo vistazo que luego podremos utilizar para
comparar y, si fuera preciso, tomar decisiones.
Ana Ivelisse García 100353145
Rango
El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello,
comparte unidades con los datos. Permite obtener una idea de la dispersión de
los datos, cuanto mayor es el rango, aún más dispersos están los datos. El rango,
también es llamado amplitud o recorrido de medida.
Su fórmula es:
R = Máxx – Mínx
Donde:
R → Es el rango.
Máx → Es el valor máximo de la muestra o población.
Mín → Es el valor mínimo de la muestra o población estadística.
x → Es la variable sobre la que se pretende calcular esta medida.
Las ventajas de calcular el rango son evidentes: es muy sencillo y rápido de hallar,
pues es una simple diferencia.
Además tiene las mismas unidades que los datos con los cuales se trabaja y el
concepto es muy fácil de interpretar para cualquier observador.
Desviación de la media
La desviación estándar mide el grado de dispersión de los datos con respecto a la
media, se denota como s para una muestra o como σ para la población. Se define
como la raíz cuadrada de la varianza según la expresión:
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde
se divide entre n; también existe la fórmula de desviación típica donde el
denominador es n pero se prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es
decir existe menor dispersión, el incremento de los valores de la desviación
estándar indica una mayor variabilidad de los datos.
También cabe comentar que teniendo uno de los datos y su desviación respecto a
la media, se puede despejar la media aplicando una simple resta: y
posteriormente usarla para calcular las demás desviaciones.
Desviación media
Informa de lo muy dispersados (o no) que están los datos. Una desviación media
elevada implica mucha variabilidad en los datos, mientras que una desviación
media igual a cero implica que todos los valores son iguales y por lo tanto
coinciden con la media.
1.1) PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma de valores
absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un
inconveniente:
La desviación media al tomar los valores absolutos mide una observación sin
mostrar si la misma está por encima o por debajo de la media aritmética.
Ejemplo ilustrativo:
Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución
Varianza
La varianza es una medida de dispersión que representa la variabilidad de una
serie de datos respecto a su media. Formalmente se calcula como la suma de los
residuos al cuadrado divididos entre el total de observaciones.
Donde
X: variable sobre la que se pretenden calcular la varianza xi: observación
número i de la variable X. i puede tomará valores entre 1 y n. n: número de
observaciones. x:̄ Es la media de la variable X. O lo que es lo mismo:
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer también la desviación que
representan los datos en su distribución, con objeto de tener una visión de los
mismos más acorde con la realidad a la hora de describirlos e interpretarlos para
la toma de decisiones.
EJEMPLO
1.-El gerente de una empresa de alimentos desea saber que tanto varían los pesos
de los empaques (en gramos), de uno de sus productos; por lo que opta por
seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los
siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente. Por lo que
su media es:
Ana Ivelisse García 100353145
Ejercicios
Datos no agrupados
• Media Aritmética
Xi: 2 3 4 4 4 5 5 5 5 5 6 6 6 7 7 7 9
= 90 / 17 =
5.29 puntos.
• Mediana
Me = (n + 1) / 2
Me = (17 + 1) / 2 = 18 / 2 = 9
Me = 9na. Posición
Xi: 2 3 4 4 4 5 5 5 5 5 6 6 6 7 7 7 9
Me = 5 Puntos
Moda
Mo = 5, 4, 6 y 7
• Calcular el Q2
QK = (k (n+1)) / 4
Q2 = (2 (17+1)) / 4 = 9na. Posición
Xi: 2 3 4 4 4 5 5 5 5 5 6 6 6 7 7 7 9
Q2 = Me = 5 puntos.
• Calcular el D5
DK = (k (n+1)) / 10
D5 = (5 (17+1)) / 10 = 9na. Posición
Xi: 2 3 4 4 4 5 5 5 5 5 6 6 6 7 7 7 9
Ana Ivelisse García 100353145
D5 = Q2 = Me = 5 puntos.
Xi
Interpolar 2 5.29 3.29 10.8241
P25 = 4 + 0.50 (4 - 4) = 4 3 5.29 2.29 5.2441
P25 = 4 puntos 4 5.29 1.29 1.6641
4 5.29 1.29 1.6641
4 5.29 1.29 1.6641
Desviación estándar. 5 5.29 0.29 0.0841
5 5.29 0.29 0.0841
5 5.29 0.29 0.0841
5 5.29 0.29 0.0841
5 5.29 0.29 0.0841
6 5.29 0.71 0.5041
6 5.29 0.71 0.5041
6 5.29 0.71 0.5041
7 5.29 1.71 2.9241
7 5.29 1.71 2.9241
7 5.29 1.71 2.9241
= 1.69 puntos. 9 5.29 3.71 13.7641
90.00 21.87 45.5297
• Coeficiente de Variación
C.V =
(1.69/5.29)*100=31.95%
C.V = 31.95%
• Se han anotado las tallas, en centímetros, de los 17 alumnos de una clase y se
han obtenido los siguientes resultados: 166, 171, 167, 165, 152, 150, 147, 152,
Ana Ivelisse García 100353145
162, 155, 158, 158, 158, 164, 157, 155, 160,
= 2,697 / 17 = 158.65
158.65 cm.
c) ¿Entre que tallas se encuentra la mitad más baja y entre que tallas se encuentra
la mitad más alta?
Xi: 147 150 152 152 155 155 157 158 158 158 160 162 164 165 166 167 171
Me = (n + 1) / 2 Xi
= 6.56 Cm
N = 17
MEDIA ARITMÉTICA = 158.655.23
a) EL RANGO
R = Xmax – Xmin
R = 68 – 40 = 28
R = 28
b) MÉTODO DE STURGES
NG (CLASES) = 7
c) AMPLITUD
I = R / NG
Ana Ivelisse García 100353145
I = 28 / 7= 4
I=4
Minutos fi Fi Xi Xifi
40 - 4 9 9 41.5 373.5
3
44 - 4 11 20 45.5 500.5
7
48 - 5 5 25 49.5 247.5
1
52 - 5 5 30 53.5 267.5
5
56 - 5 2 32 57.5 115
9
60 - 6 1 33 61.5 61.5
3
64 - 6 2 35 65.5 131
7
68 - 7 1 36 69.5 69.5
1
TOTAL 36 1,766
= 1,766 / 36 = 49.06
Ana Ivelisse García 100353145
49.06 Minutos.
La Moda
Li = 44
Δ 1 = 11 – 9 = 2
Δ 2 = 11 – 5 = 6
Ci = 5
Mo = 45.25 Minutos
F X
Minutos fi Xifi
i i
40 - 43 9 9 41 373.5 49.06 68.04 514.38
.5 0
44 - 47 11 2 45 500.5 49.06 39.16 139.41
0 .5 0
48 - 51 5 2 49 247.5 49.06 2.20 0.97
5 .5 0
52 - 55 5 3 53 267.5 49.06 22.20 98.57
0 .5 0
56 - 59 2 3 57 115.0 49.06 16.88 142.47
2 .5 0
60 - 63 1 3 61 61.50 49.06 12.44 154.75
3 .5
64 - 67 2 3 65 131.0 49.06 32.88 540.55
5 .5 0
68 - 71 1 3 69 69.50 49.06 20.44 417.79
6 .5
TOTAL 36 1,766. 214.24 2,008.89
00
65 63 65 63 69 67 53 58 60 61
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62
EL RANGO
R = Xmax – Xmin
R = 72 – 53 = 19
R = 19
MÉTODO DE STURGES
NG (CLASES) = 1 + 3.33 LOG (N)
NG (CLASES) = 1 + 3.33 LOG (50)
NG (CLASES) = 1 + 3.33 (1.6990)
NG (CLASES) = 1 + 5.6576
NG (CLASES) = 6.6576
NG (CLASES) = 7
AMPLITUD
I = R / NG
I = 19 / 6.6576 = 2.85
Ana Ivelisse García 100353145
I=3
Peso F X
fi Xifi
(Kg) i i
53 - 55 2 2 5 108.0 63.18 168.54
4 0
56 - 58 5 7 5 285.0 63.18 190.96
7 0
59 - 61 9 1 6 540.0 63.18 91.01
6 0 0
62 - 64 15 3 6 945.0 63.18 0.49
1 3 0
65 - 67 12 4 6 792.0 63.18 95.43
3 6 0
68 - 70 5 4 6 345.0 63.18 169.36
8 9 0
71 - 73 2 5 7 144.0 63.18 155.58
0 2 0
TOTAL 50 3,159.0 871.38
0
• Calcule e Interprete
• Media
63.18 Kg
= 3,159 / 50 = 63.18
• Media
N / 2 = 50 / 2 = 25
Li = 62 Fi
– 1 = 16 fi
= 15
Ci = 3
Me = 63.80 Kg.
• Moda
Li = 62
Ana Ivelisse García 100353145
Δ 1 = 15 – 9 = 6
Δ 2 = 15 – 12 = 3
Ci = 3
Mo = 64 Kg.
Interpretación: Esto quiere decir que 64 Kg fue el peso más frecuente entre la
muestra de 50 estudiantes de primer semestre de una universidad.
• Q1
KN / 4 = (1*50) / 4 = 12.5
Li = 59
Fi-1 = 7
fi = 9 Ci
=3
• D4
KN / 10 = (4*50) / 10 = 20
Li = 62
Fi-1 = 16
fi = 15 Ci
=3
Ana Ivelisse García 100353145
D4 = Li + ((kn/4 - Fi-1) / fi ) x Ci D4 =
62 + (20 – 16) / 15) x 3 = 62.80 D4
= 62.80 Kg.
• P75
KN / 100 = (75*50) / 100 = 37.50
Li = 65
Fi-1 = 31
fi = 12 Ci
=3
Pes
o F X
• Coeficiente de variación. (Kg
fi
i i
Xifi
)
53 - 55 2 2 5 108. 63.18 168.54
C.V = (S / X) * 100 = 4 00
56 - 58 5 7 5 285. 63.18 190.96
(4.22/63.18)*100=6.67% 7 00
59 - 61 9 1 6 540. 63.18 91.01
C.V = 6.67 % 6 0 00
62 - 64 15 3 6 945. 63.18 0.49
1 3 00
65 - 67 12 4 6 792. 63.18 95.43
3 6 00
Interpretación: la variabilidad de 68 - 70 5 4 6 345. 63.18 169.36
8 9 00
una muestra de 50 estudiantes de 71 - 73 2 5 7 144. 63.18 155.58
0 2 00
primer semestre de una TOTAL 50 3,159. 871.38
universidad es de 6.67%. 00