Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regla empírica Dada una distribución de mediciones que tiene forma aproximada de campana o
simétrica:
𝑥̅ = 12 𝑠 = 1.7
(𝑥̅ ± 𝑠) = (𝑥̅ − 𝑠, 𝑥̅ + 𝑠) = (12 − 1.7, 12 + 1.7) = (10.3, 13,7) el 68%de los tiempos están entre
10.3 y 13.7
(𝑥̅ ± 2𝑠) = (𝑥̅ − 2𝑠, 𝑥̅ + 2𝑠) = (12 − 2 ∗ 1.7, 12 + 2 ∗ 1.7) = (8.6, 15.4) el 95% de los tiempos
está entre 8.6 y 15.4
(𝑥̅ ± 3𝑠) = (𝑥̅ − 3𝑠, 𝑥̅ + 3𝑠) = (12 − 3 ∗ 1.7, 12 + 3 ∗ 1.7) = (6.9, 17.1) el 99.7% de los tiempos
está entre 6.9 y 17.1
6
frecuencia
0
9 13 17 21 25 29 33
calificaciones
Regla empírica
(𝑥̅ ± 𝑠) = (21,6 − 5,5, 21.6 + 5.5) = (16.1, 27.1) aproximadamente contiene el 68% de las
calificaciones
(𝑥̅ ± 2𝑠) = (21,6 − 2 ∗ 5,5, 21.6 + 2 ∗ 5.5) = (10.6, 32.6) aproximadamente contiene el 95% de
las calificaciones
(𝑥̅ ± 3𝑠) = (21,6 − 3 ∗ 5,5, 21.6 + 3 ∗ 5.5) = (5.1, 38.1) aproximadamente contiene el 99.7% de
las calificaciones
Porcentajes reales para comparar
10,2 13,3 13,8 14,5 15,7 15,9 17,8 19,7 20,2 20,8 21,2 21,3
22,1 22,1 22,1 23,5 25 25,6 26 26,1 26,5 26,6 29 29,3 31,9
Percentiles
Definición: Un conjunto de n mediciones de la variable x se ha reacomodado en orden de magnitud. El p-ésimo
percentil es el valor de x que es mayor a p% de las mediciones y es menor que el restante (100 - p)%.
En general, el 60avo percentil para la variable x es un punto en el eje horizontal de la distribución de datos
que es mayor a 60% de las mediciones y menor que las otras. Esto es, 60% de las mediciones son menores
que el 60avo percentil y 40% son mayores. Como el área total bajo la distribución es 100%, 60% del área
está a la izquierda y 40% del área está a la derecha del 60avo percentil. Recuerde que la mediana, m, de un
conjunto de datos es la medición central; esto es, 50% de las mediciones son más pequeñas y 50% son más
grandes que la mediana. Entonces, ¡la mediana es igual que el 50avo percentil!
𝑛 total de datos
P es el percentil
23 25 28 26 27 26 29 30 32 37 34 33 38 39 28 29 29
Calcular el percentil 50 y 80
Para calcular los percentiles hay que ordenar de menor a mayor los datos y darles una posición como se
muestra a continuación
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Datos 23 25 26 26 27 28 28 29 29 29 30 32 33 34 37 38 39
Percentil 50
𝑝 50
Posición (𝑛 + 1) = (17 + 1) =9
100 100
Percentil 80
𝑝 80
Posición (𝑛 + 1) = (17 + 1) = 14.4
100 100
Significa que el percentil 80 está en la posición 14.4 como no es exacta debemos interpolar como se muestra
a continuación
Posición P30 (18) ∗ 0.3 = 5.4 𝑃30 = (28 − 27) ∗ 0.4 + 27 = 27.4
Posición P60 (18) ∗ 0.6 = 10.8 𝑃60 = (30 − 29) ∗ 0.8 + 29 = 29.8
Posición P75 (18) ∗ 0.75 = 13.5 𝑃75 = (34 − 33) ∗ 0.5 + 33 = 33.5
Cuartiles
Definición: Un conjunto de n mediciones en la variable x se ha acomodado en orden de magnitud. El cuartil
inferior (primer cuartil), 𝑄1 , es el valor de x que es mayor a un cuarto de las mediciones y es menor que los
restantes tres cuartos. El segundo cuartil es la mediana. El cuartil superior (tercer cuartil), 𝑄3 , es el valor de x
que es mayor a tres cuartos de las mediciones y es menor que el restante un cuarto.
Cuando las posiciones no son enteros, los cuartiles se encuentran por interpolación, usando los valores de
las dos posiciones adyacentes.
Definición: El rango intercuartil (IQR) para un conjunto de mediciones es la diferencia entre los cuartiles
superior e inferior; esto es, 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 .
Diagrama de caja
Para construir una gráfica de caja Calcule la mediana, los cuartiles superior e inferior y el IQR para el
conjunto de datos.
Trace una recta horizontal que represente la escala de medición. Forme una caja un poco arriba de la recta
horizontal con los extremos derecho e izquierdo en 𝑄1 y 𝑄3 . Trace una recta vertical que pase por la caja en
la ubicación de la mediana. Como se muestra en la figura
Detección de resultados atípicos. observaciones que están a mayor distancia:
Los límites superior e inferior se muestran con líneas interrumpidas en la figura, pero no suelen ser trazadas
en la gráfica de caja. Cualquier medición a mayor distancia del límite superior o inferior es un resultado
atípico; el resto de las mediciones, dentro de los límites, no son inusuales. Por último, la gráfica de caja
marca el rango del conjunto de datos usando “bigotes” para conectar las mediciones más pequeñas y más
grandes (excluyendo resultados atípicos) a la caja.
Solución
10,2 13,3 13,8 14,5 15,7 15,9 17,8 19,7 20,2 20,8 21,2 21,3
1 2 3 4 5 6 7 8 9 10 11 12
22,1 22,1 22,1 23,5 25 25,6 26 26,1 26,5 26,6 29 29,3 31,9
13 14 15 16 17 18 19 20 21 22 23 24 25
Media 𝑥̅ = 21.61
Diagrama de caja de excel
10 14 18 22 26 30 34
Ca lifica cione s
Ejemplo 2: Construya una gráfica de caja para estos datos e identifique los resultados atípicos:
3, 9, 10, 2, 6, 7, 5, 8, 6, 6, 4, 9, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13
Datos 2 3 4 5 6 6 6 7 8 9 9 10 22
Posición Q2 14*0.5=7 𝑄2 = 6
Posición Q3 14*0.75=10.5 𝑄3 = 9
Límite inferior: 𝑄1 − 1.5(𝑄3 − 𝑄1 ) = 4.5 − 1.5(9 − 4.5) = −2.25
Dato menor = 2
Dato mayor=22
Media 𝑥̅ = 7.46
Diagrama Excel
Ejercicios propuestos
1. Exámenes de aptitud: En contraste con exámenes de aptitud, que son medidas predictivas de lo que
se puede lograr con capacitación, los exámenes de conocimientos indican lo que una persona puede
hacer en el momento del examen. Se encontró que las calificaciones de un examen de conocimientos
matemáticos para 400 estudiantes tenían una media y varianza igual a 600 y 4900, respectivamente.
Si la distribución de calificaciones del examen era en forma de montículo, ¿más o menos cuántas de
las calificaciones caerían en el intervalo de 530 a 670? ¿Aproximadamente cuántas calificaciones se
esperaría caigan en el intervalo de 460 a 740?
2. Televidentes; El número de horas de televisión vistas por familia, así como las horas de mayor
audiencia, son dos factores que afectan el ingreso por publicidad en televisión. Una muestra aleatoria
de 25 familias en una zona particular produjo las siguientes estimaciones de horas vistas por familia:
3. Tiempos de supervivencia: Altman y Bland informan de tiempos de supervivencia para pacientes con
hepatitis activa, la mitad tratados con prednisona y la mitad no reciben tratamiento. Los tiempos de
supervivencia (en meses) están adaptados de sus datos para los tratados con prednisona.
a) Construya el diagrama de caja para los tiempos de los pacientes tratados con prednisona y sin
prednisona en la misma escala uno sobre el otro, compare los diagramas y concluya si se ve alguna
diferencia, forma de la distribución.