Está en la página 1de 10

Regla empírica

Regla empírica Dada una distribución de mediciones que tiene forma aproximada de campana o
simétrica:

El intervalo (𝑥̅ ± 𝑠) contiene aproximadamente 68% de las mediciones.

El intervalo (𝑥̅ ± 2𝑠) contiene aproximadamente 95% de las mediciones.

El intervalo (𝑥̅ ± 3𝑠) contiene aproximadamente 99.7% de las mediciones.

La distribución en forma de campana que se muestra en la figura se conoce comúnmente como


distribución normal y se estudiará en detalle más adelante.

Ejemplo 1: En un estudio de tiempo efectuado en una planta manufacturera, el tiempo para


completar una operación especificada se mide para cada uno de los n = 40 trabajadores. Se
encuentra que la media y la desviación estándar son 12 y 1.7, respectivamente. Describa los datos
muestrales usando la Regla empírica. Solución Para describir los datos, calcule estos intervalos:

𝑥̅ = 12 𝑠 = 1.7
(𝑥̅ ± 𝑠) = (𝑥̅ − 𝑠, 𝑥̅ + 𝑠) = (12 − 1.7, 12 + 1.7) = (10.3, 13,7) el 68%de los tiempos están entre
10.3 y 13.7

(𝑥̅ ± 2𝑠) = (𝑥̅ − 2𝑠, 𝑥̅ + 2𝑠) = (12 − 2 ∗ 1.7, 12 + 2 ∗ 1.7) = (8.6, 15.4) el 95% de los tiempos
está entre 8.6 y 15.4

(𝑥̅ ± 3𝑠) = (𝑥̅ − 3𝑠, 𝑥̅ + 3𝑠) = (12 − 3 ∗ 1.7, 12 + 3 ∗ 1.7) = (6.9, 17.1) el 99.7% de los tiempos
está entre 6.9 y 17.1

Ejemplo 2: Los maestros-estudiantes son capacitados para desarrollar planes de lecciones, en la


suposición de que el plan escrito les ayudará a trabajar de manera satisfactoria en el salón de clases.
En un estudio para evaluar la relación entre planes de lección escritos y su implementación en el
salón de clases, se calificaron 25 planes de lección en una escala de 0 a 34 de acuerdo a una Lista de
verificación de Plan de lección. Las 25 calificaciones se muestran en la tabla. Use la Regla empírica
(si es aplicable) para describir la distribución de estas calificaciones de evaluación.
26.1 26.0 14.5 29.3 19.7

22.1 21.2 26.6 31.9 25.0

15.9 20.8 20.2 17.8 13.3

25.6 26.5 15.7 22.1 13.8

29.0 21.3 23.5 22.1 10.2


Histograma

6
frecuencia

0
9 13 17 21 25 29 33
calificaciones

La distribución de las calificaciones si es simétrica


Resumen Estadístico para calificaciones
Recuento 25
Promedio 21,608
Desviación Estándar 5,54894
Coeficiente de Variación 25,68%
Mínimo 10,2
Máximo 31,9
Rango 21,7
Sesgo Estandarizado -0,473556
Curtosis Estandarizada -0,57232

Regla empírica

(𝑥̅ ± 𝑠) = (21,6 − 5,5, 21.6 + 5.5) = (16.1, 27.1) aproximadamente contiene el 68% de las
calificaciones

(𝑥̅ ± 2𝑠) = (21,6 − 2 ∗ 5,5, 21.6 + 2 ∗ 5.5) = (10.6, 32.6) aproximadamente contiene el 95% de
las calificaciones

(𝑥̅ ± 3𝑠) = (21,6 − 3 ∗ 5,5, 21.6 + 3 ∗ 5.5) = (5.1, 38.1) aproximadamente contiene el 99.7% de
las calificaciones
Porcentajes reales para comparar

10,2 13,3 13,8 14,5 15,7 15,9 17,8 19,7 20,2 20,8 21,2 21,3
22,1 22,1 22,1 23,5 25 25,6 26 26,1 26,5 26,6 29 29,3 31,9

intervalos cantidad % reales


(16.1,27.1) 16 64
(10.6,32.6) 24 96
(5.1, 38.1) 25 100

Percentiles
Definición: Un conjunto de n mediciones de la variable x se ha reacomodado en orden de magnitud. El p-ésimo
percentil es el valor de x que es mayor a p% de las mediciones y es menor que el restante (100 - p)%.

En general, el 60avo percentil para la variable x es un punto en el eje horizontal de la distribución de datos
que es mayor a 60% de las mediciones y menor que las otras. Esto es, 60% de las mediciones son menores
que el 60avo percentil y 40% son mayores. Como el área total bajo la distribución es 100%, 60% del área
está a la izquierda y 40% del área está a la derecha del 60avo percentil. Recuerde que la mediana, m, de un
conjunto de datos es la medición central; esto es, 50% de las mediciones son más pequeñas y 50% son más
grandes que la mediana. Entonces, ¡la mediana es igual que el 50avo percentil!

Como calcular percentiles


𝑝
Posición del percentil P: (𝑛 + 1)
100

𝑛 total de datos

P es el percentil

Ejemplo dados los siguientes datos

23 25 28 26 27 26 29 30 32 37 34 33 38 39 28 29 29
Calcular el percentil 50 y 80
Para calcular los percentiles hay que ordenar de menor a mayor los datos y darles una posición como se
muestra a continuación

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Datos 23 25 26 26 27 28 28 29 29 29 30 32 33 34 37 38 39

Percentil 50
𝑝 50
Posición (𝑛 + 1) = (17 + 1) =9
100 100

Significa que el percentil 50 es el dato que está en la posición 9 es decir 𝑃50 = 29

Percentil 80
𝑝 80
Posición (𝑛 + 1) = (17 + 1) = 14.4
100 100

Significa que el percentil 80 está en la posición 14.4 como no es exacta debemos interpolar como se muestra
a continuación

𝑃80 = (37 − 34) ∗ 0.4 + 34 = 35.2

Nota 𝑃50 es la mediana de los datos

Calcular el 𝑃30 𝑃60 𝑃75

Posición P30 (18) ∗ 0.3 = 5.4 𝑃30 = (28 − 27) ∗ 0.4 + 27 = 27.4

Posición P60 (18) ∗ 0.6 = 10.8 𝑃60 = (30 − 29) ∗ 0.8 + 29 = 29.8

Posición P75 (18) ∗ 0.75 = 13.5 𝑃75 = (34 − 33) ∗ 0.5 + 33 = 33.5
Cuartiles
Definición: Un conjunto de n mediciones en la variable x se ha acomodado en orden de magnitud. El cuartil
inferior (primer cuartil), 𝑄1 , es el valor de x que es mayor a un cuarto de las mediciones y es menor que los
restantes tres cuartos. El segundo cuartil es la mediana. El cuartil superior (tercer cuartil), 𝑄3 , es el valor de x
que es mayor a tres cuartos de las mediciones y es menor que el restante un cuarto.

𝑄1 = 𝑃25 , es el valor de x en la posición 0.25(𝑛 + 1)

𝑄2 = 𝑃50 es la mediana que se encuentra en la posición 0.50(𝑛 + 1)

𝑄3 = 𝑃75 , es el valor de x en la posición 0.75(𝑛 + 1).

Cuando las posiciones no son enteros, los cuartiles se encuentran por interpolación, usando los valores de
las dos posiciones adyacentes.

Definición: El rango intercuartil (IQR) para un conjunto de mediciones es la diferencia entre los cuartiles
superior e inferior; esto es, 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 .

Diagrama de caja
Para construir una gráfica de caja Calcule la mediana, los cuartiles superior e inferior y el IQR para el
conjunto de datos.

Trace una recta horizontal que represente la escala de medición. Forme una caja un poco arriba de la recta
horizontal con los extremos derecho e izquierdo en 𝑄1 y 𝑄3 . Trace una recta vertical que pase por la caja en
la ubicación de la mediana. Como se muestra en la figura
Detección de resultados atípicos. observaciones que están a mayor distancia:

Límite inferior: 𝑄1 − 1.5(𝑄3 − 𝑄1 )

Límite superior: 𝑄3 + 1.5(𝑄3 − 𝑄1 )

Los límites superior e inferior se muestran con líneas interrumpidas en la figura, pero no suelen ser trazadas
en la gráfica de caja. Cualquier medición a mayor distancia del límite superior o inferior es un resultado
atípico; el resto de las mediciones, dentro de los límites, no son inusuales. Por último, la gráfica de caja
marca el rango del conjunto de datos usando “bigotes” para conectar las mediciones más pequeñas y más
grandes (excluyendo resultados atípicos) a la caja.

Formas de la distribución de acuerdo al diagrama de caja


Ejemplo

Ejemplo 2: Los maestros-estudiantes son capacitados para desarrollar planes de lecciones, en la


suposición de que el plan escrito les ayudará a trabajar de manera satisfactoria en el salón de clases.
En un estudio para evaluar la relación entre planes de lección escritos y su implementación en el
salón de clases, se calificaron 25 planes de lección en una escala de 0 a 34 de acuerdo a una Lista de
verificación de Plan de lección. Las 25 calificaciones se muestran en la tabla. Use la Regla empírica
(si es aplicable) para describir la distribución de estas calificaciones de evaluación.
26.1 26.0 14.5 29.3 19.7

22.1 21.2 26.6 31.9 25.0

15.9 20.8 20.2 17.8 13.3

25.6 26.5 15.7 22.1 13.8

29.0 21.3 23.5 22.1 10.2

Solución

10,2 13,3 13,8 14,5 15,7 15,9 17,8 19,7 20,2 20,8 21,2 21,3
1 2 3 4 5 6 7 8 9 10 11 12
22,1 22,1 22,1 23,5 25 25,6 26 26,1 26,5 26,6 29 29,3 31,9
13 14 15 16 17 18 19 20 21 22 23 24 25

Posición Q1 26 ∗ 0.25 = 6.5 𝑄1 = 𝑃25 = (17.8 − 15.9) ∗ 0.5 + 15.9 = 16.85

Posición Q2 26 ∗ 0.50 = 13 𝑄2 = 𝑃50 = 22.1

Posición Q3 26 ∗ 0.75 = 19.5 𝑄3 = 𝑃75 = (26.1 − 26) ∗ 0.5 + 26 = 26.05

Límite inferior: 𝑄1 − 1.5(𝑄3 − 𝑄1 ) = 16.85 − 1.5(26.05 − 16.85) = 3.05

Límite superior: 𝑄3 + 1.5(𝑄3 − 𝑄1 ) = 26.05 + 1.5(26.05 − 16.85) = 39.85

Dato menor 10.2

Dato mayor 31.9

Media 𝑥̅ = 21.61
Diagrama de caja de excel

Diagrama de caja de STATGRAPHICS


Grá fico de Ca ja y Bigote s

10 14 18 22 26 30 34
Ca lifica cione s

Ejemplo 2: Construya una gráfica de caja para estos datos e identifique los resultados atípicos:

3, 9, 10, 2, 6, 7, 5, 8, 6, 6, 4, 9, 22
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13
Datos 2 3 4 5 6 6 6 7 8 9 9 10 22

Posición Q1 14*0.25=3.5 𝑄1 = (5 − 4) ∗ 0.5 + 4 = 4.5

Posición Q2 14*0.5=7 𝑄2 = 6

Posición Q3 14*0.75=10.5 𝑄3 = 9
Límite inferior: 𝑄1 − 1.5(𝑄3 − 𝑄1 ) = 4.5 − 1.5(9 − 4.5) = −2.25

Límite superior: 𝑄3 + 1.5(𝑄3 − 𝑄1 ) = 9 + 1.5(9 − 4.5) = 15.75

Dato menor = 2

Dato mayor=22

Media 𝑥̅ = 7.46

Distribución sesgada a la derecha

Diagrama Excel
Ejercicios propuestos
1. Exámenes de aptitud: En contraste con exámenes de aptitud, que son medidas predictivas de lo que
se puede lograr con capacitación, los exámenes de conocimientos indican lo que una persona puede
hacer en el momento del examen. Se encontró que las calificaciones de un examen de conocimientos
matemáticos para 400 estudiantes tenían una media y varianza igual a 600 y 4900, respectivamente.
Si la distribución de calificaciones del examen era en forma de montículo, ¿más o menos cuántas de
las calificaciones caerían en el intervalo de 530 a 670? ¿Aproximadamente cuántas calificaciones se
esperaría caigan en el intervalo de 460 a 740?

2. Televidentes; El número de horas de televisión vistas por familia, así como las horas de mayor
audiencia, son dos factores que afectan el ingreso por publicidad en televisión. Una muestra aleatoria
de 25 familias en una zona particular produjo las siguientes estimaciones de horas vistas por familia:

3.0 6.0 7.5 15.0 12.0

6.5 8.0 4.0 5.5 6.0

5.0 12.0 1.0 3.5 3.0

7.5 5.0 10.0 8.0 3.5

9.0 2.0 6.5 1.0 5.0

a) Calcule la media maestral 𝑥̅ y la desviación estándar de la muestra s.


b) Realice el diagrama de caja para para determinar la forma de la distribución (manual).
c) Realice el histograma en excel
d) Encuentre el porcentaje de las horas de televisión vistas por familia, que caiga en el intervalo (𝑥̅ ±
2𝑠). Compare con el correspondiente porcentaje dado por la Regla empírica.

3. Tiempos de supervivencia: Altman y Bland informan de tiempos de supervivencia para pacientes con
hepatitis activa, la mitad tratados con prednisona y la mitad no reciben tratamiento. Los tiempos de
supervivencia (en meses) están adaptados de sus datos para los tratados con prednisona.

a) Construya el diagrama de caja para los tiempos de los pacientes tratados con prednisona y sin
prednisona en la misma escala uno sobre el otro, compare los diagramas y concluya si se ve alguna
diferencia, forma de la distribución.

También podría gustarte