Está en la página 1de 24

Estadística para seres humanos Rueda, José A.

Universidad del Papaloapan

Estadística para seres humanos

Rueda, José A.

Marzo 2020

1
Estadística para seres humanos Rueda, José A.

Estadística para seres humanos


Prefacio

Pruebas de hip ótesis


I . Prueba s de hi p ó t esis so bre la media µ de una di st ri buci ó n norma l

Al realizar una prueba de hipótesis sobre la media de una distribución normal, se pueden dar tres
casos de interés práctico: a) el investigador está interesado en demostrar que la media poblacional
(µ) es menor a cierta constante (𝜇𝑜 ), por lo que esta será Ha y la prueba será de cola izquierda; b) el
investigador desea comprobar que la media poblacional (µ) supera a un valor dado (𝜇𝑜 ), dando lugar a una
prueba de cola derecha; ó c) el investigador desea probar que la media es igual al valor de referencia, lo que
significará una hipótesis que descarta la mitad de α en cada lado de la distribución. A continuación se detallan
los tres casos en una prueba de hipótesis de este tipo:

Caso Cola Hipótesis Hipótesis Regla de decisión Regla de decisión’


nula alterna n<30 o σ2estimada n>30 o σ2conocida
a) Izquierda H0: µ ≥ 𝜇0 Ha: µ < 𝜇 𝑜 Rechazar H0 si 𝑡𝐶𝐴𝐿 < 𝑡𝛼, 𝑛−1 Rechazar H0 si 𝑍𝐶𝐴𝐿 < 𝑍𝛼
b) Derecha H0: µ ≤ 𝜇0 Ha: µ > 𝜇 𝑜 Rechazar H0 si 𝑡𝐶𝐴𝐿 > 𝑡1−𝛼, 𝑛−1 Rechazar H0 si 𝑍𝐶𝐴𝐿 > 𝑍1−𝛼
c) Dos colas H0: µ = 𝜇0 Ha: µ ≠ 𝜇 𝑜 Rechazar H0 si |𝑡𝐶𝐴𝐿 | > |𝑡𝛼, 𝑛−1 | Rechazar H0 si |𝑍𝐶𝐴𝐿 |> |𝑍𝛼/2 |
2

Como podemos notar en el Cuadro 5, en función al tamaño de la muestra o al conocimiento de la


varianza, tendremos dos formas de estimar el valor calculado; dado que la distribución t fue
desarrollada para muestras pequeñas. Los valores calculados para Z & t tienen una expresión
equivalente, ambas se muestran a continuación.

Muestra pequeña varianza Varianza conocida o muestra


desconocida (t) grande (Z)

√𝑛 (𝑥̅ − 𝜇𝑜 ) √𝑛 (𝑥̅ − 𝜇𝑜 )
𝑡𝐶𝐴𝐿 = 𝑍𝐶𝐴𝐿 =
𝑆 𝜎

La regla de decisión parte el espacio muestral en dos zonas (en la curva de la función de densidad t
ó Z) que representan dos eventos mutuamente excluyentes. Donde t (ó Z) de tablas es el punto de
división de estas áreas, el área más “pequeña” aislada en la cola (o colas) es el valor de α; el área
más grande corresponde a (1-α), a la cual se denomina precisión la prueba.

2
Estadística para seres humanos Rueda, José A.

Ejemplos:
(i) Si la calificación 𝑥̅ de una prueba psicométrica es de 1000 y la S es de 100 en una muestra de
tamaño 16, ¿es el parámetro µ realmente mayor a 980?
(ii) Si en el ejemplo anterior damos por sentado que σ=100, ¿será el parámetro µ menor a 1050?

Respuestas (i) & (ii)


(i) 𝑥̅ = 1000 S =100 & n= 16 ; 𝜇0 = 980 Ha: Es 𝜇 > 980?

𝐶𝑎𝑠𝑜 [𝑏)] Muestra pequeña varianza desconocida (t). Cola derecha

a) H0: µ ≤ 980
Ha: µ > 980
√𝑛 (𝑥̅ −𝜇𝑜 ) √16 (1000−980)
b) 𝑡𝐶𝐴𝐿 = 𝑆
= 100
= 0.8
c) 𝑡1−𝛼, 𝑛−1 = 𝑡0.95, 15 = 1.7531
d) Rechazar H0 si 𝑡𝐶𝐴𝐿 > 𝑡1−𝛼, 𝑛−1
Rechazar H0 si 𝑡𝐶𝐴𝐿 > 𝑡0.95, 15 𝑿
Rechazar H0 si 0.8 > 1.7531
e) NO se rechaza H0 con α=0.05
“No existe razón para sospechar que la media poblacional de
la calificación de los sustentantes de esta prueba psicométrica
sea superior a 980 puntos (P<0.05)”

(ii) 𝑥̅ = 1000, σ =100, n=16, 𝜇0 = 1050 & Ha: Es 𝜇 < 1050?

𝐶𝑎𝑠𝑜 [𝑎)′] Varianza conocida o muestra grande (Z). Cola izquierda

a) H0: µ ≥ 𝟏050
Ha: µ < 𝟏050
√𝑛 (𝑥̅ −𝜇𝑜 ) √16 (1000−1050)
b) 𝑍𝐶𝐴𝐿 = = = −2.0
𝜎 100
c) 𝑍𝛼 = 𝑍0.05 = −1.65
d) Rechazar H0 si 𝑍𝐶𝐴𝐿 < 𝑍𝛼
Rechazar H0 si 𝑍𝐶𝐴𝐿 <𝑍0.05

Rechazar H0 si −2.0 <−1.65
e) SI se rechaza H0 con α=0.05.
“La media poblacional de la calificación de los sustentantes de
esta prueba psicométrica es inferior a 1050 puntos (P<0.05)”

(iii) Suponiendo que se ha tomado una muestra de tamaño 27 y se ha encontrado una media y
desviación idénticas a las reportadas en el ejercicio resuelto. Un sustentante alega que su
calificación fue de 975 y que por tanto está en la media de inteligencia nacional. (i) ¿Será
la media poblacional significativamente diferente de 975? Resuelva.

3
Estadística para seres humanos Rueda, José A.

Pruebas de hip ótesis


II . Pruebas de Hi p ó tesi s so bre l a di ferencia ent re do s media s (µ𝟏 − µ𝟐 ) co n
di st ri buci ó n normal :

Sea θ = µ𝟏 − µ𝟐 & ∴ 𝜃̂ = 𝒙
̅𝟏 − 𝒙
̅𝟐 ; entonces se pueden dar cualquiera de los tres casos descritos
en seguida:
Caso Cola Hipótesis Hipótesis Regla de decisión Regla de decisión’
nula alterna Varianzas homogéneas y Varianzas heterogéneas
estimadas (t) y conocidas (Z)

a) Izquierda Ho: θ ≥ 𝜃 0 Ha: θ < 𝜃 𝑜 Rechazar H0 si 𝑡𝐶𝐴𝐿 < 𝑡𝛼, 𝑛1+ 𝑛2 −2 Rechazar H0 si 𝑍𝐶𝐴𝐿 < 𝑍𝛼
b) Derecha Ho: θ ≤ 𝜃 0 Ha: θ > 𝜃 𝑜 Rechazar H0 si 𝑡𝐶𝐴𝐿 > 𝑡1−𝛼, 𝑛1+ 𝑛2−2 Rechazar H0 si 𝑍𝐶𝐴𝐿 > 𝑍1−𝛼
c) Dos colas Ho: θ = 𝜃 0 Ha: θ ≠ 𝜃 𝑜 Rechazar H0 si |𝑡𝐶𝐴𝐿 | > |𝑡𝛼, 𝑛 + 𝑛 −2 | Rechazar H0 si |𝑍𝐶𝐴𝐿 |> |𝑍𝛼/2 |
2 1 2

El caso más importante es aquel donde θ = 0 y la hipótesis es el caso ‘c)’, ya que implica que los
parámetros µ1 & µ2 son iguales. Puede verificarse que los tres casos aquí planteados son
equivalentes a los presentados para el caso de las pruebas de hipótesis sobre una sola media (tema
anterior) y que son basados de hecho en t y Z también. Las únicas dos diferencias residen en que el
valor calculado refleja la diferencia entre dos medias y el valor de tablas se consulta con 𝑛1 + 𝑛2 − 2
grados de libertad. Cuando el valor de α a usar no sea especificado en el requerimiento de una
prueba deberá de usarse regular e indistintamente un α=0.05.

Varianzas homogéneas y Varianzas heterogéneas


estimadas (t) y conocidas (Z)

Valor (𝑥̅1 − 𝑥̅2 ) − 𝜃0


𝑡𝐶𝐴𝐿 = (𝑥̅1 − 𝑥̅2 ) − 𝜃0
calculado 1 1
√𝑆2𝑝 (𝑛 + 𝑛 ) 𝑍𝐶𝐴𝐿 =
1 2
𝜎2 𝜎2
√( 1 + 2 )
𝑛 𝑛
𝑆12 (𝑛1 − 1) + 𝑆22 (𝑛2 − 1) 1 2
𝑆2𝑝 =
𝑛1 + 𝑛2 − 2

La regla de decisión separa la función de densidad de Z o t en dos áreas (bajo la curva) es función al
valor de tabas (Zα ó tα ). En el caso de las pruebas de una sola cola, el valor del área más pequeña
(PET I ó α) está aislado en uno de los extremos en la gráfica de la función de densidad. En las pruebas
de dos colas, el valor de α está dividido en dos pequeñas áreas en los extremos de la función de
densidad. Los valores de Z (ó t) que se ubican bajo el área que representa α comprende un segmento
de recta que se conoce como “zona de rechazo de H0”; los valores que están fuera de esta zona
comprenden la “zona de NO rechazo de H0”.

4
Estadística para seres humanos Rueda, José A.

Ejemplos:

(i) En una empresa ensambladora de circuitos “plug in” para nodos de red, se midió el número
de unidades que se ensamblaban por día bajo A un esquema de descansos de 5 min c/h o& B
15 min c/2 h. Obteniendo los sig. datos: A: 1735, 2002, 1820, 2082, 1894, 2873, 1816, 2008,
1758, 1898, 2223, 2313 & B: 3403, 3294, 2899, 3350, 3212, 2964,3098, 2984, 2492. ¿Son las
medias poblacionales resultados diferentes? ¿qué método recomendaría?
(ii) El empresario del caso (i) ha estimado que de acuerdo con la energía requerida para encender
la maquinaria cada dos horas solo será rentable establecer el esquema de descansos largos si
la diferencia entre los métodos de descanso rebasa 700 unidades (es mayor qué). ¿puede
usted ayudar a tomar esta decisión?

Respuestas (i) & (ii)


(i) 𝑥̅ 1 = 2035.2 𝑆12 =101678.5 & n1 = 12,
𝑥̅ 2 = 3077.3 𝑆22 =80235.8 & n2 = 9, ¿Es µ2  µ1?
θ0 = 𝟎 & 𝜃 = 𝒙 ̂ ̅𝟏 − 𝒙̅𝟐 = - 1 0 4 2 . 1

𝐶𝑎𝑠𝑜 [𝑐)] Varianzas homogéneas y estimadas (t) n & m pequeños. Dos colas

a) H0: θ = 0
Ha: θ  0
(𝑥̅1 −𝑥̅2 )−𝜃0 −1042.1−𝜃0
b) 𝑡𝐶𝐴𝐿 = 1 1
= 1 1
= -7.7641
√𝑆2𝑝 (𝑛 +𝑛 ) √92650( + )
1 2 12 9

𝑆12 (𝑛1 −1)+𝑆22 (𝑛2 −1) 101678.5(11)+80235.8(8)


𝑆𝑝2 = = = 92650
𝑛1 +𝑛2 −2 12+9−2

c) 𝑡𝛼, 𝑛1 +𝑛2 −2
= 𝑡0.025, 19 = 2.093
2

d) Rechazar H0 sí|𝑡𝐶𝐴𝐿 | > |𝑡𝛼, 𝑛1 +𝑛2 −2


|
2

Rechazar H0 sí | − 7.764| > |𝑡0.025,19 |



Rechazar H0 sí 7.764 > 2.093
(Se rechaza por la izquierda)

e) SI se rechaza H0 con α=0.05


“Los dos métodos de descanso producen resultados
diferentes en cuanto a producción de unidades (P<0.05)”

5
Estadística para seres humanos Rueda, José A.

(ii) 𝑥̅ 1 = 2035.2 𝑆12 =101678.5 & n1 = 12,


𝑥̅ 2 = 3077.3 𝑆22 =80235.8 & n2 = 9, Es µ2 - µ1 > 700
θ0 = 𝟕𝟎𝟎 ̂
& 𝜃 =𝒙 ̅𝟐 − 𝒙
̅𝟏 = 1 0 4 2 . 1

𝐶𝑎𝑠𝑜 [𝑏)] Varianzas homogéneas y estimadas (t) n & m pequeños, cola derecha

a) H0: θ ≤ 700
Ha: θ > 700
𝜃̂ = 𝒙
̅𝟐 − 𝒙
̅𝟏 θ = µ𝟐 − µ𝟏

̂ −𝜃0
𝜃 1042.1−700
b) 𝑡𝐶𝐴𝐿 = 1 1
= 1 1
= 2.5487
√𝑆𝑝2 (𝑛 +𝑛 ) √92650( + )
1 2 12 9

𝑆12 (𝑛1 −1)+𝑆22 (𝑛2 −1) 101678.5(11)+80235.8(8)


𝑆𝑝2 = 𝑛1 +𝑛2 −2
= 19
= 92650

Note que en la fórmula de t se ha sustituido el valor (𝑥̅1 − 𝑥̅2 ) por 𝜃̂ = 𝒙 ̅𝟐 − 𝒙̅𝟏 = 1 0 4 2 .1 ;


i n d i c á n d o l e q u e l a p r u e b a d e h i p ó t e s i s e s t o t a lm e nt e d i f e r e nt e s i s e p e g u n t a
p o r l a d i f e re n c i a µ2 - µ1 que si se pregunta por a diferencia µ2 - µ1

c) 𝑡1−𝛼, 𝑛1 +𝑛2 −2 = 𝑡0.95, 19 = 1.7291

d) Rechazar H0 sí 𝑡𝐶𝐴𝐿 > 𝑡1−𝛼, 𝑛1+𝑛2−2


Rechazar H0 sí 𝑡𝐶𝐴𝐿 > 𝑡0.95, 19
Rechazar H0 sí 2 .5487 > 1.7291 √

e) SI se rechaza H0 con α=0.05


“El método de descansos más largos supera en más de 700
unidades la producción diaria lograda por el método de
descansos cortos en esta empresa (P<0.05)”

(iii) Se evalúa la capacidad de producción de calor que tiene el carbón proveniente de la mina A:
𝑥̅ 1 = 8230, 𝜎12 =15750 & n1 = 5; respecto al de la mina B: 𝑥̅ 2 = 7940, 𝜎22 = 10920 & n2 = 6. Use
un α=0.01 para responder, ¿es esta diferencia, estadísticamente significativa? Resuelva.

Note que en este caso no trasciende si denotamos θ′̂ = x̅2 − x̅1 ó θ̂ = x̅1 − x̅2 (θ’
=µ2-µ1, o bien θ = µ1-µ2, respectivamente); ya que en tanto la diferencia exista, está
podrá ser probada si invade zona de rechazo de H0 en la cola izquierda o en la cola
derecha. Acorde con la regla de decisión, es irrelevante si entra en la zona de rechazo
por la izquierda o por la derecha.

6
Estadística para seres humanos Rueda, José A.

Pruebas de hip ótesis


II I . P rueba s de Hi p ó tesi s so bre la v arianza 𝝈𝟐 de una di st ri buci ó n no rmal

En situaciones donde es primordial que las medias de ciertas mediciones sean lo más precisas posibles, es
necesario hacer pruebas para comprobar que la varianza no rebase ciertos límites. Para ello, las condiciones
generales que aplican a una prueba de hipótesis son iguales a las ya revisadas en los temas II y III de Pruebas
de hipótesis. No obstante, el modelo probabilístico que se ajusta a la distribución de la varianza es “ji
cuadrada”.

Caso Cola Hipótesis nula Hipótesis alterna Regla de decisión


2
a) Izquierda H0: 𝝈𝟐 ≥ 𝝈𝟐 0 Ha: 𝝈𝟐 < 𝝈𝟐 0 Rechazar H0 sí 𝜒𝐶𝐴𝐿 < 𝜒 2𝛼, 𝑛−1
2
b) Derecha H0: 𝝈𝟐 ≤ 𝝈𝟐 0 Ha: 𝝈𝟐 > 𝝈𝟐 0 Rechazar H0 sí 𝜒𝐶𝐴𝐿 > 𝜒 21−𝛼, 𝑛−1
c) Dos colas H0: 𝝈𝟐 = 𝝈𝟐 0 Ha: 𝝈𝟐 ≠ 𝝈𝟐 0 Rechazar H0 sí 𝜒𝐶𝐴𝐿 < 𝜒 2(𝛼), 𝑛−1 ó
2
2
2
Sí 𝜒𝐶𝐴𝐿 > 𝜒 2(1−𝛼), 𝑛−1
2

El valor de “ji cuadrada” calculado se estima de la siguiente manera:

2
(𝑛 − 1)𝑆 2
𝜒𝐶𝐴𝐿 =
𝜎02
Ejercicios:

Resuelva
(i) El llenado de las bolsas de alimentos a granel presenta un reto importante cuando el
9llenado y sellado de las bolsas se hace mecánicamente; es posible encontrar desde 987
hasta 1019 g en las bolsas de 1 kg de una muestra tomada al azar durante una hora de
funcionamiento de la empacadora; el supervisor ha decidido detener la producción y
ajustar las maquinas si la varianza es mayor a 49. Si se tomó una muestra de 37
productos al azar se obtuvo una varianza de 56, ¿Qué decidirá el supervisor?.

(ii) Con las condiciones mencionadas en (i) ¿podrá declararse que la desviación estándar es
diferente de 6.4 g?

(iii) El proceso usado para pulir discos de silicio a fin de que su grosor sea el apropiado es
aceptable solo si su desviación no supera 0.005 pulgadas. En una muestra de 15 discos
se ha calculado una desviación de 0.0064. Con un a PETI máxima de 0.01, verifique si el
proceso de pulido es aceptable.

7
Estadística para seres humanos Rueda, José A.

Pruebas de hip ótesis


𝜎12
IV. Pruebas de Hi p ó tesi s so bre la razó n de do s va ria nza s Φ = 𝜎22
de po bl acio nes
co n di st ri buci ó n norma l

𝜎12 𝜎22
Si dos varianzas son homogéneas, entonces el cociente {Φ = 𝜎22
} ≅ 1, o bien {Φ′ = 𝜎12
} ≅ 1. Siendo
estas dos expresiones totalmente diferentes, dado que las unidades en las que expresa el resultado
toman al divisor como valor de referencia (e.g.: 𝜎22 para la primera expresión). Si la varianza dos es
mayor, entonces Φ′ > 1 & Φ < 1. Que dos varianzas sean homogéneas no implica que sean
𝐒𝟐 𝐒𝟐
idénticas, sino similares. Nótese que el estimador cambiaría de 𝜙 = 𝐒𝟏𝟐 a 𝜙′ = 𝐒𝟐𝟐 , cuando el
𝟐 𝟏

numerador y el denominador se invierten.

Caso Cola Hipótesis Hipótesis Regla de decisión


nula alterna
a) Izquierda H0: Φ ≥ Φ0 Ha: Φ < Φ0 𝐧 −𝟏
Rechazar H0 sí 𝑭𝑪𝑨𝑳 < 𝐅𝐧𝟐𝟏−𝟏 ,

𝐧 −𝟏
b) Derecha H0: Φ ≤ Φ0 Ha: Φ > Φ0 Rechazar H0 sí 𝑭𝑪𝑨𝑳 > 𝐅𝐧𝟐𝟏−𝟏 ,
𝟏−∝
𝐧 −𝟏 𝐧 −𝟏
c) Dos H0: Φ = Φ0 Ha: Φ ≠ Φ0 Rechazar H0 sí 𝑭𝑪𝑨𝑳 < 𝐅𝐧𝟐𝟏−𝟏 , ∝ o 𝑭𝑪𝑨𝑳 > 𝐅𝐧𝟐𝟏−𝟏 , ∝
𝟏− 𝟐
colas 𝟐

𝑺𝟐𝟏
𝑭 = ( 𝟐)
𝑺𝟐

El caso práctico más importante en las pruebas sobre la razón de dos varianzas, es aquel en el que Φ0 = 1.
Cuando se ejecuta una prueba de hipótesis para comparar dos medias de una distribución normal (tema II de
Pruebas de Hipótesis), uno de los supuestos que debiera corroborarse antes de ejecutar esa prueba, es el de
“homogeneidad de varianzas”. Es decir, si dos medias con distribución normal se comparan, sus varianzas
deberían ser similares ¿Serán similares las varianzas de la prueba ejecutada en el tema II?.

(i) Verifique si la comparación de medias cumplió con este importante supuesto


(ii) Si las varianzas de un par de muestras son 29 y 48 y estas fueron estimadas con tamaños
de muestra 19 y 22. ¿Deberían estas las medias cuya variación se contabiliza
compararse?. Es decir, son estas varianzas homogéneas?

8
Estadística para seres humanos Rueda, José A.

Intervalos de Confianza
I. Estimación

Estimación puntual:

Cada vez que estamos en interés de describir un fenómeno a través de sus variables aleatorias
relacionadas; deseamos en primer lugar estimar sus parámetros. Al cálculo de una media muestral
(𝑥̅ ) con el fin de tener una aproximación de la media poblacional (µ) se le llama estimación puntual,
de igual manera será una estimación puntual cualquier dato que sea obtenido directamente a partir
de una lista de datos y su resultado sea una constante simple (s, b0, rxy, etc.). No obstante, la idea
principal es representar al parámetro poblacional con base en la muestra; y son los parámetros los
que regularmente serán el motivo de nuestras conclusiones.

Estimación por intervalo:

Dada la intrínseca variación de todo fenómeno, de toda variable y de toda estimación en una
muestra (esta variación es el motivo de esta ciencia que nos ocupa) un estimador resulta ser poco
creíble o confiable a nivel científico. En la práctica es común usar los estimadores como semilla para
calcular un intervalo, en el cual podría localizarse el parámetro que este estima; asociando además
a tal intervalo un grado de precisión [precisión =1 −∝] o confianza [confianza = 100*(1 −∝)]. A estos
intervalos se les llama “intervalos de confianza” y constituyen una segunda forma de estimación
(además de la estimación puntual, e. g. 𝑥̅ ), llamada estimación por intervalo.

En la estimación puntual se obtiene una constante cuya esperanza es el parámetro que se estima
[E(𝑥̅ )=µ]. En la estimación por intervalo se acepta el hecho de que el estimador es impreciso y por
ello se le afirma que la media poblacional se encuentra entre dos valores dados (L < µ < 𝐿̅ ),
equidistantes de 𝑥̅ ; asignando además una probabilidad a tal afirmación. De tal manera que se
acepta que aun cuando tenemos un intervalo de valores en los que posiblemente se localice el
parámetro, de alguna manera estamos también afirmando que el parámetro no estará contenido
entre esos valores en el 100(1-α) % de los casos.

Definiendo un intervalo de confianza

𝑃( 𝜃̂ − 𝐸 < 𝜃 < 𝜃̂ + 𝐸 ) = 1−∝

9
Estadística para seres humanos Rueda, José A.

Dónde: por ejemplo, si el parámetro 𝜃 de interés, es µ; entonces la expresión del error E será: 𝐸 =
𝑆 𝑆
𝑡𝛼/2, 𝑛−1 ( 𝑛) ó 𝐸 = 𝑍𝛼/2 ( 𝑛) ; según la naturaleza de la variable. Si el parámetro, es tal que
√ √
2 1 1 𝜎2 𝜎2
𝜃 = µ𝟏 − µ𝟐 , e n to n c es 𝐸 = 𝑡1−∝, (𝑛1 +𝑛2 −2) √𝑆𝑝 (𝑛 + 𝑛 ) ó 𝐸 = 𝑧1−∝ √( 𝑛1 + 𝑛2 ) , según la
2 1 2 2 1 2

naturaleza de las variables implícitas. Para el primer caso de este párrafo, hablamos usamos como semilla
(𝜃̂ ) al estimador 𝑥̅ ± 𝐸 y para el segundo caso al estimador (𝑥̅1 − 𝑥̅2 ) ± 𝐸.

O bien, usando una notación familiar para nosotros P (L < 𝜃 < 𝐿̅ ) = 1−∝ , donde L = 𝜃̂ − 𝐸
y 𝐿̅ = 𝜃̂ + 𝐸. Se pueden plantear intervalos de confianza para µ con base en 𝑥̅ , intervalos de
𝜎2 𝑆2
confianza para µ̅1 − µ2 con base en 𝑥̅1 − 𝑥̅2 , para σ2 con base en s2, o para 𝜎21 con base en 𝑆12 ; según
2 2
sea necesario.

Relación entre pruebas de hipótesis e intervalos de confianza

Al evaluar una prueba de hipótesis de dos colas para la diferencia de dos medias con distribución
normal; la zona de no rechazo de H0, equivale a un intervalo de confianza con la misma PETI usada
en la prueba. Si un intervalo de confianza con 0.95 de precisión, para µ𝟏 − µ𝟐 , contiene entre sus
límites a las cero; entonces la hipótesis nula de igualdad entre las dos medias no se rechazará con
un α de 0. 05. De forma análoga: si un intervalo de confianza al 0.95 de precisión para la razón de
dos varianzas, contiene al valor 1.0; entonces la hipótesis nula de igualdad entre estas dos varianzas
no se rechazará con un α =0. 05. En general, un intervalo de confianza tiene una estrecha relación
con una prueba de hipótesis de dos colas que use la misma PETI.

Por otro lado, el límite superior de un intervalo de confianza podría equipararse con él punto que
divide la zona de no rechazo (izquierda) de la zona de rechazo (derecha) en una prueba de hipótesis
de con la derecha con una PETI igual a la mitad del α usado en el intervalo. Sin embargo, este límite
conserva las unidades originales de la variable aleatoria en el intervalo de confianza, pero el valor
de tablas (t, Z, 𝜒 2 ó F) es el mismo (en el IC respecto a la PH de cola derecha) cuando se cumplen las
condiciones mencionadas arriba.

10
Estadística para seres humanos Rueda, José A.

Intervalos de Confianza
I. Intervalo de confianza para la media µ de una distribuci ó n
normal

Muestra pequeña ó varianza desconocida (n<30) (t)

S S
P (x̅ − t ∝,n−1 ( ) < 𝜇 < x̅ + t ∝,n−1 ( )) = 1−∝
2 √n 2 √n

Varianza conocida ó muestra grande (n> 30) (Z)

𝜎 𝜎
𝑃 (𝑥̅ − 𝑍∝ ( ) < 𝜇 < 𝑥̅ + 𝑍∝ ( )) = 1−∝
2 √𝑛 2 √𝑛

Intervalos de Confianza
II. Intervalo de confianza para la diferencia entre dos medias 𝚯=
(µ𝟏 − µ𝟐 ) con distribuci ó n normal

Una de las necesidades más frecuentes en la experimentación es la comparación entre dos medias
que provienen de dos muestras independientes de una variable con distribución normal.
Usualmente una de las muestras representa la variable natural y la otra son datos tomados de la
misma variable después de inducir una modificación en el fenómeno que estudia. El interés de la
comparación entre estas dos muestras será: determinar si la modificación inducida en la segunda
muestra provocó una modificación palpable entre las medias muestrales. No obstante, la conclusión
implica que si no existe diferencia entre las medias, estas proviene de la misma población; indicando
que la modificación inducida no creó una nueva condición y por tanto ambas medias muestrales
representan a la misma población y variable.

Tanto una prueba de hipótesis, como un intervalo de confianza para la diferencia entre dos medias
con distribución normal, pueden ser utilizados para conseguir las conclusiones que se implican en
el párrafo anterior. Tanto las pruebas de hipótesis como los intervalos de confianza para la
diferencia de medias se basan en la distribución del parámetro Theta, donde 𝚯 = (µ𝟏 − µ𝟐 ) &

𝚯′ = (µ𝟏 − µ𝟐 ) tienen por estimadores a 𝝋 = 𝒙𝟏 − 𝒙𝟐 & 𝝋′ = 𝒙𝟐 − 𝒙𝟏 .

De acuerdo con el tamaño de la muestra con que se cuente o con el conocimiento de la varianza y
de acuerdo también con la forma en que se calcule el estimador, a continuación se presentan las
cuatro fórmulas que implican un intervalo de confianza para Theta:
11
Estadística para seres humanos Rueda, José A.

Varianzas homogéneas o estimadas

1 1 1 1
̅𝟏 − 𝒙
𝑷 ((𝒙 ̅𝟐 ) − 𝒕∝, 𝟐
(𝑛1 +𝑛2 −2) √𝑺𝒑 (
𝑛1
+ 𝑛 ) < 𝚯 < (𝒙
̅𝟏 − 𝒙
̅𝟐 ) + 𝒕∝, 𝟐
(𝑛1 +𝑛2 −2) √𝑺𝒑 (
𝑛1
+ 𝑛 ) ) = 𝟏−∝
𝟐 2 𝟐 2

1 1 1 1
̅𝟐 − 𝒙
𝑷 ((𝒙 ̅𝟏 ) − 𝒕∝, 𝟐
(𝑛1 +𝑛2 −2) √𝑺𝒑 (
𝑛1
+ 𝑛 ) < 𝚯′ < (𝒙
̅𝟐 − 𝒙
̅𝟏 ) + 𝒕∝, (𝑛1 +𝑛2 −2) √𝑺𝟐𝒑 (𝑛 + 𝑛 ) ) = 𝟏−∝
𝟐 2 𝟐 1 2

1 1
Varianzas heterogéneas o conocidas 𝑛 + 𝑛
1 2

𝜎 𝜎 2 2 𝜎 𝜎 2 2
̅𝟐 ) − 𝒛∝ √( 1 + 2 ) < 𝚯 < (𝒙
̅𝟏 − 𝒙
𝑷 ((𝒙 ̅𝟐 ) + 𝒛∝ √( 1 + 2 ) ) = 𝟏−∝
̅𝟏 − 𝒙
𝟐 𝑛1 𝑛2 𝟐 𝑛1 𝑛2

𝜎 𝜎 2 2 𝜎 𝜎 2 2
̅𝟏 ) − 𝒁∝ √( 1 + 2 ) < 𝚯′ < (𝒙
̅𝟐 − 𝒙
𝑷 ((𝒙 ̅𝟏 ) + 𝒁∝ √( 1 + 2 ) ) = 𝟏−∝
̅𝟐 − 𝒙
𝟐 𝑛1 𝑛2 𝟐 𝑛1 𝑛2

Intervalos de Confianza
III. Intervalo de confianza para la varianza σ 2 de una muestra con
distribuci ó n normal

Conforme la varianza de una distribución sea más estrecha, la media será un dato más
representativo de la variable descrita y más confiable. Una manera análoga de hacer predicciones
sobre los límites máximos y mínimos que puede tomar la varianza poblacional, es establecer un
intervalo de confianza para 𝜎 2 ó para 𝜎 con base en 𝑆 2 y el tamaño de muestra n. En ocasiones es
útil detectar si la desviación estándar o la varianza son mayores o menores a los valores permitidos
o convenientes; si un problema es detectado a este respecto, pueden a veces modificarse las
condiciones que provocan esta variación y eliminarlas. En este sentido, las pruebas de hipótesis y
los intervalos de confianza sobre la varianza tienen gran importancia en la optimización de procesos.
Un IC para la varianza de una distribución normal se calcula de la siguiente manera:

𝑺𝟐 (𝒏 − 𝟏) 𝑺𝟐 (𝒏 − 𝟏)
𝑷( < 𝝈𝟐 < ) = 𝟏−∝
𝝌𝟐 𝜶 𝝌𝟐𝜶
(𝟏− ),(𝒏−𝟏) ( ),(𝒏−𝟏)
𝟐 𝟐

12
Estadística para seres humanos Rueda, José A.

Intervalos de Confianza
𝝈𝟐𝟏
IV. Intervalo de confianza para la raz ó n de dos varianzas 𝚽 = 𝝈𝟐𝟐
de
muestras con distribuci ó n normal

A manera de introducción, las comparaciones entre medias no siempre son correctas. Para que una
comparación de medias sea adecuada, las varianzas de las medias a contrastar deben ser similares dado
que la validez de cualquier prueba de hipótesis para contrastar dos medias depende de que se cumplan
los supuestos fundamentales de la misma. La homogeneidad de varianzas u homocedasticidad, es el
supuesto fundamental de la comparación entre dos medias de muestras con distribución normal. Ello no
implica que las varianzas sean idénticas, sino similares.

Si un intervalo de confianza para la razón de dos varianzas, contiene entre sus límites el valor 1.0,
entonces puede concluirse que las dos varianzas usadas en este cociente son homogéneas entre sí. Si el
intervalo de confianza contiene el valor 1.0, entonces se declara que las varianzas son homogéneas. Por
otro lado, si no lo contiene se concluye que las varianzas son heterogéneas.

𝝈𝟐
𝟏 𝐒𝟏𝟐
Definamos primeramente el parámetro Φ = y a su estimador 𝜙 = , que representan la razón
𝝈𝟐
𝟐 𝐒𝟐𝟐

cociente) de dos varianzas de muestras normales independientes. A partir de este parámetro se deriva a
continuación un intervalo de confianza para la razón de dos varianzas de poblaciones con distribución
normal, con base en la función de distribución F. La función de distribución FX (x) = P (F<fα) = α implica
un punto fα que divide la gráfica de la función F en dos regiones. El área bajo la curva a la izquierda de la
distribución será igual a α.

Note que α puede teóricamente tomar cualquier valor entre 0.0 y 1.0, y que es más natural pensar
en la probabilidad acumulada de derecha a izquierda, a manera de función de distribución, que de
derecha a izquierda, dado que esta última no tiene una definición en sí. Por otro lado, la zona de rechazo
y no rechazo de Ho están delimitadas por el valor crítico de fα que deje en un extremo de la función de
densidad un área bajo la curva igual a un alfa crítico predefinido. El lector debe distinguir la diferencia
entre α, probabilidad de rechazar una hipótesis verdadera, y α crítico. Este último es el máximo α que se
está dispuesto a tolerar en una prueba de hipótesis en particular o en el límite superior o inferior de un
intervalo de confianza.

𝐒𝟏𝟐 /𝝈𝟐
𝟏 𝐒𝟏𝟐
𝑭 = y 𝑭𝑪𝑨𝑳 = si las varianzas son similares
𝐒𝟐𝟐 /𝝈𝟐
𝟐 𝐒𝟐𝟐

𝐧 −𝟏 𝐒𝟐 /𝝈𝟐 𝐧 −𝟏
𝐏 ((𝐅𝐧𝟐𝟏−𝟏 , ∝ ) < 𝐒𝟏𝟐/𝝈𝟏𝟐 < (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝ (1) Simplificando
𝟐 𝟐 𝟏−
𝟐 𝟐

13
Estadística para seres humanos Rueda, José A.

𝑺𝟐 𝐧 −𝟏 𝐒𝟐 𝝈𝟐 𝑺𝟐 𝑺𝟐 𝐧 −𝟏 𝑺𝟐𝟐
𝐏 (( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ ) < 𝐒𝟏𝟐 𝝈𝟐𝟐 ( 𝑺𝟐𝟐) < ( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝ (2) Multiplicando por 𝑺𝟐𝟏
𝟏 𝟐 𝟏 𝟏 𝟏 𝟏−
𝟐 𝟐

𝑺𝟐 𝐧 −𝟏 𝝈𝟐𝟐 𝑺𝟐 𝐧 −𝟏
𝐏 (( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ ) < 𝝈𝟐𝟏
< ( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝ (3) Tomando reciproco
𝟏 𝟏 𝟏−
𝟐 𝟐

𝑺𝟐 𝟏 𝝈𝟐𝟏 𝑺𝟐 𝟏
𝐏 (( 𝑺𝟐𝟏) ( 𝐧 −𝟏 )> 𝝈𝟐𝟐
> ( 𝑺𝟐𝟏) ( 𝐧 −𝟏 )) = 𝟏−∝ (4) Revirtiendo desigualdad
𝟐 𝐅𝐧 𝟏−𝟏 , ∝ 𝟐 𝐅𝐧 𝟏−𝟏 , ∝
𝟐 𝟐 𝟏−
𝟐 𝟐

𝑺𝟐 𝟏 𝝈𝟐𝟏 𝑺𝟐 𝟏
𝐏 (( 𝑺𝟐𝟏) ( 𝐧 −𝟏 )< 𝝈𝟐𝟐
< ( 𝑺𝟐𝟏) ( 𝐧 −𝟏 )) = 𝟏−∝ (5) Aplicando propiedad de F
𝟐 𝐅𝐧 𝟏−𝟏 , ∝ 𝟐 𝐅𝐧 𝟏−𝟏 , ∝
𝟐 𝟏− 𝟐
𝟐 𝟐

𝐧 −𝟏 1 𝐧 −𝟏 1
𝐅𝐧𝟏𝟐−𝟏 , ∝ = 𝐧 −𝟏 & 𝐅𝐧𝟏𝟐−𝟏 , ∝ = 𝐧 −𝟏 (6) Propiedad de F
1−
2
𝐅𝐧 𝟏−𝟏 , ∝ 2
𝐅𝐧 𝟏−𝟏 , ∝
𝟐 𝟐 1−
2 2

𝑺𝟐 𝐧 −𝟏 𝑺𝟐 𝐧 −𝟏
𝐏 (( 𝟐𝟏) (𝐅𝐧𝟏𝟐−𝟏 , ∝ ) < Φ < ( 𝟐𝟏) (𝐅𝐧𝟏𝟐−𝟏 , ∝ )) = 𝟏−∝ (7) Intervalo para Φ
𝑺𝟐 𝑺𝟐 𝟏−
2 𝟐

El intervalo presentado solo será funcional para tablas basadas en la función de distribución,
𝜎12
con P (F<fα) = α. Si dos varianzas son homogéneas, entonces el cociente {Φ = 𝜎22
} ≅ 1, o bien su

𝜎22
reciproco {Φ′ = 𝜎12
} ≅ 1 (se aproxima a). Siendo estas dos expresiones totalmente diferentes, dado

que las unidades en las que expresa el resultado toman al divisor como valor de referencia (e.g.: 𝜎22
para la primera expresión). Si la σ22 es mayor y es usada como denominador, entonces Φ <
1 & Φ′ > 1 . Que dos varianzas sean homogéneas no implica que sean idénticas, sino similares. A
continuación se presentan dos fórmulas para el cálculo del intervalo de confianza para una razón de
𝐒𝟐
𝟏 𝐒𝟐
𝟐
varianzas. Nótese que el estimador cambia de 𝜙 = a 𝜙′ = , cuando el numerador y el
𝐒𝟐
𝟐 𝐒𝟐
𝟏

denominador se invierten y que el intervalo sugerido tiene como única diferencia el intercambio los grados
de libertad del numerador y denominador, n1 y n2.

𝑺𝟐𝟏 𝟐 𝐧 −𝟏 𝑺𝟐𝟏 𝐧 −𝟏
𝐏 (( 𝟐 ) (𝐅𝐧𝟏 −𝟏 , ∝ )
<Φ<( ) (𝐅𝐧𝟏𝟐−𝟏 , ∝ )) = 𝟏−∝
𝑺𝟐 2 𝑺𝟐𝟐 𝟏−
𝟐

𝐒𝟐𝟐
𝐧 −𝟏 𝐒𝟐𝟐 𝐧 −𝟏
𝐏 (( 𝟐 ) (𝐅𝐧𝟐𝟏−𝟏 , ∝ ) < Φ′ < ( ) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝
𝐒𝟏 2 𝐒𝟐𝟏 𝟏−
𝟐

14
Estadística para seres humanos Rueda, José A.

Y de regreso a las pruebas de hipótesis para la razón de varianzas de dos muestras con distribución
normal, derivemos el estadístico de prueba más adecuado para una hipótesis en función de la cola
de la distribución donde se ubique la zona de rechazo. Partiendo primero de la cola derecha, donde
con base en el límite superior del intervalo de confianza sabemos que para que las varianzas sean
diferentes:

𝑺𝟐𝟏 𝐧 −𝟏 𝑺𝟐𝟏 𝐧 −𝟏
Φ>( ) (𝐅𝐧𝟏𝟐−𝟏 , ∝ ) Φ<( ) (𝐅𝐧𝟏𝟐−𝟏 , ∝ ) (1)
𝑺𝟐𝟐 𝟏−
𝟐 𝑺𝟐𝟐 2

𝝈𝟐𝟏 𝑺𝟐𝟏 𝐧 −𝟏 𝝈𝟐𝟏 𝑺𝟐𝟏 𝐧 −𝟏


> ( 𝟐 ) (𝐅𝐧𝟏𝟐−𝟏 , ∝ ) < ( 𝟐 ) (𝐅𝐧𝟏𝟐−𝟏 , ∝ ) (2)
𝝈𝟐𝟐 𝑺𝟐 𝟏−
𝟐 𝝈𝟐𝟐 𝑺𝟐 2

𝝈𝟐𝟏 𝑺𝟐𝟐 𝐧 −𝟏 𝝈𝟐𝟏 𝑺𝟐𝟐 𝐧 −𝟏


( )( 𝟐) > 𝐅𝐧𝟏𝟐−𝟏 , ∝ ( )( 𝟐) < 𝐅𝐧𝟏𝟐−𝟏 , ∝ (3)
𝝈𝟐𝟐 𝑺𝟏 𝟏−
𝟐 𝝈𝟐𝟐 𝑺𝟏 2

𝝈𝟐𝟏 𝝈𝟐𝟏
⁄𝟐 ⁄𝟐
𝑺𝟏 𝐧 −𝟏 𝑺𝟏 𝐧 −𝟏
𝟐
> 𝐅𝐧𝟏𝟐−𝟏 , ∝ 𝟐
< 𝐅𝐧𝟏𝟐−𝟏 , ∝ (4)
𝝈𝟐 𝟏−
𝟐 𝝈𝟐 2
⁄𝟐 ⁄𝟐
𝑺𝟐 𝑺𝟐
𝑺𝟐𝟐 𝐧 −𝟏 𝑺𝟐𝟐 𝐧 −𝟏
> 𝐅𝐧𝟏𝟐−𝟏 , ∝ < 𝐅𝐧𝟏𝟐−𝟏 , ∝ (5)
𝟐 𝟐
𝑺𝟏 𝟏−
𝟐 𝑺𝟏 2

𝑺𝟐𝟏 𝟏 𝑺𝟐𝟏 𝟏
𝟐
< 𝐧 −𝟏 𝟐
> 𝐧 −𝟏 (6)
𝑺𝟐 𝐅 𝟐

𝑺𝟐 𝐅 𝟐
𝐧𝟏 −𝟏 , 𝟏− 𝐧𝟏 −𝟏 , ∝
𝟐 2

𝑺𝟐𝟏 𝟏 𝑺𝟐𝟏 𝟏
𝟐
< 𝐧 −𝟏 𝟐
> 𝐧 −𝟏 (7)
𝑺𝟐 𝐅 𝟐

𝑺𝟐 𝐅 𝟐
𝐧𝟏 −𝟏 , 𝟏− 𝐧𝟏 −𝟏 , ∝
𝟐 2

𝑺𝟐𝟏 𝐧 −𝟏 𝑺𝟐𝟏 𝐧 −𝟏
< 𝐅𝐧𝟐𝟏−𝟏 , ∝ > 𝐅𝐧𝟐𝟏−𝟏 , ∝ (8)
𝑺𝟐𝟐 2 𝑺𝟐𝟐 1−
2

Por medio de la comparación entre los intervalos de confianza y las pruebas de hipótesis, se ha
obtenido la regla de decisión adecuada para una prueba de hipótesis sobre el parámetro Φ, con
𝐒𝟐
base en su estimador 𝜙 = 𝐒𝟏𝟐 y al uso de tablas de cola izquierda, donde P (F<fα) = α, y α es el área bajo la
𝟐
curva a la derecha de fα. Las reglas de decisión obtenida arriba son válidas para una prueba de hipótesis de

dos colas. No obstante, para una prueba de una sola cola basta con sustituir por α.
2

u 1
La distribución F tiene la propiedad de que Fv, = Fv
, siempre que Fuv se consulte en el extremo (cola)
u

contrario; de manera que las cuatro igualdades presentadas a continuación son formas diferentes
de referir la misma propiedad. Las dos formas de la segunda línea no son sino despejes de las
fórmulas que están en la primera línea. Además, las fórmulas se anotan tal como se utilizaron para

15
Estadística para seres humanos Rueda, José A.

la derivación del intervalo de confianza y de la regla de decisión para la razón de dos varianzas de
medias de muestras con distribución normal, presentadas en las tres páginas anteriores.

𝐧 −𝟏 1 𝐧 −𝟏 1
𝐅𝐧𝟐𝟏−𝟏 , ∝ = 𝐧 −𝟏
𝐅𝐧𝟐𝟏−𝟏 , ∝ = 𝐧 −𝟏
𝐅𝐧𝟏𝟐−𝟏 , ∝ 1− 𝐅𝐧𝟏𝟐−𝟏 , ∝
2 2
1−
2 2

𝐧 −𝟏 1 𝐧 −𝟏 1
𝐅𝐧𝟏𝟐−𝟏 , ∝ = 𝐧 −𝟏
𝐅𝐧𝟏𝟐−𝟏 , ∝ = 𝐧 −𝟏
1− 𝐅𝐧𝟐𝟏−𝟏 , ∝ 𝐅𝐧𝟐𝟏−𝟏 , ∝
2 2
1−
2 2

Si un intervalo de confianza para la razón de dos varianzas, contiene entre sus límites el valor 1.0,
entonces puede concluirse que las dos varianzas usadas en este cociente son homogéneas entre sí.
Si el intervalo de confianza contiene el valor 1.0, entonces se declara que las varianzas son
homogéneas. Por otro lado, si no lo contiene, estas serán heterogéneas.

Esta prueba funciona como una prueba de homogeneidad de varianzas y debería realizarse cada
vez que se pretenda hacer una prueba de hipótesis o un intervalo de confianza para la diferencia de
medias de dos muestras con distribución normal; en virtud de que la homogeneidad de varianzas es
un supuesto fundamental en ambos casos. Si las varianzas resultan homogéneas entonces los
mencionados casos deberían evaluarse mediante la distribución t de Student; si por el contrario,
resultan heterogéneas, entonces deberá usarse la distribución Z como modelo para la prueba de
hipótesis.

16
Estadística para seres humanos Rueda, José A.

Anexo I. Las fábulas como método de enseñanza en estadística

La fábula del carro viejo: La media nos dice dónde encontrar una variable
Después de andar por algunos kilómetros con 5 L de gasolina, el viejo Mustang finalmente se detuvo, el lío había
comenzado por cuestiones de liquidez, pero ahora había que llamar a un amigo para llevar jalando el viejo hasta la cochera.
Afortunadamente aún había señal telefónica. La pregunta número uno fue ¿Y dónde estás?. La posición correcta no
siempre puede conocerse con exactitud, pero algunas conjeturas llevaron al km 28.5 de la carretera libre Xalapa-México.-
Vaya!, al menos ahora sabré donde buscarte. Se requiere de una unidad o escala de medición, una recta de referencia y
con unas cuantas mediciones vualá! se tiene una localización aceptable.

La fábula del rayo McQueen: Sobre la Homogeneidad de Varianzas


La carrera del siglo estaba por terminar y la foto de salida al parecer sería la única manera de conocer el ganador.
McQueen, Chick y El Rey iban a la delantera. En la última vuelta, Mac (el tráiler que transporta a McQween a los
autódromos) cruzó la línea de meta justo en el instante que las cámaras tomaron la foto de salida. Mac creyó que la
carrera ya había terminado e iba a recoger a McQueen para resguardarlo. Sin embargo Mac resultó ser el ganador de
acuerdo con el reglamento. El enorme cuerpo del tráiler había sido lo único que logro tomar la foto ya que todos los
competidores fueron obstruidos por el trailer. En efecto, para que la carrera sea justa: “todos los autos competidores
deberían tener dimensiones similares”.

La fábula del cochinito: “¿Es la media, suficiente para describir la variable?


A ciertos estudiante Quan y Gedro les era asignado un presupuesto de 60 monedas cada día para cubrir sus
necesidades de transporte y alimento. A Q su padre le entregaba durante la semana: 58, 62, 60, 55 y 65. No obstante, el
padre de G le asignaba “en promedio” sus 60 monedas entregándole durante la semana cantidades como: 20, 100, 60, 0
y 120. Cuando Q y G se conocieron, G tuvo una revelación importante en su vida: una variable no está totalmente definida
por su media, es necesario especificar su varianza. G llegó a su casa y reclamó a su padre “en adelante verificaré la
dispersión de mi mesada; además requiero de una alcancía (cochinito) en la que pueda retirar o agregar cada día una
cantidad de dinero que en promedio será proporcional a la desviación estándar de mi presupuesto diario”.

La fábula de la mancha en la pared: Sobre la varianza


Cuando John iba apenas a la Secundaría escuchó a su maestro decir que la varianza medía la dispersión de un
conjunto de datos; eso lo hizo enojar, ya que no entendió ni J. Al llegar a su casa su padre comenzaba a pintar el muro
frente a la chimenea y John dejó caer por accidente su pelota de Ullamaliztli sobre la cubeta de pintura equivocada, por lo
que su padre la saco y la lanzó sobre el muro, dejando en este una mancha aforme gritó: ¡¿Quién metió esta cosa en mi
pintura?!; a lo que John contestó: Daddy ¿Qué es la varianza?. La varianza explica el tamaño de esa enorme mancha que
ahora tiene el muro. John comenzó entonces a limpiar la mancha y su padre se quedó balbuceando entre dientes… la
dimensión de tu pelota, el ángulo de lanzamiento y la viscosidad de la pintura son las variables independientes que causan
la varianza (tamaño de la mancha) obtenida y la media es el punto central de la mancha, pero eso, eso no viene al caso.

17
Estadística para seres humanos Rueda, José A.

Anexo II. Formulario de probabilidad y estadística

I. Intervalos de Confianza
a) IC para la media 𝝁 de una distribución normal
(i) Varianzas desconocidas o muestras pequeñas
S S
(ii) P (x̅ − t (1−∝),n−1 ( ) < 𝜇 < x̅ + t (1−∝),n−1 ( )) = 1−∝
2 √n 2 √n

(iii) Varianzas conocidas


𝜎 𝜎
𝑃 (𝑥̅ − 𝑍(1−∝) ( ) < 𝜇 < 𝑥̅ + 𝑍(1−∝) ( )) = 1−∝
2 √𝑛 2 √𝑛

b) IC para la diferencia de dos medias ‘𝚯′ con distribución normal, donde 𝚯 = 𝛍𝟏 − 𝛍𝟐


(i) Varianzas conocidas, donde: 𝚯 = 𝛍𝟏 − 𝛍𝟐 & 𝚯′ = 𝛍𝟐 − 𝛍𝟏

𝜎 𝜎 2 2 𝜎 𝜎 2 2
̅𝟐 ) − 𝒁(𝟏−∝) √( 1 + 2 ) < 𝚯 < (𝒙
̅𝟏 − 𝒙
𝑷 ((𝒙 ̅𝟐 ) + 𝒁(𝟏−∝) √( 1 + 2 ) ) = 𝟏−∝
̅𝟏 − 𝒙
𝟐 𝑛1 𝑛2 𝟐 𝑛1 𝑛2

𝜎 𝜎 2 2 𝜎 𝜎 2 2
̅𝟏 ) − 𝒁(𝟏−∝) √( 1 + 2 ) < 𝚯′ < (𝒙
̅𝟐 − 𝒙
𝑷 ((𝒙 ̅𝟏 ) + 𝒁(𝟏−∝) √( 1 + 2 ) ) = 𝟏−∝
̅𝟐 − 𝒙
𝟐 𝑛1 𝑛2 𝟐 𝑛1 𝑛2

(ii) Varianzas estimadas. Análogamente: 𝛝 ̂ = (𝒙̅ − 𝒙̅ 𝟏 ).


̂ = (𝒙̅ − 𝒙̅ 𝟐 ) & 𝛝′
𝟏 𝟐

̂−𝒕 ∝ 1 1 ̂+𝒕 ∝ 1 1
𝑷 (𝛝 (𝑛1 +𝑛2 −2)
√𝑺𝟐𝒑 ( + ) <𝚯<𝛝 (𝑛1 +𝑛2 −2)
√𝑺𝟐𝒑 ( + ) ) = 𝟏−∝
(𝟏− ),
𝟐 𝑛1 𝑛2 (𝟏− ),
𝟐 𝑛1 𝑛2

̂′ − 𝒕 ∝ 1 1 ̂′ + 𝒕 ∝ 1 1
𝑷 (𝛝 (𝑛1 +𝑛2 −2)
√𝑺𝟐𝒑 ( + ) < 𝚯′ < 𝛝 (𝑛1 +𝑛2 −2)
√𝑺𝟐𝒑 ( + ) ) = 𝟏−∝
(𝟏− ),
𝟐 𝑛1 𝑛2 (𝟏− ),
𝟐 𝑛1 𝑛2

c) IC para la varianza 𝝈𝟐 de una distribución normal

𝑺𝟐 (𝒏 − 𝟏) 𝑺𝟐 (𝒏 − 𝟏)
𝑷( < 𝝈𝟐 < ) = 𝟏−∝
𝝌𝟐 𝜶 𝝌𝟐𝜶
(𝟏− ),(𝒏−𝟏) ( ),(𝒏−𝟏)
𝟐 𝟐

𝜎12
d) IC para la razón de varianzas 𝚽, de dos distribuciones normales, donde 𝚽 = 𝜎22

𝑺𝟐𝟏 𝟐 𝐧 −𝟏 𝑺𝟐𝟏 𝐧 −𝟏
𝐏 (( 𝟐 ) (𝐅𝐧𝟏 −𝟏 , ∝ )
<Φ<( ) (𝐅𝐧𝟏𝟐−𝟏 , ∝ )) = 𝟏−∝
𝑺𝟐 2 𝑺𝟐𝟐 𝟏−
𝟐

18
Estadística para seres humanos Rueda, José A.

𝐒𝟐𝟐 𝟏 𝐧 −𝟏 𝐒𝟐𝟐 𝐧 −𝟏
𝐏 (( 𝟐 ) (𝐅𝐧𝟐 −𝟏 , ∝ )
< Φ′ < ( ) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝
𝐒𝟏 2 𝐒𝟐𝟏 𝟏−
𝟐

Anexo III. Derivación de un intervalo de confianza con base en la distribución F de cola derecha.

𝐒𝟏𝟐 /𝝈𝟐
𝟏 𝐒𝟏𝟐
𝑭 = y 𝑭𝑪𝑨𝑳 = si las varianzas son similares
𝐒𝟐𝟐 /𝝈𝟐
𝟐 𝐒𝟐𝟐

𝐧 −𝟏 𝐒𝟐 /𝝈𝟐 𝐧 −𝟏
𝐏 ((𝐅𝐧𝟐𝟏−𝟏 , ∝ ) < 𝐒𝟏𝟐 /𝝈𝟏𝟐 < (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝ (1) Simplificando
𝟏− 𝟐 𝟐
𝟐 𝟐

𝑺𝟐 𝐧 −𝟏 𝐒𝟐 𝝈𝟐 𝑺𝟐 𝑺𝟐 𝐧 −𝟏 𝑺𝟐𝟐
𝐏 (( 𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ ) < 𝐒𝟏𝟐 𝝈𝟐𝟐 ( 𝑺𝟐𝟐) < ( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝ (2) Multiplicando por
𝑺𝟏 𝟏− 𝟐 𝟏 𝟏 𝟏 𝑺𝟐𝟏
𝟐 𝟐

𝑺𝟐 𝐧 −𝟏 𝝈𝟐𝟐 𝑺𝟐 𝐧 −𝟏
𝐏 (( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )< 𝝈𝟐𝟏
< ( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝ (3) Tomando reciproco
𝟏 𝟏− 𝟏
𝟐 𝟐

𝑺𝟐 𝟏 𝝈𝟐𝟏 𝑺𝟐 𝟏
𝐏 (( 𝑺𝟐𝟏) ( 𝐧 −𝟏 )> 𝝈𝟐𝟐
> ( 𝑺𝟐𝟏) ( 𝐧 −𝟏 )) = 𝟏−∝ (4) Revirtiendo desigualdad
𝟐 𝐅𝐧 𝟏−𝟏 , ∝ 𝟐 𝐅𝐧 𝟏−𝟏 , ∝
𝟐 𝟏− 𝟐
𝟐 𝟐

𝑺𝟐 𝟏 𝝈𝟐𝟏 𝑺𝟐 𝟏
𝐏 (( 𝑺𝟐𝟏) ( 𝐧 −𝟏 )< 𝝈𝟐𝟐
< ( 𝑺𝟐𝟏) ( 𝐧 −𝟏 )) = 𝟏−∝ (5) Aplicando propiedad de F
𝟐 𝐅𝐧 𝟏−𝟏 , ∝ 𝟐 𝐅𝐧 𝟏−𝟏 , ∝
𝟐 𝟐 𝟏−
𝟐 𝟐

𝐧 −𝟏 1 𝐧 −𝟏 1
𝐅𝐧𝟏𝟐−𝟏 , ∝ = 𝐧 −𝟏 & 𝐅𝐧𝟏𝟐−𝟏 , ∝ = 𝐧 −𝟏
1−
2
𝐅𝐧 𝟏−𝟏 , ∝ 2
𝐅𝐧 𝟏−𝟏 , ∝
𝟐 𝟐 1−
2 2

𝑺𝟐 𝐧 −𝟏 𝑺𝟐 𝐧 −𝟏
𝐏 (( 𝟐𝟏) (𝐅𝐧𝟏𝟐−𝟏 , ∝ ) < Φ < ( 𝑺𝟐𝟏) (𝐅𝐧𝟏𝟐−𝟏 , ∝ )) = 𝟏−∝ (7) Intervalo para Φ
𝑺𝟐 1− 𝟐
2 𝟐

𝑺𝟐 𝐧 −𝟏 𝑺𝟐 𝐧 −𝟏
𝐏 (( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ ) < Φ′ < ( 𝑺𝟐𝟐) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝ (8) Intervalo para Φ′
𝟏 𝟏− 𝟏
𝟐 𝟐

El intervalo solo será funcional para tablas de cola derecha

19
Estadística para seres humanos Rueda, José A.

FORMULARIO

II. Medidas descriptivas para una variable


Datos originales Tablas de frecuencia

Media ( ) 𝜮𝒏𝒊=𝟏 𝒙𝒊 𝜮𝒌𝒊=𝟏 𝒇𝒊 𝒗𝒊


= 𝒕 =
𝒏 𝜮𝒌𝒊=𝟏 𝒇𝒊

Medidas de Mediana (µ𝒆 ) µ𝒆 =Valor central o ⃖ 𝒊)


𝑨(𝟎.𝟓−𝑷
µ𝒆 = Lµe +
tendencia media de los dos centrales 𝒑𝒊
central
Moda (µo) µo : Dato que se repite más µo : 𝒗𝒊 de la clase con mayor
veces 𝒇𝒊
𝒏
Varianza (𝐒 𝟐 ) 𝜮 𝒊=𝟏 (𝒙𝒊 − )
𝟐
𝜮 𝒌
𝒊=𝟏 (𝒗𝒊 − ) 𝒇𝒊
𝟐
𝐒𝟐 = 𝑺𝟐 𝒕 =
𝒏−𝟏 (𝜮𝒌𝒊=𝟏 𝒇𝒊 ) − 𝟏

Desviación 𝐒 = √𝑺𝟐 𝑺𝒕 = √𝑺𝟐 𝒕


estándar(𝐒)
𝜮𝒏𝒊=𝟏 |𝒙𝒊 − | 𝜮𝒌𝒊=𝟏 |𝒗𝒊 − | 𝒇𝒊
Medidas de Desviación media ̅=
𝑫 ̅=
𝑫
𝒏 𝒏
dispersión ̅)
(𝑫

Coeficiente de C.V.= (𝑺 / )*100 C.V. = (𝑺𝒕 / 𝒕 )*100


variación (C.V.)

Rango (R) R = Máx. – Mín. ̅ k - L1


Rt = 𝑳
xi: cada uno de los valores de X. n: número de datos. fi: frecuencia absoluta de la clase i. vi: valor central de la clase i. Lµe : límite inferior de la clase de la
mediana. A: amplitud o ancho de clase, constante en todas las clases. 𝒑𝒊 : frecuencia relativa de la clase i. Máx.: valor máximo. Mín.: valor mínimo, 𝑳̅k:
límite superior de la última clase (clase k). & L1: límite inferior de la clase 1. La flecha atrás significa que se tomará la clase anterior a la de la mediana.

III. Medidas de asociación entre dos variables aleatorias


1. Covarianza 4. Coeficientes de Regresión Lineal
(𝒙𝒊− )(𝒚𝒊− ) β0 y β1 estimados como b0 y b1
𝑺𝒙𝒚 = ∑𝒏𝒊=𝟏
𝒏−𝟏 𝑺𝑷𝒙𝒚 𝑺𝒙𝒚
2. Coeficiente de Correlación 𝒃𝟏 = = 𝟐
𝑺𝒙𝒚 𝑺𝑷𝒙𝒙 𝑺𝒙
𝜸𝒙𝒚 = 𝒃𝟎 = 𝒚̅ − 𝒃𝟏
𝑺𝒙 𝑺𝒚
̂ = 𝒃𝟎 + 𝒃𝟏 𝒙𝒊
𝒚
3. Coeficiente de Determinación
𝟐
ℝ𝟐 𝒙𝒚 = (𝜸𝒙𝒚 )

20
Estadística para seres humanos Rueda, José A.

IV. Probabilidad
(iv) Dualidad en la probabilidad condicional

𝑃(𝐴B) 𝑃(𝐴B)
𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴) =
𝑃(𝐵) 𝑃(𝐴)

𝑃(𝐵) 𝑃(𝐴|𝐵) = 𝑃(𝐴B) 𝑃(𝐴) 𝑃(𝐵|𝐴) = 𝑃(𝐴B)

𝑃(𝐵) 𝑃(𝐴|𝐵) = 𝑃(𝐴) 𝑃(𝐵|𝐴)

𝑃(𝐴) 𝑃(𝐵|𝐴) 𝑃(𝐵) 𝑃(𝐴|𝐵)


𝑃(𝐵) = 𝑃(𝐴) =
𝑃(𝐴|𝐵) 𝑃(𝐵|𝐴)

𝑃(𝐴) 𝑃(𝐵|𝐴) 𝑃(𝐵) 𝑃(𝐴|𝐵)


𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴) =
𝑃(𝐵) 𝑃(𝐴)

(v) Teorema de Bayes


P(D) = P(D|A1) P(A1) + P(D|A2) P(A2) … + P(D|An) P(An) = ∑𝑛𝑖=1 P(D|Ai )P(Ai )

𝐏(𝐃|𝐀𝐢 ) 𝐏(𝐀𝐢 ) P(D|Ai ) P(Ai )


𝑷(𝑨𝒊 |𝑫) = ∑𝒏 =
𝒋=𝟏 𝐏(𝐃|𝐀𝐣 ) 𝐏(𝐀𝐣 ) 𝑃(𝐷)

(vi) Funciones de probabilidad (modelos discretos)


Distribución Binomial Si 𝑋∿𝛽(𝑛, 𝑝) Distribución Poisson 𝑺𝒊 𝑋∿𝑷(𝝀)
(𝑛𝑥) 𝑝 𝑥 𝑞 𝑛−𝑥 , 𝑥 = 0,1, … 𝑛 𝑒 −𝜆 𝜆𝑥
, 𝑥 = ,1,2 … ∞
𝑓𝑋 (𝑥) = 𝑥!
𝑓𝑋 (𝑥) =
0 , 𝑑. 𝑜 𝑓.
0 , 𝑑. 𝑜 𝑓.
Distribución Híper-geométrica Distribución Geométrica 𝑺𝒊 𝑋∿𝐺(𝒑)
Si 𝑋∿𝐻𝑦𝑝(𝑁, 𝐴, 𝑛)

(𝐴 𝐵
𝑥 ) (𝑛−𝑥) 𝑞 𝑥−1 𝑝 , 𝑥 = 1,2 … ∞
, 𝑛 <𝐴& 𝑛<𝐵 𝑓𝑋 (𝑥) =
(𝑁
𝑛)
𝑓𝑋 (𝑥) = 𝑥 = 0,1,2 … 𝑛 0 , d. o. f.

0 , d. o. f.
(vii) Media y varianza de una distribución
∞ ∞
µ= ∑ 𝑥 𝑓𝑋 (𝑥) µ = ∫ 𝑥 𝑓𝑋 (𝑥) 𝑑𝑥
−∞ −∞

∞ ∞
𝜎2 = ∑ 𝑥 2 𝑓𝑋 (𝑥) − µ2 𝜎 2 = ∫ 𝑥 2 𝑓𝑋 (𝑥) 𝑑𝑥 − µ2
−∞ −∞

21
Estadística para seres humanos Rueda, José A.

V. Pruebas de Hipótesis
a) PH para µ usando la función de distribución 𝑭𝒁 (𝒛) = 𝑷 (𝒁 ≤ 𝒛), o 𝑭𝑻 (𝒕) = 𝑷 (𝑻 ≤ 𝒕).
Caso Cola Hipótesis Hipótesis Regla de decisión Regla de decisión’
nula alterna n<30 o σ2estimada n>30 o σ2conocida
a) Izquierda H0: µ ≥ 𝜇0 Ha: µ < 𝜇𝑜 Rechazar H0 si 𝒕𝑪𝑨𝑳 < 𝒕𝜶, (𝒏−𝟏) Rechazar H0 si 𝒁𝑪𝑨𝑳 < 𝒁𝜶
b) Derecha H0: µ ≤ 𝜇0 Ha: µ > 𝜇𝑜 Rechazar H0 si 𝒕𝑪𝑨𝑳 > 𝒕(𝟏−∝),( 𝒏−𝟏) Rechazar H0 si 𝒁𝑪𝑨𝑳 > 𝒁𝟏−𝜶
c) Dos colas H0: µ = 𝜇0 Ha: µ ≠ 𝜇𝑜 Rechazar H0 si |𝒕𝑪𝑨𝑳 | > |𝒕𝜶, Rechazar H0 si |𝒁𝑪𝑨𝑳 |> |𝒁𝜶/𝟐 |
(𝒏−𝟏) |
𝟐

Muestra pequeña varianza Varianza conocida o muestra


desconocida (t) grande (Z)
√𝑛 (𝑥̅ − 𝜇𝑜 ) √𝑛 (𝑥̅ − 𝜇𝑜 )
𝑡𝐶𝐴𝐿 = 𝑍𝐶𝐴𝐿 =
𝑆 𝜎
b) 𝐏𝐇 𝐩𝐚𝐫𝐚 𝚯 usando la función de distribución 𝑭𝒁 (𝒛) = 𝑷 (𝒁 ≤ 𝒛), o 𝑭𝑻 (𝒕) = 𝑷 (𝑻 ≤ 𝒕);
donde 𝚯 = 𝛍𝟏 − 𝛍𝟐
Cola Hipótesis Hipótesis Regla de decisión Regla de decisión’
nula alterna Varianzas homogéneas y estimadas (t) Varianzas heterogéneas y
conocidas ((Z)
a) Izquierda H0: θ ≥ 𝜃 0 Ha: θ < 𝜃 𝑜 Rechazar H0 si 𝒕𝑪𝑨𝑳 < 𝒕𝜶,( 𝒏𝟏 + 𝒏𝟐 −𝟐) Rechazar H0 si 𝒁𝑪𝑨𝑳 < 𝒁𝜶
b) Derecha H0: θ ≤ 𝜃 0 Ha: θ > 𝜃 𝑜 Rechazar H0 si 𝒕𝑪𝑨𝑳 > 𝒕(𝟏−𝜶),(𝒏𝟏 + 𝒏𝟐−𝟐) Rechazar H0 si 𝒁𝑪𝑨𝑳 > 𝒁𝟏−𝜶
c) Dos colas H0: θ = 𝜃 0 Ha: θ ≠ 𝜃 𝑜 Rechazar H0 si |𝒕𝑪𝑨𝑳 | > |𝒕(𝜶),( 𝒏𝟏+ 𝒏𝟐 −𝟐) | Rechazar H0 si |𝒁𝑪𝑨𝑳 |> |𝒁𝜶/𝟐 |
𝟐

Varianzas homogéneas y Varianzas heterogéneas y


estimadas (t) conocidas (Z)

Valor (𝑥̅1 − 𝑥̅2 ) − 𝜃0 (𝑥̅1 − 𝑥̅2 ) − 𝜃0


𝑡𝐶𝐴𝐿 = 𝑍𝐶𝐴𝐿 =
calculado 1 1
√𝑆𝑝2 ( + ) 𝜎2 𝜎2
𝑛1 𝑛2 √( 1 + 2 )
𝑛1 𝑛2
𝑆12 (𝑛1 − 1) + 𝑆22 (𝑛2 − 1)
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

c) 𝐏𝐇 𝐩𝐚𝐫𝐚 𝝈𝟐 usando tablas de cola izquierda, a manera de función de la distribución


Ji-cuadrada 𝑭𝝌𝟐 (𝝌𝟐 ) = 𝑷 (𝝌𝟐 ≤ 𝝌𝟐 ).

Caso Cola Hipótesis Hipótesis Regla de decisión


nula alterna
a) Izquierda H0: 𝝈𝟐 ≥ 𝝈𝟐 0 Ha:𝝈𝟐 < 𝝈𝟐 0 Rechazar H0 sí 𝝌𝟐𝑪𝑨𝑳 < 𝝌𝟐𝜶, 𝒏−𝟏
b) Derecha H0: 𝝈𝟐 ≤ 𝝈𝟐 0 Ha:𝝈𝟐 > 𝝈𝟐 0 Rechazar H0 sí 𝝌𝟐𝑪𝑨𝑳 > 𝝌𝟐(𝟏−𝜶),( 𝒏−𝟏)
c) Dos colas H0: 𝝈𝟐 = 𝝈𝟐 0 Ha: 𝝈𝟐 ≠ 𝝈𝟐 0 Rechazar H0 sí 𝝌𝟐𝑪𝑨𝑳 < 𝝌 𝟐 𝜶 ó 𝝌𝟐𝑪𝑨𝑳 > 𝝌𝟐 𝜶
( ),(𝒏−𝟏) (𝟏− ),( 𝒏−𝟏)
𝟐 𝟐

2
(𝑛 − 1)𝑆 2
𝜒𝐶𝐴𝐿 =
𝜎02

22
Estadística para seres humanos Rueda, José A.

d) Prueba de hipótesis para la razón de dos varianzas “𝚽 ” usando tablas de cola


izquierda, a manera de función de distribución
𝜎12
FF (f) = P (F ≤ f); donde 𝚽 = 𝜎22

Caso Cola Hipótesis Hipótesis Regla de decisión


nula alterna
𝐧 −𝟏
a) Izquierda H0: Φ ≥ Φ0 H0: Φ < Φ0 Rechazar H0 sí 𝑭𝑪𝑨𝑳 < 𝐅𝐧𝟐𝟏−𝟏 ,

𝐧 −𝟏
b) Derecha H0: Φ ≤ Φ0 Ha:Φ > Φ0 Rechazar H0 sí 𝑭𝑪𝑨𝑳 > 𝐅𝐧𝟐𝟏−𝟏 ,
𝟏−∝
𝐧 −𝟏 𝐧 −𝟏
c) Dos H0: Φ = Φ0 Ha: Φ ≠ Φ0 Rechazar H0 sí 𝑭𝑪𝑨𝑳 < 𝐅𝐧 𝟏−𝟏 , ∝
𝟐
o 𝑭𝑪𝑨𝑳 > 𝐅𝐧𝟐𝟏−𝟏 , ∝
𝟏− 𝟐
colas 𝟐

𝑺𝟐𝟏
𝑭 = ( 𝟐)
𝑺𝟐

VI. Intervalos de Confianza


e) IC para la media 𝝁 de una distribución normal
(viii) Varianzas desconocidas o muestras pequeñas
S S
(ix) P (x̅ − t (1−∝),n−1 ( n) < 𝜇 < x̅ + t (1−∝),n−1 ( n)) = 1−∝
2 √ 2 √

(x) Varianzas conocidas


𝜎 𝜎
𝑃 (𝑥̅ − 𝑍(1−∝) ( ) < 𝜇 < 𝑥̅ + 𝑍(1−∝) ( )) = 1−∝
2 √𝑛 2 √𝑛

f) IC para la diferencia de dos medias ‘𝚯′ con distribución normal, donde 𝚯 = 𝛍𝟏 − 𝛍𝟐


(iii) Varianzas conocidas, donde: 𝚯 = 𝛍𝟏 − 𝛍𝟐 & 𝚯′ = 𝛍𝟐 − 𝛍𝟏

𝜎 𝜎 2 2 𝜎 𝜎 2 2
̅𝟐 ) − 𝒁(𝟏−∝) √( 1 + 2 ) < 𝚯 < (𝒙
̅𝟏 − 𝒙
𝑷 ((𝒙 ̅𝟐 ) + 𝒁(𝟏−∝) √( 1 + 2 ) ) = 𝟏−∝
̅𝟏 − 𝒙
𝟐 𝑛1 𝑛2 𝟐 𝑛1 𝑛2

𝜎 𝜎 2 2 𝜎 𝜎 2 2
̅𝟏 ) − 𝒁(𝟏−∝) √( 1 + 2 ) < 𝚯′ < (𝒙
̅𝟐 − 𝒙
𝑷 ((𝒙 ̅𝟏 ) + 𝒁(𝟏−∝) √( 1 + 2 ) ) = 𝟏−∝
̅𝟐 − 𝒙
𝟐 𝑛1 𝑛2 𝟐 𝑛1 𝑛2

(iv) Varianzas estimadas. Análogamente: 𝛝 ̂ = (𝒙̅ − 𝒙̅ 𝟏 ).


̂ = (𝒙̅ − 𝒙̅ 𝟐 ) & 𝛝′
𝟏 𝟐

̂−𝒕 ∝ 1 1 ̂+𝒕 ∝ 1 1
𝑷 (𝛝 (𝑛1 +𝑛2 −2)
√𝑺𝟐𝒑 ( + ) <𝚯<𝛝 (𝑛1 +𝑛2 −2)
√𝑺𝟐𝒑 ( + ) ) = 𝟏−∝
(𝟏− ),
𝟐 𝑛1 𝑛2 (𝟏− ),
𝟐 𝑛1 𝑛2

̂′ − 𝒕 ∝ 1 1 ̂′ + 𝒕 ∝ 1 1
𝑷 (𝛝 (𝑛1 +𝑛2 −2)
√𝑺𝟐𝒑 ( + ) < 𝚯′ < 𝛝 (𝑛1 +𝑛2 −2)
√𝑺𝟐𝒑 ( + ) ) = 𝟏−∝
(𝟏− ),
𝟐 𝑛1 𝑛2 (𝟏− ),
𝟐 𝑛1 𝑛2

23
Estadística para seres humanos Rueda, José A.

g) IC para la varianza 𝝈𝟐 de una distribución normal

𝑺𝟐 (𝒏 − 𝟏) 𝑺𝟐 (𝒏 − 𝟏)
𝑷( < 𝝈𝟐 < ) = 𝟏−∝
𝝌𝟐 𝜶 𝝌𝟐𝜶
(𝟏− ),(𝒏−𝟏) ( ),(𝒏−𝟏)
𝟐 𝟐

𝜎12
h) IC para la razón de varianzas 𝚽, de dos distribuciones normales, donde 𝚽 = 𝜎22

𝑺𝟐𝟏 𝐧𝟐 −𝟏 𝑺𝟐𝟏 𝐧𝟐 −𝟏
𝐏 (( 𝟐 ) (𝐅𝐧𝟏 −𝟏 , ∝ )
<Φ<( 𝟐 ) (𝐅𝐧𝟏 −𝟏 , 𝟏−∝ ))
= 𝟏−∝
𝑺𝟐 2 𝑺𝟐 𝟐

𝐒𝟐𝟐 𝟏 𝐧 −𝟏 𝐒𝟐𝟐 𝐧 −𝟏
𝐏 (( 𝟐 ) (𝐅𝐧𝟐 −𝟏 , ∝ )
< Φ′ < ( ) (𝐅𝐧𝟐𝟏−𝟏 , ∝ )) = 𝟏−∝
𝐒𝟏 2 𝐒𝟐𝟏 𝟏−
𝟐

24

También podría gustarte