Estadistica Inferencial Clase 2

Pruebas de Hipótesis.
Estadística Inferencial
Carlos Gaviria?
? Universidad de San Buenaventura, Departamento de Ciencias Básicas
29 de abril de 2021
Carlos Gaviria Estadística Inferencial

Pruebas de Bondad de Ajuste.
Tablas de Contingencia Mutuas o Bidireccionales.
Ideas Preliminares.
Ideas Generales.
Un parámetro puede ser estimado a partir de datos muestrales con un sólo número o con un
intervalo de confianza completo. Con frecuencia el objetivo de la investigación no sólo es esti-
mar el parámetro de interés sino decidir cuál de dos pretensiones contradictorias es la correcta.
Los métodos para lograr dicho objetivo conforman la parte de la inferencia llamada Pruebas de
Hipótesis.
Primero discutiremos algunos conceptos y terminología básica usados en las pruebas de hipótesis
y luego desarrollaremos procedimientos para la toma de decisiones basados en dichas pruebas.

Ideas Preliminares.
Idea General.
Una hipótesis estadística o simplemente hipótesis es una pretensión, aseveración ó afirmación
sobre el valor de un sólo parámetro, sobre los valores de varios parámetros o sobre la forma de
una distribución de probabilidad completa.
Ejemplos.
1 Pretensión de que µ = 0.5, donde µ es el diámetro interno promedio verdadero de cierto
tipo de tubo de PVC.
2 Afirmar que p < 0.10, donde p es la proporción de circuitos defectuosos entre todas las
tarjetas de circuito fabricadas por cierto fabricante.
3 Afirmar que µ1 − µ2 = 0 donde µ1 y µ2 denotan las resistencias a la ruptura promedio
verdaderas de dos tipos diferentes de cuerdas.
4 Afirmar que los diámetros a la altura de el pecho de un tipo particular de árbol, sigue una
distribución normal.

Ideas Preliminares.
Idea General.
En cualquier problema de prueba de hipótesis, siempre se consideran dos hipótesis contradicto-
rias.
Ejemplos.
1 µ = 0.5 versus µ 6= 0.5.
2 p < 0.10 versus p ≥ 0.10.
3 µ1 − µ2 = 0 versus µ1 − µ2 6= 0.
4 La población sigue una distribución normal versus la población no sigue una distribución
normal.
Objetivo.
Decidir en base a la información muestral, cuál de las afirmaciones es la correcta.
En pruebas de hipótesis, el problema se formula de modo que una de las hipótesis sea inicial-
mente favorecida.

Ideas Preliminares.
Definición.
La hipótesis nula denotada por H0 , es la pretensión que inicialmente se supone cierta. La hipótesis
alternativa denotada por Ha es la afirmación contradictoria a H0 .
Observación.
1 La hipótesis nula será rechazada en favor de la hipótesis alternativa sólo si la evidencia
muestral sugiere que H0 es falsa. Si la muestra no contradice fuertemente a H0 , entonces se
continuará creyendo que H0 es verdadera.
2 Las dos posibles conclusiones de una análisis de prueba de hipótesis son rechazar H0 o no
rechazar H0 .
Ejemplos.
1 H0 : µ = 0.5 vs Ha : µ 6= 0.5.
2 H0 : p < 0.10 vs Ha : p ≥ 0.10.
3 H0 : µ1 − µ2 = 0 versus Ha : µ1 − µ2 6= 0.
4 H0 :La población sigue una distribución normal vs Ha : La población no sigue una distri-
bución normal.

Ideas Preliminares.
Ejemplo 1
Suponga que una compañía está considerando aplicar un nuevo tipo de recubrimiento para los
cojinetes que fabrica. Suponga que la vida de desgaste promedio verdadera con el recubrimien-
to actual es de 1500 horas. La compañía no desea cambiar de recubrimiento a menos que la
evidencia sugiera fuertemente lo contrario. Proponga H0 y Ha .
Ejemplo 2
La investigación científica a menudo debe decidir si una teoría actual debe ser reemplazada por
una explicación más satisfactoria del fenómeno investigado. Proponga H0 y Ha .
Ejemplo 3
Suponga que 15 % de todas las tarjetas de circuito producidas por cierto fabricante durante un
periodo reciente estaban defectuosas. Un ingeniero ha sugerido un cambio en el proceso de pro-
ducción en la creencia que disminuirá el porcentaje de tarjetas defectuosas. Proponga H0 y Ha .

Ideas Preliminares.
Observación.
En el tratamiento de pruebas de hipótesis, la hipótesis nula siempre será formulada como una
afirmación de igualdad. Si θ denota el parámetro de interés, entonces la hipótesis nula tiene la
siguiente forma:
H0 : θ = θ0 ,
mientras que la hipótesis alternativa puede tener alguna de las siguientes formas:
Ha : θ < θ0 o Ha : θ > θ0 o Ha : θ 6= θ0
Observación.
Formular H0 como una afirmación de igualdad es simplemente un tecnicismo, pues de manera
implícita se tiene la forma estructural de H0 ; esto es:
1 H0 : θ = θ0 vs H0 : θ < θ0 equivale a H0 : θ ≥ θ0 vs Ha : θ < θ0 .
2 H0 : θ = θ0 vs H0 : θ > θ0 equivale a H0 : θ ≤ θ0 vs Ha : θ < θ0 .
3 H0 : θ = θ0 vs H0 : θ 6= θ0 equivale a H0 : θ ≤ θ0 , θ ≥ θ0 vs Ha : θ 6= θ0 .

Ideas Preliminares.
Procedimiento de Prueba.
Un procedimiento de prueba de hipótesis está especificado por:
1 Un estadístico de prueba. Una función de los datos muestrales en la cuál se basa la decisión
de rechazar o no rechazar H0 .
2 Una región de rechazo. El conjunto de todos los valores estadísticos de prueba por los cuales
H0 será rechazada.
La hipótesis nula es rechazada si y sólo si el valor estadístico de prueba observado o calculado
queda dentro de la región de rechazo.
Ejemplo 4
Considere una m.a de n = 200 tarjetas de circuito y considere la prueba H0 : p = 0.10 vs
Ha < 0.10. Sea X : Número de tarjetas defectuosas en la muestra, una v.a binomial. x es el valor
observado de X. Si H0 es verdadera, se esperan E(X) = 20 tarjetas defectuosas, mientras que si
Ha es verdadera entonces se esperan menos de 20 tarjetas defectuosas. Es razonable rechazar H0
si el valor observado x es suficientemente menor que 20. Por tanto se rechaza H0 , por ejemplo,
si x ≤ 15 o x ≤ 14, entre otras.

Ideas Preliminares.
Ejemplo 5
Una compañía de tabaco afirma que el contenido promedio de nicotina µ de los cigarrillos marca
gato es cuando mucho 1.5 mg. Una prueba de hipótesis sería probar:
H0 : µ = 1.5 vs Ha : µ > 1.5.
Considere un procedimiento de prueba basado en una m.a de 35 cigarrillos. Sea X el contenido de

nicotina promedio muestral. Si H0 es verdadera entonces E(X) = µ = 1.5, mientras que si Ha es
verdadera entonces se espera que X exceda 1.5. De esta manera podría tenerse un procedimiento
de prueba basado en:
1 Estadístico de prueba X.
2 Región de rechazo x ≥ 1.6 o x ≥ 1.55, entre otras.

Ideas Preliminares.
Errores en la Prueba de Hipótesis.

Dado que los procedimientos de prueba dependen de muestras aleatorias, estamos sujetos a dos
tipos de error en las pruebas de hipótesis
1 Rechazar H0 cuándo H0 es verdadera.
2 No rechazar H0 cuando H0 es falsa.
Ejemplo 6
Cuando seleccionamos una m.a de tamaño 200 de tarjetas de circuito y estamos considerando la
región de rechazo x ≤ 15, puede suceder que aún cuando H0 sea verdadera, se tenga que x = 13
pues la m.a es inusual. De manera similar puede darse que H0 sea falsa y sin embargo con la m.a
se obtiene x = 20, lo que conduce a aceptar H0 de manera errónea.
Definición.
Un error tipo I consiste en rechazar H0 cuando es verdadera. Un error tipo II consiste en aceptar
H0 cuando es falsa.

Ideas Preliminares.
Observación.
1 Se podrían desarrollar procedimientos de prueba donde no haya errores tipo I y II; sin
embargo, solo puede darse cuando se examina toda la población.
2 Como los procedimientos de prueba se basan en datos muestrales, entonces debido a la
variabilidad del muestreo puede obtenerse como resultado una muestra no representativa.
3 Aún cuando E(X) = µ, el valor observado x puede diferir mucho de µ.
4 En lugar de buscar procedimientos sin errores, se buscan procedimientos donde sea poco
probable que ocurra cualquier tipo de error.
5 La selección de corte de una región de rechazo, fija las probabilidades de cometer un error
tipo I o tipo II.
6 Las probabilidades de error tipo I y tipo II son denotadas por α y β, respectivamente.
7 Como H0 especifica un valor único del parámetro entonces existe un único valor de α; sin
embargo, existe un valor diferente de β por cada valor del parámetro compatible con Ha .

Ideas Preliminares.
Ejemplo 7
Se sabe que un cierto tipo de automóvil sufre daños visibles el 25 % del tiempo en pruebas de
choque a 30 km/h. Se ha propuesto un nuevo diseño de defensa modificado en un esfuerzo para
disminuir ese porcentaje. Sea p la proporción de todos los choques a 30 km/h que no producen
daños visibles con la nueva defensa. Las hipótesis a contrastar son:
H0 : p = 0.25 vs Ha : p > 0.25
La prueba se basa en un experimento que implica n = 20 choques independientes con prototipos

del nuevo diseño. Considere el siguiente procedimiento de prueba:
1 Estadístico de Prueba. X : Número de choques sin daños visibles.
2 Región de rechazo. R8 = {8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20}
Se calcularán α y β.

Ideas Preliminares.
Cuando H0 es verdadera, X ∼ bin(20, 0.25). Luego:
α = P(error tipo I)
= P(Rechazar H0 siendo verdadera)
= P(X ≥ 8 cuando X ∼ bin(20, 0.25)
= 1 − F(7; 20, 0.25)
= 1 − 0.898
= 0.102

Ideas Preliminares.
Cuando H0 es falsa no hay un solo valor de β, pues hay varios valores para p. Por ejemplo, si
p = 0.30, entonces:
β(0.30) = P(error tipo II cuando p = 0.30)

= P(Aceptar H0 siendo falsa, pues p = 0.30)
= P(X ≤ 7 cuando X ∼ bin(20, 0.30)
= F(7; 20, 0.30)
= 0.772
La siguiente tablas muestra β para diferentes valores de p.
p 0.3 0.4 0.5 0.6 0.7 0.8

β(p) 0.772 0.416 0.132 0.021 0.001 0.000

Ideas Preliminares.
Suponga ahora que la región de rechazo es R6 . En este caso, si H0 es verdadera, X ∼ bin(20, 0.25).
Luego:
α = P(error tipo I)
= P(Rechazar H0 siendo verdadera)
= P(X ≥ 6 cuando X ∼ bin(20, 0.25)
= 1 − F(5; 20, 0.25)
= 1 − 0.617
= 0.0383
Además,
p 0.3 0.4 0.5 0.6 0.7 0.8

β(p) 0.416 0.126 0.021 0.002 0.000 0.000

Pruebas sobre una Media de Población.
Caso 1. Población Normal con Sigma Conocida.

1 Hipótesis Nula: H0 : µ = µ0 .
2 Estadístico de Prueba: X. Estandarizando se tiene que:
X − µ0
Z= σ
√
n
3 Hipótesis alternativa y Región de Rechazo:

Hipótesis Alternativa Región de Rechazo
Ha : µ < µ0 z ≤ −zα
Ha : µ > µ0 z ≥ zα
6 µ0
Ha : µ = z ≤ −z α ó z ≥ z α
2 2

Caso 2. Muestra Grande.

X − µ0
Z= S
√
n

Ha : µ < µ0 z ≤ −zα
Ha : µ > µ0 z ≥ zα
6 µ0
Ha : µ = z ≤ −z α o z ≥ z α
2 2

Caso 3. Población Normal y σ desconocida.

X − µ0
T= S
√
n

Ha : µ < µ0 t ≤ −tα,ν
Ha : µ > µ0 t ≥ tα,ν
6 µ0
Ha : µ = t ≤ −t α ,ν o t ≥ t α ,ν
2 2

Intervalo de Confianza para µ.
Ejemplo 8
Las mediciones humanas constituyen una rica área de aplicación de métodos estadísticos. El
artículo A Longitudinal Study of the Development of Elementary School Children’s Private
Speech(Merril-Palmer Q., 1990:443-463 ) reportó sobre un estudio de niños que hablan solos.
Se pensaba que la conversación a solas estaba relacionado con el IQ, dado que este mide la ma-
durez mental y se sabia que la conversación a solas disminuye conforme los estudiantes avanzan
a través de los años de la escuela primaria. El estudió incluyó 33 estudiantes de primer año de
escuela cuyos resultados de IQ se dan a continuación.
82 96 99 102 103 103 106 107 108 108 108

108 109 110 110 111 113 113 113 113 115 115
118 118 119 121 122 122 127 132 136 140 146
Use pruebas de hipótesis para mostrar si la media del IQ es igual a 110.

Ejemplo 9
Los siguientes datos corresponden al índice de desarrollo psicomotor para niños LBW.
96 120 112 100 125 96 86 124 89 104 116 89 127 89

89 124 102 104 120 102 112 92 92 102 120 124 83 116
108 96 108 96 92 108 108 95 120 86 92 100 104 100
120 120 89 92 102 98 92 98 100 108 89 117 112 126
Ensaye pruebas de hipótesis para µ.

Ejemplo 10
Los siguientes datos corresponden a resultados de la medición de las aptitudes de estudiantes de
los cursos de capacitación en una universidad:
95 101 92 67 118 105 76 104 84 122

86 87 97 87 94 94 79 94 89 90
103 101 81 94 91 77 107 94 100 102
93 94 105 68 82 117 94 119 117 89
106 111 107 92 91 89 83 73 97 99
91 120 103 90 89 112 93 100 117 78
99 111 91 83 84 81 88 84 81 110

Distribución de la Media Muestral.
Ejemplo 11
Las pruebas que se utilizan actualmente para los condones son sustitutos de los desafíos que se
enfrentan en uso, incluyendo una prueba de hoyos, una de inflación, una de sello del paquete y
las de dimensiones y calidad del lubricante. Los investigadores agregaron una nueva prueba que
agrega tensión cíclica a un nivel muy por debajo de la rotura y determina el número de ciclos
hasta llegar a la rotura. El número de ciclos hasta la rotura se puede modelar como una v.a normal
con media 1584. la rotura media muestral se obtendrá a partir de una muestra de 16 condones.
1569 1571 1573 1580 1584 1580 1583 1585

1590 1589 1588 1586 1584 1590 1580 1572

Ejemplo 10
La identificación automática de los limites de estructuras significativas en una imagen medi-
ca es un área de investigación continua. El artículo Automatic Segmentation of Medical Image
Registration: Diagnostic and Simulation Applications, discutió una nueva técnica para realizar
la identificación mencionada. Una medid de la precisión de la región automática es el despla-
zamiento lineal promedio. El artículo da las siguientes observaciones de desplazamiento lineal
promedio con una muestra de 49 riñones.
1.38 0.44 1.09 0.75 0.66 1.28 0.51 0.39 0.70 0.46 0.54
0.83 0.58 0.64 1.30 0.57 0.43 0.62 1.00 1.05 0.82 1.10
0.65 0.99 0.56 0.56 0.64 0.45 0.82 1.06 0.41 0.58 0.66
0.54 0.83 1.59 0.51 1.04 0.85 0.45 0.52 0.58 1.11 0.34
1.25 0.38 1.44 1.28 0.51
Los autores comentan que en la mayoría de los casos el desplazamiento lineal promedio es del
orden de 1.00 o mejor. ¿ Proporcionan los datos una fuerte evidencia para concluir que el des-
plazamiento lineal promedio en estas condiciones es menor que 1.0?. Efectúe una prueba de
hipótesis apropiada.

Ejemplo 12
El artículo Uncertainty Estimation in Railway Track Life cycle Cost, presenta lo siguientes datos
sobre el tiempo de reparación (minutos) de la rotura de un carril alto en una vía curva del tren de
cierta línea de ferrocarril.
159 120 480 149 270 547 340 43 228 202 240 218
Una gráfica de probabilidad normal de los datos muestra un patrón bastante lineal, por lo que es
probable que la distribución de la población del tiempo de reparación sea por lo menos aproxi-
madamente normal.
1 ¿ Hay pruebas de peso para concluir que de verdad el tiempo medio de reparación sea
superior a 200 minutos?. Utilice una prueba de hipótesis con un nivel de significancia de
0.05.
2 Usando σ = 150, ¿ Cuál es la probabilidad de error tipo II de la prueba utilizada en l
numeral 1 cuando el tiempo de reparación es en realidad 300 minutos?.

Pruebas sobre Diferencia de Medias Poblacionales.
Caso 1. n1 ≥ 30, n2 ≥ 30, varianzas conocidas o desconocidas.

1 Hipótesis Nula: H0 : µ1 − µ2 = ∆0 .
2 Estadístico de Prueba: X − Y. Estandarizando se tiene que:
X − Y − ∆0
Z= r
σ12 σ22
n1
+ n2

Ha : µ1 − µ2 < ∆0 z ≤ −zα
Ha : µ1 − µ2 > ∆0 z ≥ zα
Ha : µ1 − µ2 6= ∆0 z ≤ −z α o z ≥ z α
2 2
Si la varianza es desconocida entonces se cambian σ12 y σ22 por S12 y S22 , respectivamente.

Caso 2. n1 < 30, n2 < 30, varianzas conocidas y población normal.

X − Y − ∆0
Z= r
σ12 σ22
n1
+ n2

Ha : µ1 − µ2 < ∆0 z ≤ −zα
Ha : µ1 − µ2 > ∆0 z ≥ zα
Ha : µ1 − µ2 6= ∆0 z ≤ −z α o z ≥ z α
2 2

Caso 3. n1 < 30, n2 < 30, varianzas desconocidas e iguales y población normal.
X − Y − ∆0
Z= r
Sp2 n1 + n1
1 2

Ha : µ1 − µ2 < ∆0 t ≤ −tα,ν
Ha : µ1 − µ2 > ∆0 t ≥ tα,ν
Ha : µ1 − µ2 6= ∆0 t ≤ −t α ,ν o t ≥ t α ,ν
2 2
(n1 −1)S12 +(n2 −1)S22
donde ν = n1 + n2 − 2 y Sp2 = n1 +n2 −2

Caso 4. n1 < 30, n2 < 30, varianzas desconocidas y diferentes y población normal.
X − Y − ∆0
Z= r
S12 S22
n1
+ n2

Ha : µ1 − µ2 < ∆0 t ≤ −tα,ν
Ha : µ1 − µ2 > ∆0 t ≥ tα,ν
Ha : µ1 − µ2 6= ∆0 t ≤ −t α ,ν o t ≥ t α ,ν
2 2
donde 2
S12 S22
n1
+ n2
ν= !2 !2
S2 S2
1 2
n1 n2
n1 −1
+ n2 −1

Prueba sobre cociente de varianzas.
Prueba sobre cociente de varianzas.

1 Hipótesis Nula: H0 : σ12 = σ22 .
S12
2 Estadístico de Prueba: f = S22
.
Ha : σ12 < σ22 f ≤ F1−α,n1 −1,n2 −1

Ha : σ12 > σ22 f ≥ Fα,n1 −1,n2 −1
6 σ22
Ha : σ12 = f ≤ F1− α ,n1 −1,n2 −1 o f ≥ F α ,n1 −1,n2 −1
2 2

Prueba sobre Proporción de una Población.
Prueba sobre Proporción de una Población.

1 Hipótesis Nula: H0 : p = p0 .
2 Estadístico de Prueba: b
p. Estandarizando se tiene:
p − p0
b
Z= q
p0 (1−p0 )
n

Ha : p < p0 z ≤ −zα
Ha : p > p0 z ≥ zα
6 p0
Ha : p = z ≤ −z α o z ≥ z α
2 2

Prueba sobre Diferencia entre Proporciones de Población.
Prueba sobre Diferencia entre Proporciones de Población.

1 Hipótesis Nula: H0 : p1 − p2 = 0.
2 p1 − b
Estadístico de Prueba: b p2 . Estandarizando se tiene:
p1 − b
b p2
Z= r
q n1 +
pb
b 1
n2
1
n1 n2
p=
donde b p
n1 +n2 1
b + p
n1 +n2 2
b q = 1−b
yb p
Ha : p1 − p2 < 0 z ≤ −zα
Ha : p1 − p2 > 0 z ≥ zα
Ha : p1 − p2 6= 0 z ≤ −z α o z ≥ z α
2 2

Pruebas t con Datos Apareados.
Supuestos.
Las pruebas t con datos apareados se utiliza cuando se tienen n pares ordenados independiente-
mente seleccionados:
(X1 , Y1 ), (X2 , Y2 ), · · · , (Xn , Yn )
tales que E(Xi ) = µ1 y E(Yi ) = µ2 . Se consideran D1 = X1 − Y1 , D2 = X2 − Y2 , · · · , Dn =
Xn − Yn , de modo que las Di son las diferencias dentro de los pares. En ese caso se supone que
las Di casi siempre están distribuidas con valor medio µD y varianza σD 2 (Comúnmente esto es
consecuencia de que las Xi y las Yi están normalmente distribuidas).
Observación
La prueba hipótesis se da en relación a la diferencia de medias µ1 − µ2 . La prueba t para la dife-
rencia de medias se hizo utilizando el estadístico de prueba X − Y y suponiendo que las muestras
eran independientes. Sin embargo, en datos apareados, las variables X e Y no son independientes;
por lo tanto, se usa una prueba diferente.


1 Hipótesis Nula: H0 : µD = ∆0 , donde D = X − Y es la diferencia entre la primera y
segunda observación dentro de un par ordenado y µD = µ1 − µ2 .
2 Estadístico de Prueba:
d − ∆0
t= SD
√
n

Ha : µD < ∆0 t ≤ −tα,n−1
Ha : µD > ∆0 t ≥ tα,n−1
6 ∆0
Ha : µD = t ≤ −t α ,n−1 ó t ≥ t α ,n−1
2 2

Ejemplo 12
En una empresa se desea conocer si la música tiene un efecto sobre la satisfacción laboral de los
trabajadores, y para ello, los participantes respondieron la Escala de Satisfacción Laboral en dos
momentos diferentes durante la jornada laboral: con y sin música. Las puntuaciones obtenidas
por los trabajadores fueron las siguientes:
Sin mísica 23 25 27 22 28 22 28 27 18 34
Con música 26 30 33 35 34 30 39 31 35 40
Sin música 30 21 33 26 28 29 26 38 30 30
Con música 35 38 35 20 38 30 32 40 30 25
Sin música 20 22 20 27 22 28 29 26 38 30
Con música 32 28 32 30 22 38 30 32 40 30
Indique si existen diferencias estadísticamente significativas en la satisfacción laboral de los
trabajadores durante jornadas de trabajo con y sin música, considere un nivel de significancia de
0.05.

Ejemplo 13
Las trazas de metales presentes en el agua potable afectan el sabor y las concentraciones inusual-
mente altas plantean un riego para la salud. El artículo Trace Metals of South Indian River, reporta
sobre un estudio en el cual se seleccionaron seis lugares en el río (seis objetos experimentales) y
se determinó la concentración de zinc (mg/l) tanto en el agua superficial como en la del fondo
en cada lugar. Los seis pares ordenados aparecen en la siguiente tabla:
Ubicación
1 2 3 4 5 6
Concentración de zinc en el 0.430 0.266 0.567 0.531 0.707 0.716

agua del fondo (x)
Concentración de zinc en el 0.415 0.238 0.390 0.410 0.605 0.609

agua d ela superficie (y)
¿ Sugieren los datos que la concentración promedio verdadera en el agua del fondo excede la del
agua de la superficie?

P.B.A. Probabilidades Categóricas Satisfechas por Completo
Experimento Multinomial.
Un experimento multinomial es la extensión de un experimento binomial. Un experimento mul-
tinomial satisface las siguientes condiciones.
1 Está compuesto por n ensayos independientes.
2 En cada ensayo se da un resultado que pertenece a una y solo una de k categorías.
3 La probabilidad de caer en la categoría i es constante ensayo a ensayo y se denota por pi .
Observación.
Un experimento binomial es un experimento multinomial con k = 2, p1 = p y p2 = 1 − p = q.

Variable Aleatoria Multinomial.

Suponga que se lleva a cabo un experimento multinomial con k categorías. Sea Ni una variable
multinomial que se define como:
Ni : Número de ensayos que dan por resultado la categoría i.
El valor observado de la variable aleatoria Ni se denota por ni . Como un ensayo solo puede dar
como resultado una y sólo una categoría, entonces:
X
Ni = n.
Esperanza de la v.a Multinomial.

Sea Ni una v.a multinomial, donde la probabilidad de que de como resultado la categoría i es pi .
Se tiene que:
E(Ni ) = npi

Hipótesis Nula.
Cuando se lleva a cabo una experimento multinomial se tiene que:
H0 : p1 = p10 , p2 = p20 , · · · pk = pk0
Valores Esperados en cada Categoría, si H0 es verdadera.

Cuando H0 es verdadera se tiene que los números esperados de intentos que resulten en la cate-
goría i, son:
E(N1 ) = np10 , E(N2 ) = np20 , · · · , E(Nk ) = npk0
Cantidades de Celda Observadas y Esperadas.

Categoría i=1 i=2 ··· i=k Total Fila
Observada n1 n2 ··· nk n
Esperada np10 np20 ··· npk0 n

Observación.
Cuando se lleva a cabo un procedimiento de prueba con la distribución multinomial se tiene que:
1 Cuando H0 es verdadera se tiene que las ni deben ser razonablemente cercanas a las npi0 .
2 Cuando H0 es falsa se tiene que las ni deben ser diferentes de manera considerable a las
npi0 .
3 El procedimiento de prueba consiste en evaluar la discrepancia entre las ni y las npi . Una
medida de discrepancia se basa en los cuadrados de las desviaciones (n1 − np10 )2 , (n2 −
np20 )2 , · · · , (nk − npk0 )2 .
4 Para tener en cuenta las magnitudes relativas de las desviaciones, cada desviación cuadráti-
ca se divide entre la correspondiente cantidad esperada.

Teorema.
Siempre que npi ≥ 5 para toda i = 1, 2, · · · , k, la variable:
k
X (observada − esperada)2 X (ni − npi )2
=
todas las celdas
esperada i=1
npi
tiene aproximadamente una distribución chi cuadrada con k − 1 grados de libertad.
Procedimiento de Prueba.
1 Hipótesis nula: H0 : p1 = p10 , p2 = p20 , · · · pk = pk0 .
2 Hipótesis alternativa: H0 : Al menos una pi no es igual a pi0 .
k
(ni −npi )2
Valor del estadístico de prueba: χ2 =
P
3
npi
.
i=1
4 Región de Rechazo: χ2 ≥ χ2α,k−1 .

Ejemplo 14
El departamento de estadística de una importante universidad mantiene un servicio de asesoría
privada a estudiantes en sus cursos de introducción. El servicio cuenta con profesores que es-
peran que 40 % de sus clientes sean del curso de estadística para negocios, 30 % de estadística
para ingeniería, 20 % para estudiantes de ciencias sociales y el otro 10 % para estudiantes de
agricultura. Una muestra aleatoria de n = 120 estudiantes dejó ver que había 52, 38, 21 y 9 de
los cuatro cursos, ¿ Estos datos sugieren que los porcentajes en que los profesores se basaban no
son correctos? Exprese y pruebe las hipótesis relevantes usando α = 0.05
Cantidades de celda observadas y esperadas
Categoría Negocios Ingeniería Ciencias sociales Agricultura Total Fila
Observada 52 38 21 9 120
Esperada 48 36 24 12 120
(Obs-Esp)2 16 4 9 9
(Obs-Esp)2 /Esp 0.3333 0.1111 0.3750 0.7500 1.5694

Ejemplo 15
Un sistema de recuperación de información tiene 10 lugares de almacenamiento. Se ha guardado
información con la esperanza de que la proporción de peticiones, a largo plazo para la posición i,
5.5−|i−5.5|
sea dada por pi = 30
. Una muestra de 200 peticiones dio las siguientes frecuencias para
las posiciones 1 − 10, respectivamente: 4, 15, 23, 25, 38, 31, 32, 14, 10 y 8. Utilice una prueba ji
cuadrada al nivel de significación de 0.10 para determinar si la información es consistente con
las proporciones a priori.

Observación.
Hasta el momento hemos estudiado problemas inferenciales donde los datos se muestran en cel-
das de una tabla rectangular. Cada una de esas tablas está conformada por un número específico
de filas y un número específico de columnas.
Ahora Estudiaremos:
Problemas en los que los datos son cantidades o frecuencias, pero la tabla está conformada por I
filas y J columnas. Hay dos situaciones de interés:
1 Hay I poblaciones de interés y por cada población hay J categorías. Las poblaciones se
ponen en las filas y las categorías en las columnas. Se toma una m.a de cada categoría y las
respectivas frecuencias se colocan en las celdas.
2 Hay una sola población de interés y cada individuo se clasifica con respecto a dos factores
diferentes. Hay I categorías asociadas al primer factor y J categorías asociadas al segundo
factor. Se toma una sola m.a y en la componente i, j-ésima de la tabla se pone el número
de objetos o individuos de la población que pertenecen a la categoría i del factor 1 y a la
categoría 2 del factor 2.

Tabla de contingencia Mutua.

Denote por nij el número de individuos de la(s) muestra(s) que caen en la i, j-ésima celda de la
tabla. La tabla que presenta las cantidades nij recibe el nombre de contingencia mutua.
1 2 ··· j ··· J
1 n11 n12 ··· n1j ··· n1J
2 n21 n22 ··· n2j ··· n2J
.. .. .. .. .. .. ..
. . . . . . .
i ni1 ni2 ··· nij ··· niJ
.. .. .. .. .. .. ..
. . . . . . .
I nI1 nI2 ··· nIj ··· nIJ

Prueba de Homogeneidad.
Se tiene que:
1. Cada individuo de las I poblaciones pertenece a exactamente una de las J categorías.
2. Se toma una muestra de tamaño ni de la i-ésima población.
P
3. n = ni .
4. nij : Número de individuos de la muestra i sobre la categoría j.
I
P
5. n.j = nij : Número total de individuos entre los n muestreados que cae en la categoría j.
i=1
6. pij : Proporción de individuos de la población i que cae en la categoría j.

Prueba de Homogeneidad.
Se tiene que:
7. La hipótesis nula de homogeneidad expresa que la proporción de individuos de la
categoría j es la misma para cada población y que esto es cierto para toda categoría; esto
es, p1j = p2j = · · · = pIj para toda j.
8. Cuando H0 es verdadera tienen sentido p1 , p2 , · · · , pJ .
9. Cuando H0 es verdadera se tiene que E(Nij ) = ni pj .
N.j
pj =
10. b pj
.
11. b eij = ni n.j

eij : Cantidad esperada estimada en la i, j-ésima celda. b n
.
12. Hay (I − 1)(J − 1) grados de libertad.

Prueba de Homogeneidad. Procedimiento de Prueba.

1 Hipótesis Nula: H0 : p1j = p2j = · · · = pIj para j = 1, 2, · · · , J.
2 Hipótesis alternativa: Ha : H0 no es verdadera.
3 estadístico de Prueba:
I J
X (observada − eperada estimada)2 X X (nij − b eij )2
χ2 = = .
Todas las celdas
esperada estimada i=1 j=1
e
bij
4 Región de Rechazo:
χ2 ≥ χ2α,(I−1)(J−1) .

Ejemplo 16
Una compañía empaca un producto particular en latas de tres diferentes tamaños, cada uno con
una línea de producción diferente. La mayor parte de las latas están ligadas a especificaciones,
pero un ingeniero de control de calidad ha identificado las siguientes razones de no cumplimien-
to: Defecto en lata, Grieta en lata, Ubicación incorrecta de arillo, Arillo faltante y Otras. Se
selecciona una muestra de unidades fuera de especificación de cada una de las tres líneas, y cada
unidad se clasifica según la razón por la que está fuera de especificación. Los resultados se dan
en la siguiente tabla de contingencia:
Razón para estar fuera de especificación.
Defecto Grieta Ubicación Faltante Otras Tamaño

Muestra
1 34 65 17 21 13 150
Línea 2 23 52 25 19 6 125
3 32 28 16 14 10 100
Total 89 145 58 54 29 375
¿Sugiere la información que las proporciones que caen en las diversas categorías fuera de espe-
cificación no son iguales para las tres líneas?
Ejemplo 16. Continuación

La siguiente tabla muestra los valores esperados:
Razón para estar fuera de especificación.
Defecto Grieta Ubicación Faltante Otras
1 35.6 58 23.2 21.6 11.6

Línea 2 29.7 48.3 19.3 18 9.7
3 23.73 38.7 15.47 14.4 7.73

Ejemplo 17
La siguiente información corresponde a marcas de hojas halladas en muestras de trébol blanco
seleccionadas de regiones de pastos largos y pastos cortos. Use pruebas χ2 para determinar si las
proporciones verdaderas de marcas diferentes son idénticas para los dos tipos de regiones.
Tipo de Marca.
L LL Y+YL O Otras Tamaño

Muestra
Regiones de Pas- 409 11 22 7 277 726

to Largo
Regiones de Pas- 512 4 14 11 220 761
to Corto

Prueba de Independencia.
Se tiene que:
1 Cada individuo de la población de interés pertenece a sólo una de las I categorías del primer
factor y a sólo una de las J categorías del segundo factor.
2 Para una muestra de n individuos, denote por nij el número de individuos entre los n que
caen en la categoría i del primer factor y en la categoría j del segundo factor.
3 Las ni. y n.j son valores observados de variables aleatorias.
4 pij : Proporción de individuos de la población que pertenece a la categoría i del factor 1 y
la categoría j del factor 2.
P P
5 pi. = pij y p.j = pij .
j i
6 La hipótesis nula indica que la categoría en un individuo con respecto al factor uno es
independiente de la categoría con respecto al factor dos; esto es, pij = pi. p.j para todo i, j.
7 Cuando H0 es verdadera se tiene E(Ni ) = npij = npi. p.j .
ni. n.j n.j ni. n.j
8 pi. =
b n
p.j =
yb n
, eij = n nni.
de donde b n
= n

Prueba de Independencia. Procedimiento de Prueba.

1 Hipótesis Nula: H0 : pij = pi. p.j para i = 1, 2, · · · , I y j = 1, 2, · · · , J.
2 Hipótesis alternativa: Ha : H0 no es verdadera.
3 estadístico de Prueba:
I J
X (observada − eperada estimada)2 X X (nij − b eij )2
χ2 = = .
Todas las celdas
esperada estimada i=1 j=1
e
bij
4 Región de Rechazo:
χ2 ≥ χ2α,(I−1)(J−1) .

Ejemplo 18
Un estudio da la relación entre las condiciones del equipo de gasolineras y la agresividad en
los precios de gasolina. El estudio publica la siguiente información basada en una muestra de
n = 441 gasolineras:
Política de Precios Observada.
Agresiva Neutral No Agresiva

Abajo de Estándar 24 15 17
Condición Estándar 52 73 80
Moderna 58 86 36
¿ Sugiere la información que las condiciones del equipo y la política de precios son independien-
tes entre sí?.

Ejemplo 19
Cada uno de los estudiantes de una m.a de estudiantes, de preparatoria y universidad, se clasificó
en cruz con respecto a puntos de vista políticos y consumo de marihuana; los datos resultantes
se presentan en la siguiente tabla:
Nivel de Consumo.
Nunca Rara Vez Con Frecuencia

Liberal 479 173 119
Punto de Vista Conservador 214 47 15
Otro 172 45 85
¿La información apoya la hipótesis de que los puntos de vista políticos y el nivel de consumo de
marihuana son independientes dentro de la población?.

Ejemplo 19. Continuación

La siguiente tabla muestra los valores esperados
Nivel de Consumo.
Nunca Rara Vez Con Frecuencia

Liberal 494.38 151.47 125.17
Punto de Vista Conservador 176.98 54.22 44.81
Otro 193.65 59.33 49.03

Estadistica Inferencial Clase 2

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Inferencial Clase 2

Cargado por

Copyright:

Formatos disponibles

Pruebas de Hipótesis.

? Universidad de San Buenaventura, Departamento de Ciencias Básicas

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

H0 : µ = 1.5 vs Ha : µ > 1.5.

Considere un procedimiento de prueba basado en una m.a de 35 cigarrillos. Sea X el contenido de

Carlos Gaviria Estadística Inferencial

Errores en la Prueba de Hipótesis.

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

H0 : p = 0.25 vs Ha : p > 0.25

La prueba se basa en un experimento que implica n = 20 choques independientes con prototipos

Carlos Gaviria Estadística Inferencial

Cuando H0 es verdadera, X ∼ bin(20, 0.25). Luego:

Carlos Gaviria Estadística Inferencial

β(0.30) = P(error tipo II cuando p = 0.30)

La siguiente tablas muestra β para diferentes valores de p.

p 0.3 0.4 0.5 0.6 0.7 0.8

Carlos Gaviria Estadística Inferencial

p 0.3 0.4 0.5 0.6 0.7 0.8

Carlos Gaviria Estadística Inferencial

Pruebas sobre una Media de Población.

Caso 1. Población Normal con Sigma Conocida.

3 Hipótesis alternativa y Región de Rechazo:

Carlos Gaviria Estadística Inferencial

Pruebas sobre una Media de Población.

Caso 2. Muestra Grande.

3 Hipótesis alternativa y Región de Rechazo:

Carlos Gaviria Estadística Inferencial

Pruebas sobre una Media de Población.

Caso 3. Población Normal y σ desconocida.

3 Hipótesis alternativa y Región de Rechazo:

Carlos Gaviria Estadística Inferencial

Intervalo de Confianza para µ.

82 96 99 102 103 103 106 107 108 108 108

Carlos Gaviria Estadística Inferencial

Intervalo de Confianza para µ.

96 120 112 100 125 96 86 124 89 104 116 89 127 89

Ensaye pruebas de hipótesis para µ.

Carlos Gaviria Estadística Inferencial

Intervalo de Confianza para µ.

95 101 92 67 118 105 76 104 84 122

Carlos Gaviria Estadística Inferencial

Distribución de la Media Muestral.

1569 1571 1573 1580 1584 1580 1583 1585

Carlos Gaviria Estadística Inferencial

Pruebas sobre una Media de Población.

Carlos Gaviria Estadística Inferencial

Pruebas sobre una Media de Población.

Carlos Gaviria Estadística Inferencial

Pruebas sobre Diferencia de Medias Poblacionales.

Caso 1. n1 ≥ 30, n2 ≥ 30, varianzas conocidas o desconocidas.

3 Hipótesis alternativa y Región de Rechazo:

Carlos Gaviria Estadística Inferencial

Pruebas sobre Diferencia de Medias Poblacionales.

Caso 2. n1 < 30, n2 < 30, varianzas conocidas y población normal.