Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Inferencial
Carlos Gaviria?
29 de abril de 2021
Ideas Preliminares.
Ideas Generales.
Un parámetro puede ser estimado a partir de datos muestrales con un sólo número o con un
intervalo de confianza completo. Con frecuencia el objetivo de la investigación no sólo es esti-
mar el parámetro de interés sino decidir cuál de dos pretensiones contradictorias es la correcta.
Los métodos para lograr dicho objetivo conforman la parte de la inferencia llamada Pruebas de
Hipótesis.
Primero discutiremos algunos conceptos y terminología básica usados en las pruebas de hipótesis
y luego desarrollaremos procedimientos para la toma de decisiones basados en dichas pruebas.
Ideas Preliminares.
Idea General.
Una hipótesis estadística o simplemente hipótesis es una pretensión, aseveración ó afirmación
sobre el valor de un sólo parámetro, sobre los valores de varios parámetros o sobre la forma de
una distribución de probabilidad completa.
Ejemplos.
1 Pretensión de que µ = 0.5, donde µ es el diámetro interno promedio verdadero de cierto
tipo de tubo de PVC.
2 Afirmar que p < 0.10, donde p es la proporción de circuitos defectuosos entre todas las
tarjetas de circuito fabricadas por cierto fabricante.
3 Afirmar que µ1 − µ2 = 0 donde µ1 y µ2 denotan las resistencias a la ruptura promedio
verdaderas de dos tipos diferentes de cuerdas.
4 Afirmar que los diámetros a la altura de el pecho de un tipo particular de árbol, sigue una
distribución normal.
Ideas Preliminares.
Idea General.
En cualquier problema de prueba de hipótesis, siempre se consideran dos hipótesis contradicto-
rias.
Ejemplos.
1 µ = 0.5 versus µ 6= 0.5.
2 p < 0.10 versus p ≥ 0.10.
3 µ1 − µ2 = 0 versus µ1 − µ2 6= 0.
4 La población sigue una distribución normal versus la población no sigue una distribución
normal.
Objetivo.
Decidir en base a la información muestral, cuál de las afirmaciones es la correcta.
En pruebas de hipótesis, el problema se formula de modo que una de las hipótesis sea inicial-
mente favorecida.
Ideas Preliminares.
Definición.
La hipótesis nula denotada por H0 , es la pretensión que inicialmente se supone cierta. La hipótesis
alternativa denotada por Ha es la afirmación contradictoria a H0 .
Observación.
1 La hipótesis nula será rechazada en favor de la hipótesis alternativa sólo si la evidencia
muestral sugiere que H0 es falsa. Si la muestra no contradice fuertemente a H0 , entonces se
continuará creyendo que H0 es verdadera.
2 Las dos posibles conclusiones de una análisis de prueba de hipótesis son rechazar H0 o no
rechazar H0 .
Ejemplos.
1 H0 : µ = 0.5 vs Ha : µ 6= 0.5.
2 H0 : p < 0.10 vs Ha : p ≥ 0.10.
3 H0 : µ1 − µ2 = 0 versus Ha : µ1 − µ2 6= 0.
4 H0 :La población sigue una distribución normal vs Ha : La población no sigue una distri-
bución normal.
Ideas Preliminares.
Ejemplo 1
Suponga que una compañía está considerando aplicar un nuevo tipo de recubrimiento para los
cojinetes que fabrica. Suponga que la vida de desgaste promedio verdadera con el recubrimien-
to actual es de 1500 horas. La compañía no desea cambiar de recubrimiento a menos que la
evidencia sugiera fuertemente lo contrario. Proponga H0 y Ha .
Ejemplo 2
La investigación científica a menudo debe decidir si una teoría actual debe ser reemplazada por
una explicación más satisfactoria del fenómeno investigado. Proponga H0 y Ha .
Ejemplo 3
Suponga que 15 % de todas las tarjetas de circuito producidas por cierto fabricante durante un
periodo reciente estaban defectuosas. Un ingeniero ha sugerido un cambio en el proceso de pro-
ducción en la creencia que disminuirá el porcentaje de tarjetas defectuosas. Proponga H0 y Ha .
Ideas Preliminares.
Observación.
En el tratamiento de pruebas de hipótesis, la hipótesis nula siempre será formulada como una
afirmación de igualdad. Si θ denota el parámetro de interés, entonces la hipótesis nula tiene la
siguiente forma:
H0 : θ = θ0 ,
mientras que la hipótesis alternativa puede tener alguna de las siguientes formas:
Ha : θ < θ0 o Ha : θ > θ0 o Ha : θ 6= θ0
Observación.
Formular H0 como una afirmación de igualdad es simplemente un tecnicismo, pues de manera
implícita se tiene la forma estructural de H0 ; esto es:
1 H0 : θ = θ0 vs H0 : θ < θ0 equivale a H0 : θ ≥ θ0 vs Ha : θ < θ0 .
2 H0 : θ = θ0 vs H0 : θ > θ0 equivale a H0 : θ ≤ θ0 vs Ha : θ < θ0 .
3 H0 : θ = θ0 vs H0 : θ 6= θ0 equivale a H0 : θ ≤ θ0 , θ ≥ θ0 vs Ha : θ 6= θ0 .
Ideas Preliminares.
Procedimiento de Prueba.
Un procedimiento de prueba de hipótesis está especificado por:
1 Un estadístico de prueba. Una función de los datos muestrales en la cuál se basa la decisión
de rechazar o no rechazar H0 .
2 Una región de rechazo. El conjunto de todos los valores estadísticos de prueba por los cuales
H0 será rechazada.
La hipótesis nula es rechazada si y sólo si el valor estadístico de prueba observado o calculado
queda dentro de la región de rechazo.
Ejemplo 4
Considere una m.a de n = 200 tarjetas de circuito y considere la prueba H0 : p = 0.10 vs
Ha < 0.10. Sea X : Número de tarjetas defectuosas en la muestra, una v.a binomial. x es el valor
observado de X. Si H0 es verdadera, se esperan E(X) = 20 tarjetas defectuosas, mientras que si
Ha es verdadera entonces se esperan menos de 20 tarjetas defectuosas. Es razonable rechazar H0
si el valor observado x es suficientemente menor que 20. Por tanto se rechaza H0 , por ejemplo,
si x ≤ 15 o x ≤ 14, entre otras.
Ideas Preliminares.
Ejemplo 5
Una compañía de tabaco afirma que el contenido promedio de nicotina µ de los cigarrillos marca
gato es cuando mucho 1.5 mg. Una prueba de hipótesis sería probar:
Ideas Preliminares.
Ejemplo 6
Cuando seleccionamos una m.a de tamaño 200 de tarjetas de circuito y estamos considerando la
región de rechazo x ≤ 15, puede suceder que aún cuando H0 sea verdadera, se tenga que x = 13
pues la m.a es inusual. De manera similar puede darse que H0 sea falsa y sin embargo con la m.a
se obtiene x = 20, lo que conduce a aceptar H0 de manera errónea.
Definición.
Un error tipo I consiste en rechazar H0 cuando es verdadera. Un error tipo II consiste en aceptar
H0 cuando es falsa.
Ideas Preliminares.
Observación.
1 Se podrían desarrollar procedimientos de prueba donde no haya errores tipo I y II; sin
embargo, solo puede darse cuando se examina toda la población.
2 Como los procedimientos de prueba se basan en datos muestrales, entonces debido a la
variabilidad del muestreo puede obtenerse como resultado una muestra no representativa.
3 Aún cuando E(X) = µ, el valor observado x puede diferir mucho de µ.
4 En lugar de buscar procedimientos sin errores, se buscan procedimientos donde sea poco
probable que ocurra cualquier tipo de error.
5 La selección de corte de una región de rechazo, fija las probabilidades de cometer un error
tipo I o tipo II.
6 Las probabilidades de error tipo I y tipo II son denotadas por α y β, respectivamente.
7 Como H0 especifica un valor único del parámetro entonces existe un único valor de α; sin
embargo, existe un valor diferente de β por cada valor del parámetro compatible con Ha .
Ideas Preliminares.
Ejemplo 7
Se sabe que un cierto tipo de automóvil sufre daños visibles el 25 % del tiempo en pruebas de
choque a 30 km/h. Se ha propuesto un nuevo diseño de defensa modificado en un esfuerzo para
disminuir ese porcentaje. Sea p la proporción de todos los choques a 30 km/h que no producen
daños visibles con la nueva defensa. Las hipótesis a contrastar son:
Ideas Preliminares.
α = P(error tipo I)
= P(Rechazar H0 siendo verdadera)
= P(X ≥ 8 cuando X ∼ bin(20, 0.25)
= 1 − F(7; 20, 0.25)
= 1 − 0.898
= 0.102
Ideas Preliminares.
Cuando H0 es falsa no hay un solo valor de β, pues hay varios valores para p. Por ejemplo, si
p = 0.30, entonces:
Ideas Preliminares.
Suponga ahora que la región de rechazo es R6 . En este caso, si H0 es verdadera, X ∼ bin(20, 0.25).
Luego:
α = P(error tipo I)
= P(Rechazar H0 siendo verdadera)
= P(X ≥ 6 cuando X ∼ bin(20, 0.25)
= 1 − F(5; 20, 0.25)
= 1 − 0.617
= 0.0383
Además,
X − µ0
Z= σ
√
n
Ha : µ < µ0 z ≤ −zα
Ha : µ > µ0 z ≥ zα
6 µ0
Ha : µ = z ≤ −z α ó z ≥ z α
2 2
X − µ0
Z= S
√
n
Ha : µ < µ0 z ≤ −zα
Ha : µ > µ0 z ≥ zα
6 µ0
Ha : µ = z ≤ −z α o z ≥ z α
2 2
X − µ0
T= S
√
n
Ha : µ < µ0 t ≤ −tα,ν
Ha : µ > µ0 t ≥ tα,ν
6 µ0
Ha : µ = t ≤ −t α ,ν o t ≥ t α ,ν
2 2
Ejemplo 8
Las mediciones humanas constituyen una rica área de aplicación de métodos estadísticos. El
artículo A Longitudinal Study of the Development of Elementary School Children’s Private
Speech(Merril-Palmer Q., 1990:443-463 ) reportó sobre un estudio de niños que hablan solos.
Se pensaba que la conversación a solas estaba relacionado con el IQ, dado que este mide la ma-
durez mental y se sabia que la conversación a solas disminuye conforme los estudiantes avanzan
a través de los años de la escuela primaria. El estudió incluyó 33 estudiantes de primer año de
escuela cuyos resultados de IQ se dan a continuación.
Ejemplo 9
Los siguientes datos corresponden al índice de desarrollo psicomotor para niños LBW.
Ejemplo 10
Los siguientes datos corresponden a resultados de la medición de las aptitudes de estudiantes de
los cursos de capacitación en una universidad:
Ejemplo 11
Las pruebas que se utilizan actualmente para los condones son sustitutos de los desafíos que se
enfrentan en uso, incluyendo una prueba de hoyos, una de inflación, una de sello del paquete y
las de dimensiones y calidad del lubricante. Los investigadores agregaron una nueva prueba que
agrega tensión cíclica a un nivel muy por debajo de la rotura y determina el número de ciclos
hasta llegar a la rotura. El número de ciclos hasta la rotura se puede modelar como una v.a normal
con media 1584. la rotura media muestral se obtendrá a partir de una muestra de 16 condones.
Ejemplo 10
La identificación automática de los limites de estructuras significativas en una imagen medi-
ca es un área de investigación continua. El artículo Automatic Segmentation of Medical Image
Registration: Diagnostic and Simulation Applications, discutió una nueva técnica para realizar
la identificación mencionada. Una medid de la precisión de la región automática es el despla-
zamiento lineal promedio. El artículo da las siguientes observaciones de desplazamiento lineal
promedio con una muestra de 49 riñones.
1.38 0.44 1.09 0.75 0.66 1.28 0.51 0.39 0.70 0.46 0.54
0.83 0.58 0.64 1.30 0.57 0.43 0.62 1.00 1.05 0.82 1.10
0.65 0.99 0.56 0.56 0.64 0.45 0.82 1.06 0.41 0.58 0.66
0.54 0.83 1.59 0.51 1.04 0.85 0.45 0.52 0.58 1.11 0.34
1.25 0.38 1.44 1.28 0.51
Los autores comentan que en la mayoría de los casos el desplazamiento lineal promedio es del
orden de 1.00 o mejor. ¿ Proporcionan los datos una fuerte evidencia para concluir que el des-
plazamiento lineal promedio en estas condiciones es menor que 1.0?. Efectúe una prueba de
hipótesis apropiada.
Ejemplo 12
El artículo Uncertainty Estimation in Railway Track Life cycle Cost, presenta lo siguientes datos
sobre el tiempo de reparación (minutos) de la rotura de un carril alto en una vía curva del tren de
cierta línea de ferrocarril.
159 120 480 149 270 547 340 43 228 202 240 218
Una gráfica de probabilidad normal de los datos muestra un patrón bastante lineal, por lo que es
probable que la distribución de la población del tiempo de reparación sea por lo menos aproxi-
madamente normal.
1 ¿ Hay pruebas de peso para concluir que de verdad el tiempo medio de reparación sea
superior a 200 minutos?. Utilice una prueba de hipótesis con un nivel de significancia de
0.05.
2 Usando σ = 150, ¿ Cuál es la probabilidad de error tipo II de la prueba utilizada en l
numeral 1 cuando el tiempo de reparación es en realidad 300 minutos?.
X − Y − ∆0
Z= r
σ12 σ22
n1
+ n2
Ha : µ1 − µ2 < ∆0 z ≤ −zα
Ha : µ1 − µ2 > ∆0 z ≥ zα
Ha : µ1 − µ2 6= ∆0 z ≤ −z α o z ≥ z α
2 2
Si la varianza es desconocida entonces se cambian σ12 y σ22 por S12 y S22 , respectivamente.
X − Y − ∆0
Z= r
σ12 σ22
n1
+ n2
Ha : µ1 − µ2 < ∆0 z ≤ −zα
Ha : µ1 − µ2 > ∆0 z ≥ zα
Ha : µ1 − µ2 6= ∆0 z ≤ −z α o z ≥ z α
2 2
Caso 3. n1 < 30, n2 < 30, varianzas desconocidas e iguales y población normal.
1 Hipótesis Nula: H0 : µ1 − µ2 = ∆0 .
2 Estadístico de Prueba: X − Y. Estandarizando se tiene que:
X − Y − ∆0
Z= r
Sp2 n1 + n1
1 2
Ha : µ1 − µ2 < ∆0 t ≤ −tα,ν
Ha : µ1 − µ2 > ∆0 t ≥ tα,ν
Ha : µ1 − µ2 6= ∆0 t ≤ −t α ,ν o t ≥ t α ,ν
2 2
(n1 −1)S12 +(n2 −1)S22
donde ν = n1 + n2 − 2 y Sp2 = n1 +n2 −2
Caso 4. n1 < 30, n2 < 30, varianzas desconocidas y diferentes y población normal.
1 Hipótesis Nula: H0 : µ1 − µ2 = ∆0 .
2 Estadístico de Prueba: X − Y. Estandarizando se tiene que:
X − Y − ∆0
Z= r
S12 S22
n1
+ n2
Ha : µ1 − µ2 < ∆0 t ≤ −tα,ν
Ha : µ1 − µ2 > ∆0 t ≥ tα,ν
Ha : µ1 − µ2 6= ∆0 t ≤ −t α ,ν o t ≥ t α ,ν
2 2
donde 2
S12 S22
n1
+ n2
ν= !2 !2
S2 S2
1 2
n1 n2
n1 −1
+ n2 −1
p − p0
b
Z= q
p0 (1−p0 )
n
Ha : p < p0 z ≤ −zα
Ha : p > p0 z ≥ zα
6 p0
Ha : p = z ≤ −z α o z ≥ z α
2 2
p1 − b
b p2
Z= r
q n1 +
pb
b 1
n2
1
n1 n2
p=
donde b p
n1 +n2 1
b + p
n1 +n2 2
b q = 1−b
yb p
3 Hipótesis alternativa y Región de Rechazo:
Hipótesis Alternativa Región de Rechazo
Ha : p1 − p2 < 0 z ≤ −zα
Ha : p1 − p2 > 0 z ≥ zα
Ha : p1 − p2 6= 0 z ≤ −z α o z ≥ z α
2 2
Supuestos.
Las pruebas t con datos apareados se utiliza cuando se tienen n pares ordenados independiente-
mente seleccionados:
(X1 , Y1 ), (X2 , Y2 ), · · · , (Xn , Yn )
tales que E(Xi ) = µ1 y E(Yi ) = µ2 . Se consideran D1 = X1 − Y1 , D2 = X2 − Y2 , · · · , Dn =
Xn − Yn , de modo que las Di son las diferencias dentro de los pares. En ese caso se supone que
las Di casi siempre están distribuidas con valor medio µD y varianza σD 2 (Comúnmente esto es
Observación
La prueba hipótesis se da en relación a la diferencia de medias µ1 − µ2 . La prueba t para la dife-
rencia de medias se hizo utilizando el estadístico de prueba X − Y y suponiendo que las muestras
eran independientes. Sin embargo, en datos apareados, las variables X e Y no son independientes;
por lo tanto, se usa una prueba diferente.
Ha : µD < ∆0 t ≤ −tα,n−1
Ha : µD > ∆0 t ≥ tα,n−1
6 ∆0
Ha : µD = t ≤ −t α ,n−1 ó t ≥ t α ,n−1
2 2
Ejemplo 12
En una empresa se desea conocer si la música tiene un efecto sobre la satisfacción laboral de los
trabajadores, y para ello, los participantes respondieron la Escala de Satisfacción Laboral en dos
momentos diferentes durante la jornada laboral: con y sin música. Las puntuaciones obtenidas
por los trabajadores fueron las siguientes:
Sin mísica 23 25 27 22 28 22 28 27 18 34
Con música 26 30 33 35 34 30 39 31 35 40
Sin música 30 21 33 26 28 29 26 38 30 30
Con música 35 38 35 20 38 30 32 40 30 25
Sin música 20 22 20 27 22 28 29 26 38 30
Con música 32 28 32 30 22 38 30 32 40 30
Indique si existen diferencias estadísticamente significativas en la satisfacción laboral de los
trabajadores durante jornadas de trabajo con y sin música, considere un nivel de significancia de
0.05.
Ejemplo 13
Las trazas de metales presentes en el agua potable afectan el sabor y las concentraciones inusual-
mente altas plantean un riego para la salud. El artículo Trace Metals of South Indian River, reporta
sobre un estudio en el cual se seleccionaron seis lugares en el río (seis objetos experimentales) y
se determinó la concentración de zinc (mg/l) tanto en el agua superficial como en la del fondo
en cada lugar. Los seis pares ordenados aparecen en la siguiente tabla:
Ubicación
1 2 3 4 5 6
Experimento Multinomial.
Un experimento multinomial es la extensión de un experimento binomial. Un experimento mul-
tinomial satisface las siguientes condiciones.
1 Está compuesto por n ensayos independientes.
2 En cada ensayo se da un resultado que pertenece a una y solo una de k categorías.
3 La probabilidad de caer en la categoría i es constante ensayo a ensayo y se denota por pi .
Observación.
Un experimento binomial es un experimento multinomial con k = 2, p1 = p y p2 = 1 − p = q.
El valor observado de la variable aleatoria Ni se denota por ni . Como un ensayo solo puede dar
como resultado una y sólo una categoría, entonces:
X
Ni = n.
Hipótesis Nula.
Cuando se lleva a cabo una experimento multinomial se tiene que:
Observada n1 n2 ··· nk n
Esperada np10 np20 ··· npk0 n
Observación.
Cuando se lleva a cabo un procedimiento de prueba con la distribución multinomial se tiene que:
1 Cuando H0 es verdadera se tiene que las ni deben ser razonablemente cercanas a las npi0 .
2 Cuando H0 es falsa se tiene que las ni deben ser diferentes de manera considerable a las
npi0 .
3 El procedimiento de prueba consiste en evaluar la discrepancia entre las ni y las npi . Una
medida de discrepancia se basa en los cuadrados de las desviaciones (n1 − np10 )2 , (n2 −
np20 )2 , · · · , (nk − npk0 )2 .
4 Para tener en cuenta las magnitudes relativas de las desviaciones, cada desviación cuadráti-
ca se divide entre la correspondiente cantidad esperada.
Teorema.
Siempre que npi ≥ 5 para toda i = 1, 2, · · · , k, la variable:
k
X (observada − esperada)2 X (ni − npi )2
=
todas las celdas
esperada i=1
npi
Procedimiento de Prueba.
1 Hipótesis nula: H0 : p1 = p10 , p2 = p20 , · · · pk = pk0 .
2 Hipótesis alternativa: H0 : Al menos una pi no es igual a pi0 .
k
(ni −npi )2
Valor del estadístico de prueba: χ2 =
P
3
npi
.
i=1
4 Región de Rechazo: χ2 ≥ χ2α,k−1 .
Ejemplo 14
El departamento de estadística de una importante universidad mantiene un servicio de asesoría
privada a estudiantes en sus cursos de introducción. El servicio cuenta con profesores que es-
peran que 40 % de sus clientes sean del curso de estadística para negocios, 30 % de estadística
para ingeniería, 20 % para estudiantes de ciencias sociales y el otro 10 % para estudiantes de
agricultura. Una muestra aleatoria de n = 120 estudiantes dejó ver que había 52, 38, 21 y 9 de
los cuatro cursos, ¿ Estos datos sugieren que los porcentajes en que los profesores se basaban no
son correctos? Exprese y pruebe las hipótesis relevantes usando α = 0.05
Observada 52 38 21 9 120
Esperada 48 36 24 12 120
(Obs-Esp)2 16 4 9 9
Ejemplo 15
Un sistema de recuperación de información tiene 10 lugares de almacenamiento. Se ha guardado
información con la esperanza de que la proporción de peticiones, a largo plazo para la posición i,
5.5−|i−5.5|
sea dada por pi = 30
. Una muestra de 200 peticiones dio las siguientes frecuencias para
las posiciones 1 − 10, respectivamente: 4, 15, 23, 25, 38, 31, 32, 14, 10 y 8. Utilice una prueba ji
cuadrada al nivel de significación de 0.10 para determinar si la información es consistente con
las proporciones a priori.
Observación.
Hasta el momento hemos estudiado problemas inferenciales donde los datos se muestran en cel-
das de una tabla rectangular. Cada una de esas tablas está conformada por un número específico
de filas y un número específico de columnas.
Ahora Estudiaremos:
Problemas en los que los datos son cantidades o frecuencias, pero la tabla está conformada por I
filas y J columnas. Hay dos situaciones de interés:
1 Hay I poblaciones de interés y por cada población hay J categorías. Las poblaciones se
ponen en las filas y las categorías en las columnas. Se toma una m.a de cada categoría y las
respectivas frecuencias se colocan en las celdas.
2 Hay una sola población de interés y cada individuo se clasifica con respecto a dos factores
diferentes. Hay I categorías asociadas al primer factor y J categorías asociadas al segundo
factor. Se toma una sola m.a y en la componente i, j-ésima de la tabla se pone el número
de objetos o individuos de la población que pertenecen a la categoría i del factor 1 y a la
categoría 2 del factor 2.
1 2 ··· j ··· J
1 n11 n12 ··· n1j ··· n1J
2 n21 n22 ··· n2j ··· n2J
.. .. .. .. .. .. ..
. . . . . . .
i ni1 ni2 ··· nij ··· niJ
.. .. .. .. .. .. ..
. . . . . . .
I nI1 nI2 ··· nIj ··· nIJ
Prueba de Homogeneidad.
Se tiene que:
1. Cada individuo de las I poblaciones pertenece a exactamente una de las J categorías.
2. Se toma una muestra de tamaño ni de la i-ésima población.
P
3. n = ni .
4. nij : Número de individuos de la muestra i sobre la categoría j.
I
P
5. n.j = nij : Número total de individuos entre los n muestreados que cae en la categoría j.
i=1
6. pij : Proporción de individuos de la población i que cae en la categoría j.
Prueba de Homogeneidad.
Se tiene que:
7. La hipótesis nula de homogeneidad expresa que la proporción de individuos de la
categoría j es la misma para cada población y que esto es cierto para toda categoría; esto
es, p1j = p2j = · · · = pIj para toda j.
8. Cuando H0 es verdadera tienen sentido p1 , p2 , · · · , pJ .
9. Cuando H0 es verdadera se tiene que E(Nij ) = ni pj .
N.j
pj =
10. b pj
.
4 Región de Rechazo:
χ2 ≥ χ2α,(I−1)(J−1) .
Ejemplo 16
Una compañía empaca un producto particular en latas de tres diferentes tamaños, cada uno con
una línea de producción diferente. La mayor parte de las latas están ligadas a especificaciones,
pero un ingeniero de control de calidad ha identificado las siguientes razones de no cumplimien-
to: Defecto en lata, Grieta en lata, Ubicación incorrecta de arillo, Arillo faltante y Otras. Se
selecciona una muestra de unidades fuera de especificación de cada una de las tres líneas, y cada
unidad se clasifica según la razón por la que está fuera de especificación. Los resultados se dan
en la siguiente tabla de contingencia:
1 34 65 17 21 13 150
Línea 2 23 52 25 19 6 125
3 32 28 16 14 10 100
Total 89 145 58 54 29 375
¿Sugiere la información que las proporciones que caen en las diversas categorías fuera de espe-
cificación no son iguales para las tres líneas?
Carlos Gaviria Estadística Inferencial
Pruebas de Bondad de Ajuste.
Pruebas de Hipótesis.
Tablas de Contingencia Mutuas o Bidireccionales.
Ejemplo 17
La siguiente información corresponde a marcas de hojas halladas en muestras de trébol blanco
seleccionadas de regiones de pastos largos y pastos cortos. Use pruebas χ2 para determinar si las
proporciones verdaderas de marcas diferentes son idénticas para los dos tipos de regiones.
Tipo de Marca.
Prueba de Independencia.
Se tiene que:
1 Cada individuo de la población de interés pertenece a sólo una de las I categorías del primer
factor y a sólo una de las J categorías del segundo factor.
2 Para una muestra de n individuos, denote por nij el número de individuos entre los n que
caen en la categoría i del primer factor y en la categoría j del segundo factor.
3 Las ni. y n.j son valores observados de variables aleatorias.
4 pij : Proporción de individuos de la población que pertenece a la categoría i del factor 1 y
la categoría j del factor 2.
P P
5 pi. = pij y p.j = pij .
j i
6 La hipótesis nula indica que la categoría en un individuo con respecto al factor uno es
independiente de la categoría con respecto al factor dos; esto es, pij = pi. p.j para todo i, j.
7 Cuando H0 es verdadera se tiene E(Ni ) = npij = npi. p.j .
ni. n.j n.j ni. n.j
8 pi. =
b n
p.j =
yb n
, eij = n nni.
de donde b n
= n
4 Región de Rechazo:
χ2 ≥ χ2α,(I−1)(J−1) .
Ejemplo 18
Un estudio da la relación entre las condiciones del equipo de gasolineras y la agresividad en
los precios de gasolina. El estudio publica la siguiente información basada en una muestra de
n = 441 gasolineras:
Ejemplo 19
Cada uno de los estudiantes de una m.a de estudiantes, de preparatoria y universidad, se clasificó
en cruz con respecto a puntos de vista políticos y consumo de marihuana; los datos resultantes
se presentan en la siguiente tabla:
Nivel de Consumo.
Nivel de Consumo.