Está en la página 1de 38

TECNOLÓGICO NACIONAL DE MÉXICO

Instituto Tecnológico de Tijuana

“Pruebas de hipótesis con dos muestras y


varias muestras con datos categóricos ”

Tijuana, B.C., 30 de Mayo de 2016

1
Índice
x 2 son equivalentes a las pruebas con el estadístico normal Z, las cuales se han estudiado en

unidades anteriores.

El análisis de datos categóricos con propósito de toma de decisiones es de vital importancia

en la investigación financiera, médica y de las ciencias sociales. Al efectuar una encuesta, por

ejemplo, las preguntas se redactan, a menudo, de manera que se den respuestas categóricas

en lugar de numéricas.

Varios estudios resultan en datos que son categóricos o cualitativos antes que cuantitativos

y que admiten más de dos resultados posibles

5.1 Prueba Z para la diferencia entre dos proporciones

Cuando se desea probar una hipótesis sobre la diferencia entre 2 proporciones puede
emplearse la distribución Z si se tienen tamaños de muestra lo suficientemente grandes

2
P1 −P 2
z≈
1 1
Pc (1−Pc )( + )
n1 n2

P1−P2
z=
1 1
√ P c (1−Pc )( + )
n1 n 2

P1 = proporción de éxitos en la muestra 1


P2= proporción de éxitos en la muestra 2
n1= número de elementos en la muestra 1
n2 = numero de elementos en la muestra 2
Pc = es la combinación de las 2 proporciones dado que la hipótesis nula supone que son
iguales.

X 1+ X 2
Pc=
n1 + n 2

X 1 = número de casos de éxitos en la muestra 1

X 2 = número de casos de éxitos en la muestra 2

X1 X2
P 1= P 2=
n1 n2

Ejercicios

3
1. Se desea probar si existe diferencia entre las proporciones de aficionados al futbol que
tienen estudios universitarios. Se encontró que 56 de ellos son aficionados a ese
deporte. Otra muestra de 150 personas que no tienen estudios refleja que 90
manifiestan ser aficionados. Compruebe con una significancia del 0.05 si existe
diferencia entre las proporciones de aficionados de ambas poblaciones.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.05

α
=0.025
2

P (−1.96< z <1.96 )=0.05

X 1+ X 2 56+ 90
Pc= = =0.584
n1+ n2 250

P1−P2 0.56−0.06
z≈ = =−9.8788
1 1 1 1
Pc ( 1−Pc )
( +
n1 n2 ) 0.584 ( 1−0.584 ) ( +
100 150 )
Se rechaza Ho, si hay diferencia entre los aficionados.

2. En un invierno con epidemia de gripe, una compañía farmacéutica estudio a 200 bebes
para determinar si el nuevo medicamento de la compañía era eficaz después de dos
días. Entre 120 bebes que tenían gripe y se les suministro el medicamento, 29 se
curaron dentro de dos días. Entre 280 bebes que tenían gripe pero que no recibieron el
fármaco, 56 se curaron dentro de dos días. ¿Hay alguna afirmación significativa que
apoye la afirmación de la compañía de la efectividad del medicamento?

H o =π 1 =π 2
H 1=π 1 > π 2

X 1+ X 2 29+56
Pc= = =0.2125
n1+ n2 120+ 280

P1−P2 0.2416−0.2
z= = =0.9335
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.2125(0.7875)( +
20 280
)

P ( Z >0.9335 ) =0.1762

Se acepa Ho, no hay evidencia suficiente para concluir que el nuevo medicamento es más
efectivo.

4
3. Una comunidad urbana quiere demostrar que la incidencia de cáncer de mama es
mayor en ella que en la de una rural vecina si se encuentra que 20 de 200 mujeres
adultas en la comunidad urbana tienen cáncer de mama contra 10 de 150 mujeres
adultas en la comunidad rural. ¿Se podría concluir con un nivel de significancia del 5%
que este tipo de cáncer prevalece más en la comunidad urbana?

H o =π 1 =π 2
H 1=π 1 > π 2

α =1.645

X 1+ X 2 20+ 10
Pc= = =0.0857
n1+ n2 200+ 150

P1−P2 0.1−0.06
z= = =1.10
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.0857(0.9143)( +
200 150
)

1.10>1.645

Se acepa Ho, pues no hay la suficiente evidencia de que este tipo de cáncer prevalece más en
la comunidad urbana.

4. En un proceso de producción se encontraron 35 artículos defectuosos en una muestra


aleatoria de 500 y se encontraron que 20 defectuosos en otra muestra de 400 artículos
provenientes de otro proceso similar que se lleva a cabo en otra fábrica. Pruebe la
hipótesis de que los productos producen la misma proporción de artículos defectuosos,
con un nivel de significancia de 1%

H o =π 1 =π 2
H 1=π 1 ≠ π 2

α =2.575

X 1+ X 2 35+20
Pc= = =0.0061
n1+ n2 500+ 400

P1−P2 0.07−0.05
z= = =1.2457
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.0061(0.939)( +
500 400
)

Debido a que la z calculada es mayor que -2.575 y menor que 2.575 se acepta la hipótesis
nula y se concluye que los dos procesos producen la misma proporción de artículos
defectuosos.
5
5. Una empresa que se dedica a elaborar declaraciones de impuestos desea comparar la
calidad del trabajo que se realiza en dos de sus oficinas regionales. Con muestras
aleatorias de las declaraciones de impuestos elaboradas en dichas oficinas y verificando
la exactitud de los reportes, la empresa podrá estimar la proporción de las declaraciones
con errores en que incurrió cada una de estas oficinas. Suponga que esta realiza una
prueba de hipótesis para determinar si las proporciones de errores en las dos oficinas
son diferentes. Para esto se requiere una prueba de dos colas. La hipótesis nula y
alternativa son las siguientes:
Oficina 1 Oficina 2
H o =π 1 −π 2=0 n1= 250 n2= 300
H 1=π 1−π 2 ≠0 Declaraciones Declaraciones

con errores= con errores=


α =10 %
35 27
X 1+ X 2 35+ 27
Pc= = =0.1127
n1+ n2 250+ 300

P1−P2 0.14−0.09
z= = =1.8463
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.1127 (0.8873)( +
250 300
)

Se rechaza la Ho para un nivel de significancia del 10%. La empresa concluye que las
proporciones de errores de las dos oficinas difieren. La conclusión de esta prueba de hipótesis
es consistente con los resultados de la estimación por intervalo calculada antes, los cuales
indicaban la diferencia entre las proporciones poblacionales de errores en las dos oficinas
estaba entre 0.005 y 0.095, siendo la oficina 1 la que arrojaba una mayor tasa de errores.

6. Considere la prueba de hipótesis:


a) ¿Cuál es el valor de Pc?
b) Usando una significancia del 5%, ¿Cuál es la conclusión en esta prueba de hipótesis?

H o =π 1 −π 2 ≤ 0 Muestra 1 Muestra 2
H 1=π 1−π 2 >0 n1= 200 n2= 300
P1=0.22 P2=0.16
α =0.05

X 1+ X 2 200 (0.22)+300 (0.16)


Pc= = =0.1840
n1+ n2 200+ 300

6
P1−P2 0.22−0.16
z= = =1.70
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.1840(0.816)( +
200 300
)

a) Valor P= 1.0000-0.9554=0.0446
b) Se rechaza Ho

7. En un estudio de la Asociación Estadounidense de Automovilistas (AAA, por sus siglas en


inglés) se investigó si era más probable que los conductores de género masculino o
femenino se detuvieran para solicitar indicaciones sobre cómo llegar a una dirección. Se
preguntaba a los conductores “Si usted y su conyugue van en su automóvil y se pierden,
¿se detiene para preguntar por el domicilio que busca?” En una muestra representativa
se encontró que 300 de 811 mujeres dijeron que si se detenían para preguntar, mientras
que 255 de 750 hombres dijeron que también lo hacían.
Pruebe la hipótesis usando una significancia del 5%, ¿cuál es la conclusión a la que se
esperaría que llegara AAA?

H o =π 1 ≤ π 2
H 1=π 1 > π 2
α =5 % =1.645

X 1+ X 2 300+ 255
Pc= = =0.3555
n1+ n2 811+750

P1−P2 0.3699−0.34
z= = =1.2330
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.3555(0.6445)( +
811 750
)

Debido a que la z calculada, 1.2330 es menor que 1.645 se acepta la hipótesis nula; no se
puede concluir que las mujeres sean más propensas a preguntar por un domicilio.

8. Suponga que es el gerente de T.C Resort Properties, un conjunto de cinco hoteles de


gran prestigio localizados en dos islas. En una de las islas T.C Resort tiene dos hoteles, el
Beachcomber y Windsurfer. Al tabular las respuestas para la única pregunta ¿Elegiría
venir a este hotel nuevamente? , 163 de 227 huéspedes del hotel Beachcomber
respondieron SI, y 164 de 262 huéspedes del Windsurfer respondieron sí. Con un nivel
de significancia de 0.05, ¿Existe evidencia para una diferencia significativa en la
satisfacción de los huéspedes entre los dos hoteles?

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =5 % =1.645

7
X 1+ X 2 163+164
Pc= = =0.648
n1+ n2 227+262

P1−P2 0.718+0.588
z= = =30.1573
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.648(0.352)( +
227 262
)

Con un nivel de significancia de 0.05, se rechaza la hipótesis nula puesto que


Z=30.1573>1.645 El valor calculado de p es 0.0026. Existe evidencia para concluir que los dos
hoteles son significativamente diferentes con respecto a la satisfacción de los huéspedes.

9. Se ponen a prueba la enseñanza de la Estadística empleando Excel y Winstats. Para


determinar si los estudiantes difieren en términos de estar a favor de la nueva
enseñanza se toma una muestra de 20 estudiantes de dos paralelos. De paralelo A 18
están a favor, en tanto que del paralelo B están a favor 14. ¿Es posible concluir con un
nivel de significación de 0,05 que los estudiantes que están a favor de la nueva
enseñanza de la Estadística es la misma en los dos paralelos?

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =5 % =1.645

X 1+ X 2 18+14
Pc= = =0.8
n1+ n2 20+20

P1−P2 0.9−0.7
z= = =1.5811
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.8(0.2)( + )
20 20

La hipótesis nula es aceptada, ya que Z=1.5811 está en la zona de aceptación de la región


critica 1.96, por lo tanto la proporción de los estudiantes a favor de la nueva enseñanza
estadística es la misma en los dos paralelos.

10. Un estudio de mercadotecnia refleja mediante una muestra aleatoria que 35 de 50


niños de Tijuana y 32 de 50 de Puebla, prefieren videojuegos de una marca específica.
Pruebe la hipótesis de que estas proporciones son iguales con un nivel de significancia
de 0.025.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.025=1.96

X 1+ X 2 35+ 32
Pc= = =0.67
n1+ n2 50+50

8
P1−P2 0.7−0.64
z= = =0.6380
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.67(0.33)( + )
50 50

Debido a que la z calculada, 0.6380 es menor que 1.96 se acepta la hipótesis nula; de que las
proporciones son iguales.

11. Un empresario tomo una muestra aleatoria de 100 empleados del área administrativa y
otra de 500 de la operativa. Encontró que 8 y 25, respectivamente, no están cumpliendo
con su trabajo. Determine con un nivel de significancia de 1% si la hipótesis de que las
proporciones de trabajadores con esta características es la misma en las 2 áreas.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.10=1.285

X 1+ X 2 8+ 25
Pc= = =0.055
n1+ n2 100+500

P1−P2 0.08−0.05
z= = =1.2012
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.055(0.945)( +
100 500
)

Debido a que la z calculada, 1.2012 es menor que 1.285 se acepta la hipótesis nula; de que
las proporciones de los trabajadores con esta característica es la misma en las 2 áreas.

12. Una empresa de telecomunicaciones toma una muestra aleatoria de 70 llamadas


locales, de las cuales 20 tienen una duración superior a 15 minutos. Otra muestra
aleatoria de 50 llamadas internacionales refleja que solo 15 rebasan este tiempo.
Tomando en cuenta con un nivel de significancia de 5% pruebe la hipótesis de que la
proporción de llamadas que duran más de 15 minutos entre locales e internacionales es
la misma.

H o =π 1 =π 2
H 1=π 1 ≠ π 2

9
α =0.05=1.645

X 1+ X 2 20+ 15
Pc= = =0.2916
n1+ n2 70+ 50

P1−P2 0.2857−0.3
z= = =0.1699
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.2916( 0.7084)( + )
70 50

Debido a que la z calculada0.1699 es menor que 1.645 se rechaza la hipótesis nula; y se


concluye que la proporción de llamadas que duran más de 15 minutos entre locales e
internacionales es diferente.

13. Un laboratorio toma una muestra aleatoria de 150 pacientes hombres y 200 pacientes
mujeres a quienes se les aplico un tratamiento. Al cabo de 10 días 100 hombres y 180
mujeres muestran mejoría gracias al tratamiento. Con un nivel de significación de 1%
determine si la proporción es la misma para hombres y mujeres que tuvieron una buena
reacción.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.01=2.575

X 1+ X 2 100+ 180
Pc= = =0.8
n1+ n2 150+ 200

P1−P2 0.6666−0.9
z= = =5.4021
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.8(0.20)( +
150 200
)

Debido a que la z calculada 5.4021 es mayor que 2.575, se acepta la hipótesis nula; y se
concluye que la proporción de hombres y mujeres que tuvieron una buena reacción es la
misma.

14. Un banco compara 2 sucursales esperando que la proporción de transacciones que


generan comisión alta sea la misma. De una muestra aleatoria de 600 transacciones de
la sucursal 1, 270 generan una comisión alta; de otra muestra aleatoria de 720
transacciones de la sucursal 2, 340 cumplen con esta característica. Pruebe con un nivel
de significación de 0.05% la hipótesis de que esta proporción es la misma en las 2
sucursales.
10
H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.05=1.645

X 1+ X 2 270+ 340
Pc= = =0.4621
n1+ n2 600+ 720

P1−P2 0.45−0.4722
z= = =0.8055
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.4621(0.5379)( +
600 720
)

Debido a que la z calculada 0.8055 es menor r que el valor z de tablas 1.645, se rechaza la
hipótesis nula; y se concluye que la proporción de transacciones que generan comisión alta es
diferente.

15. Una estética toma una muestra aleatoria de 100 clientas de las cuales 25 prefieren el
gelish. Otra muestra aleatoria de 100 clientas de las cuales 50 prefieren las uñas de
acrílico. Con un nivel de significación de 1% determine si la proporción es la misma de
las que prefieren gelish a las que prefieren uñas de acrílico.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.01=2.575

X 1+ X 2 25+ 50
Pc= = =0.375
n1+ n2 100+100

P1−P2 0.25−0.5
z= = =−3.6515
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.375(0.625)( +
100 100
)

Debido a que la z calculada -3.6515 es menor que el valor z de tablas 2.575, se rechaza la
hipótesis nula; y se concluye que la proporción de las que prefieren gelish y uñas acrílicas es
diferente.

16. Un laboratorio toma una muestra aleatoria de 500 pacientes hombres y 450 pacientes
mujeres a quienes se les aplico un tratamiento. Al cabo de 25 días 100 hombres y 180
mujeres muestran mejoría gracias al tratamiento. Con un nivel de significación de 5%

11
determine si la proporción es la misma para hombres y mujeres que tuvieron una buena
reacción.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.05=1.645

X 1+ X 2 100+180
Pc= = =0.2947
n1+ n2 500+ 450

P1−P2 0.2−0.4
z= = =−6.7512
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.2947(0.7053)( +
500 450
)

Debido a que la z calculada -6.7512 es menor que el valor z de tablas 1.645, se rechaza la
hipótesis nula; y se concluye que la proporción de hombres y mujeres que tuvieron una
buena reacción es diferente.

17. Un estudio de mercadotecnia refleja mediante una muestra aleatoria que 200 de 500
niños de San Diego y 250 de 550 de Florida, prefieren las hamburguesas de una marca
específica. Pruebe la hipótesis de que estas proporciones son iguales con un nivel de
significancia de 0.025.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.025=1.96

X 1+ X 2 200+ 250
Pc= = =0.4285
n1+ n2 500+ 550

P1−P2 0.4−0.45
z= = =−1.6351
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.4285(0.5715)( +
500 550
)

Debido a que la z calculada, -1.6351 es menor que 1.96 se acepta la hipótesis nula; de que las
proporciones son iguales.

12
18. Un ejecutivo de Deloitte tomo una muestra aleatoria de 300 empleados del área
administrativa y otra de 500 de la operativa. Encontró que 50 y 45, respectivamente, no
están cumpliendo con su trabajo. Determine con un nivel de significancia de 1% si la
hipótesis de que las proporciones de trabajadores con esta características es la misma
en las 2 áreas.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.10=1.285

X 1+ X 2 50+ 45
Pc= = =0.1187
n1+ n2 300+ 500

P1−P2 0.16−0.09
z= = =2.9635
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.1187 (0.8813)( +
300 500
)

Debido a que la z calculada, 2.9635 es mayor que 1.285 se rechaza la hipótesis nula; de que
las proporciones de los trabajadores con esta característica es la misma en las 2 áreas y se
concluye que son diferentes.

19. Una firma de abogados toma una muestra aleatoria de 50 empleados del área penal y
otra de 60 del área familiar. Encontró que 10 y 20, respectivamente, no están llegando a
su trabajo puntualmente. Determine con un nivel de significancia de 10% si la hipótesis
de que las proporciones de los abogados con esta característica es la misma en las 2
áreas.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.10=1.285

X 1+ X 2 10+ 20
Pc= = =0.2727
n1+ n2 50+ 60

P1−P2 0.2−0.33
z= = =−1.5244
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.2727(0.7273)( + )
50 60
13
Debido a que la z calculada, -1.5244 es menor que 1.285 se acepta la hipótesis nula; de que
las proporciones de los trabajadores con esta característica es la misma en las 2 áreas.

20. La directora del plantel toma muestra aleatoria de 100 niños de segundo de primaria y
otra de 80 de tercero de primaria.Encontró que 45 y 65, respectivamente, no están
desayunando correctamente en sus casas. Determine con un nivel de significancia de 1%
si la hipótesis de que las proporciones de alumnos con esta características es la misma
en los dos grados.

H o =π 1 =π 2
H 1=π 1 ≠ π 2
α =0.10=1.285

X 1+ X 2 45+65
Pc= = =0.6111
n1+ n2 100+ 80

P1−P2 0.45−0.81
z= = =−4.9228
1 1 1 1
√ P c (1−Pc )( + )
n1 n 2 √ 0.611( 0.389)( + )
100 80

Debido a que la z calculada, -4.9228 es menor que 1.285 se acepta la hipótesis nula; de que
las proporciones de los alumnos con esta característica es la misma en en los dos grados.
Las pruebas de hipótesis a partir de proporciones se realizan casi en la misma forma utilizada
cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada
caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situación
particular.
En caso de que la muestra sea grande n>30, el estadígrafo de prueba es: se distribuye normal
estándar.
Regla de decisión: se determina de acuerdo a la hipótesis alternativa (si es bilateral o
unilateral. En el caso de muestras pequeñas se utiliza la distribución Binomial. No lo
abordaremos por ser complicado y poco frecuente su uso.
1. En un proceso de producción se encontraron 35 artículos defectuosos en una muestra
aleatoria de 500 y se encontraron que 20 defectuosos en otra muestra de 400 artículos
provenientes de otro proceso similar que se lleva a cabo en otra fábrica. Pruebe la
hipótesis de que los productos producen la misma proporción de artículos defectuosos,
con un nivel de significancia de 1%

H o =π 1 =π 2
H 1=π 1 ≠ π 2

P ( x 2 ≥ 3.84|gl=1 ) =0.05
14
gl=( 2−1 )( 2−1 ) =1

2 ( f −fe )2
× =∑ =1.5528
fe
P=( ×2 ≥3.8411 , gl=1 ) =0.05
P=( ×2 ≥ 6.635, gl=1 ) =0.01

Debido a que el valor calculado de Chi2 igual a 1.5528 es menor que el valor crítico, no puede
rechazarse la hipótesis nula. Se concluye que los dos procesos tienen la misma proporción de
artículos defectuosos.

2. Una empresa realiza evaluaciones a sus dos productos más vendidos. Con una muestra
aleatoria de 250 artículos del producto A y 200 del B, se obtiene que: 230 y 190 pasan
las pruebas de acuerdo con las normas de producción respectivamente. El jefe de
operaciones mantiene la hipótesis de que las dos líneas de producción tienen la misma
proporción de artículos que cumplen con la norma. Compruébelo con un nivel de
significancia de 5%.

( f −fe )2
X 2 =∑ =1.6086
fe

3. Una compañía tiene dos fundidoras de tamaños similares y dedicados a las mismas
operaciones de producción. Se implanta un programa de seguridad experimental en una
de ellas. Antes de emplear el programa a la otra los administradores desean comparar la
proporción de trabajadores lesionados durante el periodo de prueba en el sitio
experimental contra el de la otra planta. Se piensa que el programa es rentable si las
proporciones difieren en más de 0.05

15
H 0 :π 1−π 2=0.05
H a :π 1−π 2> 0.05

24+5
Pc = =0.565
263+250
P ( X 2 ≥6.635 , gl=1 )=0.01
( f −fe )2
X 2 =∑ =12.2415
fe
12.2415>6.635

4. La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas al


lanzar un dado 60 veces. Contrastar la hipótesis de que el dado es bueno, con un nivel
de significación de 0,01.

H 0 :Todaslas proporciones de la población son iguales


H a : Notodas las proporciones de la población son iguales

gl=( 2−1 )( 6−1 )=5


X 2tabla =15.086
( 6−10 )2 ( 8−10 )2 ( 9−10 )2 ( 15−10 )2 ( 14−10 )2 ( 8−10 )2
X 2 =∑ + + + + +
10 10 10 10 10 10
2
X =6.6

Se acepta la hipótesis nula, ya que X 2 =6.6 es menor que X tabla 15.086, por lo tanto se
concluye que todas las proporciones de la población son iguales.

5. Se realiza un estudio sobre el cáncer de piel en ancianos y su relación con el hábito de


fumar. Suponemos que hubo 15 casos de cáncer en un total de 35 fumadores y 10 casos
de cáncer entre un total de 50 no fumadores.

H 0 :π fumadores=π no fumadores
H a :π fumadores ≠ π no fumadores

16
25-10,3 =14.7 no fumadores con cáncer
35-10,3 =24.7 fumadores sin cáncer
60-24,7 =35.3 no fumadores sin cáncer
( 15−10.3 )2 ( 10−14.7 )2 ( 20−24.7 )2 ( 40−35.3 )2
X 2 =∑ + + +
10.3 14.7 24.7 35.3
2
X =5.16
gl=( 2−1 )( 2−1 ) =1

Como conclusión, podemos afirmar que la diferencia es estadísticamente significativa y tenemos


evidencias para rechazar la hipótesis nula ya que le corresponde un valor p<0.05.
Podemos decir que existe una asociación estadísticamente significativa entre ser fumador y la
incidencia de cáncer de piel en ancianos (se puede afirmar que existen evidencias de un mayor riesgo
de cáncer de piel entre fumadores).

6. Comparar si el factor género influyes en la cantidad de cigarros fumados por causa del
estrés en personas que trabajan. El modelo experimental tiene dos muestras
independientes.

H 0 : No habrá diferencia significativa entre la cantidad de cigarros fumados por causa del estrés en hombres y
mujeres que trabajan
H a :Habrá diferencia significativa entre la cantidad de cigarros fumados por causa del estrés en hombres y
mujeres que trabajan
∝=0.05

( 15−15.9 )2 ( 10−6.81 )2 (25−27.7 )2 ( 20−19.09 )2 ( 5−8.18 )2 ( 35−32.7 )2


X 2 =∑ + + + + +
15.9 6.81 27.7 19.09 8.18 32.7
2
X =3.15
gl=( 3−1 )( 2−1 )=2

El valor 3.15 con 2 grados de libertad se compara con los valores críticos de ji cuadrada; así, se puede
observar que a la cifra 5.99 corresponde la probabilidad de 0.05, lo cual significa que el estadístico
calculado tiene una probabilidad mayor que 0.05.
17
Decisión: En razón de que el valor de ji cuadrada de 3.15 tiene una probabilidad mayor que 0.05, cae
en la zona de rechazo. Por tanto se acepta Ho y se rechaza Ha. X2c < X2t se rechaza Ho  
3.15 > 5.99 se rechaza Ho. Si hay diferencias significativas entre el consumo de cigarros por causa del
estrés entre hombres y mujeres que trabajan.

El consumo de cigarros por causa del estrés entre hombres y mujeres que trabajan, se debe a factores
del azar.

Ejercicios
H o =π 1 =π 2=π 3=π 4
H 1=cuando menosuna de las igualdades anteriores no se cumple
gl=( 4−1 )( 2−1 ) =3
P ( x 2 11.45 ; gl=3 ) =0.01
P ( x 2 ≥ 7.815; gl=3 )=0.05
( fo−fe)2
x 2= ∑ =3.9828+0.6618=4.6443
fe

H o =Las variables son independientes


H 1=Las variables son dependientes
gl=( 5−1 )( 2−1 )=4
P ( x 2 9.488 ; gl=4 ) =0.05
2 (fo−fe)2
x =∑ =6.7081+319.8381=326.5461
fe
H o =π 1 =π 2=π 3=π 4
H 1=cuando menosuna de las igualdades anteriores no se cumple
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05

18
(fo−fe)2
x 2= ∑ =10.7606+0.6792+5.3578=16.7975
fe

H o =π 1 =π 2=π 3=π 4
H 1=cuando menosuna de las igualdades anteriores no se cump≤¿
gl=( 2−1 )( 3−1 )=2
P ( x 2 7.378 ; gl=2 )=0.025
2 (fo−fe)2
x =∑ =0.9333+0.1875+ 0.1956=1.3164
fe

H o =π 1 =π 2=π 3=π 4
H 1=cuando menosuna de las igualdades anteriores no se cumple
gl=( 2−1 )( 3−1 )=2
P ( x 2 9.210 ; gl=2 ) =0.01
2 (fo−fe)2
x =∑ =0.2155+1.3867+ 0.5141=2.1162
fe

H o =π 1 =π 2=π 3=π 4
H 1=cuando menosuna de las igualdades anteriores no se cumple
gl=( 2−1 )( 3−1 )=2
P ( x 2 9.210 ; gl=2 ) =0.01
2 (fo−fe)2
x =∑ =0.9305+0.8666+ 0.0158=1.8129
fe

H o =Lacalificación de los alumnos es independiente de la licenciatura que han elegido


H 1=La calificacion de los alumnos es dependiente de lalicenciatura que han elegido
gl=( 2−1 )( 3−1 )=2
P ( x 2 9.210 ; gl=2 ) =0.01
(fo−fe)2
x 2= ∑ =1.3568+2.0513+0.4615=3.8696
fe

19
H o =Laedad es independientede la opinion de los ciudadanos sobre el tipo de seguridad social
H 1=La edad es dependiente de la opinionde losciudadanos sobre el tipo de seguridad social
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05
(fo−fe)2
x 2= ∑ =0.7856+0.4076+ 0.0056=1.1988
fe

H o =El estado civil es independiente de la edad


H 1=El estado civiles dependiente de la edad
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05
(fo−fe)2
x 2= ∑ =16.3798+0.0447+ 8.9542=25.3778
fe

H o =La puntualidad es independiente a lashrs que duermen l os trabajadores


H 1=La puntuaidad es dependiente a las hrs que duermenlos trabajadores
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05
2 (fo−fe)2
x =∑ =0.0293+3.2059+1.3943=4.6295
fe

H o =Los habitos alimenticios dependen de la edad


H 1=Los habitos alimenticios son independientes a la edad
gl=( 2−1 )( 3−1 )=2
P ( x 2 4.605 ; gl=2 ) =0.10
(fo−fe)2
x 2= ∑ =12.7011+6.4834+ 5.3705=24.5549
fe

H o =Las nuevas inscripciones dependen de las vacaciones de sus socios


20
H 1=Las nuevas insripciones son independientes a las vacacines de sus socios
gl=( 2−1 )( 3−1 )=2
P ( x 2 10.597 ; gl=2 )=0.005
2 (fo−fe)2
x =∑ =16.2338+13.7671+0.1959=30.1968
fe

H o =Las propinas haciasus meseros dependen del consumo de los clientes


H 1=Las propinas hacia sus meseros dependen del consumo de los clientes
gl=( 2−1 )( 3−1 )=2
P ( x 2 9.210 ; gl=2 ) =0.0 1
(fo−fe)2
x 2= ∑ =7.5089+1.5750+0.7619=9.8458
fe

H o =Los alumnos que reprueban matematicas es dependiente aluso excesivo


H 1=Los alumnos que reprueban matematicas es independiente aluso excesivo
gl=( 2−1 )( 3−1 )=2
P ( x 2 10.597 ; gl=2 )=0.005
2 (fo−fe)2
x =∑ =2.0631+0.8336+11.9858=14.8825
fe

H o =La preferenciade sus dos planesdepende de la ciudad donde se contrata


H 1=La preferencia de susdos planes depende de la ciudad donde se contrata
gl=( 2−1 )( 3−1 )=2
P ( x 2 10.597 ; gl=2 )=0.005
2 ( fo−fe)2
x =∑ =10+2+ 4=16
fe

H o =La preferenciade sus zapatos deportivos de pende de la edad de sus consumidores


H 1=La preferencia de sus zapatos deportivos depende de la edad de sus consumidores
gl=( 2−1 )( 3−1 )=2
P ( x 2 7.378 ; gl=2 )=0.05
21
( fo−fe )2
x 2= ∑ =20.7692+22.2236+0.6731=43.6659
fe

H o =La preferenciade la presentacion del detergente es dependiente a su ocupacion


H 1=La preferencia de la presentacion del detergente es dependiente a su ocupacion
gl=( 2−1 )( 3−1 )=2
P ( x 2 6.635 ; gl=2 )=0.01
( fo−fe )2
x 2= ∑ =22.8023+79.3052+25.1209=127.2284
fe

H o =La preferencia del ¿ loslabiales es dependiente a la estacion del año


H 1=La preferenciadel ¿ loslabiales es independiente a laestacion delaño
gl=( 2−1 )( 3−1 )=2
P ( x 2 4.605 ; gl=2 ) =0.1
2 ( fo−fe )2
x =∑ =43.1876+ 2.5521+ 9.7547=55.4944
fe

H o =Los litros de agua consumidos son dependientes a la ocupacion de la poblacion


H 1=Los litros de agua consumidos son dependientes ala ocupacionde la poblacion
gl=( 2−1 )( 3−1 )=2
P ( x 2 10.597 ; gl=2 )=0.005
( fo−fe )2
x 2= ∑ =7.5938+5.0417+22.2315=34.8669
fe

H o =El desempeño de sus agentesde ventas depende de la experiencia en el area


H 1=El desempe ño de sus agentesde ventas independe de laexperiencia en el area
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05
( fo−fe )2
x 2= ∑ =0.0130+1.3807+1.7376=3.1313
fe

22
H o =El banco que usan los estudiantes depende de su edad
H 1=El banco que usan los estudiantes es independiente a su edad
gl=( 2−1 )( 3−1 )=2
P ( x 2 1.386 ; gl=2 )=0.50
2 ( fo−fe )2
x =∑ =0.2888+0.3143+0.0059=0.6090
fe

H o =Laedad de sus consumidores es dependiente de la bebida que prefieren tomar


H 1=La edad de susconsumidores es independiente de labebida que prefieren tomar
gl=( 2−1 )( 3−1 )=2
P ( x 2 10.597 ; gl=2 )=0.005
2 ( fo−fe )2
x =∑ =2.5855+6.3516+22.5723=31.5095
fe

H o =Las calificaciones de su grupo son dependientes alas hrs de estudio


H 1=Las calificaciones de su grupo sonindependientes a las hrs de estudio
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
( fo−fe )2
x 2= ∑ =0.0275+1.4066+0.9423=2.3764
fe

H o =Laintencion del voto es independiente ala edad de las personas


H 1=La intencion del voto es dependiente a laedad de las personas
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
( fo−fe )2
x 2= ∑ =15.1629+2.0995+6.0652=23.3275
fe
25. El gerente de un centro comercial quería saber si hay diferencias en la proporción de mujeres
compradoras a diversas horas durante diversos días de la semana. Se seleccionaron muestras
aleatorias de 300 clientes en el día, 300 en la noche y 400 compradores en los fines de semana;
obteniéndose los siguientes resultados:

23
H o =¿ No existe diferencia en las proporciones
H 1=¿ Existe diferencia en las proporciones
gl=( 2−1 )( 3−1 )=2
P ( 10.597 ; gl=2 )=0.005
( fo−fe )2
x 2= ∑ =12.50+0.3472+6.5104=19.3576
fe

H o =¿ La proporción de sus ventas es dependiente al mes del año


H 1=¿ La proporción de sus ventas es independiente al mes del año
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
2 ( fo−fe )2
x =∑ =39.0950+3.1060+26.2629=19.3576
fe

H o =¿ El número de alumnos que sufren algún tipo de accidente es dependiente al semestre que cursan
H 1=¿ El número de alumnos que sufren algún tipo de accidente es independiente al semestre que cursan
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
2 ( fo−fe )2
x =∑ =10.6734+3.0415+1.3824=15.0973
fe

H o =¿ La proporción de sus consumidores es dependiente a la carrera que estudian


H 1=¿ La proporción de sus consumidores es independiente a la carrera que estudian
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
2 ( fo−fe )2
x =∑ =1.6667+0.3846+ 4.50=6.5513
fe
La proporción de sus consumidores es dependiente a la carrera que estudian.

29. Una papelería escolar desea saber si la proporción de las calculadoras que vende depende de la
carrera que estudian sus clientes. Compruebe la hipótesis con un nivel de significancia del 5%

24
H o =¿ La proporción de las calculadoras que vende depende de la carrera que estudian sus clientes
H 1=¿ La proporción de las calculadoras que vende es independiente de la carrera que estudian sus clientes
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
2 ( fo−fe )2
x =∑ =4.1220+ 4.5844+ 4.8139=13.5003
fe
30. Una papelería escolar desea saber si la marca de plumas que vende depende de la edad de sus
clientes. Compruebe la hipótesis con un nivel de significancia del 5%

H o =¿ La proporción de la marca de plumas depende de la edad de sus clientes


H 1=¿ La proporción de la marca de plumas depende de la edad de sus clientes
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
( fo−fe )2
x 2= ∑ =3.7220+9.6240+6.5691=19.9151
fe
x 2 para la bondad de ajuste también se puede usar para probar la hipótesis de independencia
de dos variables de clasificación.

Ejercicios

1. Una empresa de investigación de mercados desea saber si la marca de ciertos


automóviles depende de la zona en la que habitan sus propietarios. Para investigarlo,
toma una muestra aleatoria de 600 propietarios con sus autos e identifica que marca
poseen y en qué zona de la ciudad habitan. En la siguiente tabla se muestran los
resultados. La empresa decide realizar la prueba con un nivel de significación del 0.01

H o =Lamarca de auto que possen los propietarios es independiente de la zona de la ciudad que habitan
H 1=La marca de autoque poseen los propietarios si depende de la zona de la ciudad en la que habitan
α =0.01
gl=4
x 2=13.277
P ( x 2 ≥ 13.277|gl=4 ) =0.01
3.0172+2.6160+10.5776=16.2107

25
x 2. Este valor calculado es mayor que el valor crítico, 13.277, así que se rechaza la hipótesis nula, y se
concluye que, efectivamente, la marca de auto que poseen los propietarios de automóviles de esas
ciudad si depende de la zona en que habitan.

H o =El tipo de defecto observado en las unidades es independiente delturno en que se fabrican
H 1=El tipo de defecto observado en lasunidades sidepende del turnoen que se fabrican
α =0.01
gl=( 4−1 )( 3−1 )=6
x 2=16.812
P ( x 2 ≥ 13.277|gl=4 ) =0.01
3.0172+2.6160+10.5776=16.2107
x 2. Este valor calculado es menor que el valor crítico, 16.2107, así que se acepta la hipótesis nula, y se
concluye que, efectivamente, el tipo de defecto observado en las unidades producidas en una planta
manufacturera es independiente del turno en el que se fabrican.

H o =Lacalid ad de la educacion primariaes independiente de la ubicacion de la escuela


H 1=La calidad de laeducacion primaria sidepende de laubicacion de la escuela
α =0.05
gl=( 3−1 )( 4−1 )=6
x 2=12.592
P ( x 2<13.277|gl=4 )=0.05
17.0960+12.5480+6.6667=36.3106
x 2. Este valor calculado es mayor que el valor crítico, 12.592, así que se rechaza la hipótesis nula, y se
concluye que, efectivamente, la calidad de la educación primaria si depende de la ubicación de la
escuela.

H o =El rendimiento en eltrabajo es independiente del desempeño en la capacitación


H 1=El rendimiento en el trabajo sidepende del desempeño en la capacitación
α =0.01
gl=( 3−1 )( 3−1 )=4
x 2=13.277
P ( x 2<13.277|gl =4 )=0.01
6.8689+2.0756+10.5700=19.5145

26
x 2. Este valor calculado es mayor que el valor crítico, 13.277, así que se rechaza la hipótesis nula, y se
concluye que, efectivamente, el rendimiento en el trabajo si depende del desempeño en la
capacitación.

5. Se analizaron los limones producidos en 4 estados del país para evaluar si existe relación entre las
regiones y la calidad de los mismos. Los resultados que se obtuvieron fueron:

¿La calidad de los limones es independiente del estado donde se cosechan? Realice la prueba con un
nivel de significancia de 0.01

H o =Lacalidad de los limones es independiente del estadodonde se cosechan


H 1 La calidad de los limones si depende del estado de donde se cosechan
α =0.01
gl=( 3−1 )( 4−1 )=6
x 2=16.812
2
P ( x <16.812|gl=6 )=0.01
412.5991+15.6268+17.1649+1679.1864=2124.5772
x 2. Este valor calculado es mayor que el valor crítico, 16.812, así que se rechaza la hipótesis nula, y se
concluye que, efectivamente, la calidad de los limones si depende del estado donde se cosechan.
H o =El modelo de telefono que prefieren sus clientes es independiente de la edad de estos
H 1 El modelo de telefono que prefieren sus clientes si depende de la edad de estos
α =0.05
gl=( 4−1 )( 5−1 )=12
x 2=21.026
P ( x 2<21.026|gl =6 ) =0.05
17.8219+6+20.8106+ 5.5617+6.3159=56.7035
x 2. Este valor calculado es mayor que el valor crítico, 21.026, así que se rechaza la hipótesis nula, y se
concluye que, efectivamente, el modelo de teléfono que prefieren sus clientes si depende de la edad
de estos.

H o =El tipo de seguro es dependiente de losingresos del cliente


H 1=El tipo de seguro es independiente de losingresos del cliente
α =0.10
gl=( 4−1 )( 3−1 )=6
x 2=10.645
P ( x 2<10.645|gl=6 )=0.10
3.2966+11.0989+ 12.2948=26.6903
x 2. Este valor calculado es mayor que el valor crítico, 10.645, así que se rechaza la hipótesis nula, y se
concluye que, efectivamente, el tipo de seguro es independiente de los ingresos del cliente.

27
8. El coordinador de una universidad desea saber si las calificaciones de los alumnos de la
licenciatura a su cargo dependen del género de los estudiantes. Para saber esto toma una
muestra de 200 alumnos e identifica las calificaciones de hombres y mujeres. Con un nivel de
significación de 0.025, ¿Las calificaciones y el género son variables independientes?

H o =Las calificaciones son independientes del género


H 1=Las calificaciones son dependientes del género
α =0.025
gl=( 2−1 )( 2−1 ) =1
x 2=5.024
P ( x 2<5.024|gl=6 ) =0.025
2.3094+ 31.0030=33.3124
x 2. Este valor calculado es mayor que el valor crítico, 5.024, así que se rechaza la hipótesis nula, y se
concluye que, efectivamente, las calificaciones son dependientes del género.

H o =El genero es independiente altipo de cerveza seleccionada


H 1=El genero es dependiente al tipo de cerveza seleccionada
α =0.05
gl=( 2−1 )( 3−1 )=2
x 2=5.991
P ( x 2<5.991|gl=2 ) =0.05
0.1326+ 0.1989=0.3314
x 2. Este valor calculado es menor que el valor crítico, 5.991, así que se acepta la hipótesis nula, y se
concluye que, efectivamente, el género es independiente al tipo de cerveza seleccionada.

H o =El nivel nutricional es independiente al desempeño academico


H 1=El nivel nutricional es dependiente al desempeño academico
α =0.005
gl=( 2−1 )( 3−1 )=2
x 2=10.597
P ( x 2<10.597|gl=2 )=0.005
17.2449+0.5357+16.6234=34.4040
x 2. Este valor calculado es mayor que el valor crítico, 10.597, así que se rechaza la hipótesis nula, y se
concluye que, efectivamente, el nivel nutricional es dependiente al desempeño académico.

28
11. Una agencia de publicidad hace un estudio de mercado y desea saber si la proporción de las
franquicias de comida rápida depende de si son de niños, jóvenes y adultos quienes lo consumen.
Pruebe la hipótesis con un nivel de significancia del 5%

H o =¿La proporción de las franquicias de comida rápida depende de la edad


H 1=¿ La proporción de las franquicias de comida rápida es independiente de la edad
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
( fo−fe )2
x 2= ∑ =54.6368+10.5405+11.8925=77.0068
fe

H o =¿La proporción de la preferencia de tomar jugo o soda depende de la edad del consumidor
H 1=¿ La proporción de la preferencia de tomar jugo o soda es independiente de la edad del consumidor
gl=( 2−1 )( 3−1 )=2
P ( 5.991; gl=2 )=0.05
2 ( fo−fe )2
x =∑ =28.3128+0.0080+18.3992=46.72
fe

H o =La puntualidad es independiente a lashrs que duermen los trabajadores


H 1=La puntuaidad es dependiente a las hrs que duermenlos trabajadores
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05
(fo−fe)2
x 2= ∑ =0.0293+3.2059+1.3943=4.6295
fe

H o =¿La proporción de los hábitos alimenticios es dependiente al peso de sus pacientes


H 1=¿ La proporción de los hábitos alimenticios es independiente al peso de sus pacientes
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05

29
(fo−fe)2
x 2= ∑ =0.1736+7.3472+1.1842=8.7050
fe

H o =¿El nivel socioeconómico depende de la marca de teléfono que la población elige


H 1=¿ El nivel socioeconómico depende de la marca de teléfono que la población elige
gl=( 2−1 )( 3−1 )=2
P ( x 2 9.210 ; gl=2 ) =0.01
(fo−fe)2
x 2= ∑ =10.5195+1.0101+10.6371=22.1667
fe
nivel socioeconómico depende de la marca de teléfono que la población elige.

H o =La preferencia del ¿ loslabiales es dependiente a la estacion del año


H 1=La preferenciadel ¿ loslabiales es independiente a laestacion delaño
gl=( 2−1 )( 3−1 )=2
P ( x 2 4.605 ; gl=2 ) =0.1
( fo−fe )2
x 2= ∑ =43.1876+ 2.5521+ 9.7547=55.4944
fe

H o =Laedad es independiente de la opinion de los ciudadanos sobre el tipo de seguridad social


H 1=La edad es dependiente de la opinionde losciudadanos sobre eltipo de seguridad social
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05
(fo−fe)2
x 2= ∑ =0.7856+0.4076+ 0.0056=1.1988
fe

H o =El estado civil es independiente de la edad


H 1=El estado civiles dependiente de la edad
gl=( 2−1 )( 3−1 )=2
P ( x 2 5.991 ; gl=2 )=0.05
(fo−fe)2
x 2= ∑ =16.3798+0.0447+ 8.9542=25.3778
fe

30
H o =El sistema operativo del ordenador depende de la profes ion
H 1=El sistema operativo del ordenador es independiente de la profesion
gl=( 2−1 )( 3−1 )=2
P ( x 2 9.210 ; gl=2 ) =0.01
(fo−fe)2
x 2= ∑ =19.2857+89.6296+ 31.2963=140.2116
fe
sistema operativo del ordenador es independiente de la profesión.

H o =El lugar de nacimiento depende de silas personas son zurdas o diestras


H 1=El lugar de nacimiento depende de silas personas son zurdas o diestras
gl=( 2−1 )( 3−1 )=2
P ( x 2 10.597 ; gl=2 )=0.005
( fo−fe)2
x 2= ∑ =4.8485+ 0+5.9259=10.7744
fe
lugar de nacimiento depende de si las personas son zurdas o diestras.
En las pruebas de bondad y ajuste que vimos anteriormente, se analizaba únicamente una
variable y un rasgo. Sin embargo, la prueba de ji cuadrada también se puede utilizar cuando se
analizan dos rasgos a la vez. En estos casos, se utiliza para saber si existe alguna relación entre
estos dos rasgos.
La prueba chi-cuadrado de contingencia sirve para comprobar la independencia de frecuencias
entre dos variables aleatorias, X e Y.

Las hipótesis contrastadas en la prueba son:

Hipótesis nula: X e Y son independientes.

Hipótesis alternativa: X e Y no son independientes (No importa cuál sea la relación que
mantengan ni el grado de esta.

La estadística de prueba adecuada es ji cuadrada que se designa por χ2

Para conocer las frecuencias observadas se utiliza la siguiente fórmula:

31
Ejercicios

1. El Centro de Readaptación Social (CERESO) de la ciudad de Tamaulipas, quiere investigar


si es diferente la readaptación a la vida civil de un hombre liberado de prisión, si regresa a
vivir en su lugar de origen, o si se va vivir a otro lado. Dicho de otra forma, ¿existe alguna
relación entre la readaptación a la vida civil y el lugar de residencia después de haber sido
liberado de prisión? Los psicólogos del CERESO de Tamaulipas entrevistaron a una
muestra aleatoria de 200 prisioneros ya liberados, y con base en los resultados,
clasificaron su readaptación como excelente, buena, regular e insatisfactoria. En la
siguiente tabla se muestran los resultados obtenidos para esta muestra.
H o =¿ No hay relación entre la readaptación a la vida civil y el lugar en donde vive el individuo después de haber sido
liberado de prisión.
H 1=¿ Hay relación entre la readaptación a la vida civil y el lugar en donde vive el individuo después de haber sido liberado
de prisión.
α =0.01

0.7509+1.0012+1.4464+1.9286+ 1.225+1.6333+0.4464+ 0.5952=9.0291


x 2=9.0291
gl=( 2−1 )( 4−1 ) =3
valor critico=x 2=11.345
Como el valor calculado, 9.0291 es menor al valor crítico, 11.345, se acepta la hipótesis nula y
se concluye que efectivamente, hay relación entre la readaptación a la vida civil y el lugar en
donde vive el individuo después de haber sido liberado de prisión.

H o =¿ Las opiniones de los votantes residentes del estado de California son independientes a sus niveles de ingreso.
H 1=¿ Las opiniones de los votantes residentes del estado de California son dependientes a sus niveles de ingreso
α =0.05
1.7831+2.6524+ 0.0458+ 0.0682+ 1.3381+1.9905=7.8782
32
x 2=7.8782
gl=( 2−1 )( 3−1 )=2
valor critico=x 2=7.815
Como el valor calculado, 7.8782 es mayor al valor crítico, 7.815, se rechaza la hipótesis nula y
se concluye que efectivamente, las opiniones de los votantes residentes del estado de
California son dependientes a sus niveles de ingreso.

H o =¿ La hipertensión es dependiente a los hábitos de fumar


H 1=¿ La hipertensión es independiente a los hábitos de fumar
α =0.05
4.5734 +4.2783+1.2147+ 1.1364+1.6847+1.5760=14.4636
x 2=14.4636
gl=( 2−1 )( 3−1 )=2
valor critico=x 2=5.991
Como el valor calculado, 14.4636 es mayor al valor crítico, 5.991, se rechaza la hipótesis nula
y se concluye que efectivamente, la hipertensión es independiente a los hábitos de fumar.

H o =¿ El tiempo que pasan viendo televisión es independiente del sexo del espectador
H 1=¿ El tiempo que pasan viendo televisión es dependiente del sexo del espectador
α =0.01
1.4911+1.4263+1.3047+1.2480=5.4702
x 2=5.4702
gl=( 2−1 )( 2−1 ) =1
valor critico=x 2=6.635
Como el valor calculado, 5.4702 es menor al valor crítico, 6.635, se acepta la hipótesis nula y
se concluye que efectivamente, el tiempo que pasan viendo la televisión es dependiente del
sexo del espectador.

5. Una muestra aleatoria de 200 hombres casados, todos jubilados, se clasifica de acuerdo
con la educación y número de hijos:

Con un nivel de significancia de del 0.05, pruebe la hipótesis de que el tamaño de la familia es
independiente del nivel académico del padre.
33
H o =¿ El tamaño de la familia es independiente del nivel académico del padre
H 1=¿ El tamaño de la familia es dependiente del nivel académico del padre
α =0.05
1.1703+0.1198 +1.1853+0.2024+0.5554 +0.1580+2.3065+1.5698+ 0.1969=7.6444
x 2=7.6444
gl=( 4−1 )( 3−1 )=6
valor critico=x 2=12.592
Como el valor calculado, 7.6444 es menor al valor crítico, 12.592, se acepta la hipótesis nula y
se concluye que efectivamente, que el tamaño de la familia es dependiente del nivel
académico del padre.

6. Un criminólogo realizo una investigación para determinar si, en una ciudad grande, la
incidencia de ciertos tipos de delitos varía de una parte a otra. Los crímenes específicos
de interés son asalto (con violencia), robo en casa, hurto y homicidio. La siguiente tabla
muestra el número de delitos cometidos en cuatro áreas de la ciudad durante el año
pasado.

H o =¿ La ocurrencia de estos tipos de delitos es dependiente del distrito de la ciudad


H 1=¿ La ocurrencia de estos tipos de delitos es independiente del distrito de la ciudad
α =0.01
3.1875+12.8824+ 3.7607+19.6589+0.4894+14.2987+ 9.6433+6.1292+1.7868+20.3707+7.3055+19.8656+1
x 2=124.5297
gl=( 4−1 )( 4−1 )=9
valor critico=x 2=21.666
Como el valor calculado, 124.5297 es mayor al valor crítico, 21.666, se rechaza la hipótesis
nula y se concluye que efectivamente, la ocurrencia de estos tipos de delitos es
independiente del distrito de la ciudad.

7. El hospital de la universidad realizo un experimento para determinar el grado de alivio


que brindan tres remedios para la tos. Cada medicamento para la tos se trata en 50
estudiantes y se registran los siguientes datos:

H o =¿ Los tres remedios para la tos son igualmente efectivos

34
H 1=¿ Los tres remedios para la tos no son igualmente efectivos
α =0.05
0+ 0.3103+ 0.9+0.3636+0.0345+ 0.10+0.3636+0.1379=3.81
x 2=3.81
gl=( 3−1 )( 3−1 )=4
valor critico=x 2=9.488
Como el valor calculado, 3.81 es menor al valor crítico, 9.4888, se acepta la hipótesis nula y se concluye que
efectivamente, los tres remedios para la tos no son igualmente efectivos.

H o =¿ Las proporciones de viudas y viudos son independientes a los años vividos


H 1=¿ Las proporciones de viudas y viudos son dependientes a los años vividos
α =0.05
1.5313+0.0244+ 8.1667+1.5313+0.0244+ 1.3333=12.6113
x 2=12.6113
gl=( 3−1 )( 2−1 )=2
valor critico=x 2=5.991
Como el valor calculado, 12.6113 es mayor al valor crítico, 5.991, se rechaza la hipótesis nula y se
concluye que efectivamente, las proporciones de viudas y viudos son dependientes a los años vividos.

H o =¿ La opinión de los votantes hacia los candidatos depende de la ciudad donde habitan
H 1=¿ La opinión de los votantes hacia los candidatos es independiente de la ciudad donde habitan
α =0.05
0.5140+0.2066+ 0.1975+0.5140+0.2066+ 0.1975=1.8362
x 2=1.8362
gl=( 3−1 )( 2−1 )=2
valor critico=x 2=5.991
Como el valor calculado, 1.8363 es menor al valor crítico, 5.991, se acepta la hipótesis nula y se
concluye que efectivamente, la opinión de los votantes hacia los candidatos depende de la ciudad
donde habitan.

10. Se lleva a cabo un estudio en Indiana, Kentucky y Ohio, para determinar la postura de los
votantes con respecto al transporte escolar. Una encuesta de 200 votantes cada uno de estos
estados los siguientes resultados:

35
H o =¿ La postura de los votantes es independiente de la ciudad donde habitan
H 1=¿ La postura de los votantes es dependiente de la ciudad donde habitan
α =0.025
1.5319+1.7979+0.0106+ 4.1013+2.1392+0.3165+1.3333+0+1.3333=12.5641
x 2=12.5641
gl=( 3−1 )( 3−1 )=4
valor critico=x 2=11.143
Como el valor calculado, 12.5641 es mayor al valor crítico, 11.143, se rechaza la hipótesis nula y se
concluye que efectivamente, la postura de los votantes es dependiente de la ciudad donde habitan.
Las pruebas de hipótesis estadísticas acerca de parámetros tales como μ σ 2 π . Existen otras
pruebas para determinar si una población tiene una distribución teórica específica. Esta
prueba se basa en que tan buen ajuste tenemos entre la frecuencia de ocurrencia de las
observaciones que se obtienen a partir de la distribución hipotética
Considere el lanzamiento de un dado; El dado se lanza 120 veces y se registra cada resultado,
teóricamente si el dado esta balanceado esperamos que cada cara ocurriera 20 veces.
Frecuenci 6
1 2 3 4 5
a
2 24
Observada 20 17 18 19
Al comparar las 2 frecuencias
observadas con 2 20 las frecuencias
Esperada 20 20 20 20
esperadas 0 correspondientes,
debemos decir que si es posible que tales discrepancias ocurran como resultado de
fluctuaciones del muestreo y de que el dado esta balanceado o que este no es legal, y que la
distribución de resultados no es uniforme.
2
k
( f oi−f ei )
X =∑
i=1 f ei

El número de grados de libertad que se asocia con la distribución chi-cuadrada que se utiliza
aquí; hay sólo k-1 frecuencias de celdas libremente determinadas.

Si en las frecuencias observadas están cerca de las frecuencias esperadas correspondientes


del valor chi-cuadrada, será pequeño lo cual indica un buen ajuste. Si las frecuencias
esperadas observadas difieren de manera considerable de las frecuencias esperadas, el valor
chi-cuadrada tendrá un ajuste deficiente. Un buen ajuste conduce a la aceptación de la
hipótesis nula mientras que un ajuste deficiente conduce a su rechazo.

La región critica en la cola derecha de la distribución chi-cuadrada para un nivel de


significancia igual a ∝
X 2 > X 2∝ Región Crítica

36
El criterio de decisión que aquí se describe no se deberá utilizar, a menos que cada una de las
frecuencias esperadas sea al menos igual a 5. Esta restricción podría requerir la combinación
de celdas adyacentes lo que tiene como resultados una reducción en el número de grados de
libertad.
2 ( 20−20 )2 ( 22−20 )2 ( 17−20 )2 (18−20 )2 ( 19−20 )2 ( 24−20 )2
X = + + + + +
20 20 20 20 20 20
2 34 17
X = = =1.7
20 10
gl=5

Ejercicios
1. Probemos la hipótesis de que la distribución de frecuencias de las duraciones de baterías
puede aproximarse mediante una distribución normal con μ=3.5 y una desviación
estándar de 0.7.

( f −fe )2 ( 7−8.582 )2 ( 15−10.176 )2 ( 8−9.672 )2


X 2 =∑ = + +
fe 8.582 10.176 9.672
X 2 =2.8911
P ( X 2 >7.815 , 3 )=0.05

Como el valor chi calculado es menor que nuestra región critica, no tenemos razón para rechazar la
hipótesis nula y concluimos que la distribución normal con μ=3.5 y σ =0.7 brindan un buen ajuste
para la distribución de duraciones de las baterías.

2. En cierta máquina expendedora de refrescos existen 4 canales que expiden el mismo tipo
de bebida. Estamos interesados en averiguar si la selección de cualquiera de estos canales
se hace de forma aleatoria o por el contrario existe algún tipo de preferencia en la
selección de alguno de ellos por los consumidores. La siguiente tabla muestra el número
de bebidas vendidas en cada uno de los 4 canales durante una semana. Contrastar la
hipótesis de que los canales son seleccionados al azar a un nivel de significación del 5%.

37
70
fe= =17.5
4

( f −fe )2 ( 13−17.5 )2 ( 22−17.5 )2 (18−17.5 )2 ( 17−17.5 )2


X 2 =∑ = + + +
fe 17.5 17.5 17.5 17.5
2
X =2.3428
gl=( 4−1 )=3
X 2 0.05=7.815
P ( X 2 <7.815∨gl =3 )=0.05
Puesto que el valor del estadístico de prueba, 2.3438 es menor que el valor crítico, 7.815, se acepta la
hipótesis nula de que los datos se ajustan a una distribución uniforme. Es decir los canales son
seleccionados aleatoriamente por los consumidores .

pruebas de hipótesis con dos muestras y varias muestras con datos categóricos tienen
aplicaciones de gran importancia, como la ocurrencia de dos eventos, en la cual se desea
observar si son dependientes o independientes. La distribución chi cuadrada sirve para todas
las inferencias sobre la varianza de una población. Existen muchos problemas para los cuales
los datos son categorizados y los resultados expuestos en forma de conteos o cuentas, se
pueden aplicar en un conjunto de calificaciones de un examen final puede ser representado
con una distribución de frecuencias.
 Díaz Mata, A. (2013). Estadística Aplicada a la Administración y la Economía. México,
D.F: The McGraw Hill.
 J. Kazmier, L. (2003). Estadística Aplicada a la Administración y a la Economía (3rd ed.,
pp. 133-1661). México, D.F: McGraw-Hill

38

También podría gustarte