Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad Vi Tema 2 Pruebas de Proporciones
Unidad Vi Tema 2 Pruebas de Proporciones
Prueba de independencia
Ejemplo 2.1
*
Ver Vol. 1, Introducción a los métodos estadísticos, SEAD, UPN, México, 1981
Ahora bien, cada uno de los valores de estas variables define un
evento. Entonces parece natural decir que si las dos variables son
independientes, cada uno de los eventos definidos por una variable es
independiente de cada uno de los eventos definidos por la otra variable. Así
por ejemplo, si la calificación es independiente del nivel socioeconómico,
esperamos que sean independientes los eventos:
*
Ver tema 2, Unidad III, Vol. 1 Introducción a los métodos estadísticos, SEAD, UPN, México,
1981.
Y, con respecto a la calificación:
41 23
Ρ(b) = Ρ(ΝΑ) =
115 115
45 38
Ρ(m) = Ρ(S ) =
115 115
29 34
Ρ( a) = Ρ(Β) =
115 115
20
Ρ(ΜΒ ) =
115
Calificación
Nivel
NA S B MB Total
socioeconómico
Bajo 9 15 10 7 41
Medio 11 12 14 8 45
Alto 3 11 10 5 29
Total 23 38 34 20 115
Una tabla de este tipo recibe el nombre de tabla de contingencia.
Con base en ella podemos estimar todas las probabilidades que nos
interesen con respecto a las combinaciones de valores de las dos variables.
Es claro que los números 9/41, 11/45 y 3/29 son distintos y que
difieren de 23/115, que es la estimación de la probabilidad de que un alumno
cualquiera tenga NA. ¿Puede decirse entonces que el hecho de que un
alumno tenga NA no es independiente de su nivel socioeconómico? Esta
misma pregunta puede surgir con respecto a los demás valores de
calificación: por ser 15/41, 12/45 y 11/29 distintos de 38/115, ¿se puede decir
que el hecho de que un alumno tenga S no es independiente de su nivel
socioeconómico?; por ser 10/41, 14/45 y 10/29 distintos de 38/115, ¿se
puede decir que el hecho de que un alumno tenga B no es independiente de
su nivel socioeconómico?; por ser 7/41, 8/45 y 5/29 distintos de 20/115. ¿Se
puede decir que el hecho de que un alumno tenga MB no es independiente
de su nivel socioeconómico?
*
Aquí no damos Η 0 y Η 1 en forma simbólica, ya que resultaría muy complicado
En adelante simplemente escribiremos
Η 0 : hay independencia
Η 1 : no hay independencia
23 38 34 20
Medio 115 45 115 45 115 45 115 45 45
23 38 34 20
Alto 115 29 115 29 115 29 115 29 29
Total 23 38 34 20 115
Calificación
Nivel
NA S B MB Total
socioeconómico
(23)(41) (38)(41) (34)(41) (20 )(41)
Bajo 41
115 115 115 115
(23)(45) (38)(45) (34)(45) (20 )(45)
Medio 45
115 115 115 115
(23)(29) (38)(29 ) (34)(29) (20 )(29 )
Alto 29
115 115 115 115
Total 23 38 34 20 115
Calificación
NA S B observadas MB Total
observadas
observadas
observadas
esperadas
esperadas
esperadas
Nivel esperadas
socio-
económico
Total 23 38 34 20 115
k
(oi − ei )2
∑i =1 ei
k
(oi − ei )2
En cada muestra, el número ∑
ei
i =1
es tanto mayor mientras más
g.l.=2
g.l.=3
g.l.=4
g.l.=5
g.l.=6
x2
0
Fig. 2.1
**
Esta tabla se incluye también al final del volumen (tabla D)
Valores de x 2 para algunas probabilidades
TABLA 2.1
Supongamos que desea encontrar el valor de x 2 que corresponde a
24 grados de libertad para α = .025 . Para ello, consultamos la tabla como la
de “t-Student”: localizamos el valor .025 en el primer renglón y el valor 24 en
la primera columna; el número buscado será el valor del vigésimo cuarto
renglón que está debajo de .025; esto es, x 2 ( 24) = 39.364 . Esto en símbolos
puede interpretarse así:
( )
Ρ x 2 > 39.364 = .025 (ver la figura 2.2*):
α = .025
x 2 ( 24)
0
Fig. 2.2 39.364
a) x 2 ( 24 ) = .10
d) x 2 ( 6) = .05
*
En adelante representaremos todas las distribuciones “ji-cuadrada” con el contorno que
tiene la figura 2.2, independientemente de sus grados de libertad. Esto es, las
representaciones gráficas de las distribuciones “ji-cuadrada” ilustran las áreas señaladas
pero no el contorno exacto de cada distribución
Regresemos ahora a nuestro problema. Queríamos someter a prueba
la hipótesis de que las variables nivel socioeconómico y calificación no son
independientes. Para ello, calculamos ya las frecuencias que se esperarían
en una muestra que reflejara exactamente a la población y bajo el supuesto
de que la hipótesis nula de independencia es cierta. Vimos también que
podremos medir el grado de discrepancia entre las k frecuencias observadas
(oi ) y las k frecuencias esperadas (ei ) mediante la expresión
k
(oi − ei )2
∑
i =1 ei
1) Planteamiento de hipótesis
* 2
para el uso de x c cómo estadístico de prueba se requieren ciertas condiciones que se
enunciarán más adelante y que se cumplen en nuestro problema.
Η inv : la calificación y el nivel socioeconómico de los alumnos no son
independientes.
Η 0 : Hay independencia
Η 1 : No hay independencia
k
(oi − ei )2
x 2
c =∑
i =1 ei
3) Regla de decisión
α = .025
x 2 (6)
0
12.592
Fig. 2.3
4) Cálculos
12
(oi − ei )2 (9 − 8.2000 )
2
(5 − 5.0435)
2
x 2
c =∑ = + ... + =
i =1 ei 8.200 5.0435
.6400 .0019
= + ... + = 3.445
.8200 5.0435
5) Decisión estadística
k
(oi − ei )2
x 2
c =∑
i =1 ei
Ejemplo 2.2
k
(oi − ei )2
x 2
c =∑
i =1 ei
3) Regla de decisión
α = .05
x 2 ( 4)
0
9.488
Fig. 2.4
4) Cálculos
observadas
observadas
observadas
Esperadas
esperadas
esperadas
de
Total
atención
9
(oi − ei ) (7 − 17.08)2 (31 − 14.31)
2
x 2
c =∑ = + ... + = 65.076
i =1 ei 17.08 14.31
5) Decisión estadística
Η 0 : Hay independencia
2
1
n sv − tu − n
x 2c = 2
(s + t )(u + v )(s + u )(t + v )
Donde n, s, v, t y u son valores que se encuentran en la tabla de
contingencia como sigue:
s t s s+t
Segunda
Variable
u v u+v
Total s+u t +v n
x 2 (1)3 ∞ >
Donde x 2 (1) es el valor en la tabla de la distribución “ji-cuadrada” con α en
una cola y un grado de libertad.
Ejemplo 2.3
Se cree que en una ciudad, las familias con alto ingreso generalmente
envían a sus hijos a escuelas particulares en tanto que las familias de bajo
ingreso los envían a escuelas oficiales. Con objeto de someter a prueba esta
hipótesis, se escogen 150 familias al azar y se obtienen los siguientes datos.
Η 0 : Hay independencia
Η 1 : No hay independencia
2
1
n sv − tu − n
x 2c = 2
(s + t )(u + v )(s + u )(t + v )
que bajo el supuesto de que Η 0 es cierta, tiene una distribución “ji-
cuadrada” con un grado de libertad.
La condición para el uso de x 2 c como estadístico de prueba es que
todas las frecuencias esperadas sean mayores que 5. Observe que aquí
la menor frecuencia esperada es
(51)(46 ) > 5 , por lo que la condición se
150
cumple.
Regla de decisión
α = .01
x 2 (1)
0
6.635
Fig. 2.5
4) Cálculos
*
Recuerde que las figuras de las distribuciones “i-cuadrada” no representan con exactitud el contorno
de cada distribución (ver las figuras 2.1 y 2.2), pero si el área señalada.
2
1
2
1
n sv − tu − n 150 (13)(8) − (91)(38) − (150)
x2c = 2
= 2 =
(s + t )(u + v )(s + u )(t + v ) (13 + 91)(38 + 8)(13 + 38)(91 + 8)
=
[
150 − 3354 − 75
=
] 150[3279]
2
2
= 66.769
(104)(46)(51)(99) (104)(46)(51)(99)
5) Decisión estadística
Calificación
Nivel promedio 6 7 8 9 10
socioeconómico
Bajo 20 54 68 26 7
Medio 11 31 62 46 9
Alto 7 16 26 12 5
*
Ver Vol. 1, Introducción a los métodos estadísticos, SEAD, UPN, México , 1981.
2.3 Un sociólogo que hace una investigación en un sector escolar toma una
muestra representativa de 300 padres de familia, y los clasifica según
dos criterios; el ingreso familiar y el grado de participación en las
actividades de la escuela a la que asisten sus hijos. La tabla siguiente
concentra los datos.
Ocasional 31 51 15 97
Sistemática 24 74 4 102
¿Sé puede decir que el ingreso familiar tiene relación con el grado de
participación de los padres en las actividades escolares? Pruebe la hipótesis
correspondiente utilizando un nivel de significancia del 1%.
2.4 Un psicólogo sostiene que en los adolescentes hay una relación muy
estrecha entre sus promedios de calificación y la opinión que tienen de
sí mismos; para someter a prueba su hipótesis toma una muestra de
210 alumnos y los clasifica según estos dos criterios con los datos que
aparecen la siguiente tabla:
Buena 77 28 105
Mala 42 63 105
a) para α = .05
b) para α = .01
Prueba de homogeneidad
Ejemplo 2.4
Profesionista 40 11 7 58
Comerciante 36 8 11 55
Campesino 35 15 13 63
k
(oi − ei )2
x 2c = ∑
i =1 ei
Η 0 : Hay homogeneidad
Η 1 : No hay homogeneidad
k
(oi − ei )2
x 2c = ∑
i =1 ei
3) Regla de decisión
α = .05
x 2 ( 4)
0
9.488
Fig. 2.6
4) Cálculos
observadas
observadas
observadas
esperadas
esperadas
esperadas
Ocupación
Observa que todas las frecuencias esperadas son mayores que 5; por
lo tanto, se cumplen las condiciones para utilizar el estadístico x 2 c .
9
(oi − ei )2 (40 − 36.5795) 2 + ... + (13 − 11.0966 ) 2 = 3.76
x 2c = ∑ =
i =1 ei 36.5797 11.0966
5) Decisión estadística
Η 0 : Hay homogeneidad
Entonces un estadístico de prueba es:
i =1 ei
Donde las oi son los k frecuencias observadas y las ei son las k
frecuencias esperadas. Para usar este estadístico se requiere que ei > 5
Por lo menos en el 80% de los casos y que ei > 1 en todos los casos.
Alumnos de la Alumnos de la
Total
escuela A escuela B
Trabajan 65 112 177
No trabajan 35 38 73
Total 100 150 250
Η 0 : Hay homogeneidad
Η 1 : No hay homogeneidad
3) Regla de decisión
α = .05
x 2 (1)
0
3.841
Fig. 2.7
4) Cálculos
2
1
2
250
n sv − tu − n 250 (65)(38) − (35)(112) −
x 2c = 2
= 2
= 2.265
(s + t )(u + v )(s + u )(t + v ) (65 + 35)(112 + 38)(65 + 112)(35 + 38)
5) Decisión estadística
Mínimo
Matrimonios Matrimonios Matrimonios
grado de
ACTIVIDADES en el estado en el estado en el estado Total
escolaridad
A B C
DE deseado
ESTUDIO
Primaria 48 45 38 131
Secundaria 48 30 74 152
Profesional 144 125 208 477
Total 240 200 320 760
Condición Carrera
física Medicina Leyes Ingeniería Filosofía
Alta 14 15 17 13
Media 20 19 21 22
Baja 16 16 12 15
Total 50 50 50 50
Escuelas de
Apoyo de la Escuelas
organización Total
S.S.A. unitarias
completa
Satisfactorio 42 57 99
No satisfactorio 38 23 61
Total 80 80 160
Diestros Zurdos
No resuelven el problema 41 22
Resuelven el problema 73 58
¿Puede afirmarse que la asistencia a algún jardín de niños tiene relación con
la coordinación motora? (use α = .01 ).
2.11 Una universidad patrocina un programa dominical de radio. Para saber
si las opiniones de los estudiantes de cuatro licenciaturas difieren
respecto del programa, se toma una muestra representativa de 100
estudiantes de cada licenciatura y se les clasifica según su opinión
acerca del programa de radio. Su resultado se muestra en la tabla
correspondiente:
Opinión
Licenciatura
Favorable Desfavorable Total
A 60 40 100
B 65 35 100
C 71 29 100
D 77 23 100
¿Se puede decir, con α = .05 , que la opinión que del programa tienen los
alumnos es diferente en cada licenciatura?
2.12 Se puede demostrar que en el caso de una tabla de contingencia de
2x2. la prueba de homogeneidad es equivalente a la prueba de
comparación de proporciones (con Η 0 : ρ1 − ρ 2 = 0 ) estudiada en el
tema anterior. Para verificar esto, use la prueba de comparación de
proporciones para probar, con los datos de la actividad de estudio 2.7,
la hipótesis de que en el estado considerado las escuelas unitarias
reciben apoyo satisfactorio de la S.S.A. en distinta proporción que las
escuelas de organización completa,
a) con α = .05
b) con α = .01
c) Compare sus conclusiones con las obtenidas en la actividad 2.7; ¿qué
observa?
GUIA DE AUTOEVALUACIÓN
*
Recuerde que la moda es la categoría de mayor frecuencia. Ver el tema 3 de la Unidad II,
Vo.. 1 de Introducción a los métodos estadísticos, SEAD, UPN, México, 1981.
3. Se tomó una muestra aleatoria de 30 adolescentes que practican con
asiduidad algún deporte, una muestra aleatoria de 45 adolescentes que
practican esporádicamente algún deporte, y una muestra aleatoria de 25
adolescentes que no practican ningún deporte. Todos los adolescentes
fueron clasificados mediante una prueba en tres niveles según su
agresividad. Los resultados se muestran en la siguiente tabla.
Adolescentes
Adolescentes
que practican Adolescentes
que no
Nivel de con que practican
practican Total
agresividad asiduidad esporádicamente
ningún
algún algún deporte
deporte
deporte
Bajo 17 15 5 37
Medio 9 17 6 32
Alto 4 13 14 31
Total 30 45 25 100
Con un nivel de significancia de 1%. ¿Se puede decir que los niveles de
agresividad difieren en las tres poblaciones de adolescentes?