Está en la página 1de 17

TEMA 1

COMPARACIÓN DE DOS PROPORCIONES

Cuando se trabaja con una variable categórica, suele suceder que se


esté interesado en saber si un mismo valor de la variable ocurre con igual
proporción en dos poblaciones distintas. En este tema veremos un método
estadístico que permite comparar dos proporciones poblacionales.

Introduciremos este tema mediante la presentación de algunos


ejemplos.

Ejemplo 1.1.

En una pequeña ciudad, la calle principal es un tramo de una


importante carretera, razón por la cual las personas con domicilio en dicha
calle se encuentran sometidas al ruido que producen los vehículos pesados
cuando pasan por ahí. Un profesor de la ciudad cree que la contaminación
por ruido afecta el rendimiento escolar de los alumnos que viven en la calle
principal. Para ver si esto puede ser cierto, decide medir el rendimiento
escolar mediante el índice de aprobación; su hipótesis es que la proporción
de aprobados es menor en la población de alumnos que viven en la calle
principal que en la población de alumnos que no viven en ella. Como no
puede estudiar a todos los alumnos de ambas poblaciones, puesto que
serían todos los estudiantes de la ciudad, el profesor toma una muestra
representativa de la población de alumnos con domicilio en la calle principal y
otra de la población de alumnos que no viven en ella: a partir de la
información contenida en ambas muestras, sedea inferir si su hipótesis
acerca de las proporciones poblacionales está cercana a la realidad (puede
considerarse válida) o bien está alejada de la realidad (no es válida).

Ejemplo 1.2

Al realizar una investigación sobre la posible influencia de la


drogadicción en la delincuencia juvenil, una trabajadora social está
interesada en comparar la proporción de jóvenes fármaco-dependientes que
cometen actos delictivos con la proporción de jóvenes no fármaco-
dependientes que cometen dichos actos, ya que supone que la primera es
mayor. La trabajadora social toma muestras representativas de ambas
poblaciones y obtiene las proporciones muestrales correspondientes para
hacer la inferencia deseada.
En cada uno de los ejemplos anteriores se plantea una situación en
la que se desea comparar dos proporciones poblacionales, conociendo sólo
sus respectivas estimaciones. Es decir, se desea ver si se puede considerar
que dos proporciones poblacionales son distintas, a partir del conocimiento
que se tenga de las respectivas proporciones muestrales.

Es importante observar que este problema difiere del que se


presentó en el tema 4 de la unidad V. ahí habíamos visto el caso en que se
compara una proporción poblacional, ρ , que no se conoce con una
proporción, ρ 0 , que se conoce o que se supone dada ( Η 0 : ρ = ρ 0 ). Lo que
veremos ahora es cómo comparar dos proporciones poblacionales estimando
ambas con los datos de dos muestras.

A continuación veremos cómo se hace esta comparación, mediante


el análisis de otro ejemplo.

Ejemplo 1.3

Supongamos que cierta institución de crédito rural está en posibilidad


de financiar un “Plan Intensivo de Desarrollo Comunal” en dos regiones, A y
B, que tienen características similares. El encargado de promover el plan
considera que el grado de aceptación es diferente en cada región. Como esto
influiría necesariamente en los planes de promoción, el promotor desea
averiguar si efectivamente hay distinto grado de aceptación en ambas
regiones. Sin embargo, no puede conocer la opinión de todos los habitantes
de cada región, por lo que entrevista a algunos habitantes de cada una,
elegidos aleatoriamente, y obtiene los resultados que se muestran en la
siguiente tabla:

Número de Número de
Región entrevistados que están entrevistados que están Total
a favor del plan en contra del plan
A 75 40 115

B 66 31 97

¿Puede concluir el promotor que efectivamente hay diferencia entre


la proporción de habitantes que están a favor del plan en la región A y la
proporción de habitantes que están a favor del plan en la región B?
Antes de ver cómo se puede contestar esta pregunta, hagamos
algunas observaciones. Tenemos una variable categórica, que podemos
llama opinión y cuyos valores (categorías) son “a favor” y “en contra”.
Estamos considerando dos poblaciones, que son la constituida por los datos
referentes a todos los habitantes de la región A y la constituida por los datos
de todos los habitantes de la región B. La hipótesis de investigación es que la
proporción de habitantes a favor del plan en una región es diferente de la
proporción de habitantes a favor en la otra región; entonces, si llamamos ρ1
a la proporción de habitantes que están a favor del plan en la región A, y ρ 2
a la proporción de habitantes que están a favor del plan en la región B,
tenemos que la hipótesis de investigación es:

Η inv : ρ1 ≠ ρ 2

Y por lo tanto las hipótesis estadísticas generadas son las siguientes:


la hipótesis nula, que contradice a Η inv , es:
Η 0 : ρ1 = ρ 2
Y la hipótesis alternativa es:
Η1 : ρ1 ≠ ρ 2

Como no se puede entrevistar a todos los habitantes de ambas


regiones, aprovecharemos la información obtenida en las dos muestras para
hacer una comparación de las proporciones poblacionales a partir de las
∧ ∧
proporciones muestrales ρ 1 = 75/115 y ρ 2 = 66/97

Para hacer esta inferencia, veremos, como en los casos anteriores, si


la información contenida las muestras aporta evidencia en contra de la
hipótesis nula.

∧ ∧
Por otra parte, sabemos que tanto ρ 1 como ρ 2 están sujetas a una
variación muestral *. Por ello, aun en el caso de que las proporciones
poblacionales sean iguales, es decir, que Η 0 sea cierta no es de esperarse
∧ ∧
que las proporciones muestrales ρ 1 y ρ 2 , que se obtienen al tomar una
muestra de cada población, también sean iguales. Necesitamos, pues, un
∧ ∧
estadístico de prueba que nos indique si la diferencia entre ρ 1 y ρ 2 puede
ser considerada lo suficiente “grande” como para rechazar Η 0 .

*
Ver el tema 4 de Unidad IV.
Recordemos ahora que en el último tema de la unidad anterior, cuando
queríamos encontrar un estadístico de prueba para la hipótesis nula
Η 0 : ρ = ρ 0 , utilizamos nuestro conocimiento de la distribución muestral de

ρ , el estimador del parámetro bajo prueba. Así, como sabíamos que, si n es

ρ −ρ
grande, la distribución de es la normal estándar, pudimos saber
ρ (1 − ρ ) / n

ρ − ρ0
que la distribución de también es la normal estándar bajo el
ρ 0 (1 − ρ 0 ) / n
supuesto de que Η 0 es cierta, por lo que usamos esta última expresión como
estadístico de prueba.

De la misma manera se puede llegar a un estadístico de prueba para


la hipótesis nula Η 0 : ρ1 = ρ 2 , que es equivalente a Η 0 : ρ1 − ρ 2 = 0 . Para ello,
∧ ∧
se utiliza la distribución muestral de ρ 1 - ρ 2 (que es la diferencia de las
proporciones muestrales), cuando los tamaños de muestra n1 y n2 son
grandes, es decir cuando se cumplen las relaciones

∧ ∧
n1 ρ 1 > 5 , n1 (1 − ρ 1 ) > 5

∧ ∧
n2 ρ 2 > 5 y n2 (1 − ρ 2 ) > 5

Observe que estas relaciones de cumplen en nuestro ejemplo,


puesto que, si n1 es el tamaño de la muestra tomada en la región a y n2 el de
la muestra de la región B, tenemos:

 75  ∧
 40 
n1 ρ 1 = 115  = 75 > 5 , n1 (1 − ρ 1 ) = 115  = 40 > 5
 115   115 


 66  ∧
 31 
n2 ρ 2 = 97  = 66 > 5 y n2 (1 − ρ 2 ) = 97  = 31 > 5
 97   97 

Ahora bien, si la hipótesis nula es cierta, entonces ρ1 = ρ 2 , por lo que


∧ ∧
tanto ρ 1 = 75 / 115 como ρ 2 = 66 / 97 serían estimadores de una misma
proporción. Podríamos entonces obtener un solo estimador de esta
proporción con todos los datos, dividiendo el total de entrevistados que están
a favor del plan (75 + 66) entre el total de entrevistados (115 + 97). A esta
estimación la llamaremos estimación mancomunada de la proporción

poblacional común y la denotaremos con ρ . Observe que
∧ ∧
n ρ +n ρ 75 + 66 141
ρ= 1 1 2 2 = =
n1 + n2 115 + 97 212

∧ ∧ ∧
Es claro que ρ , como ρ 1 y ρ 2 , esta sujeta a una variación muestral.
∧ ∧
ρ1− ρ 2
Además se puede saber que, si Η 0 es verdadera, tiene
∧ ∧ ∧ ∧
ρ (1 − ρ ) ρ (1 − ρ )
+
n1 n2
una distribución normal estándar. Este será nuestro estadístico de prueba, y
denotaremos con z c el valor de toma con las muestras obtenidas. Entonces:

∧ ∧
ρ1 − ρ 2
zc =
∧ ∧ ∧ ∧
ρ (1 − ρ ) ρ (1 − ρ )
+
n1 n2

Observe que el estadístico de la prueba de hipótesis de una



ρ − ρ0
proporción, , y el de la prueba de hipótesis de una diferencia
ρ 0 (1 − ρ 0 ) / n
∧ ∧
ρ1 − ρ 2
de proporciones, , son muy parecidos*. La diferencia
∧ ∧ ∧ ∧
ρ (1 − ρ ) ρ (1 − ρ )
+
n1 n2
estriba en que4 el primero contrasta la hipótesis Η 0 : ρ = ρ 0 , en la que ρ 0 es
un número conocido de antemano, y el segundo contrasta la hipótesis
Η 0 : ρ1 = ρ 2 , en donde no conocemos ni ρ1 ni ρ 2 .

A continuación procederemos a realizar la prueba de hipótesis


correspondiente al ejemplo 1.3, siguiendo los pasos establecidos en el tema
2 de la unidad V.

*
Hemos usado el símbolo ( z c ) para denotar a los dos, pero no deben confundirse.
1) Planteamiento de la hipótesis
La hipótesis de investigación del promotor es que hay una diferencia entre la
proporción poblacional de habitantes a favor del plan en la región A y la
proporción de habitantes a favor del plan en la región B. Entonces, si
llamamos ρ1 , a la proporción de habitantes a favor en la región A y ρ 2 a la
proporción de habitantes a favor en la región B, tenemos

Η inv : ρ1 ≠ ρ 2

y las hipótesis estadísticas se pueden escribir así:

Η 0 : ρ1 − ρ 2 = 0
Η1 : ρ1 − ρ 2 ≠ 0

2) Estadístico de prueba y condiciones de uso

El estadístico de prueba que usaremos es:

∧ ∧
ρ1 − ρ 2
zc =
∧ ∧ ∧ ∧
ρ (1 − ρ ) ρ (1 − ρ )
+
n1 n2

Donde ρ , la estimación mancomunada de la proporción poblacional es:
∧ ∧
n ρ +n ρ
ρ= 1 1 2 2
n1 + n 2
La distribución de este estadístico es la normal estándar, bajo el supuesto de
que Η 0 es verdadera.
La condición para usar este estadístico de prueba es que n1 y n2 sean
grandes. Esto se cumple en este caso, puesto que, como lo vimos
anteriormente, tenemos que
∧ ∧
n1 ρ 1 > 5 , n1 (1 − ρ )1 > 5
∧ ∧
n2 ρ 2 > 5 y n2 (1 − ρ ) 2 > 5

3) Regla de decisión
Utilicemos α = .05 en esta prueba. Como la hipótesis alternativa es
Η 1 : ρ1 − ρ 2 ≠ 0 , tendremos α en dos colas. El valor en la tabla de la
distribución normal estándar con α = .05 en dos colas es z = 1.96 .
A partir de este valor se definen las regiones de rechazo y no rechazo de
Η 0 , como sigue (ver la figura 1.1):

no se rechaza Η 0 si z c ∈< −1.96, 1.96 >


se rechaza Η 0 si z c ∈< −∞, − 1.96] Υ [ 1.96, ∞ >

α = .05

Z
-1.96 0 1.96

Región de rechazo de Η 0 Región de no rechazo de Η 0 Región de rechazo de Η 0

Fig. 1.1

4) Cálculos

∧ 75 ∧ 66
Como n1 = 115 , ρ 1 = , n2 = 97 y ρ 2 = , tenemos:
115 97

∧ ∧
n ρ +n ρ 75 + 66 141
ρ= 1 1 2 2 = = = .665
n1 + n2 115 + 97 212

∧ 75 ∧ 66
además, ρ 1 = = .6522 y ρ 2 = = .6804 , por lo que tenemos:
115 97
∧ ∧
ρ1 − ρ 2 .6522 − .6804 − .0282
zc = = = = −.4351
∧ ∧ ∧ ∧
.665(1 − .665) .665(1 − .665) .0019 + .0023
ρ (1 − ρ ) ρ (1 − ρ ) +
+ 115 97
n1 n2

5) Decisión estadística

Como .4351 ∈< −1.96,1.96 > , no se rechaza Η 0

6) Interpretación de los resultados

No hay evidencia suficiente para afirmar, con una confianza de 95%,


que las proporciones de habitantes a favor del plan de desarrollo en cada
una de las dos regiones sean diferentes.

Hemos analizado el procedimiento de prueba a partir de un ejemplo, lo


que nos permite ahora generalizar los aspectos más relevantes del
procedimiento de prueba.
Si ρ1 es la proporción con la que ocurre cierta categoría de una variable
categórica en una población y ρ 2 es la proporción con la que ocurre la
misma categoría en otra población y si se tiene una de las siguientes
hipótesis nulas:

Η 0 : ρ1 − ρ 2 = 0 Η 0 : ρ1 − ρ 2 ≤ 0 Η 0 : ρ1 − ρ 2 ≥ 0

entonces un estadístico de prueba es:

∧ ∧
ρ1 − ρ 2
zc =
∧ ∧ ∧ ∧
ρ (1 − ρ ) ρ (1 − ρ )
+
n1 n2

donde
∧ ∧
n ρ +n ρ
ρ= 1 1 2 2
n1 + n 2

Y ρ1 , ρ 2 son las proporciones con la que ocurre la categoría en muestras



representativas de tamaño n1 y n2 de las poblaciones. Si n1 ρ 1 > 5 ,
∧ ∧ ∧
n1 (1 − ρ )1 > 5 , n2 ρ 2 > 5 y n2 (1 − ρ ) 2 > 5 , y si Η 0 es cierta, la distribución de
z c es la normal estándar.
Para una α determinada, la regla de decisión se plantea de acuerdo a la
siguiente tabla:

Región de rechazo z es el valor de Z con


Forma de Η 1
de Η 0 α en

Η1 : ρ1 − ρ 2 ≠ 0 < −∞,− z ] Υ [ z , ∞ > dos colas

Η1 : ρ1 − ρ 2 > 0 [z, ∞ > una cola

Η1 : ρ1 − ρ 2 < 0 < −∞,− z ] una cola


Apliquemos este método en otro ejemplo:

Ejemplo 1.4

Un pedagogo supone que si el maestro hace énfasis en actividades


dirigidas a ejercitar la lectura de comprensión en el sexto grado de la escuela
primaria, los alumnos de este grado tendrían mayor facilidad en aprobar el
examen de admisión de la escuela secundaria. Para verificar esto toma una
muestra representativa de 80 alumnos que presentaron examen de admisión
en secundaria cuyos maestros de sexto grado hicieron énfasis en ejercitar la
lectura de comprensión. Así mismo, toma una muestra representativa de 102
alumnos que presentaron examen de admisión en secundaria y cuyos
maestros del sexto grado de primaria no hicieron énfasis en la lectura de
comprensión.

Del primer grupo, el 72.5% aprueban el examen de admisión, y de los


otros, el 58.8%. ¿Dispone el pedagogo de evidencia suficiente para
comprobar su suposición?

Procedemos a hacer la prueba de hipótesis:

1) Planteamiento de las hipótesis:

La hipótesis de investigación es que la proporción de aprobados en


el examen de admisión es mayor entre los alumnos cuyos maestros
hicieron énfasis en la lectura de comprensión que entre los alumnos
cuyos maestros no lo hicieron. Si llamamos ρ1 a la proporción de
alumnos que aprueban el examen en la población de alumnos que sí
ejercitaron la lectura de comprensión, y ρ 2 a la proporción de alumnos
que aprueban el examen en la población de alumnos que no ejercitaron la
lectura de comprensión, tendremos la hipótesis de investigación:

Η inv : ρ1 > ρ 2 ,
que se puede expresar como

Η inv : ρ1 − ρ 2 > 0

en consecuencia, las hipótesis estadísticas son:

Η 0 : ρ1 − ρ 2 ≤ 0
Η1 : ρ1 − ρ 2 > 0
2) Estadístico de prueba y condiciones para su uso

El estadístico de prueba que usaremos es:

∧ ∧ ∧ ∧
ρ1 − ρ 2 n ρ +n ρ
zc = donde ρ= 1 1 2 2
∧ ∧ ∧ ∧ n1 + n 2
ρ (1 − ρ ) ρ (1 − ρ )
+
n1 n2

La distribución de este estadístico, bajo el supuesto de que Η 0 es


cierta, es la normal estándar.

La condición para usar este estadístico de prueba es que n1 y n2


sean grandes. En nuestro caso, como n1 = 80 , ρ1 = .725 , n2 = 102 y
ρ 2 = .588 , tenemos:

n1 ρ1 = (80)(.725) > 5 , n1 (1 − ρ1 ) = (80)(.275) > 5


n2 ρ 2 = (102)(.588) > 5 , n2 (1 − ρ 2 ) = (102)(.412) > 5

Por lo tanto, las condiciones para el uso del estadístico de prueba se


cumplen.

3) Regla de decisión

Tomemos α = .05 . Como lo indica la hipótesis alternativa Η 1 : ρ1 − ρ 2 > 0 ,


tendremos α = .05 en la cola derecha. El valor en la tabla de la distribución
normal estándar con α = .05 en una cola es z = 1.645 . A partir de este valor
se definen las regiones de rechazo y no rechazo de Η 0 , como sigue (ver la
figura 1.2):
no se rechaza Η 0 si z c ∈< −∞,1.645 >
se rechaza Η 0 si z c ∈< 1.645, ∞ >

α = .05

Z
0 1.645

Región de no rechazo de Η 0 Región de rechazo de Η 0

Fig. 1.2

4) Cálculos

Como n1 = 80 , ρ1 = .725 , n2 = 102 y ρ 2 = .588 , tenemos:

∧ ∧
n ρ +n ρ (80)(.725) + (102) + (.588)
ρ= 1 1 2 2 = = .648
n1 + n2 80 + 102

y entonces

∧ ∧
ρ1 − ρ 2 .725 − .588 .137
zc = = zc = zc = = .1921
∧ ∧ ∧ ∧
(.648)(1 − .648) (.648)(1 − .648) .228 .228
ρ (1 − ρ ) ρ (1 − ρ ) + +
+ 80 102 80 102
n1 n2

5) Decisión estadística

Como 1.921 ∈ [1.645, ∞ > , se rechaza Η 0 .


6) Interpretación de los resultados

Se puede decir, con una confianza de 95%, que la proporción de


alumnos que aprueban el examen de admisión en la escuela
secundaria habiéndose ejercitado durante el 6º grado de la primaria en
lectura de comprensión es mayor que la de aquellos que aprueban el
examen y no se ejercitaron en lectura de comprensión.

En las siguientes actividades, use el esquema de


seis pasos para realizar la prueba de hipótesis
correspondiente.

1.1 Considere el ejemplo 1.1 y suponga que la


muestra representativa de la población de
alumnos con domicilio en al calle principal
ACTIVIDADES
consta de 83 alumnos, de los cuales 46 son
aprobados, en tanto que la muestra
DE
representativa de la población de alumnos que
no viven en la calle principal consta de 110
ESTUDIO
alumnos de los cuales 84 son aprobados.

Someta a prueba la hipótesis de que la


proporción de aprobados en la población de
alumnos que viven en la calle principal es
menor que la proporción de aprobados en la
población de alumnos que no viven en la calle
principal. Use un nivel de significancia de 5%.
1.2. Considere el ejemplo 1.2 y suponga que la trabajadora social obtiene
una muestra representativa de 100 jóvenes fármaco-dependientes y
encuentra que 14 de ellos comenten actos delictivos, y que obtiene una
muestra representativa de 150 jóvenes no fármaco-dependientes y
encuentra que 12 de ellos comenten actos delictivos.

a) Someta a prueba la hipótesis de que la proporción de delincuentes


es mayor en la población de fármaco-dependientes que en la
población de no fármaco-dependientes, usando α = .10 .
b) Haga la misma prueba de hipótesis, usando ahora un nivel de
significancia de 5%. ¿Qué observa?
1.3. Un psicólogo afirma que, según sus experiencias informales, las
estudiantes de secundaria tienen distinta memoria verbal que los
estudiantes varones del mismo nivel. Para someter a prueba su
hipótesis, elige dos muestras aleatorias, una de 75 alumnas y otra de
80 alumnos. A cada persona le recita, por separado, una lista de
palabras sin sentido y le pide que las repita. Al final del experimento,
logra registrar que 12 de las 75 alumnas repiten correctamente la lista
de palabras, en tanque que 11 de los 80 alumnos lo hacen.

Haga la prueba de hipótesis correspondiente con α = .05 .


1.4. Para saber si son distintos los porcentajes de docentes y administrativos
de una universidad que están a favor de solicitar despensas familiares,
se tomó una muestra representativa de 37 docentes, de los cuales 22
estuvieron a favor y el resto indiferentes, y se tomó una muestra de 45
administrativos de los cuales 41 se mostraron a favor y el resto
indiferentes.

¿Sé puede decir, con 99% de confianza, que es distinto el porcentaje


de docentes que desean la despensa que el porcentaje de administrativos
que también desean la despensa?
1.5. Se supone que, entre los maestros que tienen más de 30 años de
servicios, es menor la proporción de mujeres con afecciones serias en
la garganta que la de hombres con esas afecciones. Para saber si esto
puede ser cierto, se tomaron dos muestras aleatorias, unas de 78
maestros de los cuales 57 tenían dichas afecciones, y otra de 95
maestras de las cuales 61 estaban afectadas.

Haga la prueba de hipótesis correspondiente, con un nivel de


significancia de 5%.

También podría gustarte