Está en la página 1de 16

5 PRUEBAS DE HIPÓTESIS CON DOS MUESTRAS Y VARIAS

MUESTRAS CON DATOS CATEGÓRICOS.


5.1 Prueba Z para la diferencia entre dos proporciones.
Diferencias entre proporciones hay muchos problemas en los que debemos decidir
si una diferencia observada dos proporciones muéstrales se puede atribuir al azar
o si es un indicio del hecho de que las proporciones de la población
correspondiente no son iguales. Por ejemplo, tal vez queremos decidir, con base
en datos muéstrales, si existe alguna diferencia entre las proporciones reales de
personas vacunada no contra la gripe que contraen esta enfermedad o quizá
queremos probar, basándonos en muestras, si dos fabricantes de equipo
electrónico embarcan proposiciones iguales de equipo con defectos.
El método que usaremos aquí para probar si una distribución de la frecuencia
observada entre dos proporciones muéstrales es importante o si se Puede atribuir
al azar se basa en la teoría siguiente: si x 1 y x2 son los números de éxitos
obtenidos en n1 intentos de una clase y n2 de otra, todos los intentos son
independientes y las probabilidades correspondientes son, respectivamente. P1 y
X1 X1
p2 entonces la distribución del muestreo de − tiene la medida p1-p2 y la
n1 n2
desviación estándar.

p 1 1− p 1 p 2 1− p 2
√ n1
+
n2

Se acostumbra referirse a esta desviación estándar como el error


estándar de la diferencia entre dos proporciones.
Cuando probamos la hipótesis nula p1=p2 =p contra una hipótesis
alternativa apropiada la medida de la distribución del muestreo de a
diferencia entre dos proporciones muéstrales es p1-p2=0 y la forma del
error estándar se puede expresar como.

1 1
√ p 1−p( +
n2 n2 )

Donde p generalmente se estima dando peso a los datos y


x 2+ x 2
sustituyendo p por la proporción muestra combinada, p= n 1+n 2 , que como
antes, se lee como p con acento circunflejo. Entonces, convirtiendo a
unidades estándar, obtenemos el estadístico.
x 1 x2

n1 n 2 x 1+ x 2
con. p
1 1 n 1+ n 2
√ ∝ 1− p +
n2 n2

Que para muestras grandes, es un valor de una variable aleatoria que tiene
aproximadamente la distribución normal estándar. Para hacer que esta
fórmula sea más compacta, podemos sustituir en el numerador p1 por
x1 x2
y p 2 por
x1 n2

Los criterios de la prueba de nuevo. Con p1 y p2 sustituyendo μ y μg : análogos


a la tabla de página 305 los criterios para la prueba de la hipótesis nula p1=p2
son los siguientes:

Hipótesis alternativa Rechazo de la hipótesis Aceptación de la


nula si hipótesis nula o reserva
de la opinión si

Para probar la efectividad de un nuevo analgésico, se administró a 80


pacientes de una clínica una píldora que contenía el analgésico y a otros 80
se les dio un placebo que solo contenía azúcar. Si 56 de los pacientes del
primer grupo y 38 del segundo grupo científico un efecto beneficio, ¿Qué
podemos concluir, en el nivel de significancia 0.01 acerca de la efectividad del
nuevo medicamento?
1. Ho. P1=p2
Ha. P1>p2
2. ∝=0.01
3. Se rechaza la hipótesis nula si z > 2.33, donde z se obtiene por medio
de la f6 mula anterior; de otra manera esta se acepta o se reserva la
opinión.
4. Sustituyendo
56+ 38
x 1=56 , x 2=38 , n 1=80 n 2=80. y ρ= =0.5875
80+ 80
5.2 PRUEBA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES.

Esta prueba se aplica en diseños de investigación en los que se


estudia a dos grupos de individuos a quienes se ha medido una
variable cualitativa. La variable tiene una escala compuesta de
modalidades y se dispone de información sobre la frecuencia de
individuos en cada modalidad, tanto para un grupo como para el otro.
Como ejemplo, observable.

5
10

F2=10
ft=6

Las modalidades de la variable cualitativa medida en ambos grupos


son Complicada y Normal. Para cada modalidad se consignan sus
frecuencias. Metodológicamente la variable cualitativa Tipo de
covalencia puede considerarse como dependiente de otra variable
cualitativa Tipo de covalencia puede considerarse como dependiente
de otra variable: la técnica quirúrgica; a esta última se le considera
mitológicamente como independiente.
La variable cualitativa medida en ambos grupos se puede resumir en
forma de proporciones. Por lo anterior, se dispone de dos
proporciones que pueden ser comparadas para averiguar si existe una
diferencia estadísticamente significativa entre ellas.

5
10
El propósito de la prueba es averiguar si existen diferencias
estadísticamente significativas entre las proporciones de interés, en
este caso, las proporciones de convalecientes complicados con uno y
otro tipo de técnica quirúrgica. En otras palabras, la averiguación se
refiere a determinar si hay una diferencia estadísticamente significativa
entre la proporción con valor de 0.375 y la proporción con valor de
0.667.
En la prueba se plantea las siguientes hipótesis estadísticas:

Hipótesis estadística nula: Ho: p1=p2


Hipótesis estadística alterna: Ha:p1≠p2
Donde:
P1: proporción de interés calculada en el primer grupo, en este caso la
proporción de convalecientes complicados con la técnica de
endoscopio, calculada dividendo f1+n1
P2: proporción de interés calculada en el segundo grupo, en este caso
la proporción de convalecientes complicados con la técnica de cielo
abierto, calculada dividiendo f2+n2
El procedimiento de la prueba incluye la determinación de un valor
llamado z calculado. El rechazo de ña Ho ocurre cuando el valor z
calculado con los datos resulta mayor que el valor critico de dicha
medida que está contenido en la tabla de áreas bajo la curva normal.
En el caso de que haya podido rechazar a la Ho, se dice que existe
una diferencia estadísticamente significativa entre ambas
proporciones.
EJEMPLO DESARROLLADO
Un odontólogo deseaba saber si la deserción del habito de lavado
dental era diferente en niños que usaban pasta dental con diferentes
sabores. Durante tres meses proporcionado dotaciones de pasta
dental sabor cereza a un grupo de 16 niños y de sabor menta a otro
grupo de 15 niños. El interés del odontólogo era verificar si existía una
diferencia estadísticamente significativa entre la proporción de
desertores en uno y otro grupo.

5
10
Deserción

SI

NO
F2=10
ft=6

CEREZA Menta
n1=16 n2=15
El odontólogo calculado la proporción de desertores en uno y otros
grupos así:
Grupo cereza: p1=f1 =n1=6/16=0.375
Grupo menta: p2=f2 = n2=10+15=0.667
Para cada grupo también calculo la proporción complementaria
correcpondiente; es decir la proporción de niños que no desertaron.
Para el primero grupo (cereza) su calculo fue el siguiente:
q1=10/16=0625 y para el segundo grupo (menta) fue asi:
q2=5/15=0.333.
Hasta el momento, sus cálculos se esquematizaban de la siguiente
forma:

Grupo de niños Grupo de niños


que usaron que usaron
pasta sabor pasta sabor
cereza menta
n=16 n=15
Desertaron P1=0.375 P2=0.667 Desertaron
No desertaron q1=0.625 Q2=0.333 No desertaron

Como el odontólogo pretendía averiguar si existía una diferencia


estadísticamente significativa entre las proporciones de desertores en
ambos grupos planteo las siguientes hipótesis estadísticas:
Ho: p1=p2 Ha:p1≠p2
En un libro encontró que la prueba de análisis estadístico que le
permitiría probar si se podría rechazar o no a su hipótesis nula se
llamaba prueba de comparación de dos proporciones y que antes de
realizarla era un requisito indispensable verificar que se cumplían las
siguientes cuatro condiciones:
N1p1>5 n1q1>5 N1p1>5 n1q1>5
Al efectuar sus cálculos encontró lo siguiente:
(16) (0.375)=6 (16) (0.625) (15)(0.667)10 (15)
(0.333)5
En vista de que se cumplía las condiciones procedió a efectuar el
siguiente cálculo.

n=16 n=15
P1=0.375 P2=0.667
q1=0.625 Q2=0.333
5.4 PRUEBA DE INDEPENDENCIA
ji-cuadrado
En una prueba de independencia el único número que el investigador controla
directamente es el tamaño total de la muestra. Se extrae una muestra de tamaño n de la
población y cada objeto se clasifica según las dos variables que se estudian. Ni las
frecuencias de cada celda, ni los totales de fila y columna se conocen de antemano.
El investigador no fija previamente ningún conjunto, es decir, son aleatorios.
El planteamiento de las Hipótesis será:
H 0 : A y B son independientes
H 1 : A y B no son independientes
 
Independencia significa que el conocimiento del nivel de clasificación de un objeto
respecto a la característica A no tiene nada que ver con su nivel respecto a la
característica B. Para expresar esta idea matemáticamente utilizamos las probabilidades
dadas en la siguiente tabla:
Tabla 2. Tabla de contingencia 2 x 2 con proporciones o probabilidades

Variable 1 (A)

Si No Total
Variable 2 Si p 11 p 12 p 1.
(B) No p 21 p 22 p 2.
Total p .1 p .2 1
 
Se sabe que, para que dos sucesos sean independientes, la probabilidad de que ocurran
ambos a la vez debe ser igual al producto de las probabilidades de que cada suceso
ocurra individualmente.
P[A y B] = P[A]P[B]
O
p 11 = p .1 p 1.
La relación debe cumplirse para cada celda. Por tanto, la hipótesis nula de independencia
se expresa matemáticamente como
i = 1, 2
H 0 : p ij = p i. P .j
j = 1, 2
i = 1, 2
H 1 : p ij ? p i. P .j
j = 1, 2
Comparamos el número de observaciones en cada celda con el número esperado, si H
0 es cierta. Si estos números difieren poco, no hay razón para rechazar H 0 ; si hay una
gran discrepancia entre los valores observados y esperados, entendemos esto como
evidencia de que H 0 no es cierta. Entonces se calcula el valor esperado así:
E ij = np ij

  n 1. n .1 total fila marginal x total comlumna marginal


Ê 11 = ________________________ _________________________
  n tamaño de la muestra
La pregunta es la siguiente: ¿son estas diferencias demasiado grandes como para que se
deban únicamente al azar?
Para responderla necesitamos un estadístico cuya distribución de probabilidad sea
conocida bajo la hipótesis de que H0 es cierta. El estadístico en cuestión es:

 Prefijamos un nivel de significancia en 0.05


Si el valor p es pequeño (es menor de 0.05); podemos rechazar H 0
Para que las pruebas de Ji-cuadrado sean válidas, es necesario que las muestras sean
grandes. Es decir que las frecuencias esperadas no sean menores de 5. Si esto no se
cumple, puede utilizarse una prueba para pequeñas muestras llamada prueba exacta de
Fischer para contrastar independencia.
EJEMPLO
Se realiza una investigación para determinar si hay alguna asociación aparente entre la
altura de los estudiantes de posgrado y el éxito en sus clases, a juicio de sus profesores.
Se selecciona una muestra aleatoria consistente en 500 estudiantes. Se clasifica a cada
estudiante de acuerdo a dos criterios, la altura y el éxito. La tabla de contingencia
generada es la siguiente:

    Mayor altura que el promedio poblacional


    Si No  
Exito Si 162 263 425
No 38 37 75
  200 300 500
Comparamos el número de observaciones en cada celda con el número esperado, si H
0 es cierta:

Datos utilizados para contrastar asociación entre altura y éxito en las clases. Las
frecuencias esperadas aparecen entre paréntesis :
 
    Mayor altura que el promedio poblacional
    Si No  
Exito Si 162 (170) 263 (255) 425
No 38 (30) 37 (45) 75
    200 300 500
5.6 Pruebas de bondad de ajuste.

También podría gustarte