Está en la página 1de 8

Comparar dos medias poblacionales (independientes)

Cuando la variable es numérica (por ejemplo ingresos, nivel de colesterol o


kilómetros por litro de combustible) y se comparan dos poblaciones o grupos
(por ejemplo hombres frente a mujeres), para contrastar una afirmación sobre
la diferencia entre las medias de dichas poblaciones o grupos se utilizan los
pasos descritos en este apartado (por ejemplo, ¿la diferencia entre las medias
poblacionales es igual a cero, lo cual significa que las medias son idénticas?).
A fin de recopilar los datos necesarios para este contraste es preciso
seleccionar dos muestras aleatorias independientes (totalmente separadas),
una de cada población. La hipótesis nula es que las dos medias poblacionales
son idénticas, o dicho de otro modo, que su diferencia es igual a cero. La
notación de la hipótesis nula es H0 : μ1 = μ2 , en la que μ1 representa la media
de la primera población y μ2 representa la media de la segunda población.

Para calcularla, haz lo siguiente:


1. Calcula las medias muestrales y (supondremos que nos dan las
desviaciones estándares de las poblaciones, σ1 y σ2 ). n1 y n2 representan los
dos tamaños muestrales (no es necesario que sean iguales). Estos cálculos se
explican en el capítulo 5.
2. Calcula la diferencia entre las dos medias muestrales: 1 - 2. Como la
diferencia μ1–μ2 es igual a cero si H0 es verdadera, no es necesario incluirla
en el numerador del estadístico de contraste. Sin embargo, si el valor de la
diferencia es cualquier número distinto de cero, hay que restar ese valor en el
numerador del estadístico de contraste.
3. Calcula el error estándar por medio de la siguiente ecuación:

4. Divide el resultado del paso 2 por el resultado del paso 3.


Para interpretar el estadístico de contraste, añade los dos pasos siguientes:
5. Busca tu estadístico de contraste en la distribución normal estándar
(distribución Z) (encontrarás la tabla Z en el apéndice) y calcula el valor p. (En
el capítulo 14 encontrarás más información sobre cómo calcular el valor p.)
6. Compara el valor p con el nivel de significación, por ejemplo 0,05. Si es
menor o igual que 0,05, rechazas H0. De lo contrario no rechazas H0. (En el
capítulo 14 encontrarás más información sobre los niveles de significación.)
Por ejemplo, imagina que quieres comparar la absorción de dos marcas de
papel de cocina (las llamaremos marca A y marca B). Puedes realizar esta
comparación midiendo el número medio de gramos que puede absorber una
hoja de cada marca antes de saturarse del todo. H0 dice que la diferencia entre
los promedios de absorción es cero (inexistente), y Ha dice que la diferencia no
es cero. Dicho de otro modo, una marca es más absorbente que la otra. En
notación estadística tenemos H0 = μ1 – μ2 = 0 contra Ha = μ1 – μ2 ≠ 0. Aquí
no se indica qué papel de cocina es más absorbente, de manera que hay que
utilizar la alternativa “distinto de” (vuelve al capítulo 14 si lo necesitas).
Supongamos que seleccionas una muestra aleatoria de 50 hojas de cada
marca y mides la absorción de cada una de ellas. Supongamos que la
absorción media de la marca A (x1 ) en tu muestra es 3 gramos, y supongamos
que la desviación estándar de la población es 0,9 gramos. En el caso de la
marca B (x2 ), la absorción media es 3,5 gramos según los datos de tu
muestra, y la desviación estándar de la población es 1,2 gramos. Realiza este
contraste de hipótesis siguiendo los seis pasos anteriores:
1. Por la información que tienes, sabes que 1 = 30, σ1 = 9, 2 = 35, σ2 = 12, n1
= 50 y n2 = 50.
2. La diferencia entre las medias muestrales (marcas A–marca B) es = (30 –
35) = –5 gramos. (Una diferencia negativa simplemente significa que la media
de la segunda muestra era más grande que la media de la primera.)
3. El error estándar es

4. Al dividir la diferencia, –5, por el error estándar, 2,1213, te da –2,36. Éste es


tu estadístico de contraste.
5. Para encontrar el valor p, busca –2,36 en la distribución normal estándar
(distribución Z). Encontrarás la tabla Z en el apéndice. La probabilidad de
superar –2,36, en este caso en sentido negativo, es igual a 0,0091. Como Ha
es una alternativa del tipo “distinto de”, doblas este porcentaje, con lo que
obtienes 2 × 0,0091 = 0,0182, tu valor p. (En el capítulo 14 encontrarás más
información sobre la alternativa “distinto de”.)
6. Este valor p es bastante más pequeño que 0,05. Por consiguiente, tienes
indicios suficientes para rechazar H0
Tu conclusión es que, por la información de tus muestras, existe una diferencia
estadísticamente significativa entre la capacidad de absorción de estas dos
marcas de papel de cocina. La marca B es más absorbente porque tiene una
media más alta (que la media de la marca A menos la media de la marca B sea
un número negativo significa que la marca B tenía un valor más alto).
Contraste de hipótesis para una diferencia media (prueba t para
datos apareados)
Puedes realizar un contraste de hipótesis para una diferencia media utilizando
la prueba descrita en este apartado cuando la variable es numérica (por
ejemplo ingresos, nivel de colesterol o kilómetros por litro de combustible) y los
elementos de la muestra están apareados de algún modo en relación con
variables relevantes como por ejemplo la edad o el peso, o bien los mismos
elementos se utilizan dos veces (por ejemplo, en una prueba preliminar y una
prueba posterior). Las pruebas de datos apareados generalmente se utilizan
para estudios en que alguien quiere M CPC - RZE - 007 saber si un nuevo
tratamiento, técnica o método funciona mejor que otro método existente, sin
tener que preocuparse de otros factores relacionados con los sujetos que
puedan influir en los resultados.
ejemplo, imagina que un investigador quiere averiguar si enseñar a los alumnos
a leer utilizando un juego de ordenador da mejores resultados que enseñarles
con un método fonético de eficacia probada. El investigador selecciona 20
alumnos y los organiza en 10 parejas en función de su dominio de la lectura,
edad, coeficiente intelectual, etc. A continuación selecciona aleatoriamente a
un alumno de cada pareja y le enseña a leer con el método informático (lo
llamaremos MI), mientras que el otro aprende con el método fonético (lo
llamaremos MF). Al final del estudio, los dos alumnos hacen el mismo examen
de lectura. Los datos figuran en la tabla 15-1.

Al examinar las diferencias entre las parejas de observaciones, en realidad


tienes un solo conjunto de datos y un solo contraste de hipótesis para una
media poblacional. En este caso la hipótesis nula es que la media (de las
diferencias apareadas) es 0, y la hipótesis alternativa es que la media (de las
diferencias apareadas) es>0. Si los dos métodos de aprendizaje son iguales, la
media de las diferencias apareadas debe ser 0. Si el método informático es
mejor, la media de las diferencias apareadas debe ser positiva (la puntuación
de los alumnos que han aprendido con el método informático es mayor que la
de los alumnos que han aprendido con el método fonético).
La notación de la hipótesis nula es H0 : σd = 0, donde σd es la media de las
diferencias apareadas para la población (la d del subíndice simplemente te
recuerda que estás trabajando con las diferencias apareadas).
Para calcular el estadístico de contraste para diferencias apareadas, haz lo
siguiente:
1. Para cada par de datos, coge el primer valor del par y réstale el segundo
valor del par para encontrar la diferencia apareada. Considera que las
diferencias son tu nuevo conjunto de datos.
2. Calcula la media, , y la desviación estándar, sd , de todas las diferencias.
3. Siendo nd el número de diferencias apareadas que tienes, calcula el error
estándar:

En el ejemplo de las puntuaciones obtenidas en los exámenes de lectura,


puedes utilizar los pasos anteriores para ver si el método informático es mejor
para enseñar a leer a los alumnos. Para encontrar el estadístico, sigue los
pasos siguientes:
1. Calcula las diferencias para cada par (se indican en la columna 4 de la tabla
15-1). El signo de cada diferencia es importante: indica qué método funcionó
mejor para ese par en concreto.
2. Calcula la media y la desviación estándar de las diferencias calculadas en el
paso 1. Según mis cálculos, la media de las diferencias, , es igual a 2, y la
desviación estándar, sd , es igual a 4,64. Observa que aquí nd = 10.
3. El error estándar es = 1,47. (Recuerda que aquí nd es el número de pares,
que es 10.)
4. Si divides la media de las diferencias (paso 2) por el error estándar (paso 3)
te sale 1,36, que es el estadístico de contraste.
¿El resultado del paso 4 es suficiente para decir que la diferencia entre
puntuaciones hallada en este experimento se aplica a toda la población? Como
la desviación estándar de la población, σ, se desconoce y la has estimado con
la desviación estándar de la muestra (s), tienes que utilizar la distribución t en
lugar de la distribución Z para encontrar el valor p. (Revisa el apartado
“Muestras pequeñas y desviaciones estándares desconocidas: la prueba t”, en
este mismo capítulo.) Para calcular el valor p, ve a la tabla t (incluida en el
apéndice) y busca 1,36 en la distribución t que tiene 10–1=9 grados de libertad.
El valor p en este caso es mayor que 0,05 porque 1,36 es menor que el valor
1,38 de la tabla (es decir, se encuentra a la izquierda de dicho valor), y por
tanto su valor p es mayor que 0,1 (el valor p para la cabecera de columna
correspondiente a 1,38).
Como el valor p es mayor que 0,05, no rechazas H0 ; no tienes indicios
suficientes de que la diferencia media de puntuaciones entre el método
informático y el método fonético sea significativamente mayor que cero.
Eso no significa necesariamente que no exista una diferencia real en la
población formada por todos los alumnos. Sin embargo, el investigador no
puede afirmar que el juego de ordenador es un método mejor basándose en
esta muestra de 10 alumnos. (En el capítulo 14 encontrarás más información
sobre la potencia de un contraste de hipótesis y su relación con el tamaño
muestral.)
Comparar dos proporciones poblacionales
Este contraste se utiliza cuando la variable es categórica (por ejemplo
fumador/no fumador, demócrata/republicano, a favor/en contra de cierta
opinión, etc.) y estás interesado en la proporción de personas que poseen una
determinada característica, por ejemplo, la proporción de fumadores. En este
caso se comparan dos poblaciones o grupos (por ejemplo, la proporción de
mujeres fumadoras contra la de hombres fumadores).
Para realizar este contraste hay que seleccionar dos muestras aleatorias
independientes (separadas), una de cada población. La hipótesis nula es que
las dos proporciones poblacionales son idénticas, o dicho de otro modo, que su
diferencia es igual a cero. La notación de la hipótesis nula es H0 : p1 = p2 ,
donde p1 es la proporción de la primera población y p2 es la proporción de la
segunda población
Afirmar en H0 que las dos proporciones son idénticas es lo mismo que decir
que su diferencia es cero. Si empiezas con la ecuación p1 = p2 y restas p2 en
cada lado, te queda p1 - p2 = 0. Por lo tanto, puedes expresar la hipótesis nula
de ambas formas.
La fórmula del estadístico de contraste para comparar dos proporciones (si se
cumplen ciertas condiciones) es:

en la que 1 es la proporción de elementos de la primera muestra que poseen la


característica de interés, 2 es la proporción de elementos de la segunda
muestra que poseen la característica de interés, es la proporción de elementos
de la muestra combinada (todos los elementos de la primera y la segunda
muestra) que poseen la característica de interés, y z es un valor de la
distribución Z (hablamos de ella en el capítulo 9). Para calcular el estadístico de
contraste, haz lo siguiente:
1. Calcula las proporciones muestrales 1 y 2 para cada muestra. n1 y n2
representan los dos tamaños muestrales (no es necesario que sean iguales).
2. Calcula la diferencia entre las dos proporciones muestrales, 1 - 2.
3. Calcula la proporción muestral global , el número total de elementos de
ambas muestras que poseen la característica de interés (por ejemplo, el
número total de fumadores, ya sean hombres o mujeres, que hay en la
muestra) dividido por el número total de elementos de ambas muestras (n1 +
n2 ).
4. Calcula el error estándar:

puesta es tu estadístico de contraste. Para interpretar el estadístico de


contraste, búscalo en la distribución normal estándar (la tabla Z del apéndice),
calcula el valor p y toma las decisiones que corresponda. (En el capítulo 14
encontrarás más información sobre valores p.) Piensa ahora en los anuncios de
medicamentos que salen en las revistas. La foto principal muestra un sol
esplendoroso, campos de flores, gente sonriendo... todo el mundo es más feliz
gracias a ese medicamento. La compañía farmacéutica afirma que sus
medicamentos pueden reducir los síntomas de la alergia, ayudar a la gente a
dormir mejor, bajar la tensión arterial o solucionar cualquier otro problema de
salud. QuM CPC - RZE - 007 izá todo esto te parezca demasiado bueno para
ser cierto, pero cuando pasas la página para ver el reverso del anuncio, te
encuentras con la letra pequeña donde el laboratorio farmacéutico justifica sus
afirmaciones (¡ahí es donde suelen estar las estadísticas!). En algún lugar de
esa letra pequeña es probable que encuentres una tabla donde se indiquen los
efectos adversos del medicamento en comparación con un grupo de control
(sujetos que tomaron un medicamento ficticio), para establecer un parangón
justo con los que realmente tomaron el medicamento (el grupo experimental;
más información en el capítulo 17).
Si nos fijamos en la información de una combinación de anfetamina y
dextroanfetamina indicada para el trastorno por déficit de atención e
hiperactividad (TDAH), dice que 26 de los 374 sujetos (el 7%) a quienes se les
administró el fármaco experimentaron vómitos como efecto secundario, frente a
8 de los 210 sujetos (el 4%) que tomaron un placebo. Ten presente que los
pacientes no sabían qué tratamiento estaban recibiendo. De todas las personas
de la muestra que tuvieron vómitos, los que tomaron el fármaco representaron
un porcentaje más alto. Sin embargo, ¿es suficiente este porcentaje para
afirmar que toda la población que lo tome tendrá vómitos? Puedes hacer un
contraste de hipótesis para averiguarlo.
En este ejemplo tienes H0 : p1 –p2 =0 contra Ha : p1 –p2 >0, donde p1
representa la proporción de sujetos que tuvieron vómitos al tomar el
medicamento, y p2 representa la proporción de sujetos que tuvieron vómitos
tomando el placebo.
¿Por qué Ha contiene el signo > y no el signo representa la situación en la que
los sujetos que tomaron el fármaco tuvieron más vómitos que los que tomaron
el placebo, algo que la FDA (y también cualquier candidato a tomar este
medicamento) querría saber. En este sentido, el orden de los grupos también
es importante. Te va mejor poner en primer lugar el grupo del fámaco, para que
cuando calcules la proporción de sujetos que lo tomaron menos la proporción
de sujetos que tomaron el placebo te salga un número positivo si Ha es
verdadera. Si cambias los grupos de orden, el signo habría sido negativo.
Ahora calcula el estadístico de contraste:
maños muestrales son n1 =374 y n2 =210, respectivamente.
2. La diferencia entre estas proporciones muestrales es 1 - 2 = 0,070 –0,038
=0,032.
3. La proporción muestral global es = 0,058.
4. El error estándar es =0,020.
5. Por último, el estadístico de contraste es 0,032/0,020=1,60
El valor p es la probabilidad de alcanzar o superar (en este caso en sentido
positivo) 1,60. Esta probabilidad es 1–0,9452=0,0548. Este valor p es un poco
mayor que 0,05, de manera que, técnicamente, no tienes indicios suficientes
para rechazar H0 . Esto significa que, según tus datos, las personas que toman
el fármaco no sufren más vómitos que aquellas que toman un placebo.
Una valor p muy próximo al mágico pero un tanto arbitrario nivel de
significación de 0,05 es lo que en estadística se llama un resultado marginal.
En el ejemplo anterior, como el valor p de 0,0548 está cerca de la frontera entre
aceptar y rechazar H0 , generalmente se considera un resultado marginal y
debe comunicarse como tal.

Conclusion
Muchas estadísticas que ves y oyes están basadas en los resultados de
encuestas, experimentos y estudios de observación. Por desgracia, no puedes
creer todo lo que ves ni todo lo que oyes. En esta parte hablaré sobre lo que
ocurre realmente entre bastidores. Te enseñaré cómo se diseñan y realizan
estos estudios y cómo se recopilan (o cómo deberían recopilarse) los datos,
para que seas capaz de detectar resultados engañosos. También verás lo que
necesitas para realizar tu propio estudio de manera correcta y eficaz. Además,
analizaremos los datos de estudios válidos para encontrar relaciones entre dos
variables, ya sea mediante tablas de contingencia (si las dos variables son
categóricas) o mediante correlación y regresión (si las dos variables son
numéricas), y veremos cómo extraer conclusiones correctas y detectar
problemas.

También podría gustarte