Está en la página 1de 25

COMPROBACIÓN DE

DIFERENCIAS ENTRE
MEDIAS
La mayoría de las investigaciones buscan contrastar hipótesis acerca de
las diferencias entre dos o más muestras.

¿Difieren los mexicanos de los colombianos respecto a la obediencia a


la autoridad?
¿Quién presenta una tasa de suicidios más alta, la gente que vive en
zona rural o la gente que vive en zona urbana?

Cada pregunta de investigación implica hacer una comparación entre


dos grupos.
Hipótesis nula
En el análisis estadístico se suele empezar con la comprobación de la
hipótesis nula. De acuerdo con la hipótesis nula, la diferencia que existe
entre dos medias muestrales no representa una diferencia real entre
sus medias poblacionales, si no un hecho casual resultante del error de
muestreo.
= media de la primera población

1
1 2 = media de la segunda población
2
Hipótesis nulas:

Los mexicanos nos son más, ni menos obedientes a la autoridad que los
colombianos.

La gente que vive en zona rural presenta la misma tasa de suicidios que
la gente que vive en zona urbana.
Hipótesis de investigación
La hipótesis nula se expone generalmente con la esperanza de
rechazarla, ya que la mayoría de las investigaciones busca establecer
relaciones entre variables. Al rechazar la hipótesis nula, aceptamos
automáticamente la hipótesis de investigación (alterna) que plantea
que si existe una diferencia poblacional, que la diferencia entre medias
muestrales es demasiado grande como para ser explicada por el error
de muestreo.

1 2
Hipótesis de investigación:

Los mexicanos difieren de los colombianos respecto a la obediencia a la


autoridad.

La gente que vive en zona rural no tiene la misma tasa de suicidios que
la gente que vive en zona urbana.
Contrastación de las hipótesis con la distribución
muestral de diferencias entre medias

La distribución muestral de diferencias entre medias se podría obtener


si tomáramos múltiples muestras de las dos poblaciones que estamos
estudiando y sacáramos la media de los puntajes de cada muestra,
obteniendo posteriormente la diferencia entre las medias de cada
muestra.
La distribución muestral de diferencias entre medias toma la forma de
curva normal, por lo tanto, puede considerarse como una distribución
de probabilidad.
La probabilidad disminuye a medida que nos alejamos de la media
de diferencias.
68.3% de la diferencia entre medias caen entre -1 DE y +1 DE de cero.
En términos de probabilidad P = 0.68 de que cualquier diferencia entre
medias muestrales caiga dentro de ese intervalo. Podemos decir que
P = 0.95 (95 oportunidades entre 100) de que cualquier diferencia
entre medias muestrales caiga entre -2 DE y +2 DE de una diferencia
media de 0.
La distribución muestral de diferencias sirve para comprobar la
hipótesis acerca de la diferencia de media entre dos muestras
(hipótesis de investigación) y que no se debe sólo a un error de
muestreo. Si la diferencia entre medias está muy cerca de cero, se
acepta la hipótesis nula y se trata la diferencia como error de
muestreo; si está lejos, se rechaza la hipótesis nula y se acepta la de
investigación.

Si una muestra de 100 liberales tiene un puntaje medio de


permisibilidad de 7 y una muestra de 100 conservadores tiene un
puntaje medio de 2, nuestra diferencia entre medias sería de 5 (7 – 2).
Para determinar que tan lejos está nuestra diferencia entre las medias
obtenida (en este caso 5) de una diferencia media de 0. Debemos
convertir primero nuestra diferencia obtenida a unidades de DE.
Traducimos la diferencia entre medias muestrales a unidades de DE,
por la fórmula:

X 1 = Media de la primera muestra


z = (X 1 - X 2) – 0 X 2 = Media de la segunda muestra
dif 0 = Valor de la media de la distribución
muestral de diferencias
dif = desviación estándar de la distribución muestral de diferencias
Como siempre la media de la distribución de diferencias es cero,
podemos quitar el 0 de la fórmula. Si dif es 2, entonces:

z = _7 – 2_ = _5_ = +2.5
2 2

En la tabla B podemos ver que z = 2.5 representa el 49.38% de la


distribución en una y otra dirección.
49.38 + 49.38 = 98.76% , es decir, que el 98.76 de las diferencias entre
medias muestrales están entre 0 y una diferencia media de 5.
En términos de probabilidad indica que P = 0.99 (99 oportunidades
entre 100) de que una diferencia entre medias caiga entre -5 y +5.
Restando 100% - 98.76% = 1.24%, encontramos que P = 0.01 de que
una diferencia media de 5 entre las muestras pueda ocurrir por error
de muestreo. Esto es, que una diferencia media de 5 ocurre por error
de muestreo sólo una vez en cada 100 diferencias entre medias.

Para decidir si la diferencia entre dos medias muestrales es tan grande


que ya no se le pueda atribuir al error de muestreo, se requiere un
método para determinar cuánto es estadísticamente significativo
nuestro resultado.
Niveles de confianza
Para establecer si nuestra diferencia muestral obtenida es
estadísticamente significativa (resultado de una diferencia poblacional
real y no sólo de un error de muestreo) se acostumbra establecer un
nivel de confianza (o de significancia); el cual es el nivel de probabilidad
en el cual se puede rechazar la hipótesis nula y se puede aceptar la
hipótesis de investigación.

Se suele usar el nivel de confianza de 0.05, es decir, que estamos


dispuestos a rechazar la hipótesis nula si una diferencia muestral
obtenida ocurre sólo 5 veces o menos entre 100 (5%).
Representación gráfica del nivel de confianza
de 0.05

El 95% de las
diferencias
muestrales cae entre
-1.96 DE y +1.96 DE,
sólo el 5% cae más
allá.
z = 1.96 z = 1.96

95%
Los niveles de confianza pueden establecerse para cualquier grado de
probabilidad. Nivel de confianza de 0.01, se rechaza la hipótesis nula si
solo hay una oportunidad entre 100 de que la diferencia muestral
pueda ocurrir por error de muestreo.

Siempre que decidamos rechazar la hipótesis nula, nos abriremos a la


posibilidad de tomar la decisión equivocada.
Rechazar la hipótesis nula cuando se debería de aceptar se le conoce
como el error Alpha (error tipo I ). Varía con el nivel de confianza que
escojamos. Si rechazamos la hipótesis nula al nivel de confianza de
0.05, hay 5 oportunidades entre 100 de que nos equivoquemos.
P = 0.05 de que cometamos el error Alpha.
Mientras más riguroso sea nuestro nivel de confianza (más cerca de la
cola de la curva) menos probabilidades de cometer el error alpha.
Sin embargo, mientras más cerca de la cola de la curva caiga nuestro
nivel de confianza, mayor será el riesgo de cometer otra clase de error,
el error beta (error tipo II), error en el que se cae al aceptar la hipótesis
nula cuando debió ser rechazada, ese error indica que nuestra hipótesis
de investigación puede ser aún correcta, a pesar de rechazarla.
Error estándar de la diferencia
Desviación estándar de la distribución de diferencias. Sirve para
contrastar hipótesis acerca de las diferencias entre las medias.

= 2 2 dif = error estándar de la diferencia


dif
X1 + X2
X 1 = error estándar de la primera
media muestral
X 2 = error estándar de la segunda
media muestral
Ejemplo:

Liberales: Conservadores:
N = 50 N = 50
X=7 X=6
s =2 s = 1.5

Diferencia entre medias = 1


1.- Encontrar el error estándar para cada media muestral:

s1 2 2
= = = 0.29
1
7
50 - 1

s2 1.5 1.5
= = = 0.21
2
7
50 - 1
2.- Obtener el error estándar de la diferencia:

dif = 2
X1 +
2
X2 = 0.29 2 + 0.21
2

= +
0.08 0.04 = 0.12

= 0.35
3.- Convertir la diferencia entre medias muestrales obtenida a unidades
de error estándar de la diferencia (puntaje z):

X1 X2 7 6
z = = = 1 = 2.86
dif 0.35 0.35

4.- Encontrar el porcentaje del área total bajo la curva normal entre z y
una diferencia media de cero (Ver Tabla B):
El puntaje z de 2.86 en la Tabla B equivale al 49.79% de las diferencias
de medias a ambos lados de una diferencia de media de cero (49.79% +
49.79% = 99.58%).
5.- Restar lo obtenido de 100% para encontrar el porcentaje del área
total asociado con la diferencia entre medias muestrales obtenida:

Restamos 99.58% al 100%, encontramos entonces que 0.42% de los


puntajes de diferencias de medias tienen un valor de 1. Por tanto, P es
menor a 0.01 (0.42/100).
Esto es, que una diferencia media de 1 ocurre por error de muestreo
menos de 1 vez en cada 100 diferencias entre medias. Podemos
rechazar la hipótesis nula ya sea al nivel de confianza de 0.05 (5 veces o
menos entre 100) o de 0.01 (1 vez o menos entre 100).
Ejercicio:

Nuestra hipótesis de investigación establece que las mujeres son


diferentes a los hombres respecto al etnocentrismo (tendencia a
evaluar a todos los grupos usando nuestras propias normas culturales).
¿Podemos aceptar esta hipótesis utilizando un nivel de confianza de
0.05?

Se utilizó para la investigación una escala de etnocentrismo donde 1


representa el nivel más bajo de etnocentrismo y 5 el nivel más alto de
etnocentrismo. Las muestras estuvieron constituidas por 35 hombres y
35 mujeres.
Puntajes obtenidos

Hombres:
1, 1, 1, 1, 2, 1, 1, 3, 3, 1, 2, 1, 2, 1, 1, 1, 1, 2, 4, 5, 1, 1, 2, 1, 2, 1, 2, 1, 1,
1, 1, 3, 3, 1, 4

Mujeres:
1, 1, 1, 2, 1, 1, 1, 3, 1, 2, 4, 1, 1, 1, 1, 5, 1, 2, 2, 1, 1, 1, 1, 2, 3, 1, 1, 1, 2,
2, 2, 1, 1, 1, 1

También podría gustarte