Está en la página 1de 33

Tema 3.

Contraste de Hipótesis

Parte B.
EL CONTRASTE DE
HIPÓTESIS

1
1. El concepto del contraste de hipótesis
2. Las hipótesis estadísticas
3. Los supuestos
4. El estadístico de contraste
5. La regla de decisión
6. La decisión
7. Errores tipo I y tipo II
8. Potencia de un contraste
9. Comprobación de hipótesis acerca de algunos
parámetros
10. Comprobación de hipótesis acerca de la media

BIBLIOGRAFÍA BÁSICA
Amón, J. (1991). Estadística para psicólogos. Vol. 2. Probabilidad. Estadística
inferencial.Madrid: Pirámide.
Pardo, A. y San Martín, R. (1998). Análisis de Datos en Psicología II. Madrid:
Pirámide.

BIBLIOGRAFÍA COMPLEMENTARIA
Bernardo, J.M. (1981). Bioestadística. Una perspectiva bayesiana. Barcelona:
Vicens Vives.
DeGroot, M.H. (1988). Probabilidad y Estadística. México: Addison-Wesley
Iberoamericana.
Gonick, L. y Smith, W. (1999). Estadística en cómic. Barcelona: Zambrera y
Zariquiey.
Maciá, A., Lubin, P. y Rubio, P. (1997). Psicología Matemática II. (3 vol.).
Madrid: UNED.
Martín, Q. (2001). Contraste de Hipótesis. Madrid: La Muralla-Hespérides.
Martínez-Arias, M.R., Maciá, A. y Pérez, J.A. (1989). Psicología Matemática II
(2). Madrid: UNED.
Peña, D. (2001). Fundamentos de Estadística.. Madrid: Alianza Universidad.
Walpole, R.E. y Myers, R.H. (1994). Probabilidad y Estadística. Méjico:
McGraw Hill.
Welkowit, J.; Even, R.B. y Cohen, J. (1981). Estadística aplicada a las ciencias
de la educación. Madrid: Santillana.

2
1. LA LÓGICA DEL CONTRASTE DE
HIPÓTESIS
Inferencia estadística: extraer conclusiones acerca de
la población a partir de los datos obtenidos en una muestra.
Dos formas de inferencia estadística:
•Estimación de parámetros
•Contraste de hipótesis: procedimiento que nos permite
decidir si una proposición acerca de una población puede
ser mantenida o debe ser rechazada
En la investigación psicológica, o de otro tipo, es frecuente
encontrase con cuestiones del tipo:
¿produce el estímulo “a” tiempo de reacción más corto que
el estímulo “b”?
¿es la terapia A más apropiada que la terapia B para aliviar
los síntomas depresivos?
¿rinden los sujetos motivados más que los no motivados?
¿difieren los hombres y las mujeres en inteligencia?

Una vez que surge el problema, el paso siguiente es aventurar alguna


solución al mismo
Esta solución provisional suele tomar forma de afirmación
empíricamente contrastable en la que se establece de forma
operativa el comportamiento de la variable o variables involucradas
en el problema.
Esta afirmación contrastable recibe el nombre de hipótesis científica.
Así ante la pregunta ¿difieren los hombres y las mujeres en
inteligencia? podríamos aventurar la hipótesis: “las mujeres y los
hombres no difieren en inteligencia”.
Por supuesto, tendríamos que definir operativamente (con precisión)
qué entendemos por inteligencia y como vamos a medirla. Sólo
entonces nuestra afirmación sería una hipótesis científica.
Hecho lo anterior, ya estaríamos en condiciones de iniciar el proceso
de verificación o contraste de hipótesis

3
El primer paso para realizar un contraste de hipótesis es transformar
una hipótesis científica en una hipótesis estadística.
Hipótesis científica: “los hombres y las mujeres no difieren en
inteligencia”
Hipótesis estadística: µh=µm (esta hipótesis indicaría que en la
población de varones el promedio en inteligencia no difiere del
promedio de inteligencia en la población de mujeres)

El siguiente paso consiste en buscar evidencia empírica relevante


capaz de informar sobre si la hipótesis es o no sostenible.

Si una hipótesis sobre la población es correcta, al extraer una muestra


representativa de esa población debemos encontrarnos con un
resultado muestral similar a lo que esperábamos (a lo que dice la
hipótesis). En el ejemplo anterior al medir sobre una muestra de
mujeres y una muestra de hombres, las medias obtenidas han de
ser iguales

Una discrepancia importante entre la hipótesis y el resultado muestral


encontrado puede estar indicando dos cosas:
– La hipótesis es correcta y las diferencias encontradas se deben
a fluctuaciones debidas al azar
– La hipótesis es incorrecta

Pero, ¿CUÁNDO LA DISCREPANCIA ENCONTRADA ES LO


BASTANTE GRANDE COMO PARA CONSIDERAR QUE EL
RESULTADO ES INCOMPATIBLE CON LA HIPÓTESIS?

Llegados a este punto necesitamos tener una regla de decisión en


términos de probabilidad; si el resultado muestral encontrado es
muy poco probable consideraremos que la hipótesis es
incompatible con los datos, si es muy probable la
consideraremos compatible con los datos

4
Resumiendo: “un contraste de hipótesis es un proceso de decisión
en el que una hipótesis formulada en términos estadísticos es
puesta en relación con los datos empíricos para determinar si
es o no compatible con ellos”

En caso de llegar a la conclusión de incompatibilidad entre la hipótesis


y los datos, la rechazamos. En caso contrario, no podemos
rechazarla.

1. Las hipótesis estadísticas

Una hipótesis estadística es una afirmación sobre una o mas


distribuciones de probabilidad; más concretamente sobre la
forma de una o más distribuciones de probabilidad, o sobre el valor
de uno o más parámetros de esas distribuciones. Se representan
con H seguida de una afirmación que da contenido a la hipótesis:
H:  = 0.5
H:   30
H: μ1=μ2=μ3

5
Todo contraste de hipótesis se basa en la formulación de dos
hipótesis:
LA HIPÓTESIS NULA (H0): Es la que se somete a prueba estadística.
Consiste en una afirmación concreta sobre la forma de una
distribución de probabilidad o sobre el valor de alguno de los
parámetros de esa distribución.
H0: π1=π2
H0:μ1=μ2
H0: μ1=3
H0: distribución Normal de la variable en la población

LA HIPÓTESIS ALTERNATIVA (H1): Es la negación de la nula,


incluye todo lo que H0 excluye
H1: π1 ≠ π2
H1:μ1 ≠ μ2
H1: μ≠3
H1: μ>3
H1: las variables A y B son independientes

La hipótesis nula y alternativa se plantean en términos rivales. Son


hipótesis exhaustivas y mutuamente exclusivas, lo cual implica
que si una es verdadera, la otra es necesariamente falsa.
H0:μh=μm
H0:μh ≠ μm

El signo = o modelo del azar, lo que representa que los grupos son
iguales. El modelo del azar siempre se incluye en la hipótesis nula,
la que se somete a contraste estadístico, ya sea exacta (v = m) o
inexacta ( acierto  0.5)

HIPÓTESIS SIMPLE: si se especifica completamente la distribución


(μ=30, σ2=4)
HIPÓTESIS COMPUESTA: en caso contrario (μ≠30, σ2≠4, μ>8)

CONTRASTE BILATERAL: Cuando en H1 aparece el signo 


CONTRASTE UNILATERAL: Cuando en H1 aparecen los signos “  ”
ó“”

6
2. Los supuestos
Son un conjunto de afirmaciones que necesitamos establecer (sobre
la población de partida y sobre la muestra), para poder determinar
la distribución de probabilidad en la que se basará nuestra
decisión sobre la hipótesis nula. En general, los supuestos básicos
de una técnica estadística, son los requisitos que se deben cumplir
para que la técnica pueda ser aplicada.

3. El estadístico de contraste
Es un resultado muestral que permite:
• Proporcionar información empírica relevante sobre la
afirmación propuesta en la hipótesis nula
• Posee una distribución muestral conocida

4. La regla de decisión
Es el criterio que vamos a seguir para decidir si la hipótesis nula
se mantiene o se rechaza. Se basa en la partición de la
distribución muestral del estadístico en dos zonas mutuamente
exclusivas:

• Zona de Rechazo, Zona Crítica o Región Crítica: Es el área de la


distribución muestral que corresponde a los valores del estadístico
de contraste que se encuentran tan alejados de la afirmación
establecida en H0 que es muy poco probable que ocurran, si la
hipótesis nula es correcta. Su probabilidad es  (denominado nivel
de significación o nivel de riesgo)

• Zona de Aceptación: Es el área que corresponde a los valores del


estadístico de contraste próximos a la afirmación establecida en la
hipótesis nula. Su probabilidad es 1-  (o nivel de confianza)

7
La regla de decisión: Consiste en rechazar H0 si el estadístico de
contraste toma un valor que pertenece a la zona de rechazo o
crítica o mantener H0 si toma un valor que pertenece a la zona de
aceptación

El tamaño de las zonas de aceptación y rechazo se determinan fijando


el valor de α (nivel de significación o nivel de riesgo con el que se
desea trabajar). Los niveles para α considerados más
habitualmente en la literatura, y más utilizados en la investigación
empírica, son 0.01 y 0.05.

Recordemos, que dependiendo de cómo formulemos H1 los contrastes


de hipótesis pueden ser bilaterales o unilaterales

En los contrastes bilaterales, la zona crítica se encuentra,


generalmente repartida a partes iguales, de forma simétrica, en las
dos colas de la distribución muestral (gráfico A)

En los contraste unilaterales, se encuentra en una de las colas de la


distribución muestral (gráfico B), según la direccionalidad
establecida por la hipótesis alternativa

8
5. La decisión
El ultimo paso del contraste de hipótesis consiste en calcular el
estadístico de contraste a partir de los datos de la muestra y tomar
una decisión como se ha indicado previamente, siguiendo las
pautas que ofrece la regla de decisión.

Tal decisión se toma siempre respecto a H0 y consiste en rechazarla o


no rechazarla, de acuerdo con el valor tomado por el estadístico de
contraste y las condiciones establecidas previamente: si el
estadístico de contraste cae en la zona crítica se rechaza H0, si
el estadístico de contraste cae en la zona de aceptación, se
mantiene H0.
• Cuando decidimos mantener una hipótesis nula, queremos
indicar con ello que es compatible con los datos de la muestra
(en teoría, representativa de la población)
• Cuando decidimos rechazar una hipótesis nula, queremos
indicar con ello que es incompatible con los datos de la
muestra y consideramos probado que la hipótesis es falsa

6. Errores tipo I y tipo II


Error Tipo I (α): error cometido al rechazar H0 siendo verdadera
La probabilidad de cometer este error se denomina α o nivel de
significación

Error tipo II (β): error cometido al aceptar H0 siendo falsa


La probabilidad de cometer este error se designa por β

9
Siendo H0 la hipótesis nula y H1 la hipótesis
alternativa, tendremos el cuadro siguiente:

H0 es verdadera H0 es falsa

Aceptamos H0 Decisión correcta Error tipo II


(1-α) (β)
Rechazamos H0 Error tipo I Decisión correcta
(α) (1-β)

10
7. Potencia de un contraste
La potencia de un contraste (1-β) es la probabilidad de rechazar una
hipótesis nula que es falsa.

Esto es la capacidad que tiene un contraste para detectar que una


hipótesis nula concreta es falsa.

Diremos que una región crítica es la mejor o la mas potente cuando,


para un α dado, su potencia es mayor que la de cualquier otra de
las infinitas regiones que llevan asociadas esa misma probabilidad
α

9. COMPROBACIÓN DE HIPÓTESIS
ACERCA DE ALGUNOS PARÁMETROS
Al comprobar hipótesis sobre diferentes parámetros
seguiremos el siguiente esquema:
1. Proposición de una hipótesis nula (H0) y una alternativa
(H1) acerca de alguno o algunos parámetros de cierta
población
2. Características de esta población, especialmente la
distribución de probabilidad a la que dicha población
obedece .
3. Características de la muestra extraída de dicha población

11
4. Estadístico, calculado a partir de la muestra que nos
servirá para contrastar H0 frente a H1, y que por esta
razón llamaremos estadístico de contraste
5. Distribución muestral de estadístico de contraste, es
decir, distribución de probabilidad del mismo. Conviene
recordar que la desviación típica correspondiente a
dicha distribución suele ser llamada error típico del
estadístico de que se trate
6. Región crítica que se deriva del nivel de significación, α,
impuesto por nosotros de antemano
7. Criterio decisorio: rechazo o aceptación de H0, según
que el valor del estadístico, obtenido mediante una
muestra concreta, caiga dentro o fuera de la región
crítica.

10. Comprobación de hipótesis acerca de la


media
Seguiremos el siguiente esquema:

1. Una sola media


a) Supuesta conocida σ (desviación típica de la población)
b) Supuesta desconocida σ
2. Dos medias (diferencia de medias) con observaciones independientes
a) Supuestas conocidas σ1 y σ2 (desviaciones típicas de las
poblaciones)
b) Supuestas desconocidas σ1 y σ2, pero iguales
c) Supuestas desconocidas σ1 y σ2, pero distintas
3. Dos medias (diferencia de medias) con observaciones dependientes
a) Conocidas 1 y 2
b) Desconocidas 1 y 2

12
1. Una sola media
a) Supuesta conocida σ

1. Planteamiento de las hipótesis


H 0 :   0  H 0 :   0  H 0 :   0 
     
 H1 :   0   H1 :   0   H1 :   0 
2. Población :Normal
3. Muestra : observaciones independientes de tamaño n
X  0
4. Estadístico de contraste : Z 

n
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica :
Z  Z y Z  Z1
2 2

Z  Z
Z  Z1
7. Criterio de decisión siendo Z k el valor de Z obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Z k  Z y Z k  Z1
2 2

Z k  Z
Z k  Z1

Representación gráfica de las zonas de aceptación y


rechazo

13
1. Una sola media
b) Supuesta desconocida σ
1. Planteamiento de las hipótesis
 H 0 :   0  H 0 :   0  H 0 :   0 
     
 1
H :    0  H1 :    0   H1 :    0 
2. Población :Normal
3. Muestra : observaciones independientes de tamaño n
X 
4. Estadístico de contraste : T  ~ 0
s
n
5. Distribución muestral de T : Tn -1
6. Región crítica :
Tk  T , n 1
y Tk  T1 , n 1
2 2

Tk  T ,n 1
Tk  T1 ,n 1
7. Criterio de decisión siendo Tk el valor de T obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Tk  T , n 1
y Tk  T1 , n 1
2 2

Tk  T ,n 1
Tk  T1 ,n 1

2. Dos medias (diferencia de medias) con observaciones independientes


a) Supuestas conocidas σ1 y σ2 (desviaciones típicas de las poblaciones)
1. Planteamiento de las hipótesis
 H 0 : 1   2   H 0 : 1   2  0
  ó  
 H1 : 1   2   H1 : 1   2  0 
 H 0 : 1   2   H 0 : 1   2  0
  ó  
 H1 : 1   2   H1 : 1   2  0 
 H 0 : 1   2   H 0 : 1   2  0
  ó  
 H1 : 1   2   H1 : 1   2  0 
2. Poblaciónes : Ambas normales con desviones típicas poblacionales conocidas
3. Muestra : n1 y n 2 observaciones, todas ellas independientes entre sí.
X1  X 2
4. Estadístico de contraste : Z 
 12 2
2

n1 n2
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica :
Z  Z y Z  Z1
2 2

Z  Z
Z  Z1
7. Criterio de decisión siendo Z k el valor de Z obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Z k  Z y Z k  Z1
2 2

Z k  Z
Z k  Z1

14
2. Dos medias (diferencia de medias) con observaciones
independientes
b) Supuestas desconocidas σ1 y σ2, pero iguales
1. Planteamiento de las hipótesis
 H 0 : 1   2   H 0 : 1   2   H 0 : 1   2 
     
 H 1 :  1   2   H 1 : 1   2   H 1 :  1   2 
2. Poblaciónes : Ambas normales con desviaciones típicas poblacionales desconocidas
pero iguales
3. Muestra : n 1 y n 2 observaciones, todas ellas independientes entre sí.
X1  X 2
4. Estadístico de contraste : T 
(n1  1)~
s12  (n2  1)~
s 22 1 1

n1  n2  2 n1 n2
5. Distribución muestral de T : Tn1  n2  2
6. Región crítica :
Tk  T , n1  n2  2
y Tk  T1 , n1  n2  2
2 2

Tk  T , n1  n2  2
Tk  T1 ,n1  n2  2
7. Criterio de decisión siendo Tk el valor de T obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Tk  T , n1  n2  2
y Tk  T1 , n1  n2  2
2 2

Tk  T , n1  n2  2
Tk  T1 ,n1  n2  2

2. Dos medias (diferencia de medias) con observaciones independientes


c) Supuestas desconocidas y ≠ σ1 y σ2
1. Planteamiento de las hipótesis
H 0 : 1   2   H 0 : 1   2  0
  ó  
 H1 : 1   2   H1 : 1   2  0 
H 0 : 1   2   H 0 : 1   2  0
  ó  
 H1 : 1   2   H1 : 1   2  0 
H 0 : 1   2   H 0 : 1   2  0
  ó  
 H1 : 1   2   H1 : 1   2  0 
2. Poblaciónes : Ambas normales con desviones típicas poblacionales conocidas
3. Muestra : n1 y n 2 observaciones, todas ellas independientes entre sí.
X1  X 2
4. Estadístico de contraste : Z 
~
s12  ~s22
n1 n2

5. Distribución muestral de Z : Z N(0,1)


2
  s12   s22  
  n1    n2  
Z  tk donde k     
2
2 2
 s12   s22 
 n  n 
 1

2

n1  1 n2  1
6. Región crítica :
Z  Z y Z  Z1
2 2

Z  Z
Z  Z1
7. Criterio de decisión siendo Z k el valor de Z obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Z k  Z y Z k  Z1
2 2

Z k  Z
Z k  Z1

15
3. Dos medias (diferencia de medias) con observaciones dependientes
a) Conocida σd

1. Planteamiento de las hipótesis


 H 0 : 1   2   H 0 : 1   2   H 0 : 1   2 
     
 H 1 : 1   2   H 1 : 1   2   H 1 : 1   2 
2. Poblaciones : normales con  d conocida
3. Muestra : observaciones dependientes de tamaño n
D
4. Estadístico de contraste : T 
D
n
5. Distribución muestral de T : Tn -1
6. Región crítica :
Tk  T ,n 1 y Tk  T1 , n 1
2 2

Tk  T ,n 1
Tk  T1 ,n 1
7. Criterio de decisión siendo Tk el valor de T obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Tk  T , n 1
y Tk  T1 , n 1
2 2

Tk  T ,n 1
Tk  T1 ,n 1

3. Dos medias (diferencia de medias) con observaciones dependientes


a) Desconocida σd

1. Planteamiento de las hipótesis


 H 0 : 1   2   H 0 : 1   2   H 0 : 1   2 
     
 H 1 : 1   2   H1 : 1   2   H1 : 1   2 
2. Poblaciones : ambas normales con  d desconocida
3. Muestra : observaciones independientes de tamaño n
D
4. Estadístico de contraste : T  ~
sD
n
5. Distribución muestral de T : Tn -1
6. Región crítica :
Tk  T , n 1
y Tk  T1 , n 1
2 2

Tk  T ,n 1
Tk  T1 ,n 1
7. Criterio de decisión siendo Tk el valor de T obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Tk  T , n 1
y Tk  T1 , n 1
2 2

Tk  T ,n 1
Tk  T1 ,n 1

16
Ejercicio 1
La literatura científica establece que el tiempo medio de aprendizaje de
ciertas técnicas de terapia es de 1500 horas. Un psicólogo afirma
que el tiempo medio de aprendizaje de dichas técnicas es menor
que 1500 horas. Elegida una muestra aleatoria simple de 81
psicólogos clínicos que han sido sometidos al aprendizaje de dichas
técnicas, vemos que han tardado un total de 1450 horas en
manejarlas. Suponiendo que la desviación típica de la población
vale 180 horas, ¿tiene razón el psicólogo clínico en cuanto a la
duración del aprendizaje de dichas técnicas a un nivel de
significación de 0.01?

1. Planteamiento de las hipótesis


 H 0 :  0  1500
  Contraste unilateral a la izquierda
 H 1 :  0  1500 
2. Población :Normal
3. Muestra : 81 observaciones independientes
X  0
4. Estadístico de contraste : Z 

n
1450  1500
Z  2.5
180
81
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica : eligiendo   0.01, en la tabla de la curva normal :
Z 0.01  2.33

7. Criterio de decisión
Como  2.5 es menor que  2.33, entonces rechazo H 0
Luego lleva razón segundo psicologo que afirma que el tiempo medio de aprendizaje de las
técnicas es menor de 1500 h.

17
Ejercicio 2.

De acuerdo con los datos recogidos durante los últimos años por un
psicólogo escolar, los estudiantes de COU que no reciben
orientación vocacional obtienen una media de 190 en una prueba
de madurez. El psicólogo opina que los estudiantes que sí reciben
orientación vocacional obtienen un promedio superior en la
mencionada prueba. Para obtener alguna evidencia sobre su
sospecha, toma una muestra aleatoria de 81 estudiantes entre los
que habían recibido orientación vocacional y les pasa una prueba
de madurez. Obtiene una media de 198 y una desviación típica
insesgada de 24 ¿podemos pensar con un nivel de significación de
0.05 que estos datos apoyan la opinión del psicólogo?

1. Planteamiento de las hipótesis


 H 0 :  0  190
  Contraste unilateral a la derecha
 H 1 :  0  190 
2. Población :Normal
3. Muestra : observaciones independientes de tamaño 81
X 
4. Estadístico de contraste : T  ~ 0
s
n
198  190 8
T   2.99
24 2.67
81
5. Distribución muestral de T : Tn -1
T  1.66
0.95 80

6. Región crítica :
Tk  T1 ,n 1
7. Criterio de decisión
Como 2.99 es mayor que 1.66 rechazamos H 0
Luego concluimos que el promedio obtenido en una prueba de madurez por los estudiantes de
COU que reciben orientción vocacional es significativamente superior al obtenido por los
estudiantes que no la reciben. Los datos apoyan por tanto la opinión del psicólogo.

18
Ejercicio 3

Elegimos aleatoriamente 50 alumnos de un colegio de Granada y 120


de un colegio de Málaga. La pertenencia a uno u otro depende de
causas meramente fortuitas. En particular no depende de la
inteligencia de sus alumnos. Supongamos que en cada uno de los
colegios se sigue un método diferente de enseñanza de las
matemáticas. Supongamos que sea 74 la media obtenida en un
examen de matemáticas por los 50 alumnos del colegio de Granada
y 79 la media obtenida en el mismo examen por los 120 alumnos
del colegio de Málaga. Sabiendo que la desviación típica de los
alumnos del colegio de Granada vale 12 y la de los alumnos del
colegio de Málaga vale 18. ¿podemos afirmar a un nivel de
significación de 0.01 que los resultados obtenidos por los alumnos
en la prueba de matemáticas son diferentes?

1. Planteamiento de las hipótesis


 H 0 : 1   2   H 0 : 1   2  0 
  ó   Contraste bilateral
 H 1 : 1   2   H 1 : 1   2  0 

2. Poblaciónes : Ambas normales con desviaciones típicas poblacionales 12 y 18, respectivamente


3. Muestra : n 1  50 y n 2  120 observaciones, todas ellas independientes entre sí.
X1  X 2
4. Estadístico de contraste : Z 
 12 2
2

n1 n2
74  79 5
Z   2.12
144  324 2.36
50 120
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica : con   0.01, en la tabla de la curva normal
Z  Z y Z  Z 1
2 2

Z 0.005  2.58 Z 0.995  2.58


7. Criterio de decisión : como - 2.58  -2.12  2.58 (se encuentra dentro del intervalode aceptación)
no rechazamos H 0
Luego no podemos afirmar que existan diferencias en el rendimiento en matemáticas entre los dos colegios
aunque se utilice un método diferente de aprendizaje de las mismas

19
Ejercicio 4
Se sabe que el cociente intelectual de los alumnos de cierta universidad sigue una distribución
normal de media desconocida y desviación típica 15. Si en una muestra de 50 alumnos se
observó un cociente intelectual de 116 puntos ¿podríamos afirmar a un nivel de
significación de 0.01 que la media de los alumnos de dicha universidad es superior a 125
puntos?
1. Planteamiento de las hipótesis
 H 0 :  0  125
  Contraste unilateral a la derecha
 H 1 :  0  125 
2. Población :Normal
3. Muestra : 50 observaciones independientes
X  0
4. Estadístico de contraste : Z 

n
116  125 9
Z   4.24
15 2.121
50
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica : eligiendo   0.01, en la tabla de la curva normal :
Z 0.990  2.33 (es un contraste unilateral a la derecha por eso es 1 -  )

7. Criterio de decisión
Como  4.24 es menor que 2.33, nos encontramos en la zona de aceptación de H 0
Luego, no podemos afirmar que la media de los alumnos de dicha universidad sea mayor
que 125

Ejercicio 5
Los resultados obtenidos por 501 niños en un test de aptitud numérica reflejan una puntuación
media de 59 puntos y una desviación típica insesgada de 20 puntos ¿Se puede aceptar a
un nivel de significación de 0.01 que la puntuación media obtenida por niños cualesquiera
será mayor de 60 puntos?.
1. Planteamiento de las hipótesis
 H 0 :  0  60
  Contraste unilateral a la derecha
 H 1 :  0  60 
2. Población :Normal
3. Muestra : observaciones independientes de tamaño 501
X 
4. Estadístico de contraste : T  ~ 0
s
n
59  60 1
T   1.118
20 0.894
501
5. Distribución muestral de T : Tn -1
T
0.990 500  2.334
6. Región crítica :
Tk  T1 ,n 1
7. Criterio de decisión
Como - 1.118 es menor que 2.334, se encuentra dentro de la zona de aceptación, luego
no rechazamos H 0
Así, la puntuación media obtenida por los niños no es mayor de 60 puntos

20
Ejercicio 6

Deseamos conocer si la utilización de un nuevo método de didáctica de las matemáticas


mejora el rendimiento de los alumnos de Primaria. Elegimos aleatoriamente 50 alumnos de
Primaria de un centro que han recibido nuevo método de enseñanza de las matemáticas y
sabiendo que la desviación típica de los alumnos de ese centro vale 12, se ha obtenido una
puntuación media en un test de rendimiento de 95. Igualmente hemos elegido una muestra
de 70 alumnos de otro centro que han recibido el método tradicional de enseñanza,
sabiendo que la desviación típica de los alumnos de ese centro vale 18, se ha obtenido una
media de 75. ¿Podemos afirmar a un nivel de confianza del 95% que el nuevo método de
enseñanza de las matemáticas mejora el rendimiento de los alumnos en matemáticas?.

1. Planteamiento de las hipótesis


 H 0 : 1   2   H 0 : 1   2  0
  ó   Contraste bilateral
 H1 : 1   2   H1 : 1   2  0 

2. Poblaciones : Ambas normales con desviaciones típicas poblacionales 12 y 18, respectivamente


3. Muestra : n 1  50 y n 2  70 observaciones, todas ellas independientes entre sí.
X1  X 2
4. Estadístico de contraste : Z 
 12 2
2

n1 n2
95  75 20
Z   7.299
144  324 2.74
50 70
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica : con   0.05, en la tabla de la curva normal
Z  Z1-
Z0.950  1.65
7. Criterio de decisión : como 7.299  1.65 (se encuentra dentro de la región crítica)
rechazamos H 0
Luego, podemos afirmar que con el método nuevo se obtienen mejores resultados que
con el método tradicional

21
Ejercicio 7

Se ha llevado a cabo un estudio para observar si los dibujos actúan como


facilitadores o entorpecedores del aprendizaje de palabras en niños de
3 y 4 años. Se han seleccionado dos muestras de 41 y 61 niños
respectivamente. A la primera muestra se les han intentado enseñar
palabras sin utilizar ilustraciones, obteniéndose en un test de
aprendizaje una puntuación media de 74 en un test y una desviación
típica insesgada de 18. Y a la segunda muestra se les ha intentado
enseñar las mismas palabras con sencillos dibujos obteniéndose en
este caso una puntuación media de 79 y una desviación típica
insesgada de 20. ¿Podemos afirmar a un α= 0.01 que el aprendizaje de
palabras es diferente con y sin la utilización de ilustraciones en niños de
3 y 4 años suponiendo que las desviaciones típicas poblacionales son
iguales?

Caso: Dos medias independientes con σ1 y σ2 desconocidas


pero iguales
1. Planteamiento de las hipótesis
 H 0 : 1   2 
 
 H 1 : 1   2 
2. Poblaciónes : Ambas normales con desviaciones típicas poblacionales desconocidas
pero iguales
3. Muestra : 41 y 61 observaciones, todas ellas independientes entre sí.
X1  X 2
4. Estadístico de contraste : T 
( n1  1)~
s12  (n2  1)~
s 22 1 1

n1  n2  2 n1 n2
74  79 5
T   1.288
40(18 2 )  60(20 2 )
1

1 3.882
41  61  2 41 61
5. Distribución muestral de T : Tn1  n2  2
T41 61 2  T100
6. Región crítica (contraste bilateral)
Tk  T , n1  n2  2
y Tk  T1 , n1  n2  2
2 2

0.005T100  2.626 y 0.995T100  2.626

7. Criterio de decisión : Como - 2.626  -1.288  2.626, no podemos rechazar H 0


- el estadístico se encuentra dentro de la región de aceptación -
Luego, la utilización de ilustraciones no facilita el aprendizaje de palabras en
niños de 3 y 4 años

22
Ejercicio 8
Supongamos que en el ejemplo anterior no se especifica que σ1 y σ2 son iguales
(con lo cual damos por hecho que son desconocidas y distintas)
1. Planteamiento de las hipótesis
 H 0 :   0 
 
 H1 :   0 
2. Poblaciónes : Normales . Carecemos ahora de motivos que nos permitan
suponer que  1 y  2 son iguales
3. Muestra : n1  41 y n1  61 observaciones, todas ellas independientes entre si
X1  X 2
4. Estadístico de contraste : Z 
~
s12 ~
s2
 2
n1 n2
74  79 5
Z   1.326
182 20 2 3.8

41 61
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica (con   0.01)
Z  Z y Z  Z1
2 2

z 0.005  -2.58 y z 0.995  2.58

7. Criterio de decisión : Como - 2.58  -1.316  2.58, no podemos rechazar H 0


- el estadístico se encuentra dentro de la región de aceptación -
Luego, la utilización de ilustraciones no facilita el aprendizaje de palabras en
niños de 3 y 4 años

Ejercicio 9

Según sugieren algunos trabajos, los niños con problemas perceptivos


aumentan su rendimiento con entrenamiento adecuado en preguntas
del test de Raven que habitualmente no resuelven con estrategias
adecuadas. Con el fin de obtener evidencia adicional sobre esta
afirmación, un investigador seleccionó una muestra aleatoria de 10
niños con problema perceptivos y les pasó el test de Raven para
obtener una medida inicial de los 10 niños en el test. Después los
entrenó durante dos meses en tareas similares, pero no iguales a las
planteadas en el test de Raven y les volvió a pasar el test de Raven
para obtener una medida post-tratamiento. La puntuación media
obtenida por los niños en la fase pretratamiento fue de 75.8 puntos y
la puntuación media obtenida por los niños después del tratamiento
fue de 81.8 ¿podríamos afirmar a un nivel de significación de 0.01 que
el entrenamiento mejora el rendimiento en el test de Raven en niños
con problemas perceptivos, conociendo que la media de las
diferencias vale -6 y la varianza poblacional de las diferencias de
puntuaciones vale 24.44?

23
Caso: Dos medias dependientes con σD conocida

1. Planteamiento de las hipótesis :


 H 0 : 1   2 
 
 H 1 : 1   2 
2. Poblaciones : normales con  d conocida (la  2 d  24.44 luego, la
 d  24.44  4.94
3. Muestra : observaciones dependientes de tamaño 10
D
4. Estadístico de contraste : T 
D
n
6
T  3.84
4.94
10
5. Distribución muestral de T : T9
6. Región crítica (contraste unilateral a la izquierda)
0.01T9  -2.821

7. Criterio de decisión : Como - 3.84  -2.821, se encuentra en la zona


de rechazo de H 0 .
Luego concluimos que el entrenamiento efectuado consigue mejorar el
rendimiento medio de los sujetos con problemas perceptivos

Ejercicio 10
Suponga cinco niños a los que aplicamos una prueba de memoria en
dos ocasiones la primera dos horas tras el aprendizaje de una lista de
palabras y la segunda una semana mas tarde del aprendizaje y los
resultados son los siguientes:
¿Podemos afirmar a un nivel de significación de 0.05 que el recuerdo
disminuye al aumentar el tiempo de recuerdo?

Xi1 Xi2 Di Di-D (Di-D)2

4 0 4 1 1
9 4 5 2 4
7 8 -1 -4 16
10 6 4 1 1
15 12 3 0 0
45 30 15 0 22

Caso: Dos medias dependientes desconocida σD

24
Con los datos anteriores podemos calcular:
X 1  45 / 5  9
X 2  30 / 5  6
d  15 / 5  3
~ 2 22
sd   5.5
5 1
~
s d  2.345
Con estos datos nos encontramos ante un contraste de dos medias dependientes
con  d desconocida.
1. Planteamiento de las hipótesis
 H 0 : 1   2 
 
 H 1 : 1   2 
2. Poblaciones : normales con  d desconocida
3. Muestra : observaciones dependientes de tamaño 5
D
4. Estadístico de contraste : T  ~
sD
n
3 3
T   2.84
2.345 / 5 1.049
5. Distribución muestral de T : Tn -1
T51
6. Región crítica (contraste unilateral a la derecha)
0.950T4  2.132

7. Criterio de decisión : como 2.84  2.132 se encuentra dentro de la zona de rechazo


de forma que rechazamos H 0
Luego podemos afirmar que cuando incrementa el tiempo de recuerdo, disminuye el
recuerdo de palabras

Ejercicio 11

Para comparar la nota media en selectividad por los alumnos que


estudian Ingeniería y los alumnos que estudian Filosofía, se toma
una muestra de tamaño 41 de estudiantes de primer curso de
Ingeniería y una muestra de tamaño 61 de estudiantes de Filosofía.
En la primera se observa una puntuación media de 7.75 y desviación
típica de 0.9 y en la segunda una media de 5.03 y desviación típica
de 0.5. Conociendo que la desviación típica poblacional de la nota
obtenida en selectividad es la misma para ambas carreras, ¿es
aceptable a un nivel de significación de 0.05 decir que los alumnos
de Ingeniería obtienen una nota superior en selectividad a los
estudiantes de Filosofía?

25
Caso: Dos medias independientes con σ1 y σ2 desconocidas e iguales
1. Planteamiento de las hipótesis
 H 0 : 1   2 
  Contraste bilateral a la derecha
 H 1 : 1 2 
2. Poblaciónes : Ambas normales con desviaciones típicas poblacionales desconocidas
pero iguales
3. Muestra : 41 y 61 observaciones, todas ellas independientes entre sí.
X1  X 2
4. Estadístico de contraste : T  
(n1  1)~
s12  (n2  1)~
s22 1 1

n1  n2  2 n1 n2
Pr oblema : tenemos las desviaciones típicas pero no son insesgadas
La forma de obtenerlas
~ n ~ 41 ~ 61
S ·S S1  ·0.9  0.922 S1  ·0.5  0.508
n -1 41 - 1 61 - 1
7.75  5.03 2.72 2.72
T    19.19
(41  1)0.922 2  (61  1)0.5082 1 1 34.003  15.484 0.141
 ·0.2
61  41  2 61 41 100
5. Distribución muestral de T : Tn1  n2  2
T41 61 2
T100
6. Región crítica : 0.95T100  1.66 (complementario de T
0.95 100  1.66)
Como 19.29 es mayor que 1.66, se encuentra dentro de la región de rechazo de H 0,
Luego podemos afirmar que los alumnos de Ingeniería tienen una media mayor que
los estudiantes de Filosofía

Ejercicio 12

Se trata de comprobar la eficacia de dos métodos de tratamiento


conductual de la “enuresis” basados en dos modelos teóricos
diferentes: a) modelo de control cortical y b) modelo de
reforzamiento social. Tenemos datos de dos grupos de pacientes
que han sido tratamos mediante dichos procedimientos, y que son
homogéneos en cuanto a otras variables como edad, sexo y tipo de
enuresis. Al cabo de varios días de adaptación al método se anota
para cada sujeto los días que tardan en recuperarse. Los resultados
han sido para el primer grupo una media de 23 día y una desviación
típica insesgada de 3 (n=6), y para el segundo grupo una media de
recuperación de 18 días y una desviación típica insesgada de 2
(n=4). A la vista de los datos anteriores ¿se puede afirmar a un nivel
de significación de 0.01, que ambos métodos tienen la misma o
distinta eficacia?

26
Caso: Dos medias independientes con σ1 y σ2 desconocidas y distintas

1. Planteamiento de las hipótesis


 H 0 : 1   2 
  Contraste bilateral
 H1 : 1   2 
2. Poblaciones : ambas normales con desviaciones típicas poblacionales desconocidas y como no
se especifica suponemos que son distintas
3. Muestra : 6 y 4 observaciones, todas ellas independientes entre si
X1  X 2
4. Estadístico de contraste : Z 
~
s12  ~s22
n1 n2
X1  X 2 23  18 5 5
Z     3.162
~
s12  ~s22 32  2 2 1.5  1 1.518
n1 n2 6 4
5. Distribución muestral de Z : t k 10 k  10
6. Región crítica :
t  3.17
t  3.17
Luego como 3.162 es menor que 3.17 se encuentra dentro de la zona de aceptación de H 0
Por lo que podemos decir que los métodos tienen igual eficacia

Ejercicio 13

Nos interesa saber si una determinada práctica de memorizar influye


en la mejora de las puntuaciones obtenidas en un test de memoria.
Para ello elegimos aleatoriamente a 50 niños y los sometemos a
dos test paralelos de recuerdo, rellenan un primer test antes de ser
entrenados en la práctica de memorizar y un segundo test una vez
que han sido entrenados en dicha práctica de memorizar.
Conocemos que, en la población la diferencia entre dichas
puntuaciones se distribuye de manera normal y con desviación
típica de 3. Y sabemos que la media de las puntuaciones obtenidas
por los alumnos en el test una vez que han sido entrenados en la
práctica de memorizar ha sido superior en 25 puntos a cuando
recordaban de forma natural. ¿Se podría afirmar a un nivel de
significación de 0.05 que la práctica de memorizar mejora el
recuerdo de los niños?

27
Caso: Dos medias dependientes conocida σD

1. Planteamiento de las hipótesis


 H 0 : 1   2 
 
 H 1 : 1   2 
1  con práctica de memoria
 2  sin memorizar
2. Poblaciones : normales con  d  3
3. Muestra : 50 observaciones dependientes
D
4. Estadístico de contraste : T 
D
n
25 25
T   58.9
3 0.424
50
5. Distribución muestral de T : T50-1
6. Región crítica :
Tk  T1 ,n 1
T Como no está la T con 49 gl buscamos con 50,
0.95 49

T  1.676
0.95 50

Como 58.9  1.67 nos encontramos en la zona de rechazo de H 0 ,


Luego podemos afirmar se obtienen mejores resultados utilizando la práctica
de memoria

Ejercicio 14

Se han seleccionado en un centro de salud mental, nueve pares de


pacientes diagnosticados semejantes en el grado de depresión que
padecen. Uno de cada par ha sido sometido a diferente técnica de
tratamiento contra la depresión, concretamente uno ha sido
sometido a técnicas psicoanalíticas, mientras que el otro ha recibido
técnicas cognitivo-conductuales. Considerando el nivel de mejora,
se sabe que la media de las puntuaciones obtenidas por los
pacientes que han sido sometidos a técnicas cognitivo-
conductuales ha sido superior en 4 puntos a los pacientes que han
recibido tratamiento psicoanalítico y sabiendo que la varianza
insesgada de las diferencias ha salido 6, ¿consideras que el
tratamiento cognitivo conductual produce resultados
significativamente distintos que el tratamiento psicoanalítico en la
cura de la depresión a un nivel de significación de 0.05?

28
Caso: Dos medias dependientes desconocida σD

1. Planteamiento de las hipótesis


 H 0 : 1   2 
  Contraste unilateral a la derecha
 H1 : 1   2 
1  tratamiento cognitivo - conductual
 2  tratamiento psicoanalítico
2. Poblaciones : ambas normales con  d desconocida
3. Muestra : 9 observaciones dependientes
D
4. Estadístico de contraste : T  ~
sD
n
4 4
T   4.902
6 0.816
9
5. Región crítica
Tk  T1 ,n 1
T  1.860
0.95 8

Como 4.902  1.860 que nos encontramos en la zona de rechazo de H 0


Luego podemos afirmar que el tratamiento cognitivo conductual produce
mejores resultados

Ejercicio 15
La altura media de una muestra aleatoria simple de 20 varones fue de
175cm y la de una muestra de 22 mujeres fue de 167cm. La
varianza insesgada de la muestra de varones vale 0,50 y la de la
muestra de mujeres vale 0,40. Suponiendo que la altura, tanto en la
población de varones como en la de mujeres se distribuye según
una distribución Normal, ambas con igual varianza, ¿es compatible
con los resultados obtenidos la hipótesis de igualdad en las alturas
promedio en ambas poblaciones? (α=0,01)
Solución: No es compatible dicha hipótesis con los datos obtenidos

Ejercicio 16
Una medicina A es aplicada a 26 pacientes aquejados de cierta
enfermedad. Otra medicina B es aplicada a otros 26 pacientes
aquejados de la misma enfermedad. Los resultados fueron los
siguientes: duración media requerida por la medicina A para curar la
enfermedad = 20 días, duración media requerida por la medicina B
para curar la enfermedad=17 días, siendo las varianzas insesgadas,
de A 37 y de B 35. ¿Son compatibles los resultados obtenidos con
la hipótesis de que el tiempo medio requerido para curar la
enfermedad por la medicina A y B es el mismo? (α=0,05)
Solución: Si, los datos son compatibles con dicha hipótesis

29
VARIANZAS
1. Una varianza poblacional

Estadístico de contraste : X 
n  1~s 2 X   n21
 2
0

~s 2   (X  X ) 2

n 1

3. Cociente de dos varianzas poblacionales.


a) Muestras independientes
~
s12
Estadístic o de contraste : F  ~ 2 F  Fn1 1, n 2 1
s 2

b) Muestras dependientes (realizamos el


contraste pero no calculamos el intervalo
de confianza)
Estadístic o de contraste :

T 
n2  x 2
1   x 22  T  tn2
 x12  x 22   x1 x 2 
2
2

30
Ejercicio 17

Suponga dos formas paralelas del mismo test de inteligencia espacial.


Se aplican al mismo grupo de 27 niños y se obtienen

 x x 
1 2
2
 7200 x2
1  121; x 2
2  100

Son las varianzas poblacionales iguales o distintas, a un nivel de


confianza del 95%?.

Solución: las varianzas son iguales

Ejercicio 18

Sdeseamos saber si la varianza en cierta población de estudiantes,


debida a la aplicación de un test X1 es igual a la debida a la
aplicación de otro test X2. Para ello elegimos al azar una muestra
aleatotoria simple de 61 estudiantes a los que aplicamos el test X1 y
otra de 41 estudiantes a los que aplicamos el test X2. Las varianzas
insesgadas de las muestras uno y dos son, respectivamente, 20 y
10. Son iguales o distintas las dos varianzas poblacionales con un
nivel de confianza del 95%?

Solución. Se rechaza la hipótesis nula

31
Ejercicio 19

En un taller son elegidos nueve pares de operarios, siendo lo más


parecidos posible en sus habilidades mecánicas las dos personas
de cada par, salvo que uno de cada par ha sido sometido a un
nuevo método B de aprendizaje mecánico, mientras que el otro ha
sido sometido al tradicional A. Sabiendo que el número medio de
piezas producidas por los sometidos al método B ha sido superior
en 4 al número medio de piezas producidas por los que aprendieron
con el método A, y sabiendo que la varianza insesgada de las
diferencias ha valido 6, indique si el método B produce resultados
significativamente distintos del método A (α=0,05)
Solución:No, el método B no produce resultados significativamente
distintos que el A

Ejercicio 20

Mediante un método tradicional, M1, la población de niños alumnos de


EGB de Madrid vienen obteniendo en una asignatura una media de
30 y una desviación típica de 16. Un ´nuevo método didáctico, M2,
supuestamente superior al primero, se aplica a una muestra
aleatoria simple de 256 niños madrileños de EGB, habiendo
resultado la media de dicha muestra 32. ¿Podemos afirmar a un
nivel de significación de α=0,10 que M2 es superior a M1?.
¿Podemos hacerlo a un nivel de significación α=0,01?.

Ejercicio 21
Los diámetros de 31 piezas –componentes de un aparato de registro-,
elegidos al azar de entre los producidos en cierta2 planta industrial
tienen una varianza insesgada de ~s  0,0625mm . ¿Es compatible
2

(α=0,05) con este resultado la hipótesis nula H 0 :  2  0,0484 mm 2


como supuesta varianza de los diámetros de la población de piezas
producidas en dicha planta industrial?
Solución: se acerpta la hipótesis nula

32
Ejercicio 22

En cinco días elegidos al azar, dos talleres fabricantes del mismo tipo
de piezas, han producido las siguientes piezas:

Taller 1: 8 9 7 8 8
Taller 2: 11 11 9 10 9

¿Es compatible con los resultados anteriores la hipótesis nula de


igualdad del número promedio de piezas elaboradas desde ambos?
(α=0,01). Entre qué valores se encuentra la diferencia entre el
número medio de piezas fabricadas entre uno y otro taller?.

Solución:Los datos obtenidos no son compatibles con dicha hipótesis


nula.

Ejercicio 23

Se sabe que la duración del sueño en cierta población se distribuye


normalmente con media igual a 7 horas. Intentamos ver si cierta
dosis de un sedante S alarga la duración del sueño. Para ello
elegimos aleatoriamente una muestra aleatoria de 25 personas y les
aplicamos dicha dosis. El resultado es que la duración media del
sueño en estas 25 personas ha sido de 8 horas y la desviación
típica insesgada ha sido de 4,84 horas. ¿Es compatible con estos
datos la hipótesis H0: μ=7 frente a H1: μ>7, siendo α=0,05?. Calcule
el intervalo de confianza para la media poblacional.

Solución:Si, los datos son compatibles con la hipótesis nula planteada.

33