Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cuadernos Ejercicios Diseños Bueno
Cuadernos Ejercicios Diseños Bueno
Diseños de Investigación
y Análisis de Datos
11 sanz y torres
índice
Presentación........................................................................................................ IX
BLOQUE 1
Estimación de parámetros y contraste de hipótesis
en los diseños de una muestra
BLOQUE 11
Análisis de datos en los diseños de
dos muestras independientes o relacionadas
BLOQUE 111
Análisis de datos en los diseños de
tres o más muestras: el análisis de varianza
BLOQUE IV
Análisis de regresión
VII
Presentación
l. CONDICIONES Y SUPUESTOS
En todo análisis inferencia! el estudiante debe identificar la hipótesis de la in
vestigación (resultado de la derivación de una teoría) así como, las variables (in
dependientes y dependientes) implicadas en estas hipótesis y su naturaleza. Un
aspecto esencial de este apartado son los supuestos que deben verificarse para
que podamos confiar en los resultados obtenidos. Estos supuestos son condiciones
que deben cumplirse para que el análisis tenga sentido. Además, cada análisis tiene
sus propios supuestos. En la medida de lo posible estos también debe ponerse a
prueba. Si no es posible hacerlo, deben hacerse explícitos. De alguna forma, son
como los cimientos de un edificio. El edificio puede estar bien construido pero si los
cimientos son de arena, el edificio no podrá sostenerse.
Las condiciones hacen referencia a diversos aspectos del diseño. Por ejemplo, si
los datos objeto de análisis provienen de una, dos o más de dos muestras, las cuales
a su vez pueden ser independientes o relacionadas, de la escala de las variables, etc.
Los contrastes a utilizar dependerán de estos factores.
Presentación •
y clara: Notan las mujeres en mayor proporción a partidos de centro izquierda que
a los de centro derecha?; En el proceso de trabajo manual ¿es más eficaz verba/izar
las acciones durante la tarea que hacerlas en silencio?; ¿Es más eficaz una terapia
A que otra B para el tratamiento de la fobia de los niños a montar en ascensores?;
¿Los salarios de hombres y mujeres son iguales por un mismo trabajo?».
Una vez planteada la pregunta se formulan las hipótesis nula, Ha , y su comple�
mentaría, la hipótesis alternativa o H 1 que son exhaustivas y mutuamente excluyen-
tes lo que significa que el rechazo de una implica la aceptación de la otra.
La hipótesis nula es la hipótesis que provisionalmente se acepta como verdadera
y, por tanto, la que se somete a contrastación empírica con los datos obtenidos en
la investigación (similar a la presunción de inocencia en un estado de derecho). To
dos los cálculos estadísticos se realizan asumiendo que Ha es correcta de tal forma
que si la rechazamos, lo estaremos haciendo con un alto nivel de confianza. «En
general, la hipótesis nula afirma que no existe diferencia entre el valor del estadís
tico obtenido en la muestra y el que formulamos como parámetro pob/acional o, en
otras palabras, que la diferencia observada entre estos dos valores es nula. Como la
realidad es que estos valores casi nunca van a coincidir, lo que estamos afirmando
es que la diferencia observada puede explicarse como resultado del azar» (Pág. 34).
Dependiendo de cómo se formulen la hipótesis nula y alternativa tendremos un
contraste unilateral o bilateral pero, en todo caso, la hipótesis nula añadirá a la dife
rencia nula el sentido de la diferencia y la hipótesis alternativa el sentido contrario,
excluyendo la diferencia nula. Por ejemplo, ante la pregunta ¿Votan las mujeres en
mayor proporción a partidos de centro izquierda que a los de centro derecha?, las
hipótesis serían:
Ha : Las mujeres votan en la misma o menor proporción a partidos de centro
izquierda que de centro derecha.
H 1 : Las mujeres votan en mayor proporción a partidos de centro izquierda que
de centro derecha.
«Por lo general la hipótesis científica, dirigida a encontrar resultados significati
vos, es la hipótesis alternativa que se aceptará como verdadera si la investigación
aporta evidencias contra la hipótesis nula que es la que se somete a contrastación
empírica» (Pag. 37). Por lo general, pero no siempre, porque como se puede com
probar en varios de los ejemplos desarrollados en el libro de la asignatura y en los
que aquí se presentan es perfectamente legítimo, dependiendo del contexto y de
la situación, defender que hombres y mujeres tienen el mismo salario, que niños
payos y gitanos tienen el mismo rendimiento en tareas de compresión lectora, que
no existen diferencias en la reacción de celos de hombres y mujeres ante la infide-
x1
lidad sexual, que no hay diferencias entre la nota media obtenida en las pruebas
de selectividad de los estudiantes de la enseñanza pública y privada, etc. Pero la
que se acepta inicialmente como verdadera y sobre cuya asunción se realizan los
cálculos es la Ha. Y la evidencia de los datos obtenidos en la investigación dirá si se
mantiene o se rechaza esta afirmación de igualdad (la hipótesis nula) que puede ser
el objetivo para el que se ha desarrollado la investigación.
3. ESTADÍSTICO DE CONTRASTE
«Representa una medida de la discrepancia entre la información proporcionada
por los datos empíricos recogidos en la muestra y la proposición teórica planteada
en la hipótesis nula. Esta medida es una variable aleatoria con una determinada
distribución de probabilidad (normal, t, chi-cuadrado, etc.) que va a aportar infor
mación empírica sobre la afirmación formulada en la Ha» (Pág. 37 y que se puede
ampliar en el epígrafe 1.4.3}. Un estadístico no es más que una función numérica
dependiente de los valores muestrales, de la hipótesis nula supuesta verdadera y de
los supuestos. Es por ello que el cálculo que se realiza para computar el estadístico
de contraste se ha elegido para que nos proporcione una distribución estadística
conocida que nos permite calcular las probabilidades de sus valores.
El estadístico de contraste se reduce, pues, a una fórmula que se recoge en el
formulario y que el estudiante no debe memorizar pero sí aplicarla correctamente
para, una vez obtenido su valor, interpretarlo de cara a tomar una decisión respecto
a la_ Ha: su rechazo o no con una determinada probabilidad. En definitiva, el con
traste de hipótesis no es más que la combinación de la teoría de la probabilidad y
la teoría de la decisión.
4. REGLA DE DECISIÓN
Para tomar una decisión hay que calcular el nivel crítico p o los valores críticos
de la distribución de probabilidad del estadístico de contraste aplicado (distribución
normal, t, F, chi-cuadrado, etc). «Según Fisher, el nivel de significación a, repre
senta el máximo riesgo que el investigador está dispuesto a cometer al tomar la
decisión errónea de rechazar una hipótesis nula verdadera. Por tanto, a la luz de sus
resultados y del estadístico de contraste, el investigador calcula la probabilidad de
obtener unos resultados como los observados en la muestra o más extremos. Esta
probabilidad recibe el nombre de nivel crítico p. Si el nivel crítico p es muy pequeño
en comparación con el nivel de significación //alfa'� rechazamos la Ha y en caso con
trario la mantenemos» (Pág. 38}.
«Otra alternativa a la hora de tomar la decisión de rechazar o no la hipótesis
XII
Presentación •
S. CONCLUSIÓN
La aplicación de la regla de decisión nos permite tomar una decisión probabilísti
ca sobre Ha: aceptarla o rechazarla. Esta es la conclusión para la que se ha diseñado
y realizado el experimento. El objetivo es que esta decisión tendrá consecuencias
teóricas o prácticas importantes.
6. INTERPRETACIÓN
La conclusión de rechazar o no la H a, se debe interpretar en el contexto teórico
de la investigación que se está realizando de tal forma que permita confirmar o
rechazar la hipótesis científica que dio lugar a la hipótesis estadística. Esta interpre
tación debe servir para formular nuevos avances o desarrollos tanto teóricos como
prácticos en el área concreta que se esté investigando.
XIII
BLOQUE 1
Estimación de parámetros
y contraste de hipótesis
en los diseños de una muestra
SOLUCIÓN:
1.1. Para el primer contraste de hipótesis, seguiremos los siguientes pasos:
2 2
n·;n = 81·210 =
x2 = 110,25
ªº 180 2
Probabilidad
g.l.
0,005 0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,995
1 0,0000 0,0002 0,0010 0,0039 0,0158 2,7055 3,8415 5,0239 6,6349 7,8794
2 0,0100 0,0201 0,0506 0,1026 0,2107 4,6052 5,9915 7,3778 9,2103 10,5966
3 0,0717 0,1148 0,2158 0,3518 0,5844 6,2514 7,8147 9,3484 11,3449 12,8382
4 0,2070 0,2971 0,4844 0,7107 1,0636 7,7794 9,4877 11,1433 13,2767 14,8603
50 27,9907 29,7067 32,3574 34,7643 37,6886 63,1671 67,5048 71,4202 76,1539 79,4900
60 35,5345 37,4849 40,4817 43,1880 46,4589 74,3970 79,0819 83,2977 88,3794 91,9517
70 43,2752 45,4417 48,7576 51,7393 55,3289 85,5270 90,5312 95,0232 00,4252 104,2149
80 51,1719 53,5401 57,1532 60,3915 64,2778 96,5782 101,8795 106,6286 116,3211
90 59,1963 61,7541 65,6466 69,1260 73,2911 107,5650 113,1453 118,1359 124,1163 128,2989
100 67,3276 70,0649 74,2219 77,9295 82,3581 118,4980 124,3421 129,5612 135,8067 140,1695
106,6 2 11 2,3 2
1
!x 2 = 110, 2sl
1.2. Para el segundo contraste de hipótesis, sobre el sueldo medio, seguiremos los
mismos pasos:
H0 : µ21.500 H1 :µ<1.500
z----
- Y-µo -
1400-1500
=-5
CT 180
Fn Fsi
REGLA DE DECISIÓN: En la tabla de la distribución normal tipificada de puntua-
dones Z buscamos el valor crítico para un nivel de confianza del 99% para un con-
traste unilateral izquierdo, es decir, el valor de Z que deja por debajo una probabili-
dad de 0,01, y es -2,33.
-3,50 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,40 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,30 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,20 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,10 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,00 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,90 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,80 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,70 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,60 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,50 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
™
-2,40 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
(i§) 0,0107 0,0104 0,0102 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,20 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,10 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,00 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-1,90 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-1,80 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,70 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,60 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,50 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,40 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,30 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
/
Soluciones a los ejercicios de los capítulos 1 y 2 •
0,0002
Z=-5
p < 0,0002
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Se utiliza una muestra extraída de una población
con distribución normal y varianza desconocida. Se analiza la variable «edad de ini
cio del consumo de alcohol» en los jóvenes que es una variable medida con escala
de razón. Aunque la muestra es pequeña como la variable tiene distribución normal
en la población podremos utilizar un contraste paramétrico.
HIPÓTESIS: El investigador quiere comprobar que la edad media de inicio en su
Comunidad es más tardía (por tanto, mayor) que la media de la población gene
ral establecida en 13 años. Para ello, formulará un contraste unilateral derecho en
el que la hipótesis nula que establece que no hay diferencia significativas entre la
edad media en su Comunidad y la media de la población general
14 1
T = y - µo = - 3 = 1' 786
sn-1/ 2,8/
/Fn !E
Y-µ o
T=
sn/
/)n-1
p = 0,025
1,711 2,064
T= 1,786
Probabilidad
g.l.
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900
e@]) 0,975 <@E) 0,995
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 2,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064
@ 2,797
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
Tabla 3: Representación gráfica del nivel crítico del estadístico t = 1, 786y su localización en la tabla
de la distribución t.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Se utiliza una muestra de 400 personas y la varia
ble dependiente es el «apoyo que recibirá el partido X en las próximas elecciones».
Es una variable dicotómica con distribución binomial. La muestra es grande por lo
que esta distribución se aproximará a la normal.
HIPÓTESIS: En la muestra utilizada en el sondeo encargado por el partido X, la
proporción de personas que les votarían es del 32% (128/400 = 0,32). A partir de
esta evidencia mostrada en los datos, se quiere contrastar si «el nivel de apoyos
será del 40%». Como no se marca si la diferencia será mayor o menor que ese valor
se plantea un contraste bilateral, con las siguientes hipótesis:
H0: n = 0,40
(j
P
-) "o ( 1 - ,c0 ) _ O, 40 ( 1- O, 40)
_ -----=0,0245
n 400
10
Y el estadístico:
P-n 0 = 0, 32 - 0 , 40 =
Z= -3,266
CT P 0,0245
Z=-3,27 Z = 3,27
-3,50 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,40 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,30 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,20 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005
-3,10 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0007 0,0007
-3,00 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,90 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,80 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,70 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
Tabla 4: Reproducción parcial de la tabla de la distribución normal N{0;1} para encontrar el nivel
crítico p, P(Z < = -3,27) representado en la figura superior.
de contraste con los valores críticos que son ±1,96 y ±2,58 correspondientes a los
niveles de confianza del 95% o del 99%, respectivamente, para un contraste bilate-
ral.
INTERPRETACIÓN: El nivel de apoyo que recibirá el partido X en las próximas
elecciones será significativamente distinto del 40% (Z = -3,266; p < 0,001).
INTERVALO DE CONFIANZA: A esta misma conclusión se llega utilizando el inter
valo de confianza para estimar, a partir de la proporción observada en la muestra,
la proporción poblacional de votantes que tendrá el partido.
Con un nivel de confianza del 95%, el error máximo de estimación es:
Línf =
p-Emax = 0,32-0, 0457 = 0,274
Lsup = P + Emax = 0,32 + O, 0457 = 0,366
� 0,32·(1-0,32)
Emax =Z _ � 0, 02=l , 96·
1 cy;_�� n
12
2
zl-'Ji2 1 962
n=p(l-p)-2 - =0,32·(1-0,32)--- =2089,83�2090 personas
Emax 0,022
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Utilizamos una muestra de sujetos en los que la
variable de estudio «estar en posesión de estudios superiores» es de naturaleza
dicotómica (se tienen o no se tienen estos estudios) sobre la que se determina la
proporción de personas que poseen dicha cualidad.
Los datos de los que partimos son:
378
Proporc10n
. , de personas en Ia muestra con estud.tos o bl.1gatonos:
. p=- =O,42
900
HIPÓTESIS: El investigador quiere comprobar que la proporción de adultos de su
Comunidad que solo tienen los estudios obligatorios es significativamente inferior
que el indicador de España en 2008 establecido en el 49%. Las hipótesis nula y al
ternativa son:
13
Z= p - n0 =
O, 42 -O, 49
= _4 20
/re 0 ·( -re 0 ) 0,49 ·0,51
�
� 900
«alfa»= 0,05
nivel de confianza= 0,95
Z=-4,20
14
/
p < 0,0002
0,42 0,49
Z= -4,20
0,388
p(l-p) 0,42·0,58
p±Z1_al � --+0,42±1,96 --+ ¡
72�� 900
0,452
15
p < 0,0002
0,42 0,49
Z= -4,20
SOLUCIÓN:
De forma resumida, los datos facilitados en el enunciado son:
16
17
Figura 7: Representación gráfica de los valores críticos para la regla de decisión dos contrastes
unilaterales.
18
p = 0,1131
Figura 8: Representación gráfica de los niveles críticos p para la toma de decisión en dos contrastes
unilaterales.
Por tanto, para el primer contraste y partiendo de que la hipótesis nula (que es
tablece que la media de alumnos por clase de los alumnos de los colegios públicos
de esa comunidad es igual o menor de 19,7) es verdadera, la probabilidad de obte
ner una muestra de 100 aulas de colegios públicos con una media de alumnos por
clase de 20,9 es de 0,0192 (el nivel crítico p). Esta es una probabilidad pequeña en
comparación al nivel de significación de 0,05 pero grande en comparación al nivel
de significación de 0,01 por lo que rechazaríamos la H0 con un nivel de confianza del
95% pero no podríamos tomar la misma decisión con un nivel de confianza del 99%.
cr 5, 8
Emax =Z1 _a,/ r =1, 96 � =1,1368
12 '\,/n '\,/100
19
IC=Y±Emax =20,9±1,1368---*(19,76;22,04)
Si hacemos E= l, entonces:
1=1 96�
I
Fn
Despejando «n»:
(z
J
2
1- ª 1 96 2
n= cr 2 7i_ = 5 82 -'-
1
= 129 / 23 � 129
I
E2 2
SOLUCIÓN:
De forma resumida, los datos proporcionados en esta situación vienen recogidos
en las siguientes tablas:
6.1. A partir del 8% de jóvenes (hombres y mujeres) que han consumido cocaína, el
intervalo de confianza de la proporción poblacional de jóvenes consumidores
con un nivel de confianza del 95%, es:
IC=p±Emax
21
-
Emax =Z1-� �p-(l-p) =1'96· ·(l-O , OS ) =196·0 0307=0 06
O , OS
IC=p±Emax =0,08±0,06=(0,02;0,14)
sn-1 sn 1, 1
Emax =t n -u-al C =tn -1·1-a/
' � = 2, 021 � = 0, 35
, /2 -vn 12 -vn-l -v41 -1
22
975 t = 2, 021
0,
Probabilidad
g.l.
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 2,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750
40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704
so 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678
60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660
Tabla 5: Reproducción parcial de la tabla de la distribución t y su representación gráfica con los va/o-
res críticos para el cálculo del intervalo de confianza.
14,84
Y±Emax --+15,2±0,35--+¡
15,55
6.3. Para comprobar si la edad media del inicio en el consumo de cocaína en los
hombres de su municipio ha disminuido respecto a los datos generales del
2004, formularemos un contraste de hipótesis, siguiendo los siguientes pa
sos:
H1 :µ<15, 9
15, 4 -15, 9 =-
T= Y-µ 0 = 2,31
sn 1,3
.Jn-1 ../37-1
Probabilidad
g.l.
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750
40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704
50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678
60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660
24
CONCLUSIÓN: El valor crítico representa la máxima diferencia que puede darse por
simple azar. Como el estadístico de contraste (T=-2,31; p < 0,025} supera esta máxima
diferencia (-1,684), rechazamos la hipótesis nula con un nivel de confianza del 95%.
p < 0,025
T = -2,31
H1 : a2 > 1, 21
2 2
= n-5 = 37·1,3 =51 67
2
X 2
'
ªº 1,12
Probabilidad
g.1.
0,005 0,010 0,025 0,050 0,100 0,900 0,975 0,990 0,995
1 0,0000 0,0002 0,0010 0,0039 0,0158 2,7055 3,8415 5,0239 6,6349 7,8794
2 0,0100 0,0201 0,0506 0,1026 0,2107 4,6052 5,9915 7,3778 9,2103 10,5966
3 0,0717 0,1148 0,2158 0,3518 0,5844 6,2514 7,8147 9,3484 11,3449 12,8382
4 0,2070 0,2971 0,4844 0,7107 1,0636 7,7794 9,4877 11,1433 13,2767 14,8603
29 13,1211 14,2565 16,0471 17,7084 19,7677 39,0875 42,5570 45,7223 49,5879 52,3356
30 13,7867 14,9535 16,7908 18,4927 20,5992 40,2560 46,9792 50,8922 53,6720
40 20,7065 22,1643 24,4330 26,5093 29,0505 51,8051 59,3417 63,6907 66,7660
so 27,9907 29,7067 32,3574 34,7643 37,6886 63,1671 67,5048 71,4202 76,1539 79,4900
60 35,5345 37,4849 40,4817 43,1880 46,4589 74,3970 79,0819 83,2977 88,3794 91,9517
51,67 55,758
26
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El estudio corresponde a un diseño de una mues
tra en la que la variable de estudio «Identificación ideológica» es una variable cuan
titativa medida con escala de intervalo en la que se obtiene la media y la varianza
de la muestra de 31 personas que han respondido a la encuesta. Se desconoce la
distribución poblacional de esta variable y su varianza por lo que la distribución
muestra! de la media es la t de Student.
HIPÓTESIS: El investigador sospecha que en su localidad la intención de voto es
significativamente «más conservadora», por lo que plantea un contraste unilateral
en el que la media en su locaclidad debe ser mayor de 4, 86 que es la media de la
población española:
H0 :µ::; 4, 86 ; H1 :µ> 4, 86
µ 5, 40 - 4, 86 =
T= Y- 0 = 2/ 51
sn -1 1,2
J;, F3i
REGLA DE DECISIÓN: Para los niveles de confianza utilizados habitualmente (95%
y 99%), localizamos en la tabla de la distribución t de Student con 30 grados de
libertad estos valores críticos y son 2,4 57 para un nivel de confianza del 99% en
27
Probabilidad
g.l.
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,975 0,995
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,750
40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,704
so 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678
60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660
CONCLUSIÓN: El estadístico T = 2,51 supera ambos valores los que nos conduce
a rechazar la H0 con un nivel de confianza del 99%.
p < 0,01
28
sn-1
2
Emax = tn-1;1-'Ji Fn = 0, 2
2
2
tn-1;1-'Ji 2 2,042
2
n=Sn -l 2 =1, 2 · =150,11�150
Emax 0, 2 2
29
SOLUCIÓN:
8.1. Para responder a la primera pregunta conocemos los límites superior e inferior
del intervalo de confianza. La diferencia entre ambos límites corresponde a la am
plitud del intervalo y el error máximo de estimación es la mitad de esta diferencia:
2
z� 1 962
n=p(l-p) T =0,047(1-0,047) ' 2 =24 97 ,7 3�2500 jubilados
Emax 0 ,00 83
8.2. La edad media de los jubilados es una variable cuantitativa medida con escala
de razón y de la que desconocemos su distribución poblacional y su varianza.
En estas condiciones la distribución muestra! de la media es la distribución t
de Student con n - l grados de libertad. Con un nivel de confianza del 95%, el
intervalo de confianza de la edad media de los jubilados de su localidad se ob
tiene sumando y restando a la media de la muestra el error máximo de estima
ción. Al tratarse de una muestra grande (n = 362) la distribución t se aproxima a
la normal por lo que el valor de t se busca en la tabla de la distribución normal
tipificada de puntuaciones Z:
30
sn 12,5
fmax=t1_a/· r--;;=1,96· =1,289
/2 -vn-1 -J362-1
69,91
IC =Y±Emax=71,2± 1,289 � ¡
72,49
_ �p(1-p) 0,598(1-0,598) _
fmax _zl a/ -2,58 -0,0665
-12 n 362
0,5315
IC=p±Emax = 0,598±0,0665 � {
0,6645
H 0 :rc�0,133; H1:n:>0,133
3,59
Z = 12,158
que «nada probable» y el resto «NS/NC». Imagine que usted quiere estudiar si es
tos resultados se reproducen actualmente en su localidad, para lo que realiza una
encuesta sobre una muestra de 100 personas en situación de paro con una edad
media de 39 años y desviación típica de 8,6 años de los cuales 25 le responden
que «bastante probable», 35 responden que «poco probable» y 20 que «nada pro
bable» mientras que el resto «no saben o no contestan». Con esa información se
propone realizar los siguientes análisis:
9.1. Calcular el intervalo de confianza de la varianza de la edad de las personas
en situación de paro de su localidad con un nivel de confianza del 95%.
9.2. Con los datos obtenidos en su muestra y fijando un nivel de confianza del
95%, calcular el intervalo de confianza para la proporción de personas en
situación de paro que considera «poco o nada probable» encontrar trabajo
en los próximos doce meses.
9.3. Contrastar si la proporción de personas en paro que consideran «poco pro
bable» encontrar trabajo en los próximos doce meses en su localidad es
significativamente menor que el valor 0,431 (43,1%) proporcionados en el
estudio del CIS.
9.4. Contrastar si la desviación típica de la edad media de las personas en situa
ción de paro es significativamente mayor de 7,6 años.
SOLUCIÓN:
Los datos de la encuesta del CIS, aparecen resumidos en la siguiente tabla:
En la muestra con n = 100, media 39 y desviación típica 8,6, los resultados que
obtiene son:
n5 2n__
___ n5 2
< e/ < --------'-'n-
X�_ a/ n-l X�¡ n-l
/2, /2,
74,22 129,56
Probabilidad
g.l.
0,005 0,010 0,025 1 0,050 0,100 · 0,900 0,950 0,975 1 0,990 0,995
1 0,0000 0,0002 0,0010 0,0039 0,0158 2,7055 3,8415 5,0239 6,6349 7,8794
2 0,0100 0,0201 0,0506 0,1026 0,2107 4,6052 5,9915 7,3778 9,2103 10,5966
3 0,0717 0,1148 0,2158 0,3518 0,5844 6,2514 7,8147 9,3484 11,3449 12,8382
4 0,2070 0,2971 0,4844 0,7107 1,0636 7,7794 9,4877 11,1433 13,2767 14,8603
5 0,4117 0,5543 0,8312 1,1455 1,6103 9,2364 11,0705 12,8325 15,0863 16,7496
6 0,6757 0,8721 1,2373 1,6354 2,2041 10,6446 12,5916 14,4494 16,8119 18,5476
70 43,2752 45,4417 48,7576 51,7393 55,3289 85,5270 90,5312 95,0232 100,4252 104,2149
80 51,1719 53,5401 57,1532 60,3915 64,2778 96,5782 101,8795 106,6286 112,3288 116,3211
90 59,1963 61,7541 65,6466 69,1260 73,2911 107,5650 113,1453 118,1359 124,1163 128,2989
¡ 100 67,3276 70,0649 74,2219 77,9295 82,3581 118,4980 124,3421 129,5612 135,8067 140,1695
Figura 13: Representación de la distribución chi-cuadrado con 100 g/ y los valores críticos para un ni-
ve/ de confianza del 95% y reproducción parcial de la tabla con la localización de estos valores críticos.
. 100·8, 62 100·8, 62
/inf = =57 085 /sup = =99,65
129 5 612I 74,2219
IC=p±Emax
0,4525
IC=p±Emax =0,55±0, 0975= ¡
0,6475
H0 :n?:0,431; H1 :n<0,431
35
p-no - 0,35-0,431
=-1,636;::::-l,64
- "o ( 1 "o ) - 0,431(1- 0,431)
z-
�
n- 100
Z=-1,64
-3,50 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,40 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,30 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,20 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-1,80 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,70 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
0,0495 0,0485 0,0475 0,0465 0,0455
0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,30 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
Figura 14: Representación del nivel crítico p para el estadístico Z =-1,64 y reproducción parcial de la
taba/ de la distribución N(O;l} con la localización del nivel crítico para un nivel de significación de 0,05
9.4. Para contrastar si la desviación típica de la edad media de las personas en si
tuación de paro es significativamente mayor de 7,6 años, seguimos los mismos
pasos que en los anteriores contrastes.
ESTADÍSTICO DE CONTRASTE:
100 · 8, 62 7396
---=--=128 05
57, 76 57, 76
37
Probabilidad
g.l.
0,005 0,010 0,025 0,050 0,100 0,900 0,950 1 0,975 1 0,990 0,995
1 0,0000 0,0002 0,0010 0,0039 0,0158 2,7055 3,8415 5,0239 6,6349 7,8794
2 0,0100 0,0201 0,0506 0,1026 0,2107 4,6052 5,9915 7,3778 9,2103 10,5966
3 0,0717 0,1148 0,2158 0,3518 0,5844 6,2514 7,8147 9,3484 11,3449 12,8382
4 0,2070 0,2971 0,4844 0,7107 1,0636 7,7794 9,4877 11,1433 13,2767 14,8603
5 0,4117 0,5543 0,8312 1,1455 1,6103 9,2364 11,0705 12,8325 15,0863 16,7496
6 0,6757 0,8721 1,2373 1,6354 2,2041 10,6446 12,5916 14,4494 16,8119 18,5476
70 43,2752 45,4417 48,7576 51,7393 55,3289 85,5270 90,5312 95,0232 100,4252 104,2149
80 51,1719 53,5401 57,1532 60,3915 64,2778 96,5782 101,8795 106,6286 112,3288 116,3211
90 59,1963 61,7541 65,6466 69,1260 73,2911 107,5650 113,1453 118,1359 124,1163 128,2989
100 67,3276 70,0649 74,2219 77,9295 82,3581 118,4980 I
124,3421 129,5612 I 135,8067 140,1695
Figura 15: Representación gráfica del niveJ crítico p en una distribución t con 100 gl reproducción
parcial de la tabla con la localización de los valores más próximos al estadístico de contraste.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS. El estudio corresponde a un diseño de una muestra
en el que la variable de estudio «la estimación del tiempo» es una variable conti
nua, medida con escala de razón, de la que se desconoce la forma de su distribución
poblacional y la varianza.
HIPÓTESIS:Dado que el psicólogo desea comprobar si el tiempo se sobre-esti
ma, hemos de plantear un contraste unilateral derecho, cuyas hipótesis son:
H 0 :µ�A5
H1:µ>45
-
T=Y µ 0 =51-45=3
sn-1 2
Fn
m-
sn-l � -2
a------
- Fn -
REGLA DE DECISIÓN:Buscando en las tablas Tde Student con 40 grados de liber
tad y un nivel de confianza del 95%, el valor critico es 1,684 que deja por debajo una
probabilidad de 0,95 correspondiente a un contraste unilateral derecho.
39
Probabilidad
g.l.
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,975 0,990 0,995
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750
40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704
so 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678
Por otra parte, en la distribución t de Studente con 40 gl, el valor más alto que
podemos ver en la tabla es 2,704 que deja por encima una probabilidad de 0,005.
CONCLUSIÓN: El estadístico de contraste (T = 3) supera el valor crítico con un
nivel de confianza del 95% (3 > 1,684), pero también el nivel crítico p < 0,005 es
menor que el nivel de significación a= 0,05. Por tanto, rechazamos H0.
observando que el sueldo medio en dicha muestra es igual a 1400 euros mensuales
con una cuasivarianza igual a 64000. Quiere comprobar si el sueldo medio de las
mujeres es inferior al de los hombres. Nivel de confianza 95%.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: En este trabajo el investigador utiliza una muestra
de 160 mujeres en el que la variable de estudio, el salario mensual, es una variable
cuantitativa que se mide con escala de razón de la que se desconoce la forma de
su distribución poblacional y su varianza. (Observe el estudiante que siendo esta
situación muy similar a la presentada en la situación 1, las condiciones y supuestos
son diferentes, lo que afecta a la elección del estadístico de contraste que hay que
aplicar)
HIPÓTESIS: Como el investigador quiere comprobar si el sueldo medio de las
mujeres es inferior a 1500 euros, plantea un contraste unilateral izquierdo
Y- µa 1400-1500 --5
T----
- )s;_ 1 -
)64000
160
n
41
SOLUCIÓN:
El intervalo se obtiene sumando y restando a la media de la muestra el error
máximo de estimación:
IC=Y±Emax
42
-s n - 1 =t sn
Emax =t a- =t n-1·1-ª e n-1,. 0 , 975 --ü r--;-
n-l·l_ a/ y
, /2 ,� 2 .....;n .....;n-11
15
sn =2,060 r.:::;:::--:;
Emax =t 1·1 a/CT-y =tn-1·0 975 e---;; =6,18
n-, - 12 ' ' .....;n-l .....;26-1
- 1 32,18
IC=Y±Emax =126±6,18 � {
119, 8 2
Que indica que el tiempo medio que los empleados dedican a otras actividades
es un valor comprendido entre 119,82 y 132,18 minutos de su jornada laboral se
manal con un nivel de confianza del 95%.
2,060
Linf = 119,82 --------- Lsup = 132,18
H1 : µ > 120
Y - µ 0 126-120 =-=
T=--= 6 2
sn 15 3
�n-1 �26-1
0,05
0,025
Probabilidad
g.l.
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,975 0,990 0,995
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771
Tabla 10: Reproducción parcial de la tabla de la distribución t y representación del valor crítico y el
nivel crítico p para el estadístico de contraste T = 2.
44
SOLUCIÓN:
13.1. A partir de una muestra de 400 titulados en psicología, el intervalo de confian
za de la proporción de mujeres tituladas en Psicología que estaban trabajando
6 meses después de finalizar sus estudios, es:
L¡ nf =p-Emax =0,81-0,05061=0,759
Ls up =p+Emax =0,81-0,05061=0,861
45
2
z� 2 ' 58 2
n=p(l-p)--+= 0,31(1- 0 ,31)-- =3560 titulados
0, 02
2
E
H0:n= 0 , 50 ;
0 , 54- 0 , 50
Z-
- P-n 0 _
=1 ' 6
0 , 50 (1- 0 , 50 )
-
400
REGLA DE DECISIÓN: Los valores críticos para un contraste bilateral con un nivel
de confianza del 95% son -1,96 y +1,96 y con un nivel de confianza del 99% son
-2,58 y +2,5 8. Por otra parte, en la distribución normal la puntuación típica Z = 1,6
deja por debajo una probabilidad de 0,9452 y por encima 1- 0,95 42 = 0,0548, con
lo que el nivel crítico p para un contraste bilateral es 0,05 48 + 0,0548 = 0,1096.
46
95%
-1,96 1,96
-2,58 99% 2,58
0,00 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,10 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
1,40 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,50 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,80 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,90 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9756 0,9761 0,9767
2,00 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9808 0,9812 0,9817
2,10 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,20 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,30 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,40 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,50 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,60 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
Tabla 11: Tabla de la distribución normal para localizar los valores críticos y nivel crítico p para un
estadístico Z = 1,6 en un contraste bilateral y representación gráfica de estos valores.
CONCLUSIÓN: Como el nivel critíco pes mayor que los niveles de significación
del 0,05 y del 0,01, no tenemos evidencia suficiente para rechazar la hipótesis nula.
A la misma conclusión se llegaría comparando el estadístico de contraste con los va
lores críticos ya que el estadístico de contraste no supera ninguno de esos valores.
INTERPRETACIÓN: No hay evidencia suficiente para afirmar que la proporción de
titulados que trabajan a jornada completa es distinta de los que trabajan a media
jornada.
mite a las personas adultas participar en la vida social y económica del siglo XXI
y también las habilidades laborales básicas que exige su puesto de trabajo. En su
último estudio realizado en el año 2013 comparando los resultados de 23 países de
la OCDE muestra que los adultos españoles de entre 16 y 65 obtuvieron en matemá
ticas el último puesto, con una media de 246 puntos, 23 por debajo de la media de
la OCOE y 22 por debajo de la media de la UE. Entre sus conclusiones destaca que
los jóvenes españoles puntúan mucho más alto que los mayores y están más cerca
de la media de la OCDE y que la tasa de paro de los españoles con competencias
matemáticas en los niveles inferiores es tres veces superior de la que están en los
niveles superiores». Imagine que usted aplica la misma prueba a una muestra re
presentativa de 121 jóvenes de su localidad con edades comprendidas entre 16 y
34 años obteniendo una media de 252 puntos con una desviación típica insesgada
de 77 puntos, siendo la proporción de jóvenes desempleados del 28,5%. Y estable
ciendo un nivel de confianza del 95%, desea conocer:
14.1. El intervalo de confianza de la media de la población de los jóvenes espa
ñoles en competencias matemáticas.
14.2. A partir de los datos de su estudio, y con un nivel de confianza del 95%,
¿entre que valores estimaría la proporción jóvenes desempleados en su
localidad?
14.3. El intervalo de confianza de la varianza de las puntuaciones en competen
cias matemáticas de la población de jóvenes españoles de su localidad es
14.4. Si hubiéramos querido estimar la varianza poblacional con un error máxi
mo de estimación que no supere los 200 puntos, ¿cuál debería haber sido,
aproximadamente, el tamaño de la muestra seleccionada?
14.5. Si su interés es comprobar que la media en la prueba de competencias ma
temáticas de los jóvenes españoles de su localidad es significativamente
inferior que la media general de los adultos de la UE, ¿cuál sería su conclu
sión?
SOLUCIÓN:
De los datos del enunciado extraemos la siguiente tabla resumen de los datos:
48
Cuasi-desvTipica 77
14.1. Nos encontramos ante un diseño de una muestra en la que la variable de es
tudio: «las competencias matemáticas» es de tipo cuantitativo y medida con
escala de intervalo. Se desconoce la forma de su distribución en la población y
su varianza por lo que la distribución muestra! de la media es la t de Student.
Para obtener el intervalo de confianza de la media de la prueba en la población
de los jóvenes españoles en competencias matemáticas con un nivel de confianza
del 95%, calculamos primero el error máximo de estimación.
sn -l 1,96 �77
=
= = 1,96·7 = 13,72
Emax ti-al 1
12 -vn -v121
L¡ nf =Y-Emax =252-13,72=238,28
Lsup =Y+ Emax =252+ 13,72=26 5,72
O 285(1-0 285)
Emaz =Z1 _5'i�� =1, 96 '
� ' = 1, 96 ·0,041=0,08
121
L¡ nf =p-Em ax =0,285-0,08=0,205
Ls u p = P + Emax = 0,285 + 0,08=0,36 5
49
2�
fmax =zl_a/5 - = 1, 96 · 772�
- =1494,03
12 n 121
Y el intervalo es:
4434,97
IC=S 2 ±Emax =772 ±1494,03= {
7423,03
2
21-�
1 962
n=25 4 --2 =2·774 ·-'--�6752
2
fmax 2002
14.5. Para contrastar su hipótesis de que la media de los jóvenes españoles es signi
ficativamente inferior que la media general de los adultos de la UE, partimos
de las mismas condiciones ya expuestos en el punto 14.1.
H1 : µ<268
REGLA DE DECISIÓN: En una distribución t con 121- 1 = 120 gl, el valor de tes
prácticamente igual al de Z de la distribución N(O;l). Y para un contraste unilateral
izquierdo esta probabilidad el nivel crítico p asociado al estadístico de contraste
obter,ido es p = 0,0113.
1 p = 0,01131
"'-
Z = -2,28
15.1. Si con un nivel de confianza del 95% el error máximo para estimar la pro
porción poblacional de jóvenes activos vale 0,0523 ¿Cuál era el tamaño de
la muestra utilizada en el trabajo de Esnaola y Revuelta?:
Suponiendo que el tamaño de la muestra fuera de 132 jóvenes, determine:
15.2. El intervalo de confianza de la varianza poblacional en la escala de au
to-concepto físico para los jóvenes activos con edades comprendidas entre
12 y 24 años, con un nivel de confianza del 95%.
15.3. Si el investigador quisiera comprobar que la varianza poblacional de la es
cala de auto-concepto físico para los sujetos inactivos es significativamen
te distinta de 25 puntos, ¿Cuál sería su conclusión?
SOLUCIÓN:
Partimos de los siguientes datos resumidos proporcionados en el enunciado:
Escala autoconcepto
Media = 23,7
ACTIVOS (69%)
Desv. Tip. lnses = 4,83
Media= 22,41
INACTIVOS (31%)
Desv. Tip. lnses = 4,1
0,69·0,31
0,0523 = 1,96
2 0,69·0,31
n=l,96 =300,41�300 jovenes
0,05232
15.2. Los jóvenes activos son el 69% de la muestra compuesta por 132 jóvenes. Por
tanto, el grupo de jóvenes activos está formado por n = 0,69 x 132 = 91,08 =
91 jóvenes que obtienen en la escala una desviación típica insesgada de 4,83.
Los límites del intervalo de confianza son:
52
H0: 0 2 =25;
2 (n-1)5;_ 1 (41-1)4,12
X = = =26,9
CT� 25
de 0,995. Por tanto, ambos valores representan los valores críticos con un nivel de
confianza del 99%.
Probabilidad
g.l.
0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,990
1 0,0000 0,0002 0,0010 0,0039 0,0158 2,7055 3,8415 5,0239 6,6349 7,8794
2 0,0100 0,0201 0,0506 0,1026 0,2107 4,6052 5,9915 7,3778 9,2103 10,5966
3 0,0717 0,1148 0,2158 0,3518 0,5844 6,2514 7,8147 9,3484 11,3449 12,8382
29 13,1211 14,2565 16,0471 17,7084 19,7677 39,0875 42,5570 45,7223 49,5879 52,3356
30 14,9535 16,7908 18,4927 20,5992 40,2560 43,7730 46,9792 50,8922
40 22,1643 24,4330 26,5093 29,0505 51,8051 55,7585 59,3417 63,6907
50 27,9907 29,7067 32,3574 34,7643 37,6886 63,1671 67,5048 71,4202 76,1539 79,4900
60 35,5345 37,4849 40,4817 43,1880 46,4589 74,3970 79,0819 83,2977 88,3794 91,9517
Por otra parte, para una distribución con 40 gl el valor que aparece en la tabla
más próximo al estadístico de contraste obtenido es 26,5093 que deja por debajo
una probabilidad de 0,05. Por tanto, el nivel crítico p para un contraste bilateral es
p > 0,05.
CONCLUSIÓN: Como el estadístico de contraste no supera los valores críticos (ni
por la derecha ni por la izquierda), no hay evidencia suficiente para rechazar la H0
con un nivel de confianza del 95% ni del 99%. A la misma conclusión llegamos al
comparar el nivel crítico p con el nivel de significación.
54
SOLUCIÓN:
Se trata de un estudio con un único grupo de 32 grillos cuya tasa o frecuencia de
canto se mide Antes y Después de implementar una dieta alta en proteínas, aunque
solo nos proporcionan los datos del post-test {109 Hz} indicándonos indirectamente
que la tasa base de grillos no tratados (pre-test) es de 60 Hz. Cada grillo se mide
dos veces: antes de alimentarlo con una dieta alta en proteínas y otra después de
alimentarlo con esta dieta. Luego la tasa de canto de todos y cada uno de los grillos
se ha medido dos veces. Esto significa que las puntuaciones de antes y de después
están relacionadas. Es un diseño de dos grupos con medidas dependientes (diseño
pre-post). No obstante, no podemos utilizar el contraste de dos muestras relaciona
das para la media porque no se proporcionan los datos suficientes (no tenemos la
media de las diferencias y su varianza). Pero podemos observar que tenemos datos
suficientes para realizar un contraste de una media con varianza poblacional desco
nocida asumiendo como hipótesis nula que la media es 60 Hz.
Los datos de que disponemos en el enunciado son:
• Tratamiento: dieta alta en proteínas durante 8 días.
• Número de grillos= 32; Desviación típica muestra! pos-tratamiento= Sn = 40.
Tasa de canto después del tratamiento 109 chirridos por segundo (es decir,
109 Hz}.
• Tasa usual de canto = 60. Podemos considerar que esta es la tasa de canto
previa al tratamiento. Es decir, observamos que el estudio nos indica que se
55
H0 :µ�60
H1 :µ>60
µ 109-60 =�=
T = Y- 0 = 6 82
sn 40 7,18 '
-Jn-1 -)32-1
56
Probabilidad
g.l.
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31, 21 63,657
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6, 65 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 4,604
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2, 67 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2, 62 2,756
30 9,liD 9,256 9,389 9,539 9,683 9,851 1,955 1,319 1,697 2,912�� 2,750
40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704
50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678
60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660
70 0,126 0,254 0,387 0,527 0,678 0,847 1,044 1,294 1,667 1,994 2,381 2,648
80 0,126 0,254 0,387 0,526 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639
57
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El investigador diseña una investigación con dos
muestras independientes seleccionadas al azar. La variable independiente es el
tiempo que unos profesionales llevan trabajando y que toma dos valores: menos de
cinco años trabajando-en la empresa y cinco o más años trabajando en la empresa.
La variable dependiente es el nivel de aspiraciones profesionales que toma también
dos valores: alto o bajo, por lo que se hará un análisis de diferencias de proporcio
nes para dos muestras independientes.
HIPÓTESIS: El investigador quiere comprobar si los profesionales que llevan me
nos de cinco años en una empresa (Grupo 1) poseen mayores aspiraciones que las
personas que llevan cinco o más años (Grupo 2). Como el investigador está mar
cando la dirección de la diferencia (el grupo 1 tiene mayores aspiraciones que el
grupo 2) formula un contraste unilateral derecho con las siguientes hipótesis nula
y alternativa:
61
Ho : n1 :s; n2
H1 : TC1 > TC2
O bien:
H o : TC1 -TC2 :S 0
H1 : TC1 - TC2 > 0
Primero calculamos P
18 14
32-+32-
p = 32 32 = 18 + 14 =o 5
32+32 32+32 '
Finalmente:
18 14
===3=2=3=2==== 0,5625-0,4375 =
--,= 1
1 1 0,125
o,50(1-0,50) ( -+- J
32 32
0,8413 1 p = 0, 1587 1
Z=l
1,64
Ha: µ 1 :::; µ2
H 1 : µ 1 > µ2
O bien:
H a : µ 1 -µ2 :::; O
H 1 : µ 1 -µ2 > O
+ 31+31-2 31 31
n 1 + n2 -2 n1 �J
(� n2
1,671 2,39
Ir= 21
2.2. EL TAMAÑO DEL EFECTO se cuantifica con el índice d de Cohen y su valor es:
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El investigador diseña una investigación para ana
lizar si el tiempo de reacción (la variable dependiente) es mayor cuando las pala
bras son de alta frecuencia léxica que cuando son de baja frecuencia (la variable
independiente). Utiliza un diseño de medidas repetidas (o muestra relacionadas)
en la que la misma muestra de sujetos pasa por las dos condiciones experimentales
definidas por las dos condiciones que toma la variable independiente: palabras con
alta y baja frecuencia léxica. La variable dependiente, el tiempo de reacción, es una
variable medida con escala de razón de la que se desconoce su distribución pobla
cional y su varianza. Para poder aplicar un contraste paramétrico debemos asumir
que la forma de la distribución poblacional, aunque desconocida, no se separa en
exceso de la normalidad por lo que la distribución muestra! de la diferencia de me
dias es una distribución t de Student.
HIPÓTESIS: El investigador quiere comprobar que el tiempo de reacción es más
corto ante palabras de alta frecuencia léxica que ante palabras de baja frecuencia
66
Ha : µ 1 �µ 2
H1 : µ 1 < µ 2
O bien:
Ha :µ 1 -µ 2 �o
H 1 :µ 1 -µ 2 < O
y
( 1 - y 2 )- (µ 1 -µ 2 ) ( 612,04- 645)-o
T= � =-2,06
6
d
6
n
67
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El investigador diseña una investigación para com
parar la eficacia de dos terapias. Utiliza un diseño de dos grupos independientes
seleccionados al azar. La variable independiente es el tipo de terapia, A o B y la
variable dependiente es la recuperación que es una variable dicotómica {Si/No) con
distribución binomial. Realizará un contraste de diferencias de proporciones con
muestras independientes. La distribución muestra! de la diferencia de proporciones
es una distribución binomial pero como el investigador utiliza muestras grandes, la
distribución binomial se aproxima a la normal.
HIPÓTESIS: El investigador quiere comprobar si las dos terapias tienen la misma
eficacia, es decir, la misma proporción de recuperaciones. Como el investigador no
está marcando la dirección de la diferencia, formula un contraste bilateral con las
siguientes hipótesis nula y alternativa:
Ho:nA =
na
H1: nA * na
O bien:
Ha : nA - na = O
H1 : nA -na =1:- O
68
PA =-=0, 8 6, =0, 80
172 148 172+148
200 200 400
Pa = - = 0,74, P=
Z= ' =6 =-=º'7
(PA - Pa)-(nA -na)=--;:=(= 0=8 = =4)=-= º==3
1 1
P(l-P)(�+ 2_ J 0, 8 ·0, 2 ·(- -+- -)
200 2 00
nA n a
Z = -1,96 Z = +l,96
69
BLOQUE 11
Z=-3 Z=3
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El investigador diseña una investigación con dos
muestras independientes de igual tamaño {sujetos) seleccionadas al azar. La varia
ble independiente es el tipo de estudios, con dos valores «ciencias» o «letras» y la
variable dependiente es el tiempo de reacción en el reconocimiento de palabras,
que es una variable medida en una escala de razón. El análisis de datos que aplicará
es un contraste de hipótesis sobre diferencia de medias entre dos muestras inde
pendientes, con varianzas poblacionales desconocidas pero iguales.
HIPÓTESIS: El investigador quiere comprobar que los estudiantes de carreras de
«letras» tardarán menos que los estudiantes de «ciencias» en reconocer los estí
mulos presentados, es decir, su hipótesis es que el tiempo de reacción es menor
para los estudiantes de letras que para los de ciencias. Como el investigador está
70
Ha:µce�µLL
H1:µce> µLL
O bien:
Ha:µcc-µLL�o
H1:µce -µLL> O
71
1653, 2-600¡
d=----;:::====== = 0,6756
30 · 6200 + 30 · 6200
31+31-2
El valor de la «d» de Cohen señala que la distancia de la media 653,2 del gru
po de Ciencias a la media 600 del grupo de Letras es, expresada en unidades de
puntuación típica Z y en valor absoluto, de 0,6756. Si buscamos en la Tabla la Z =
0,67 obtendremos que deja por debajo una proporción de O,7486, lo que indica por
encima deja una proporción de un 1 - 0,748 = 0,2514, es decir, que hay un 74,86%
de estudiantes de Ciencias con un tiempo de reacción superior a la media de lo que
tardan los estudiantes de letras. O de otra forma, un 25,14% de estudiantes de Cien
cias tienen un tiempo de reacción inferior a la media de los estudiantes de Ciencias.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El investigador diseña una investigación para eva
luar el efecto del tratamiento (la variable independiente) sobre el número de célu
las T-4 sanguíneas (la variable dependiente) medida en la misma muestra de sujetos
72
O bien:
Ho: µo - µgo= O
H1: µo - µgo * O
zar la H0. A la misma conclusión se llegaría interpretando el nivel crítico p < 0,0004
que es menor que el nivel de significación «alfa» de 0,01 establecido previamente
por el investigador.
INTERPRETACIÓN: La nueva terapia del tratamiento del SIDA produce una varia
ción significativa (Z = -4,41: p < 0,0004) en el aumento de células T-4 sanguíneas.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El investigador diseña una investigación para com
parar los niveles de autoestima y su variabilidad en dos grupos distintos de alum
nos. La variable dependiente, la autoestima, es de tipo cuantitativo medida en una
escala de intervalo de la que se desconoce la forma de su distribución poblacional
y su varianzas. Se trata, por tanto, de un diseño de dos muestras independientes
y hay que realizar dos contrastes de hipótesis: uno para las varianzas y el segundo
para las medias.
74
O bien:
,,...2
6,42
F= 5G1 =7 =l 606
"2 47' 58 '
SG2
75
F = 1,606 1,841
Ha : µG l � µG 2
H1 : µ G l > µ G 2
O bien:
Ha : µ G l - µG2 � O
H1 : µ G l - µ G 2 > 0
76
( 22,16-20, 0 1)-0
---;:::============ = 1, 045
30 · 76, 42+30 · 4 7, 58 � �
( + )
3 1+ 31- 2 31 31
El valor de la «d» de Cohen señala que la diferencia entre las medias 22,16
y 20,0 7 expresada en unidades de puntuación típica Z, es, en valor absoluto, de
0 ,2 654 . Si buscamos en la Tabla la Z = 0 ,26 obtendremos que deja por debajo una
proporción de 0,6026, lo que indica un 1 - 0,6026 = 0,3974, es decir, que el nivel
60,26% de los sujetos del grupo 1 tienen un nivel de autoestima superior a la media
del grupo 2. O también que el 3 9, 74 % de los sujetos del grupo 1 tienen un nivel de
autoestima por debajo de la media del grupo 2 .
77
SOLUCIÓN:
Partimos de dos muestras independientes con los siguientes datos:
- A2
Grupo l. Material Nuevo: Y Nuevo = 7 S Nuevo = 15 nNuevo = 32
- A2
Grupo 2. Material Antiguo: Y Antiguo = 5,2 5 Antiguo = 17 nAntiguo = 32
8.1. Para someter a contrastación la hipótesis del investigador, seguimos los si
guientes pasos:
2 2
Ha : CTNuevo = CTAntiguo
2
H1 : CTNuevo * CT2Antiguo
ESTADÍSTICO DE CONTRASTE: La distribución muestra! del cociente entre dos
varianzas es una distribución F de Snedecor y el estadístico de contraste es:
"2
SNuevo 15 =
F = "2 = O 88
1
5Antiguo
17
1
Fo 02s·3ü·3o = -- =O, 482 Fo,975;30;30 = 2, 074
I I I
2,074
O bien:
ESTADÍSTICO DE CONTRASTE:
(7-5' 2)-0
=18
31·15+31·17 _!_ _!._
( + J
62 32 32
p < 0,025
o 1 , 671 ( 7-5,2)
T= 1,8
Y I N- A
Y I 7= = 5,= 21= = =o 4
d=--;:::================= --;===1 - ' 5
�2 �2 31·15+31·17
(nN -l)SN+(nA-l)SA
62
nN+nA-2
Este índice representa la distancia entre las medias de los dos grupos en unida
des de puntuación típica Z.
Material 2 7 Material
Antiguo Nuevo
d = 0,45
El valor del estadístico de Cohen nos indica que el 67,36% de los estudiantes que
han utilizado el nuevo material docente han obtenido un rendimiento que supera a
la media del grupo que ha utilizado el material antiguo.
81
1,8 + 2 = 3,8
-2 o +2
1,8-2 =-0,2
(7 - 5,2) = 1,8
sentían capaces de dejar de fumar antes de la conferencia obtienen una media su
perior después de la conferencia, siendo dicha media un punto superior a la media
antes de la conferencia y la cuasidesviación típica de las diferencias es igual a 5. Se
establece un nivel de confianza del 95%.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El investigador utiliza una muestra de sujetos de
los que obtiene información en dos momentos distintos. La información obtenida
es la variable independiente: ANTES de asistir una conferencia y DESPUÉS de salir
de la misma. Utiliza, por tanto, un diseño de muestras relacionadas. Como variable
dependiente obtiene, por un lado, las medias obtenidas en una escala que cuan
tifica su capacidad estimada para abandonar el hábito de fumar, antes y después
de asistir a la conferencia. Se trata de una variable cuantitativa medida con escala
de intervalo. Y por otra parte, también obtiene la proporción de sujetos dispues
tos a someterse a la terapia antes y después de asistir a la conferencia. En estas
circunstancias tendrá que realizar dos contrastes de hipótesis dentro de un diseño
de muestras relacionadas: uno para la diferencia de proporciones y otro para la
diferencia de medias.
HIPÓTESIS: Para el contraste de la diferencia entre las proporciones el psicólogo
pretende lograr que el número de sujetos que deciden someterse a la terapia sea
mayor tras la conferencia por lo que plantea un contraste unilateral izquierdo con
las siguientes hipótesis nula y alternativa:
b-c
Z=--
�b+c
83
Después de la conferencia
SI NO
Antes de la SI a= 80 b= 20 100
conferencia NO e= 80 d= 20 100
160 40 200
Para calcular el estadístico de contraste «Z» nos fijamos en los sujetos que apor
tan información, es decir, aquellos que han cambiado de opinión ANTES y DESPUÉS
de asistir a la conferencia (casillas by e de la tabla):
z----
-
b-c
-
20- 80
--6
)b+c )20+80
84
O bien:
T= fil = 1/52
0 -µd -0
=2
�� �100
REGLA DE DECISIÓN: En la distribución t de Student con n - l = 100 - 1 = 99 gl y
para un contraste unilateral derecho buscamos el valor crítico que deja por debajo
de sí una probabilidad de 0,95. Según las tablas este valor es 1,66. Por otra parte,
para una distribución t con 100 gl (el valor más próximo a nuestra situación que tie
ne 99 gl) el valor del estadístico de contraste t = 2 se encuentra comprendido entre
1,984 y 2,364 que dejan por debajo las probabilidades de 0,975 y 0,99, respectiva
mente, y por encima de 0,025 y 0,01 respectivamente (los valores 0,025 y 0,01 son
los complementarios de 0,975 y 0,99 respectivamente). Por tanto el nivel crítico
asociado al estadístico de contraste t = 2 es un valor comprendido entre 0,025 < p <
0,01 como se representa en la siguiente gráfica,
85
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: En este trabajo la variable independiente. es el vi
deo y se quiere analizar su influencia sobre la variable dependiente que es la inten
ción de voto. Esta variable tomará dos valores, SÍ o NO, que constituye una variable
dicotómica. En el diseño de este estudio la fuente de información es la opinión
manifestada por una muestra de 200 personas en dos momentos distintos: ANTES y
DESPUÉS de ver el video. Se trata, por tanto, de un diseño de muestras relacionadas
en el que se analizará la influencia del video sobre la intención de voto.
86
O bien:
b-c
Z =--
.Jb+c
Para su cálculo, completamos la siguiente tabla que recoge en negrita los datos
proporcionados en el enunciado mientras que el resto de datos han sido calculados
por simple álgebra:
Después
SI NO
a= 76 b=4 80
Antes
e= 60 d= 60 120
136 64 200
z----
b-c
-- 4-60
- 7
.Jb+ e .J4 + 60 - -
87
2 2
2 ( b-c ) ( 60- 4 )
X = ---=49
b+c 60+4
SOLUCIÓN:
De los datos del enunciado extraemos la siguiente información:
Problemas
Paro Clase política
económicos
O bien:
H a: n2a11 - n2a12 � O
89
n +n 2 01 2 P2 01 2
siendo: P = 2 01 1 P2 01 1
n 2 011 + n 2 01 2
Y su valor, es:
63
468 · O , 094 +480-
p= 480 = 0,113
468+480
Z=
( o,094 -0,13125)-o
1
O , 113 ( 1 -0,113)(- - + -
468 480
1 -J =-1,81
Z = -1,81
90
SITUACIÓN 12. Con los mismos datos del ejemplo anterior desea comprobar
si la consideración del paro como principal problema de los jóvenes no ha variado
significativamente en el 2 012 respecto al 2 011.
CONDICIONES Y SUPUESTOS: las mismas de la situación anterior siendo ahora la
variable dependiente la consideración del paro como principal problema.
HIPÓTESIS: El investigador quiere analizar si la consideración del paro no ha
variado de un año a otro. Formula un contraste bilateral ya que no marca el sentido
de la diferencia, siendo las hipótesis nula y alternativa las siguientes:
H a : n2 011 = n2 a1 2
H1 : TC2 a11 -=;t:. TC2 a1 2
O bien:
H a : n2 a1 1 - n2 01 2 = O
H1 : TC2 a 1 1 - TC2 a1 2 -=;t:. 0
46 8·0, 573+216
P= =O 5107
46 8+4 80
SITUACIÓN 13. Siguiendo con los mismos datos del CIS, imagine por un mo
mento que tuviera usted acceso a la muestra de los 480 jóvenes encuestados en
septiembre del 2012 para volverles a realizar la misma pregunta y analizar los cam
bios de opinión sobre la consideración del paro como principal problema. Encuen
tra que ahora son 233 los que siguen considerando el paro como el problema prin
cipal y que de los 216 que en septiembre lo señalaban como el problema principal
ahora son 193 los que siguen manteniendo la misma opinión.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Ahora está utilizando la misma muestra de 480
jóvenes a los que hace la misma pregunta en dos momentos temporales distintos:
ANTES (en el 2012) y DESPÚÉS (en este momento). Utilizará un diseño de muestras
relacionadas para comparar dos proporciones.
HIPÓTESIS: El investigador quiere analizar los cambios de opinión sobre la con
sideración del paro como principal problema pero sin marcar el sentido de este
cambio, por lo que formula un contraste bilateral con las siguientes hipótesis nula
y alternativa:
Ha : n2012 = nAHORA
H1 : n2012 i:- nAHORA
O bien:
92
2012
Paro Otros problemas
Paro 193 b=40 233
Otros problemas e = 23 224 247
216 264 480
40 -23
Z = �= =2 14
.Jb+c .,/40+23
SITUACIÓN 14. Retomando los mismos datos del Barómetro del CIS de sep
tiembre de 2011 (véase siguiente tabla), el investigador desea ahora comprobar si
la percepción del paro como principal problema ha disminuido en 2012 respecto de
2011 en un porcentaje superior al 5%.
Problemas
Paro Clase política
económicos
2011 0,573 0, 192 0,094 n 1 = 468
216 = 1 14
2012 0 45 =0,2375 � =0, 13125 n 2 = 480
480 480 480
93
SOLUCIÓN:
CONDICIONES Y SUPUESTOS. Son los mismos, pero considerando ahora que la
variable dependiente son los datos del paro.
HIPÓTESIS. El investigador quiere comprobar si la percepción del paro como
principal problema ha disminuido en 2012 respecto de 2011 en un porcentaje su
perior al 5%. Como está marcando el sentido de la diferencia, formula las siguientes
hipótesis nula y alternativa:
Ha : n2 a 1 1 - n2 a1 2 :s; O , 05
H1 : n2 01 1 - n2 a 1 2 > O , 05
SOLUCIÓN:
15.1. Lo que se ha medido en ambos grupos de parejas (aquellas en las que ambos
miembros consumen sustancias tóxicas y aquellas en donde sólo las consume
el agresor) ha sido el EPV-R, que es la escala aplicada y constituye la variable
dependiente. Consideramos esta escala como cuantitativa y medida en una
escala de intervalo. Esta variable «depende» del consumo de sustancias tó
xicas (la variable independiente, en este caso de tipo cualitativo) que nos ha
permitido clasificar las parejas en dos grupos.
95
15.2. Para comparar los resultados obtenidos por los dos grupos de parejas en los
resultados obtenidos en la Escala de Predicción del Riesgo de Violencia Gra
ve contra la Pareja-Revisada (EPV-R} se aplica un contraste paramétrico para
muestras independientes (si en una pareja consumen ambos miembros sus
tancias tóxicas se clasifica en un grupo y si consume solamente el agresor se
clasifican en el otro grupo, es decir, nunca pueden coincidir) y el contraste es
paramétrico ya que se trata de una «t».
"2
9 412
F = �2 = ' 2 = 1 223
"
52 8 ' 51 '
15.4. Para analizar «e/ grado de riesgo de violencia g rave en fun ció n del con sumo
de sustan cias tóxicas den tro de la pareja» se aplica un contraste bilateral de
diferencia de medias, ya que el investigador no marca «a priori» el sentido de
la diferencia que espera encontrar.
15.5. Los resultados encontrados por Amor y cols. (2012} son t = 2,30 con una p =
0,024 luego 1 - 0,024 = 0,976 que en términos porcentuales es 97,6%, lo que
significa que hay una seguridad del 97,6% de que las diferencias encontradas
sean significativas.
15.6. A partir de los resultados de Amor y cols. (2012}, los límites del intervalo de
confianza para la diferencia de medias, con un nivel de confianza del 95% son:
96
2 2 O , 637
( 44-1 )9, 41 +( 36 -1)8, 51 1 1
= ( 20,86 -16,19 ) ± 1,99 · (- +-J -H
44+36-2 44 36 8,703
Ha : µ1 -µ1 = O
H1 : µ1 -µ2 ::;t O
15.7. El índice «d» de Cohen es un índice de tamaño del efecto y su cálculo es:
I Y N -Y A l ¡20,86 -16,191
d = ----;:::========= ----;:::========== = 0,52
A2 A2 2 2
( nN -1)5 N +( nA -1)5 A ( 44-1 )9, 41 · ( 36-1)8, 51
n +n -2
A
44 +36 -2
N
97
16,19 20,86
Media d e l grupo e n el
/ "" Media del grupo en el
que solo consume u n z = 0,5 178 "" q u e consu m e n los dos
m i e m b ro d e la pareja . m i e m b ros de la p a reja .
SOLUCIÓN:
Del enunciado extraemos la siguiente información:
-
Muestra total: n =300, Y edad =18,64; sedad =3,51; PActivos =0,69 � P¡nactivos = 0,31
98
H0 : cr A = cr,
H1 : ª A * ª1
O bien:
99
1,433 1,606
Ha : µ A = µ¡
H1 : µA :;t: µ,
100
O bien:
Ha : µA -µ/ = 0
H 1 : µA -µ , :;t: 0
-2,24 +2, 24
101
Esto indica que el 61,03% de los sujetos activos tienen un auto concepto que su
pera la media de los sujetos inactivos. Un 38,97% de los sujetos activos no alcanzan
la media del nivel de auto concepto de los sujetos inactivos.
INTERPRETACIÓN: La actividad física influye sobre al auto concepto que los suje
tos tienen sobre sí mismos, de forma que los sujetos activos tienen un auto concep
to superior que las personas inactivas (T = 2,24; p < 0,025; d = 0,2794).
Para ello, selecciona una muestra de 182 jóvenes de su localidad con edades
comprendidas entre 25 y 34 años, de los que el 33,5% están en situación de des
empleo, y les aplica la misma prueba. La media y desviación típica insesgada de
los desempleados es de 251 y 115, respectivamente, frente a 289 y 92 de los que
tienen empleo.
A partir de los datos del enunciado, tenemos la siguiente información: Número
de sujetos 182 jóvenes, de los cuales:
=
Ha : cr f cro
H1 : cr f *- ªo
O bien:
103
------- p = 0,025
------ p = 0,01
F = 1, 5 6 2
0 , 0 1 < p < 0,025
Ho : µ E � µo
H1 : µ E > µ o
104
O bien:
Ha : µ E - µo � o
H1 : µ E - µo > 0
"2 "2
5 1 52 115 2 922
- +- = - - +- =16 94
n1 n2 61 121
( 2_
__;_ s__2_
9- 1)_
s_______:c o
-_
= 2 24
16,94
g. /.
l! �r+
=
(� + *r =99, 77 = 10º
92fi
( mXS ( 21 J
r
_;___ r + ( sx
( sK-'---- +
n1 - 1 n2 - 1
61 - 1 121 - 1
105
t = 2,24
H a : nE - n0 :S 0,15
H1 : nE - n0 > O , 15
106
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El investigador diseña una investigación para com
parar si la inserción laboral difiere entre dos grupos diferentes de promociones de
estudiantes de Psicología. La variable independiente es el año de promoción y la
variable dependiente es la inserción laboral que es una variable dicotómica con
distribución binomial. Realizará un contraste de diferencias de proporciones con
muestras independientes. La distribución muestra! de la diferencia de proporciones
es una distribución binomial pero como el investigador utiliza muestras grandes, la
distribución binomial se aproxima a la normal.
HIPÓTESIS: El investigador quiere comprobar si la inserción laboral difiere entre
las tres primeras y las dos últimas promociones. Como el investigador no está mar-
107
Ha : n: G1 = n: G 2
H1 : n: G l 1:- n: G 2
O bien:
Ha : n: G1 - n: G 2 =0
H1 : n: G l - n: G 2 *- 0
n n
siendo: p= G1 PG1 + G1 PG 2
n1 +n2
Y su valor, es:
-J
319 · 0,74+212·0,80 ( O , 74- O , 80 )- O
P= =0 764 Z= = -1 59
319+212 1 1
0, 764 ( 1- 0, 764 )( - - + -
319 212
108
Z = -1,59 Z = +1,59
109
BLOQU E 1 1 1
-
SITUACIÓN l. Las puntuaciones obtenidas por dos grupos de diez alumnos cada
-
grupo, en el test de inteligencia Y, son las siguientes:
40 46 35 17 11 22 20 31 18 22
20 10 20 15 18 6 12 12 6 11
SOLUCIÓN:
1.1. Tal como se pide en el enunciado del problema, vamos a calcular el estadístico
F. Para ello, previamente, elevamos al cuadrado cada una de las puntuaciones
de los grupos A y B y sumamos, por columnas, todas las puntuaciones.
113
----
• Ejercicios y problemas resueltos y comentados. Diseños de investigación y análisis de datos
40 1600 20 400
46 2116 10 100
35 1225 20 400
17 289 15 225
11 121 18 324
22 484 6 36
20 400 12 144
31 961 12 144
18 324 6 36
22 484 11 121
262 8004 130 1930
2
Y
- ( í: L )
1 3922
SCTotal= LLYí 1 = 9934- -- =9934 -7683,2=2250,8
] N 20
2 2
SC/nter = L ( IYíj ) J - (I í:Yíj ) = [ -
262 --
-+
130 392
J - -- =871,2
2 2 2
[ n N 10 10 20
¡
Con estos datos, construimos la tabla resumen del ANOVA unifactorial para ob
tener el estadístico F.
114
e A - Ya ) - (µ A - µa )
T = --;=================----
-
Ya =130 / 10 = 13
Y¡
5� = ¿ J - Y� = 1930 _ 132 =24
na 10
A2 n 10
Cuasi-varianza: Sa = -- 582 = -- 24=26,67
n -1 10 - 1
( 26,2 -13)-o
T= =3 37
( 9 )( 126 , 6 2) + ( 9 )( 26 , 67 ) 1 1
� +
18 10 10
115
Comparando ambos resultados, tal como nos pedía el enunciado del problema,
comprobamos que t2 = F. :
(3,37) 2 = 11,36
l�RIII 2 4 3 8 6 7 3 5 7 5
l�1Rl:I 5 6 5 9 7 10 5 7 9 7
l�rarn;,. 2 3 4 1 4 6 2 3 5 o
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Dado que tenemos tres muestras independientes,
vamos a aplicar un análisis de varianza de un solo factor. El enunciado dice que se
cumplen los supuestos de independencia de las observaciones, normalidad de las
distribuciones y homogeneidad de las varianzas que son los que exige el ANOVA
unifactorial.
HIPÓTESIS ESTADÍSTICAS: Como solo hay un factor, solo podemos formular una
hipótesis para comprobar si la variable independiente, el método de educación, con
sus tres niveles (A, B y C), influye sobre los resultados. Si los métodos son igual de
eficaces, entonces las medias serán iguales, por lo que las hipótesis nula y alterna
tiva son:
116
Ha : µA = µa = µe
H1 : µA * µ8 * µe al menos para una µ¡
ESTADÍSTICO DE CONTRASTE:
F =_
M_C_
in_
te_
r
MCintra
------
Para el cálculo de las sumas de cuadrados, sumamos todas las puntuaciones y
sus cuadrados, que figuran en la siguiente tabla:
2 4 5 25 2 4
4 16 6 36 3 9
3 9 5 25 4 16
8 64 9 81 1 1
6 36 7 49 4 16
7 49 10 100 6 36
3 9 5 25 2 4
5 25 7 49 3 9
7 49 9 81 5 25
5 25 7 49 o o
50 286 70 520 30 120
¿¿Y;] (¿¿\ )- 2 2
1 ( s o+70 + 3 o)
SC Tota/ = ---
' = ( 286+520+120)- = 926 -750 = 176
N 30
( ¿Y;j )2 - ( ¿¿Y;j )2 ( so + 70 +3 0 -
SC!nter = ¿ [ =¿
2 2 2
J J 750 = 80
n ¡ N 10
117
118
Comparaciones Coeficientes
Ay B 1 -1 o
AyC 1 o -1
ByC o 1 -1
B y ( A+ C ) -1 2 -1
1
CRs,h etté �( 3 -1){ 3, 316 ) ( 3, 55)( (� + J J = ( 2, 575)( 0, 843) = 2, 17
1 10
Este valor, 2,171, es la mínima diferencia que puede producirse entre dos me
dias para que no sea significativa. Cualquier diferencia mayor, sería significativa al
nivel de significación establecido.
119
JJ
decir, valga O , para finalmente aplicar la expresión de la prueba de Scheffé:
2 2
2 2 ( -1 ) ( -1 )
CRscheffé �( 3 -1)(3 , 3 16 ) ( 3 ,55)[[ - +-- +-- = ( 2, 575)( 1,46 ) = 3 ,76
10 10 10
120
3.1. Contraste la hipótesis del investigador con un nivel de confianza del 95%.
3.2. Analice nuevamente los datos con un nivel de confianza del 99%.
SOLUCIÓN:
3.1. CONDICIONES Y SUPUESTOS: Se trata de un diseño experimental en el que
se ha manipulado una variable independiente (un único factor) que, en este
caso, es la sincronía entre el movimiento de los labios y el sonido cuando se
pronuncian palabras. En la vida real vemos a las personas hablando al mismo
tiempo que las oímos. No hay asincronía entre la voz y la imagen excepto en
condiciones anómalas de mal funcionamiento de los equipos informáticos. Sin
embargo también podemos introducir estas anomalías mediante técnicas in
formáticas para estudios como este. lnformáticamente es posible adelantar o
atrasar el sonido en relación al vídeo. La pregunta que se planteaban los inves
tigadores es en qué medida esta asincronía afecta a la memoria de las palabras
pronunciadas. Por consiguiente, la variable dependiente es una medida de la
memoria.
Finalmente, y según el enunciado, se asume el cumplimiento de los tres supues
tos: independencia, normalidad y homocedasticidad.
HIPÓTESIS: Las medias de recuerdo en las tres condiciones son idénticas.
este análisis. Pero las SC nos las presentan como SS, lo cual no es problemático ya
que son los términos que se utilizan en inglés (SC = Sumas de Cuadrados, SS = Sum
of Squares). Es muy habitual la utilización de la terminología SS en los módulos
informáticos al uso. De la misma forma, a veces podremos ver el resto de términos
con sus iniciales inglesas. Así, MC = Medias Cuadráticas es idéntico a MS = Mean
Squares, mientras que gl = grados de libertad es idéntico a dof = degrees of free
dom.
- --
El diseño nos indica que tenemos un análisis factorial de un factor con tres nive
les. La tabla del anova será:
Fuentes de variación
lnter (factor manipulado) 233,867 1-1=3-1=2 116,934 5,895
lntra (error) 535,60 N - 1 = 30 - 3 = 27 19,837
__....:====:::=====::=::::
Total 769,467 N - 1 = 30 - 1 = 29
SC 233, 867 =
.
MCmter = ;n te r = 116 , 934
g /in te r 2
SC 535,6 0
.
MCmtr a
= ;n tra = = 19 , 837
g /intra 27
MCin ter = 116 , 934
F= =5 89 5
MCintra 19 , 837
F2 , 2 0 = 3, 493
F2 , 30 = 3,316
122
Y ambos se encuentran por debajo del valor del estadístico de contraste calcula
do (5,895) por lo que no hay incertidumbre en la decisión a tomar.
CONCLUSIÓN: Debido a que la F empírica obtenida en la tabla del Anova (5,895)
es superior a las F críticas que hemos obtenido de las tablas, podemos rechazar H0
con un nivel de confianza del 95%.
INTERPRETACIÓN: Existen, al menos, dos grupos en el experimento cuyas medias
son diferentes (F = 5,895; p < 0,05). La razón F obtenida se dice que es un estadístico
global u ómnibus ya que sólo nos indica que existen diferencias significativas pero
no nos permite determinar entre qué par de grupos se producen estas diferencias.
Sería interesante realizar comparaciones a posteriori pero en este caso descono
cemos las medias de las muestras a comparar. No obstante, sí es interesante referir
los valores de los pesos, o coeficientes, para poner a prueba la hipótesis a poste
riori más interesante: que el recuerdo se muestra afectado por la asincronía de los
índices auditivos y visuales, sin importar su dirección. Es por ello que en este caso,
deberíamos comparar las condiciones «asincrónicas» versus las «no sincrónicas».
Vemos que los grupos 1 y 3 son condiciones asincrónicas y el grupo 2 es sincrónica.
Por ello, el contraste tendrá que combinar los grupos 1 y 3 y compararlos de manera
conjunta, como si fueran un único grupo, con el grupo 2. Para ello, y respetando
el orden (CoeficienteG rupo l ' CoeficienteG rupo 2 , CoeficienteG rupo 3 ), se pueden utilizar
3.2. Con un nivel de confianza del 99%, tanto los supuestos como la Tabla del Anova
son idénticas ya que el nivel de confianza sólo afecta al criterio de decisión.
123
P ( Fn n 5c fn n ) = 0, 9 9
Tenemos el mismo problema que hemos
discutido previamente cuando intentamos
l' 2 1' 2
2 3 4
encontrar el valor de la F crítica con 2 y 30
1 4052,181 5624,583
2 98,503 99,166 99,249 grados de libertad para un nivel de confian-
3 34, 1 16 29,457 28,710 za del 95%. Por consiguiente, tomaremos la
2 1, 198 16,694 15,977
5 16,258 12,060 11,392 misma decisión: aproximar al valor más cer-
cano según los grados de libertad. En este
11 9,646 6,217 5,668
n2 12 9,330 5,953 5,412 caso elegiremos F (2, 30} = 5,390. Sabemos
13 9,074 5,739 5,205 que el verdadero valor es un poco superior
14 8,862 5,564 5,035
15 8,683 5,417 4,893
a 5,390 pero sin llegar a 5,849 (se encuentra
16 8,53 1 5,292 4,773 en un punto entre ambos).
17 8,400 5,185 4,669
18 8,285 5,092 4,579 Observamos que incluso en esta situa-
19 8,185 5,010 4,500
ción, con un nivel de confianza tan elevado,
20 8,096 4,938 4,43 1
30 7,562 4,510 4,018 seguimos rechazando H0 ya que el estadísti-
60 7,077 4,977 4,126 3,649 co de contraste, 5,895 supera el valor crítico
120 6,851 4,787 3,949 3,480
5,390 que representa la máxima diferencia
que cabe esperar por simple azar.
Tipo de ciudad
Industrial Servicios Administrativa
4,3 5,1 12,5
2,8 6,2 3,1
12,3 1,8 1,6
16,3 9,5 6,2
5,9 4,1 3,8
7,8 3,6 7,1
9,1 11,2 11,4
10,2 3,3 1,9
124
SOLUCIÓN:
Observamos que nos han proporcionado los datos directos de la variable depen
diente: Tasa de criminalidad. La unidad de observación es la ciudad (cada ciudad
tiene su propia tasa de criminalidad) y cada ciudad solo puede tener una única tasa
de criminalidad en un momento determinado. Además, considerando que las ciu
dades se han clasificado en tres categorías exhaustivas (industriales, de servicios o
administrativas) en función de su actividad comercial principal, cada valor numérico
proporcionado en la tabla solo puede pertenecer a una ciudad. Esto significa que te
nemos un factor de medidas o muestras independientes con tres niveles. Debemos
aplicar un Anova de medidas independientes con tres niveles.
CONDICIONES Y SUPUESTOS: Asumimos que el modelo es de efectos fijos ya
que sólo nos interesan los niveles concretos de ciudades expuestos en la Tabla. Los
supuestos son los propios del Anova (independencia de las observaciones, norma
lidad y homocedasticidad). La variable dependiente es de razón ya que es una tasa
cuyo valor O es significativo e indica ausencia de criminalidad.
HIPÓTESIS: La hipótesis nula afirma que no existen diferencias en las tasas de
criminalidad entre los tres tipos de ciudades, es decir:
H 1 : µindus trial * µse rvicio s * µadm inistra tiva ; para al menos dos de ellas
2
( 68, 7 +44, 8 +47, 6 ) 2 5.953,2
= 1081 38
8+8 +8 24
125
2
3
68,72 44 1 82 471 62
[A ] = ¿ ( l J = + + =589,961 + 250,88+283,22=1124,06
i= l n; 8 8 8
Verificamos que la SCtotat es la suma de las SCinte r y la SCintra · Y con estos valores
podemos construir la tabla del Anova (recordando que tenemos un diseño equili
brado con 3 x 8 = 24 unidades de observación en total y 3 niveles del factor).
Hemos obtenido en la Solución una razón F empírica de 1,35. El valor crítico de
la F al 95% de confianza con 2 y 21 grados de libertad no aparece exactamente en
la tabla del formulario, pero tenemos un valor muy aproximado (F2 , 20) cuyo valor
es 3,493.
REGLA DE DECISIÓN: Rechazaremos H0 si el valor de la F empírica obtenida con
nuestros datos y que aparece en la Tabla del Anova es superior a la F crítica obteni
da en las tablas de la F de Snedecor-Fisher para un nivel de confianza del 95%.
CONCLUSIÓN: Como el valor de la F empírica (el estadístico de contraste) es in
ferior al valor de la F crítica (1,35 < 3,493) no hay evidencia suficiente para rechazar
la H0.
Una consecuencia derivada de este resultado es que no es posible contestar
positivamente a la pregunta acerca de si existen diferencias entre las ciudades in
dustriales y las de servicios. Solamente en el caso en que hubiésemos rechazado H0
tendría sentido plantearse esta pregunta realizando la prueba de Scheffé.
INTERPRETACIÓN: No existe evidencia empírica para afirmar que la tasa de cri
minalidad depende del tipo de ciudad en que viven las personas.
del año parece afectar de forma decisiva a la gravedad de los trastornos alérgicos.
En un estudio se ha utilizado una muestra aleatoria de 5 pacientes alérgicos (todos
con el mismo tipo de alergia) sometidos todos ellos a condiciones de alto estrés. Un
grupo de especialistas ha evaluado la gravedad de la alergia de cada paciente (en
una escala de O a 10) en los cuatro periodos estacionales: primavera, verano, otoño
e invierno. Para analizar estos datos, el investigador utilizó un ANOVA cuyas razones
básicas aparecen a continuación (utilice un a= 0,05):
[A X S]
910 852,5 940 845
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El estudio ha utilizado solo 5 participantes proce
dentes de una misma población caracterizada porque padecen alergia y alto estrés,
y ha medido la gravedad de la alergia (variable dependiente) en cuatro periodos
estacionales. Esto significa que para cada participante disponemos de 4 puntuacio
nes, una en cada periodo. Por consiguiente, se trata de muestras relacionadas o de
pendientes ya que las observaciones de cada estación pertenecen al mismo sujeto.
La variable manipulada ha sido el periodo estacional. Es un diseño de un factor de
medidas dependientes con 4 niveles: primavera, verano, otoño y verano.
Las condiciones que deben cumplir los datos son los propios correspondientes
a un diseño intra-sujetos:
1. La variable dependiente se encuentra medida a un nivel mínimo de intervalo.
Debido a que los especialistas han medido la alergia en una escala (asumimos
que continua) del O al 10, podemos afirmar se cumple el supuesto. Aunque
no podemos afirmar que si un especialista ha puntuado la alergia de un suje
to en una estación como cero significa ausencia absoluta de alergia ya que la
medición es subjetiva, al menos podemos confirmar el nivel de intervalo en
la medida de la variable dependiente.
2. Las puntuaciones de alergia en cada estación son independientes entre sí.
3. Las puntuaciones de alergia en cada estación deben distribuirse según la cur
va normal.
4. Las varianzas de las puntuaciones en alergia deben ser iguales entre sí.
S. Las covarianzas entre cada par de niveles del factor deben ser iguales entre sí.
127
Mientras que la hipótesis alternativa afirma que, al menos para un par de esta
ciones, sí existen diferencias. Como existen 4 estaciones, se plantea que alguna de
las 6 comparaciones posibles es significativa, es decir, que en alguna de ellas (o en
varias) existen diferencias en la magnitud de la alergia.
Estos resultados nos permiten construir la tabla del Anova considerando que
-·
tenemos 4 niveles del factor (a = 4) y tenemos 5 sujetos (s = 5).
g.d.l.
•
Factor (A) 65 a-1=4-1=3 21,667 21,67 / 1,875=11,56
Sujetos {S) 7,5 s-1 = 5-1 = 4 1,875
7,5 1,875
(a.s) -a -s+l=
(4x5)-4-5+1=12
Error (AxS)
95 N-1 = 20-1= 19 5
128
A 15 37 555 22350
B 15 34 510 18300
e 15 47 705 35295
Tras realizar todas las comprobaciones necesarias se concluyó que las observa
ciones eran independientes, las distribuciones normales y las varianzas homogé
neas y el investigador quiere comprobar si las estrategias de control de la atención
influyen sobre el rendimiento de los jugadores.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Disponemos de una variable independiente (la
estrategia de control ) con tres niveles o valores y se quiere estudiar su influen
cia sobre la atención en los jugadores de ajedrez. Se forman al azar tres muestras
indpendientes de 15 sujetos cada una. Se trata, por tanto, de un diseño factorial
equilibrado en la que se cumplen los supuestos del ANOVA.
129
·
HIPÓTESIS ESTADÍSTICAS: Se trata de un contraste bilateral ya que el investigador
no ha establecido previamente que alguna estrategia produzca mejores resultados
que otra. La hipótesis nula establece que no existen diferencias entre los tres tipos
de estrategia, frente a la hipótesis alternativa de que, al menos, para un para de
estrategia sí existen diferencias significativas.
Ha : µA = µB = µe
H1 : µA *-µ8 *-µe¡, para algún par
3. 1A¡ )2
(555+ 510+ 705)
[rJ= :2 = ( I,; ------= 25953,2 =69620
2
. 15+15+15 45
�i=ln1
'"'
3
[ At 5552 5102 7052
[A]=¿ - J =-+-+-=71010
i=l n¡ 15 15 15
Verificamos que la SCtotal es la suma de las SC inter y la SC intra · Y con estos valores
podemos construir la tabla del Anova (recordando que tenemos un diseño equili
brado con 3 x 15 = 45 jugadores de ajedrez en total repartidos a 3 niveles del factor).
130
SITUACIÓN 7. Para estudiar el efecto del paso del tiempo sobre la calidad del
recuerdo, se realiza un estudio en el que a un grupo de 9 personas seleccionadas de
forma aleatoria se les presenta una historia escrita que deben memorizar durante
20 minutos. Terminado el tiempo de memorización, se dejó transcurrir una hora y
se pidió a los 8 sujetos que escribieran la historia que habían intentado memorizar.
Un grupo de expertos evaluó la calidad del recuerdo de cada sujeto. Transcurrido
un día se volvió a pedir a los sujetos que realizasen la misma tarea, y lo mismo se
hizo al cabo de una semana y al cabo de un mes, obteniendo los resultados de la
siguiente tabla:
7 7 4
6 7 5
8 6 5
9 5 3
7 7 4
8 7 4
7 6 2
8 7 3
Con estos datos, compruebe el efecto del paso del tiempo sobre la calidad del
recuerdo.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: El experimento se realiza sobre una muestra de
ocho sujetos a los que se les evalúa la calidad del recuerdo (la variable dependiente)
en tres momentos distintos (pasado 1 día, 1 semana y 1 mes) que es la variable in-
131
Y la hipótesis alternativa, niega la anterior, para indicar que el paso del tiempo sí
influye sobre la calidad del recuerdo:
132
[s] =
¿s¡ = 324+324+361+289+... = 2s32 = 844
a 3 3
AS;¡ J (60+52+30)2
2
(L
[r]= = = 840,17
as 3·8
-- --
Para finalmente construir la tabla del ANOVA intrasujetos:
g.l.
[A]-[T] = Factor A 60,33 a-l = 2 30,167 30,9
[S]-[T] = Sujetos 3,83 s-1 = 7 0,547 0,561
[AS]-[A]-[S]+[T] = AxS 13,67 (a-l) (s-1} = 14 0,976
[AS]-[T] = Total 77,83 N-l= 23
133
A
B if1"ifoJ!iUM&f:j¡)H
-
[Y]=717 [T]=662,7
- 18 18
29 21
ÍAl=674,73 ÍBl=682,1 ÍAB1=700,6
33 22
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Contamos con dos factores, el sexo y la edad. El
primero con dos niveles, hombre y mujer y el segundo, siendo una variable cuanti
tativa, se ha categorizado en tres grupos: jóvenes, medianos y mayores. Por tanto,
se trata de un diseño de dos factores (2x3}. El número de sujetos de cada una de
134
Para el factor edad, la hipótesis nula establece que la edad no afecta a la reac
ción emocional, o dicho con otras palabras, que las medias en el cuestionario de los
tres grupos de edad son iguales. Por su parte, la hipótesis alternativa indicará que sí
afecta, al menos para un par de niveles del factor iluminación.
Para la interacción la hipótesis nula afirma que los efectos de la edad y del sexo
son aditivos, de tal forma que la reacción emocional entre hombres y mujeres es la
misma con independencia de la edad, o viceversa, que la reacción para los distintos
grupos de edad es la misma con independencia del sexo. En términos gráficos se
vería reflejado en que las medias de la reacción emocional entre hombres y mujeres
se situarían sobre líneas paralelas en los tres grupos de edad, por un lado, y que la
media para los distintos grupos de edad para hombres y mujeres se situarían sobre
líneas paralelas. Y veremos estas gráficas en la resolución de esta situación.
H0 : No existe interacción
H1 : Existe interacción
135
------
Con lo que la tabla resumen del ANOVA es:
REGLA DE DECISIÓN: Con 1 y 24 gl, para el factor A, o con 2 y 24 gl, para el factor
B y la interacción, y para los niveles de confianza del 9 5% o del 9 9 %, los valores crí
ticos que podemos encontrar en la tabla, son:
35 35
30 30
25 25
20 20 -+- J OV
-+- M UJ ERES
MED
15 H O M B R ES 15
.........._ MAY
10 10
5 5
o o
JOV MED MAY M UJ ER ES H O M B RES
A en b1 = -- - -
2
[ ] ¿(AB; 1 )
Utilizando los datos de la siguiente tabla en la que figuran las sumas de los suje
tos de cada uno de los grupos y las sumas marginales de los niveles de cada factor:
137
INIMM 18 18 36
l&IM+M 29 21 50
l#&Mll 33 22 55
80 61 141
¿ ( A8; 1 )2 =-
182 182
+-=129, 6
[A en bi ) =
n 5 5
Bf 36 2
[ 81 ] = -=- = 129, 9
an 2·5
502
[ 82 ] = _1__ = - = 250
2
8
an 2·5
8� 552
[ 83 ]=-=-=302, 50
an 2·5
138
n b. n 5 5 5 3. 5
1 1 4
Con estas sumas de cuadrados completamos la siguiente tabla, las medias cua
------
dráticas (SC/gl} y los estadísticos F, como cociente entre la media cuadrática de cada
nivel y la media cuadrática del error o intra del ANOVA realizado anteriormente:
Í2;20;0,95 = 3, 49 F = 1; 20;0,95 = 4 , 35
-+- a l : MUJ ERES a 2 : HOM B RES -+- b l : JOV b 2 : M E O -.1,- b3: MAY
35 ,----------� 35 � -- � ------- -
30 +------f-:_�"'----f--t-� 30 +----+--l-��------
25 +---- ---/--1---+----l--f-� 25 +----1---1---� �---c,----�
20 +-----7'--� -'+-+-----f>-.L--� 20 +--- --+--+-----�---
15 i;::=======::,c'.:::::=====:::;----¡---� 15 +-----+-=----------
10 t-============;::::::��======::::;- 10 i-;===.t.============,------�
F = 17,66; p < 0,01
5 4--------================= 5 -i--'======='--------
o -+----�--�--� 0 -+------�-----�
b l : J OV b2: MEO b 3 : MAY a l : M UJ ERES a2 : H O M B RES
140
a) Averigüe si es cierto que existen diferencias entre las dos razas de ratas en los
tiempos que tardan en atravesar el corredor.
b) ¿Cómo influyen esos días de privación de comida en los tiempos que tardan
las ratas en atravesar el corredor?
e) ¿5e obtiene algún efecto cuando se combinan los dos factores?
SOLUCION:
CONDICIONES Y SUPUESTOS: En este experimento se trabaja con dos variables
independientes o factores. La raza, con dos niveles, y el tiempo de privación de
alimento, con tres niveles. La variable dependiente es el tiempo que, según el enun
ciado del problema, cumple los supuestos de independencia de las observaciones,
normalidad de las distribuciones y homogeneidad de las varianzas. Se trata, por
tanto, de un diseño (2x3) que se resolverá analizando los datos con un ANOVA bi
factorial con interacción de efectos fijos.
HIPÓTESIS ESTADÍSTICAS: Hipótesis para el factor A, raza: La hipótesis nula esta
blece que no hay diferencias significativas en el tiempo que tardan en recorrer el
laberinto las dos razas de ratas, frente a la hipótesis alternativa que afirmaría que sí
existen esas diferencias. Se trata, por tanto, de un contraste bilateral.
Ha : µw = µLE
H1 : µw * µLE
Hipótesis para el factor B: La hipótesis nula establece que no hay diferencias
significativas en el tiempo que �ardan las ratas en recorrer el laberinto por causa
del tiempo de privación de comida. La hipótesis alternativa indicaría que el tiempo
de privación produce diferencias significativas en el tiempo que tardan las ratas en
recorrer el laberinto.
Hipótesis para la interacción: La hipótesis nula establece que el tiempo que tar
dan las ratas en recorrer el laberinto es el mismo con independencia de la raza y
del tiempo de privación. Es decir, no existe interacción entre la raza y el tiempo de
privación sobre la ejecución de la rata para recorrer el laberinto. La hipótesis alter
nativa indicaría que sí existe interacción.
141
H0 : No existe interación
H1 : Existe interacción
F
= M Cfactor tiempo privación
M Cerror
MCinte racción
F=
M Cerror
En la siguiente tabla aparecen las sumas de las puntuaciones para cada una de
las 3x2 condiciones que nos facilitan las operaciones para obtener las sumas de
cuadrados.
142
Calcularemos las razones básicas para obtener las sumas de cuadrados corres
pondientes:
T2 1902
[ r]=-=--=1504, 17
abn 2 · 3 · 4
A +116 2
"' ,� = 74
2
L.J_
[A] = - =1577, 67
bn 3·4
Con estos resultados, completamos la tabla del ANOVA para calcular los estadís
ticos de contraste:
143
h1te1acción (AxB)
Residual 54 20 2,70
Total 439,83 23
estadístico de contraste 57,83 es mayor que el valor crítico 3,493 por lo tanto, tam
bién rechazamos la H0 del factor tiempo de privación.
1 NTERPRETACIÓN:
a) Dado que hemos rechazado la hipótesis nula del factor tipo de rata, podemos
contestar a la primera de las preguntas diciendo que, con un nivel de confian
za del 95%, afirmamos que existen diferencias entre las dos razas de ratas en
su tarea de recorrer el laberinto (F = 27,22; p<0,05).
b) Dado que hemos rechazado la hipótesis nula del factor tiempo de privación,
podemos afirmar, con un nivel de confianza del 95%, que estar privadas de
comida 1,2 ó 3 días influye de forma distinta en el tiempo que tardan en re
correr el laberinto (F = 57,83; p < 0,05). Debemos realizar las comparaciones
múltiples para comprobar exactamente entre quienes está la diferencia.
c) Respecto a la tercera de las preguntas, vimos que el modelo era aditivo al
no poder rechazar la hipótesis nula de la interacción, por lo tanto, no se da
ningún efecto significativo cuando se combinan los dos factores (F = 1,34; p >
0,05).
La siguientes gráficas representan la situación donde se aprecia que no existe in
teracción al no producirse un cruce o « no paralelismo» significativo entre las líneas.
70 70
60 60
50 50
40 40 -+- Bl
-+- Al
30 30 B2
A2
........._ B3
20 20
10 10
o o
Bl B2 B3 Al A2
SITUACIÓN 10. Un estudio publicado por García, M.C. , Navas, M.S., Cuadra
do, l., Y Molero, F. {2003} con el título: «Inmigración y prejuicio: A ctitudes de una
muestra de adolescentes almerienses» tiene como objetivo conocer la imagen que
los adolescentes de una zona, con alta recepción de trabajadores extranjeros, tie
nen acerca de los inmigrantes. Entre sus resultados se indica que existen diferencias
significativas en la imagen de los inmigrantes en función del sexo y de la edad de los
adolescentes, siendo más bajas para las chicas y para los de mayor edad. Imagine
que desea comprobar si estas diferencias existen también en otras zonas donde la
145
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: En esta situación el investigador quiere comprobar
si en la población de adolescentes de su localidad existen diferencias significativas
en la imagen de los inmigrantes en función del sexo y de la edad. Las variables inde
pendientes son el sexo y la edad y la variable dependiente la imagen que los adoles
centes tienen de los inmigrantes medida a través de la Escala de Racismo Moderno
de McConahay y colaboradores. Cada variable independiente tiene dos valores o
categorías y la variable dependiente es de naturaleza cuantitativa medida con esca
la de intervalo. Se trata, por tanto, de un diseño 2x2 para muestras independientes
que se analiza con un ANOVA de dos factores con interacción. En el enunciado se
indica que se asume que se cumplen los supuestos necesarios para realizar este
análisis: independencia de las observaciones, normalidad y homocedasticidad. El
modelo del ANOVA de dos factores indica que cada puntuación es la suma de varios
componentes:
Donde «alfa» representa la influencia del factor A: sexo; «Beta» la influencia del
factor 8: edad y «alfa x beta» el efecto de la interacción entre estas dos variables
sobre la imagen de los inmigrantes.
HIPÓTESIS: Trabajando con dos factores, se plantean tres hipótesis nulas. La pri
mera para analizar la influencia del sexo sobre la variable dependiente. La segunda
para analizar la infl uencia de la edad y la tercera para la interacción. Todas ellas se
pueden escribir de diferentes formas:
Para analizar si existen diferencias entre chicos y chicas, formulamos las hipótesis:
H0: No existen diferencias significativas entre las medias obtenidas en la Escala
de Racismo Moderno obtenidas por los chicos y las chicas. O lo que es lo mismo:
todos los a; = O que conlleva a la igualdad de las medias poblacionales.
146
Ha : µchi co s
= µchicas
Para analizar si existe interacción del sexo con la edad, formulamos las hipótesis:
147
• ••••
• Ejercicios y problemas resueltos y comentados. Diseños de investigación y análisis de datos
A (SEXO) a-l= 1
B (EDAD) b-l= 1
AB (a-l}(b-1) = 1
ERROR 16 x 1,525 = 24,40 ab(n-l) = 16 1,525
TOTAL 70,55 n-1= 19
seintra seintra
Me,ntra = � 1, 525 =-- � se,ntra =1, 52 5 · 16 =24, 40
ab ( n-l ) 16
SeA = [A]-[T]=1240-1232, 45 = 7, 55
Y situamos todos estos resultados sobre la tabla, para obtener las Me dividiendo
su respectiva se entre sus grados de libertad. Finalmente, calculamos los valores del
estadístico F, dividiendo la Me de cada fuente de variación entre la MeError.
148
---- --
Soluciones a los ejercicios de los capítulos 5, 6 y 7 •
REGLA DE DECISIÓN: En este ejemplo concreto, los valores críticos para los nive
les de confianza del 95% y del 99% se localizan en la tabla con 1 gl en el numerador
y 16 gl en el denominador y son 4,494 y 8,531, respectivamente.
CONCLUSIÓN: Con un nivel de confianza del 95%, todos los estadísticos de con
traste obtenidos superan sus respectivos valores críticos, rechazaríamos las tres
hipótesis nulas formuladas. La hipótesis de no existencia de interacción se puede
rechazar, incluso con un nivel de confianza del 99%.
1 NTERPRETACIÓN:
• Existe interacción del sexo con la edad de los adolescentes respecto a la ima
gen que tienen de los inmigrantes (F = 17,34; p < 0,01).
sultados cuyo resumen aparece en la tabla (en las celdillas está el sumatorio de las
puntuaciones de los sujetos de cada una de las condiciones del experimento; en las
marginales los sumatorios correspondientes a cada factor A o B, respectivamente y
también conocemos que I I 2Y;}k =1456; además SCA = 70 y SC8 = 40
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Se trata de un modelo bifactorial (entrenamiento y
clima) con tres muestras independientes. Se asume que se cumplen los supuestos
de independencia de las observaciones, normalidad y homocedasticidad que re
quiere este tipo de análisis.
HIPÓTESIS ESTADÍSTICAS: Para el factor A, tipo de entrenamiento, la hipótesis
nula y alternativa, son:
Ha : µAl = µA 2 = µA3
H1 : µAl *µA 2 * µA3 , para algún µ¡ * µj
Para el factor B:
150
SCT = [Y]-[T]
T2 2402
[r] =- = -- =1280
abn 3 . 3 . 5
Y, por el enunciado, sabemos que [Y]=¿ ¿ ¿rí]k =1456. Por lo que la SCT es:
151
[ AB] = L ( AB )'. 352 +252 + 452 + 30 +20 +25 +25 +15 +20
����������������
2 2 2 2
= 1410
2 2
n 15
O bien despejar su valor de: SCT = SCA + SCB + SC(AxB) + SCError, para llegar al
mismo resultado.
-----
Finalmente, la tabla del ANOVA queda:
B 40 2 20 15,65 3,26
A 70 2 35 27,39 3,26
20 4 5 3,91 2,63
46 36 1,28
176 44
REGLA DE DECISIÓN: Con un nivel de confianza del 95%, los valores críticos para
cada una de las hipótesis aparecen en la columna derecha de la tabla anterior.
CONCLUSIÓN: Como todos los valores de F obtenidos, superan los valores críti
cos, se rechazarían las tres la hipótesis nula formuladas con un nivel de confianza
del 95%.
152
5 0 �------------- 5 0 �-------------
-+- Al: INSTRUMENTAL A2: ATRl8UCIONAL ........ A3: CONTROL -+- 81: COOPERATIVO 82: COMPETITIVO ........ 83: INDIVIDUAL
El análisis de los efectos simples nos permite analizar el factor A, tipo de en
trenamiento, en cada una de las tres condiciones del factor B, clima de clase. Para
ello, a partir de la suma de las puntuaciones de cada condición que aparecen en la
siguiente tabla, se calculan las sumas de cuadrados en cada uno de los niveles del
otro factor:
A2: ATRIBUCIONAL 30 20 25 75
A3: CONTROL 25 15 20 60
Sumas 90 60 90
A12 35 2 25 2 45 2 105 2
� =�+� + �-�- = 40
b·n 5 5 5 3. 5
-----
Con estas sumas de cuadrados completamos la siguiente tabla:
[A en b 1 1= 10 2 5 3,91 <0,05
[A en b2 1= 10 2 5 3,91 <0,05
[A en b3 1= 70 2 35 27,39 <0,01
[B en a 1 1= 40 2 20 15,65 <0,01
[B en a 21= 10 2 5 3,91 <0,0:5
[B en a 31= 10 2 5 3,91 <0,05
46 36 1,278
-+- Al: INSTRUMENTAL A2: ATRIBUCIONAL ...,._ A3: CONTROL -+- Bl: COOPERATIVO B2: COMPETITIVO ...,._ 83: INDIVIDUAL
50 -,---------,../ -
,../ --� 50 -,--- ,../ ----------�
45 +------------ --blto-\--� 45 +--�.--------------�
40 -+---------------t---+--� 40 -+---+--+-3',,�--------�
35 +---�=--------,'-----t---t-� 35 -t----�..¡.._;=------"�-------�
30 +---t-r�1:---=-..:::----?'-------t---t-� 30 -t---+---t--------=�'7'+,,l>;.;;;:::::----�
2 5 -t----\--..i::-------"'-.,,...--'='1'�------.::=t-l •t-t-� 25
20 +------F=---=-...,..-� n=------=--�-� 20 +----,..._---=-, �----=.........-+--
1 5 -+----I'------�._,.,,=--------'-�� 15 -+------''<-------"-sc----=+-
10 --1--,-__¡_-�-==----,.._::::'....._----,----.:.....____, 10 +-r---�,../ ""1----.......��----:--,
5 -t-'---'--'-'--____:___J------L-�-'-'--'---' 5 +-'---'--______:__:.____.:___,__--L.._.___:________:__:.__
O -+-------,------.--------, O -+-------,-----�------,
_;____J
Bl: COOPERATIVO B2: COM PETITIVO B3: I N DIVIDUAL Al: INSTRUM ENTAL A2: ATRI BUCIONAL A3: CONTROL
SITUACIÓN 12. En una investigación sobre el efecto que tiene el fumar sobre el
rendimiento laboral en diferentes condiciones de iluminación en una gran empresa,
se seleccionaron al azar 9 trabajadores de tres grupos (27 trabajadores en total): no
fumadores, fumadores moderados y fumadores extremos (factor Grupo). Tres suje
tos de cada grupo anterior se asignaron a un ambiente de trabajo con tres niveles
de iluminación distintos (factor Iluminación). Se registró el tiempo en completar
una tarea de ensamblado en minutos. Conocemos las sumas de cuadrados que se
muestran a continuación (nivel de significación: 0,05).
SCG r u p o = 84, 90; 5Cl l u m i n ac ión = 298, 07; SCError = 59, 25; SCTota l = 445, 03
Analice el estudio según el diseño apropiado. ¿Qué podemos decir de los efectos
simples?
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Nos indican claramente que han manipulado expe
rimentalmente dos factores o variables independientes: Grupo e Iluminación para
ver su efecto sobre el rendimiento laboral (la variable dependiente). Cada factor
tiene 3 niveles. Por consiguiente, se trata de un diseño de dos factores intersujetos
o de muestras independientes 3x3. El número de sujetos en cada combinación de
los factores es de 3. Para aplicar un ANOVA bifactorial la variable dependiente tiene
que estar medida, al menos, con escala de intervalo (variable cuantitativa), con dis
tribución normal y varianza constante para cada grupo (homocedasticidad).
HIPÓTESIS: Para el factor Grupo, establecemos que el fumar no afecta al rendi
miento laboral de los trabajadores, o lo que es lo mismo, que las medias del ren
dimiento laboral de los tres grupos son iguales. La hipótesis alternativa indica que
las medias sí afectan al rendimiento laboral, o lo que es lo mismo, que al menos las
medias de dos grupos son distintas:
155
Para el factor Iluminación sólo sabemos que hay tres niveles pero no nos han
indicado sus valores, así que los representaremos con los subíndices 1, 2 y 3. E igual
mente, la hipótesis nula establece que las condiciones de iluminación no afecta al
rendimiento laboral, frente a la hipótesis alternativa que sí afecta, al menos para un
par de niveles del factor iluminación.
Ha : µ1 =µ2 =µ3
H1 : µ1 * µ2 * µ3 al menos para un par de tratamientos
Para la interacción la hipótesis nula afirma que los efectos del Grupo y de la Ilu
minación son aditivos, de tal forma que el patrón de resultados que se observa para
el tabaquismo (Grupo) es el mismo en los tres diferentes niveles de iluminación. En
términos gráficos se vería reflejado en que las medias de rendimiento en función
del nivel de tabaquismo serían paralelas en los tres grupos de Iluminación y la hipó
tesis nula y alternativa son:
156
---
Soluciones a los ejercicios de los cap ítulos 5, 6 y 7 •
445.03 N- l = 26 17, 1 1 6
seAx B = Ser -( seA + Sea + se5 / AB )=445, 03-(84, 90 + 298, 07+59, 25) = 2, 81
En la tabla del Anova hemos incluido una nueva columna que indica el valor de
la F crítica para cada factor o interacción al 95%. Estos valores de la F crítica sólo de
pende de los grados de libertad correspondientes a cada comparación y, por tanto,
coincide en el caso de los factores A y 8 (ambos con 2 y 18 grados de libertad) pero
difiere para el contraste de la interacción (con 4 y 18 grados de libertad).
REGLA DE DECISIÓN: Rechazaremos H0 siempre que el estadístico de contraste F
obtenido en el Anova supere el valor crítico de la tabla de la distribución F. Observa
mos que esto se ha producido para el factor A y el factor 8 como factores principales
(12,895 > 3,555 y 45,272 > 3,5555, respectivamente) pero no así para la interacción
entre A y 8 (0,123 < 2,928).
CONCLUSIÓN: La primera hipótesis que hay que contrastar es sobre la interac
ción. El estadístico obtenido no supera el valor crítico por lo que la interacción no
es significativa y su variabilidad hay que sumarla al error para volver a recalcular los
estadísticos de contraste de cada uno de los factores:
157
-----
• Ejercicios y problemas resueltos y comentados. Diseños de investigación y análisis de datos
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Se trata de un experimento en donde se han ma
nipulado, según el enunciado, dos variables: el tratamiento recibido y la planta de
trabajo de la que proceden las mujeres que se van a someter al mismo. La prime
ra variable (tratamiento) adopta 3 niveles: dieta, ejercicio o dieta+ejercicio. La se-
158
M1 xl_a ntes-xl_después
M2 x2_a ntes-x2_después
M a n ufact u ra d o M3 x3_a ntes-x3_después
M4 x4_a ntes-x4_después
Ms XS_antes-XS_después
D i eta
M6 X6_antes-X6_después
M7 X7_antes-X7_después
Secreta ría Mg x8_a ntes-x8_después
Mg x9_antes-x9_después
M10 XlO_a ntes-XlO_después
M a n ufact u ra d o
Eje rcicio
Secreta ría
M a n ufa ct u ra d o
M3 5 x36_antes-x36_después
D i eta + Ej e rcicio M37 X37_a ntes-X37_después
Secreta ría M38 x38_antes-x38_después
M39 X39_a ntes-X39_después
M40 x40_a ntes-x40_después
159
Y Control -Y Experimental
d=
Sy
Observamos que nos enfrentaríamos al problema de decidir cuál de los tres gru
pos (dieta, tratamiento o dieta+tratamiento) debería considerarse como grupo de
control (no consideramos la planta de tratamiento porque, como hemos dicho, se
puede considerar una variable moderadora más que una variable independiente en
el sentido propio del término). Pero si utilizáramos un análisis 3x2 mixto podríamos
disponer de las puntuaciones pre-test como punto de partida, o control, con las que
comparar las puntuaciones experimentales.
CONDICIONES Y SUPUESTOS: Al tratarse de un Anova, los supuestos que deben
cumplirse son: normalidad, homocedasticidad e independencia. En el propio enun
ciado se nos indica que asumamos que estos supuestos se cumplen .
HIPÓTESIS: La hipótesis que se pone a prueba ( Ha) es que la media de las tres
condiciones experimentales es la misma, es decir, que los tres tratamientos de pér
dida de peso tienen el mismo efecto.
La hipótesis alternativa plantea que existen, al menos, dos grupos cuyas medias
en pérdida de peso difieren.
Como existen tres grupos para el factor tratamiento, esta hipótesis alternativa se
verifica si se cumple alguna de las tres hipótesis (o la dieta y el ejercicio difieren, o
la dieta y la combinación dieta+ejercicio o el ejercicio y la combinación dieta+ejer
cicio). Con que se cumpla alguna de las tres hipótesis se rechaza Ha y se acepta H 1 .
161
Ha : µManufacturado =µSecretaría
H1 : µManufacturado * µSecretaría
Decimos que tendría poco sentido ya que, considerada como factor principal, no
involucre al verdadero tratamiento, aquel que podemos introducir en un programa
de reducción de la obesidad.
Por últi mo, tendríamos que poner a prueba la interacción entre la planta de
trabajo y el tratamiento.
Ha : No existe interacción
H1 : Existe interacción
162
BLOQUE IV
SOLUCIÓN:
Se trata d e u n p roblema d e regresión l i n e a l s i m p l e en d o n d e p rete n d e mos eva
l u a r l a ca paci d a d p redicto ra d e l n ú m e ro d e a ños d e a maestra m i e nto d e m o n os e n
re lación a l n ú m e ro d e ta reas q u e p u e d e n rea l iza r pa ra las personas d isca pacitadas.
La va ria ble d e p e n d i e nte será e l n ú mero de ta rea s que puede rea l iza r e l m o n o y l a
va ri a b l e i n d e p e n d i e nte será el n ú mero d e a ños. Pa ra no repeti rnos c o n l o s la rgos
n o m b res de las va ria b les, l l a m a remos X a la va ria b l e i nd e pendiente e Y a la va ria ble
d e p e n d i e nte.
CO N D I CI O N ES Y S U P U ESTOS : Los s u p u estos son d e i n depende n cia e ntre las ob
serva ciones, hom ocedasticidad y n o r m a l i d a d . Con respecto a l a i n dependencia, no
pa rece l ógico d u d a r de la m isma si los m o n os h a n sido extraídos d e d i sti ntos la bo
ratorios o zoo lógicos e i n cl u so de d i sti ntos p a íses . N o podemos eva l ua r l a h omo
ced a sticidad y l a norma l i d a d porq u e n ecesita ría mos d isponer d e u n a m u estra d e
datos en la va ri a b l e Y ( n ú me ro d e ta reas), pa ra ca d a u n o d e l os va l o res d e la va ri a b l e
i nd e pend ie nte X ( n ú mero d e a ños). E n este sentido, solo C l e o y J e e p ti e n e n el m is
mo va lor en l a va ria b l e « a ños de tra baj o » y d isti nto va lor en el « n ú m e ro de ta reas » .
E n todo ca so, no te ne mos ra zo nes pa ra s u po n e r q u e s e i n c u m p l a n estos s u p u estos
segú n e l e n u n ci a d o .
L o q u e s í es i nteresa nte nota r es el i n c u m p l i m i e nto d e l s u p u esto de l a conti
n u i d a d de las va ria b les. E n co ncreto, l a va ria b l e Y es d iscreta ya que e l número de
tareas sólo p u ed e a d o pta r va l o res del conj u nto d e los n ú m e ros natura l es (N = {O, 1,
2, . . . }) . Au n q u e es u n a va ria b l e m e d i d a en u n a esca l a de ra zó n, este i n cu m p l i m ie nto
pod ría c uesti o n a r el a n á l isis de regresi ó n .
H I PÓTESIS: E l i nvestiga d o r ha p l a ntea d o e l contraste d e la bondad del aj u ste d e
la regresión pa ra lo q u e te n e m os q u e eva l u a r el co ntraste del coeficie nte d e regre
sión B med i a nte un Anova . En el m is m o, la hi pótesis n u l a es q u e e l n ú m e ro d e a ñ os
d e tra bajo del m o n o no p redice el n ú m e ro d e tareas q u e éste p u e d e rea l iza r, lo q u e
expresa d o s i m p l e m e nte i nd i ca q u e l o s monos n o a p re n d e n n u eva s ta rea s c o n l a
experi encia .
Ha : �1 = 0
H1 : �1 :;t: O
Pa ra verifi ca r la consisten cia d e l a n á l isis, rea l iza re mos e l contra ste d e l a bondad
d e aj u ste d e la recta globa l media nte e l Anova . Este Anova eva l ú a e n q u é m e d i d a
los datos p u e d e n ser p red ichos media nte u n a l ínea recta, separa n d o l a va ri a b i l i d a d
tota l e n u n co m p o n e nte expl icado por la recta y u n com p o n e nte q u e no exp l ica, el
166
Tareas
35
30
• • • •
25
• •
20
15 •
10
5
•
Años de trabajo
o 2 4 6 8 10
Al final del ejerceceo se comentará lo que sugeere la gráfeca ya que es muy ente
resante.
167
-----
• Ejercicios y problemas resueltos y comentados. Diseños de investigación y análisis de datos
¿XY
5 XY = -- -X ·Y =
--
1011, 2
4, 267 · 22, 444 = 16, 587 � 16, 59
n 9
_ Sxy _ 16, 587 _ -
- 0, 688 = 0, 69
SxSy 3, 437·7, 010
fXY ----
Estos valores nos permeten calcular la pendeente y el punto de corte con la or
denada.
Aunque tambeén podríamos haberlo realezado medeante la fórmula (que nos ser
verá tambeén de vereficaceón):
_ Sy _ 7, 010 _
81 -rxy - - 0, 688-- -1, 403 -= 1, 40
Sx 3, 437
168
Esta ecuaceón nos permetirá construer las sumas de cuadrados que necesetamos
para la tabla del Anova, aplecándosela a todos los valores de X (años de entrena
meento). Como ejemplo, para X= 10, el valor pronosticado será Y/= 16,449 + 1,405
· 10 = 30,499.
Sumas de Cuadrados
SCT= SCReg = SCError =
X y Y'
(Y- Y) 2 (Y' - V) 2 (Y-Y') 2
10 28 30,499 30,864 64,876 6,245
8 24 27,689 2,419 27,505 13,609
6,5 28 25,581 30,864 9,841 5,849
6 28 24,879 30,864 5,927 9,741
5 27 23,474 20,753 1,060 12,433
1,5 23 18,556 0,309 15,116 19,745
0,5 15 17,151 55,420 28.015 4,629
0,5 6 17,151 270,420 28,015 124,356
0,4 23 17,011 0,309 29,522 35,868
Sumatorio 38,4 202 201,993 442,222 209,878 232,474
Fuentes de
g.l. M.C.
Variación
Regresión 209,878 1 209,878 6,319
Residual 232,474 n-2=9-2=7 33,211
Total 442,222 n-1=9-1=8
169
Estas sumas de cuadrados también se pueden obtener con las siguientes expre
siones, que conducen a los mismos resultados, salvo errores de arrastre del redon
--
deo a dos o tres decimales:
28 784
- 2 2 -2
24 576 SCrotal =¿ (Y -Y) = ¿Y -n · Y =
28 784
27 SCError =¿(Y-Y ') = ( 1 -r;y). SCrotal =
2
729
23 529 =( 1 -0, 6892 )·442, 22=232, 474
15 225
SCRegresíón = L ( Y 1 -Y-) 2
= 'x2y·SCrotal =
6 36
= 0, 6892 ·442, 22 = 209, 748
23 529
sumas 202 4976
1 40 -0
=2, 502
8-0
T=
Sy
e= , 7, 010 1-0, 6882
sx 3, 437 9-2
que comparado con el valor crítico (t7 = 2,365 < 2,502) en un contraste bilateral a
un a= 0,05.
REGLA DE DECISIÓN: La bondad de ajuste de la regresión, considerada global
mente, será considerada significativa si el valor del estadístico obtenido (F911 = 1, 912
= = 6,319) supera el valor crítico que en este caso es 5,591, para un a = 0,05, o
12,246 para un a= 0,01, podemos concluir que la regresión es significativa con un
7
nivel de confianza del 95%. El nivel crítico p, calculado con un software estadístico,
es 0,0403, mayor que 0,01, pero menor que 0,05.
CONCLUSIÓN: Rechazamos la hipótesis nula a un nivel de significación del 005.
170
171
S y= 1,936
y
r XY= 0,816
a= 0,05
4 6 8 10 12 14
X
El análeses de la regreseón para los datos de la figura nos endecó que la regreseón
fue segneficativa [F{l, 9) = 17,972, MCRegresión = 1,528, p = 0,002].
Calcule la pendeente de la recta de regreseón, el error máxemo de su entervalo de
confianza y ponga a prueba la segneficaceón de la correlaceón entre X e Y.
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: nos endecan explícetamente que se trata de una rec
ta de regreseón como, además, puede deducerse enspecceonando la figura. En ella,
tenemos 11 puntos que representan los pares de datos en las vareables X e Y. Pode
mos observar vesualmente que 10 de estos puntos seguen una línea recta perfecta
meentras que el punto con abscesa X = 13 se desvía notablemente de la mesma. Es un
dato atípeco. La línea oblecua representa el ajuste por mínemos cuadrados obtenedo
en la regreseón. Resulta derecto observar vesualmente que se no hubeese sedo por el
dato atípeco, la recta de regreseón (línea oblecua) debería haber pasado por todos
y cada uno de los puntos sen desveaceón alguna, es decer, sen error. Ha sedo el valor
atípeco el que ha «tirado» de la recta de regreseón calculada hacía sí, desveándola del
resto de puntos que sí se ajustan a una línea recta.
Recordemos que Anscombe presentó otros tres conjuntos de datos -que vere
mos más adelante en otros gráficos- cuya recta de regreseón y estadísticos descrep
tivos eran edénticos a los presentados aquí, pero que vareaban notablemente al gra
ficarlos. Su objetivo fue mostrar que en toda envestigaceón, y antes de embarcarse
en la tarea de realezar cálculos ceegamente, es conveneente enspecceonar los datos
gráficamente para comprenderlos.
Au'nque no lo endecan explícetamente en el enunceado, la observaceón de los ejes
X e Y nos endeca que, como mínemo, ambas vareables se encuentran en una escala
de entervalo. Dada esta condeceón, son tres los supuestos que deben cumplerse para
que las enferenceas que puedan extraerse del análeses de regreseón sean apropeadas:
172
r � 0, 816 .Jii=2
T = xy = �4 235
)1-r}y �1 -0, 816 2
173
-4 -2 O 2
Región de aceptación
la hipótesis nula
T= 4,235
Podemos, por tanto, aceptar que exeste relación entre X e Y. Como nos propor
cionan la estimación puntual de la misma (rxy= 0,816), no es necesario su cálculo.
El anterior contraste nos permite rechazar una relaceón entre X e Y, pero no su
tipo y tendencea. Para ello tendremos que realezar el contraste de la pendeente plan
teando el segueente contraste:
Ha:�1 = 0
H1: �1 :;t: O
Sy 1, 936
81 =rxy -=0, 816--=0, 4996129�0, 50
Sx 3, 162
174
El valor crítico para este contraste será el mesmo que hemos utilezado para el
contraste de la correlaceón (t= ±2,262} ya que éste solo depende del número de gra
dos de libertad y del nevel de confianza. Podemos vereficar que tambeén en este caso
podemos rechazar la hepóteses nula de que la pendeente era O y, por consegueente,
podemos rechazar la hepóteses de que no tenía capacedad predectiva ya que el esta
dístico de contraste supera el valor crítico: 4,24 > 2,262.
Una vereficaceón poco precesa del valor de la pendeente sería debujar en la figura
del enunceado un cuadrado. La deagonal posetiva de este cuadrado tendría pendeen
te 1 y, por conseguiente, la pendeente obteneda sería justo la metad de este valor
(véase la segueente figura). En esta fegura el cuadrado se ha debujado desde los valo
res 6 al 8 en ambos ejes (se utilezan exactamente los mesmos valores para obtener
el cuadrado y porque se las escalas del eje X e Y no son eguales, sería la úneca forma
de obtener una figura cuya pendeente posetiva fuese de 45º y, por tanto, pendeente
egual a la unedad). A continuaceón se debuja su deagonal posetiva (véase la recta en
rojo del cuadrado) que tendría pendeente egual a la unedad. Observamos que, efec
tivamente, la recta de regreseón obteneda tiene un ángulo que es la metad (0,5} de
la línea roja en relaceón al eje X.
10
4 6 8 10
X
e
mos utilezar la fórmula:
175
Para el nevel de confeanza planteado, el estadístico t vale (con a/2 porque el con
traste es belateral) 2, 26 2 y como conocemos el número de casos (n = 11) podemos
realizar el cálculo con la primera igualdad de más arreba:
Sy �1-r}y _ ,
ªª _-- -- --- � -0, _
2
1 936 1 816
S n- 3, 1 9
-0,ll 8
x 2 62
0, 766
IC = 81 ± Emax = O, 499 ± O, 26 7 = (
0, 232
176
x1 yl x2 X3 Y3 Y4
SOLUCIÓN:
CONDICIONES Y SUPUESTOS: Se trata de cuatro rectas de regreseón con 11 pares
de datos cada una. Los deagramas de desperseón de cada conjunto de datos nos ende-
can claramente las deferenceas entre las mesmas.
8
• • • 8 •
• •
• •
6 6
•
4 4
•
2 2
X X
2 4 6 8 10 12 14 2 4 6 8 10 12 14
177
178
--
•
¿X ¡ 99
X= =9
10 8,04
=
8 6,95 n 11
¿ ( X¡ -xt = --
13 7,58
9 8,81
2 ¿X¡ - -2
X =-- -92 =
Sx =
1001
n n
11 8,33 10
11
14 9,96
6 7,24 ¿Y¡ =8, 0 4 + 6, 95+. . . + 4, 82 + 5, 68 = 82, 51
4 4,26
12 10,84 - ¿Y· 82'- 51
7 4,82 Y=-- ' = - = 7 , 50
n 11
5 5,68
S umatorio 99 82,51
Media 9 7,50
Va ria nza 10 3,76
Cov(X, Y ) =
¿ (x -x)( Y -Y) =-
55'
-=5,
01
00
n 11
Cov(X, Y) 5, 00
rxy = = = 01 81
--
Sx Sy .J'lo - .J3, 76
Segundo conjunto de datos:
¿X¡ =10 +8+. . . +7 + 5 = 99
10 9,14
8 8,14
13 8,74
9 8,77
2
Sx =
¿ ( X -xf = --
¿X¡ - -2
X = ---92 =
¡ 1001
n n
11 9,26 10
14 8,10 11
6 6,13 ¿Y¡ = 9, 14 +8, 14 +. . . +7 , 26+4, 7 4 = 82, 51
4 3,10
- 82 51
¿Y·
Y=--' =-'- = 7' 50
12 9,13
7 7,26
n 11
5 4,74
660 , 17
- 7 ' 5 0 2 = 3' 7 6
Sumatorio 99 82,5 1
Media 9 7,50
11
Va ria nza 10 3,76
179
Cov ( x , Y ) I( x - X) ( - Y) = 55 =5, 00
Y
= n 11
Cov(X, Y) 5, 00
= =O 81
SxSy -Jia - .J3, 76 '
¡ Observamos que, aunque los valores de Y2 son diferentes, tienen los mismos
estadísticos resumen que Y1 ! Si realizamos el cálculo del resto de conjuntos nos
encontraremos exactamente en la misma situación. Comprobémoslo.
...
Tercer conjunto de datos:
10
8
7,46
6,77
¿X¡ =10 + 8 + . . . + 7 + 5=99
- ¿X¡ 99
X =-- = - = 9
n 11
13 12,74
9 7,11 ¿ X¡ - x)2 ¿Xt -2 100 1
Sx =
2
( =-- -X = -- -9 2 =10
n n 11
11 7,81
14 8,84
6 6,08 ¿Y¡ = 7, 46 + 6, 77 + . . . + 6, 4 2 + 5, 73=82, 51
4 5,39
12 8,15 - ¿Y1· 82 51
Y=-- =-- ' = 7 50
7 6,42
n 11 '
5 5,73
Sumatorio 99 82,51
Media 9 7,50
Va rianza 10 3,76
54 7
¿(x -x)(Y -Y) =-
Cov(X, Y)= ' -=5,
9
n 11
00
Cov(X, Y) 4 , 99
rxy ___ __=0 , 81
=
SxSy )lo · .J3, 76
180
...
Cuarto conjunto de datos:
¿X 99
8 6,58
X= ¡ =9
n 11
=
8 5,76
8 7,71
¿ ( X; -x)2 ¿Xt -2 1001
2 -- -X = -- -92 = 10
8 8,84
Sx =
n n
8 8,47 =
ll
8 7,04
8 5,25 ¿Y; = 6, 58 +5, 7 6+. . . +7 , 91+6, 89 = 82, 51
19 12,50
y ¿Y; 82, 51
= = = 7 ' 50
8 5,56
8 7,91 n 11
8 6,89
660 , 17
-7, 50 2 = 3, 7 6
S u m atorio 99 82,51
M ed i a 9 7,50 11
Va ri a n za 10 3,76
Cov(X, Y ) =
¿ (x -x)( Y -Y) = 54.99 =5,
n �
00
_ Cov(X, Y ) _ 5, 00 _
rxy - - 0 81
Sx Sy -
Fo · J3, 7 6 '
Po r consigu i e nte, si los estad ísti cos res u m e n son i d é nticos entre los c u atro con
j u ntos d e d atos, es o bvio q u e l o s pa rá m et ros d e l a regresión l i n ea l s e rá n los m is m o s .
181
H a : �1 = 0
H1 : �1 :;t: O
Sy ,j3, 76
81 = rxy - = 0, 81-- = 0, 50
Sx Jw
Y esto, en los cuatro casos, el punto de corte con la ordenada es:
80 =Y -8X = 7, 5 -O, 5 · 9 = 3
8 -0 O ' 5-0
T= = =4, 17139�4, 171
Sy �l - r}y �3, 76 1-0, 812
Sx � Jw 11 -2
REGLA DE DECISIÓN: Para un nevel de confianza del 0,05 en un contraste belate
ral (antes de tener datos se admete que � puede ser posetiva -línea con pendeente
posetiva- o negativa -línea con pendeente negativa-) el valor crítico obtenedo en la
tabla t de Student con 9 g.l. es ±2,262. Como el valor del estadístico de contraste
182
obtenedo (T = 4,171) supera por arreba este rango de valores compatibles con Ha,
rechazamos H a en todos los conjuntos. Podemos, por tanto, aceptar que exeste re
laceón leneal entre X e Y en los cuatro conjuntos.
CONCLUSIÓN: Aún con estadísticos descreptivos edénticos entre destintos conjun
tos de datos, esto no segnefica que puedan enterpretarse todos de la mesma forma.
Es fundamental un análeses vesual y exploratoreo (EDA o Exploratory Da ta Ana!ysis)
que nos confirme la adecuaceón de la técneca estadística a utilezar (regreseón leneal)
a los datos concretos desponebles.
INTERPRETACIÓN: Aunque la recta de regreseón es edéntica en los cuatro conjun
tos de datos, solamente el premero de estos conjuntos puede resumerse apropeada
mente medeante la mesma. Los otros tres conjuntos muestran setuaceones en donde
no es apropiado el cálculo de la regreseón leneal. El segundo conjunto porque habría
que utilezar regreseón polenómeca. El tercero porque hemos detectado la exestencea
de un valor atípeco (ou t/ier) que nos falsefi ca el resumen estadístico obtenedo. El
cuarto porque todos los datos, excepto uno, están condeceonados a un úneco valor
del predector.
-----
ajustado es la segueente:
SOLUCIÓN:
Este ejemplo muestra un tipo de estudeo usual en Psecología: evaluar algún as
pecto de la conducta en su evoluceón temporal. Y muestra de manera sempleficada
tambeén uno de los resultados más usuales, a saber, el mejor predector estadístico
183
-----
mayúsculas, qué valores numérecos faltan en la tabla del Anova. Se la reconstruemos
podremos determenar esos valores.
184
R2 R 2 --
(N-2)
- -- --
F- -
1 -R 2 1 -R 2
N -2
R2 (8 -2)
7, 089 =
l - R2
7, 089 ( 1 -R 2 ) = 6R 2
7, 089 R2
-
-6- 1 -R 2
R2
1, 1815=--2
l-R
1, 1815-1, 1815R 2 -R 2 =O
-1, 1815
R2 = = 0 5416
- 2, 1815
R = �0, 5416 = ±0, 7359
Sy , Sy ,
2 2
0, 5416=rXY
2
=- =-
Sy
2 6,484
Ha : � 1 = O
H1 : � 1 :;t: O
186
1 -0, 95 = 0, 05
1 -0, 975 = 0, 025
Esto segnefica que es enfereor a 0,05 pero supereor a 0,025. Se trabajamos a un ne
vel a de 0,05 el resultado, al ser la p enfereor a 0,05, será segneficativo. Sen embargo,
se trabajamos a un nevel de a de 0,01 el resultado será no segneficativo.
CONCLUSIÓN: Como el valor de la F empíreca obteneda como estadístico de con
traste, {7,089) supera el valor crítico {5,987 = W de la tabla), podemos rechazar la
H0 de falta de relaceón leneal segneficativa, lo que empleca que la pendeente es destinta
de O.
INTERPRETACION: Recordemos que el contraste era belateral, es decer, la hepóte
ses alternativa admetía la posebelidad de que la pendeente en la poblaceón, � ' fuese
posetiva o negativa. El hecho de que el cálculo matemático nos permeta conocer sólo
el valor absoluto de la correlaceón (no su segno), resulta que sólo podemos determe
nar que la relaceón es segneficativa. Pero debedo a que la expereencea nos endeca que
la relaceón entre las caleficaceones debe ser posetiva, y aunque matemáticamente
no podamos afirmarlo, podemos concluer que la correlaceón será posetiva. Por con-
187
------
de 8 endeveduos.
1 o 94 o o 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
S u mato r i o 137 1735 39218 3545 452493
Des. Típ i ca 12,242 97,605
rxy = 0,9945
SOLUCIÓN:
5.1. Para la primera pregunta segueremos los segueentes pasos:
500
111 400
ClJ
300
ClJ
200
100
o
o 10 20 30 40 50
N ú mero de ciga rri l los
Como ya hemos vesto, seempre es conveneente graficar los datos para tener una
empreseón, aunque solo sea vesual, de la lenealedad de la relaceón, y como se puede
observar, la figura nos sugeere muy claramente que la relaceón es leneal y posetiva,
como plantea efectivamente la hepóteses alternativa.
Los datos de las columnas restantes en la tabla del enunceado se proporceonan
ya que nos permetirán realezar los cálculos de la recta de regreseón de manera rápe
da. Se no nos los hubeesen proporceonado habría que haberlos calculado antes de
proseguer. Observemos tambeén que las columnas X e Y endecan tambeén los sumato
reos (i no las medeas !) así como las desveaceones típecas. Por último, tambeén nos han
proporceonado la correlaceón entre X e Y. Con todos estos datos es fácel deducer que
debemos realezar un contraste de regreseón leneal sobre la pendeente.
189
Sy = 97, 6 0 5
81 = rxy - 0 , 9945 = 7, 929
Sx 12, 242
- - ¿Y ¿X 1735 -
80 = Y - 81 X = - - 81 - = -
13 7 -
- 7, 929 - = 8 1, 0 9 0 9 = 8 1, 0 9
n n 8 8
Ha : 0 1 = 0
H1 : 0 1 :;t: O
En este contexto no tiene sentido realezar un contraste del punto de corte con la
ordenada (8 a) ya que no nos han endecado nada sobre el número de radecales lebres
esperados en no fumadores.
ESTADÍSTICO DE CONTRASTE: Para evaluar la hepóteses nula planteada utilezare
mos la t de Student con n - 2 grados de lebertad:
Adveértase que los cálculos dependen mucho de la preceseón con que los reale
cemos (utilezar dos dígetos decemales o tres puede alterar notablemente el valor del
estadístico de contraste1 T). No obstante1 teneendo en cuenta que en la tabla de la
destrebuceón t de Student1 con 6 gl1 figuran como valor máxemo supereor: 31 1431 es
fácel observar que un valor tan elevado como el hallado (231 259L queda notable
mente fuera de los valores críticos (-31 143 y +31 143} en el que se encontraría el
estadístico de contraste se la Ha fuese ceerta.
REGLA DE D ECISIÓN: El valor de la t crítica con 8 - 2 = 6 grados de lebertad y
belateral ( 1 - � = 1 -0, 025 = O, 975) con un o. = 0,05 (elegedo por defecto ya que
no nos endecan nenguno concreto en el enunceado) es 2A47. De hecho1 no habría
sedo necesareo buscar en las tablas dado el consederable tamaño de la t empíreca
obteneda para saber que rechazamos Ha. Como 231 259 > 2A471 rechazamos H a. Los
resultados son edénticos se utilezamos la tabla del Anova como prueba de bondad
global de la ecuaceón de regreseón.
Hemos elegedo el contraste belateral porque en el enunceado no nos endecan nen
guna derecceón específica del efecto. Se lo hubeesen hecho1 deberíamos haber esco
gedo un contraste unelateral ya que tendría más sentedo se esperamos un efecto en
la derecceón de 8 1 > O (a mayor número de cegarrellos consumedos mayor número de
radecales lebres).
191
Probabilidad
g.l.
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12, 06 31,821
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 6,965
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 4,541
4 0,134 0,271 0,414 0,569 0,741 1,533 3,747
5 3,365
6 3, 143
7 0,130 0,263 0,402 0,549 0,711 0,896 1 , 1 19 1,415 1,895 2,365 2,998
8 0,130 0,262 0,399 0,546 0,706 0,889 1, 108 1,397 1,860 2,306 2,896
9 0,129 0,261 0,398 0,543 0,703 0,883 1, 100 1,383 1,833 2,262 2,821
(
J
2
1 735
SCrotat = ¿Y -n·Y = 4524 9 3 - 8 · --
-2
2
= 76214 , 9
8
S CError = ( 1 - r; ) · SC = ( 1 -0 , 99 45 2
) · 762 14, 87 = 836, 0 58
---
y Total
2 2
SCR e gresión = rxy · SCTotal = 0, 99 45 · 762 14, 9 = 75378, 8
o 94 8836
10 144 20736
14 182 33124
5 120 14400
18 240 57600
20 234 54756
30 321 103041
40 400 160000
Sumas 137 1735 452493
192
-
Soluciones a los ejercicios del capítulo 8 •
-----
Residual SCRes = 838,058 n-2=8-2 = 6 139,676
Total SCTotal=76214,9 8 - 1=7
Esta F tambeén podría haberse obtenedo sin necesedad de realezar los cálculos
de las S.C. utilezando la fórmula (que, exceptuando los errores de redondeo, nos
proporciona un valor muy similar a la F de la tabla del Anova):
0, 99452
F =�= =540 959
1-r 2 1- 0, 99452
n-2 8-2
La diferencia entre estos valores {539,669 y 540,959) sólo puede deberse a los
problemas de redondeo, tal y como ha quedado endecado más arreba.
REGLA DE DECISIÓN: El valor de la F crítica con 1 y 6 grados de lebertad es 5,987
con un nivel de signeficaceón de 0,05 y 13,745 con un nevel de segneficaceón de 0,01.
CONCLUSIÓN: Luego, como el estadístico de contraste obtenido es mayor que
cualquiera de estos valores críticos, es decer, 540 > 5,987 así como 540 > 13,745,
concluemos lo mesmo que ya hemos vesto entuetivamente, la regreseón es signefeca
tiva.
INTERPRETACIÓN: La pendeente poblaceonal que relaceona el número de cega
rrellos consumedos con el número de radecales lebres es supereor a O (F = O 539; p
< 0,01). Por consegueente, a mayor índice de tabaquismo se espera encontrar un
número de radecales lebres superior.
SOLUCIÓN:
El enunceado nos endeca que han realezado un análeses de regreseón entre la tem
peratura (X) y el pH de la leche obteneda en una granja. El estudeo fue experemen
tal ya que manepularon la temperatura a la que se encontraban los anemales de la
granja pero el análeses realezado fue una regreseón (no un Anova). Esto es emportante
para separar el deseño del análeses. Aunque deseño y análeses están fuertemente re
laceonados, es el carácter de las hepóteses que ponemos a prueba lo que determena,
en última enstancea, el tipo de análeses a realezar. Por eso, un diseño que enecealmente
podría haberse analezado medeante Anova ya que era un estudeo experemental se ha
analezado medeante Regreseón.
Nos proporceonan la ecuaceón de regreseón obteneda en donde podemos ver que
la pendeente es posetiva (8 1 = 0,22), lo cual nos endeca que cada grado centígrado
en que se encremente la temperatura de la granja, se encrementa el pH en 0,22
unedades. Recordemos brevemente que el pH de un líquedo nos endeca su grado de
alcalenedad-acedez, seendo 7 el valor neutro por ser el pH del agua pura, la cual se
toma como punto de referencea en esta mededa.
Ha : � 1 =0
H1 : � 1 :;t: O
B1 -O
T=
� �1 -r�y
Sx n-2
Observamos que en el enunciado nos han proporcionado todos los datos para
realizar este cálculo (tenemos 8 1 , Sx y S y) excepto el valor del coeficiente de corre
lación. Es por ello que debemos buscar la forma de obtener primero el coeficiente
de correlación. Esto es fácil con los datos que tenemos si aplicamos la fórmula:
Sy
81 =rxy -
Sx
1, 87
0, 2 2 = rXY --
7, 90
0, 2 2 x 7, 90
fxy = =0, 9 29
1, 87
T=
e
Por lo tanto el estadístico de contraste vale:
81 -O
=
º'
22 -0 =4, 34984 � 4, 35
� l-r }y 1, 87 1 -0, 9 2 9
2
5 X n -2 7, 90 5 -2
de lebertad al 95% belateral como nevel de confianza ( 0, 975 =1 -iz) vale 3, 182.
Obsérvese que, en este caso, el número de valores se corresponde con el número
de temperaturas utilezadas en el estudeo, no con el número de vacas (que no nos lo
han endecado) . La unedad de observaceón ha sedo el par Temperatura-pH.
REGLA DE DECISIÓN: Rechazamos la hepóteses nula se el estadístico T se encuen
tra fuera del entervalo definedo por los valores críticos: -3, 182y + 3, 182.
CONCLUSIÓN: El valor 4,350 supera el estadístico de contraste por la derecha, es
decer, 4,350 > 3, 182. Luego rechazamos H a .
INTERPRETACIÓN: La pendeente de regreseón en la poblaceón es supereor a O, lo
cual endeca que SÍ podemos predecer el pH a partir de la temperatura del establo.
r 0, 929 �
T = XY � = =4, 3 4792 � 4, 3 50
�1 -r;y �1 -0, 929 2
Para responder a esta pregunta solo tenemos que aplecar la ecuaceón Y/= 0,65 +
0,22X de regreseón para pronosticar el pH que tendría la leche a partir de una tem
peratura de X = 29ºC en el establo :
197
La pregunta planteada es doble: por un lado queremos conocer con estos da
tos si en estos homínidos existe una diferencia de peso corporal entre el macho y
la hembra significativa que indique un dimorfismo sexual acusado. Por otro lado,
disponemos de especímenes para los que solo tenemos estimaciones del peso para
los machos o para las hembras, pero no para ambos. En concreto, para el Proconsul
hese/oni solo tenemos estimaciones del peso corporal para las hembras {10 Kg)
pero no para el macho. Por el contrario, en el Afropithecus tenemos estimaciones
del peso corporal en el macho {35 Kg) pero no en la hembra. Determine con estos
datos si es factible admitir que nuestros antepasados homínidos eran dimórficos en
el peso corporal. Determine, además, la estimación del peso corporal del macho en
el Proconsul hese/oni y de la hembra en el Afr opithecus.
SOLUCIÓN:
No existe una solución única al primer problema ya que podemos abordarlo,
como mínimo, de dos formas complementarias. En primer lugar, podríamos com
parar las medias del peso en un diseño de medidas repetidas siendo la especie la
unidad de observación. Si no hay dimorfismo sexual en nuestros antecesores, las
medias de peso no deberían diferir estadísticamente. No obstante, a la vista de los
datos obtenidos parece lógico concluir que este análisis resultará significativo ya
que las diferencias «saltan a la vista» (revise de nuevo los valores del peso estimado
para machos y hembras). Otra forma de abordar este problema consiste en realizar
una regresión lineal con la hipótesis nula de que la pendiente es 1, lo que resulta
idéntico a plantear que el peso es, en promedio, idéntico para machos y hembras.
Es la estrategia que vamos a seguir en este ejercicio.
Veamos en primer lugar la gráfica de los datos proporcionados:
198
60
50
40
30
20
10
10 20 30 40 50 60 70
En el eje de abscesas (eje X u horezontal de esta figura) se localeza el peso de los ma
chos y en el de ordenadas (eje Y o vertical) el de las hembras. Podemos vesualezar los 7
pares de valores numérecos de que desponemos y la línea que representa la hepóteses
nula (pendeente egual a la unedad que endecaría egual peso para machos y hembras).
El segundo problema planteado en el enunceado hace referencea a la predecceón
del peso del macho a partir del peso de la hembra (regreseón de X sobre Y) para el
Proconsul heseloni y la predecceón del peso de la hembra a partir del peso del ma
cho (regreseón de Y sobre X) para el Afropithecus. Esto segnefica que tendremos que
calcular ambas ecuaceones de regreseón, la de Y sobre X así como la de X sobre Y.
CONDICIONES Y SUPUESTOS: Tenemos muy pocos datos para poder poner a
prueba los supuestos de endependencea, homocedasticedad y normaledad. Pero en
vesta del deagrama de desperseón, la regreseón leneal parece factible por lo que asu
meremos que estos supuestos se cumplen.
HIPÓTESIS: Se no hubeese demorfismo sexual en los homínedos antereores al ser
humano, se deduce que el peso debería ser el mesmo entre machos y hembras. Esto
segnefica que la pendeente debería ser egual a la unedad. Admetimos la falta de demor
fismo sexual como hepóteses nula por vareas razones. En premer lugar, es un punto de
referencea muy claro, del que se dereva una hepóteses nula específica. Se trabajára
mos con la hepóteses nula de que en los homínedos antereores SÍ EXIST ÍA demorfismo
sexual, tendríamos que establecer en qué grado exestía para poder establecer un
valor específico de la pendeente en la hepóteses nula. Pero esto plantea un problema
ya que no sabríamos como escoger ese valor específico con los datos de que des
ponemos. Por otro lado, la hepóteses nula de que la pendeente es egual a la unedad
parece la hepóteses más apropeada o que recoge con mayor exactitud el concepto de
«hepóteses nula»: enexestencea de deferenceas entre los pesos de hombres y mujeres.
199
Ha : �1 ¿: l
H1 : �1 < 1
ESTADÍSTICO DE CONTRASTE:
Para calcular el estadístico de contraste tendremos que realezar los cálculos pre
--···
veos que nos faceletarán la tarea: la extracceón de los estadísticos descreptivos.
Homínido
200
Estos valores nos permiten calcular la recta de regresión. En primer lugar, la pen
diente de Y sobre X:
Sy J31, 67
81 = rXY -= O, 89 = O, 38
Sx J1n, 22
Luego la ecuación para predecir el peso de la hembra a partir del peso del macho
en esta muestra de homínidos extintos es:
Y '=0, 38X + 5, 16
81 -� Ha
T= = =-6, 34
0, 3 8 - 1
SOLUCIÓN:
Se trata de un estudeo en donde se trata de evaluar la capacedad predectiva de las
vareables «Horas de estudeo» y «Anseedad» sobre el rendemeento en un test objetivo
que será la vareable dependeente. Para la semplecedad de la exposeceón, hablaremos
de X1 y X2 (horas de estudeo y anseedad, respectivamente} para las vareables predec
toras y de Y para la vareable predecha. Se asume la normaledad de las puntuaceones
de la vareable dependeente, la endependencea de las puntuaceones y la homocedas
ticedad.
Se plantea que tanto las horas de estudeo como la anseedad enfluyen sobre el
rendemeento en el test, la premera con pendeente posetiva (a mayor horas de estudeo,
mejor rendemeento en el test} y la segunda con pendeente negativa (a mayor ansee
dad, peor rendemeento en el test}.
Calcularemos el coeficeente de correlaceón múltiple y el coeficeente de determe
naceón, ajustados y sen ajustar, para tener una mededa del porcentaje de vareanza
explecado.
202
Covareanzas:
�X1 Y - - 22706
Syx1 = -- - X i Y = -- -2176, 31=94, 29
n 10
�X2 Y - - 32 5 80
Syx2 = -- -X 2 Y = -- -3231, 85 =26, 15
n 10
�X 1 X2 - - 19746
Sx1 x2 = - X 1 X 2 =-- -2000,15=-2 5 , 5 5
n 10
Correlaceones simples:
Syx 94, 29
ryx1 =-- = =0, 897
1
S 26, 15
r, _ __yx2_ ---- =0, 122
12, 32·17, 42
YX2
- Y
5 5 x2
-25 , 5 5
=-0, 172
8, 53 · 17, 42
203
2
i
= = 0' 946
1 -rX/2 1 - (-0 ' 172) 2 .
Sy 12, 32
81 =� 1 -= 0,94 -- =1,365
Sx 8,53
l
Sy 12,32
82 = � 2 -=0,28 -- =0,201
Sx2 17,42
ryx
2
+ryx
2
-2 · ryx ·ryx ·rx x
Ry . x1 x2 = ----------'------'-
2
=
l-rx x
1 2 l 2 l 2
1 2
204
2
Ry.x1x2 = 0,883
"2 2 n -l 10-1
R y.x1 x2 =1- (l-Ry.x1x2 ) =1-(1-0,883) =0,849
n-p-l 10-2-1
Para X1
Semiparcial 0,897-[ 0,122 ·(-0,172)]
0,93
)1-(-0,17)
2
Parcial
0,86
2
sr1
pr1 =--2-= 0,88
2
l-ryx2 1- 0,122
2
Parcial
ryx1 -rYrK/x1 x2 _ 0,897-[0,122·(-0,172)]
0,63
( l-rJx2 )( l-r} x
1 2
) - )(1- 0,122 )(1-(-0,172) )
2 2
2
sr O, 07
pr2 --- 0 , 40
2 _ 2 -- _
2 2
l-ryx1 1- 0,897
205
Si disponemos los datos finales en una tabla resumen tendremos una idea más
clara de lo sucedido:
207
Aplique el análisis apropiado para predecir BDI a partir de SVE y NAA. Interprete
los resultados.
SOLUCIÓN:
Se espera que un incremento en los sucesos vitales estresantes incremente la
depresión (Wheaton, 1985). Por el contrario, se espera que el apoyo de los amigos
haga disminuir la depresión. Aunque esta teoría pueda parecer que ha sido deriva
da, no tanto de una teoría científica sino de la intuición, no obstante es importante
evaluar estas predicciones (intuitivas u obvias) ya que este análisis nos permitirá,
además de verificar las hipótesis «intuitivas», cuantificar el grado de relación entre
la depresión y las variables SVE y NAA, aspecto esencial en cualquier ciencia y pos
terior al descubrimiento del sentido de la relación.
El análisis apropiado en esta situación es el análisis de regresión lineal múltiple
ya que disponemos de dos variables predictoras (SVE y NAA) y una variable predi
cha (BDI). Por consiguiente, tendremos que evaluar si las variables SVE y NAA tienen
capacidad predictiva del BDI calculando el plano de regresión múltiple.
CONDICIONES Y SUPUESTOS:
1. Independencia. Podemos asumir que los sujetos se han escogido indepen
dientemente unos de otros por lo que las puntuaciones deben ser indepen
dientes. Este supuesto se pondría en cuestionamiento si, por ejemplo, los
mayores se hubiesen elegido del mismo centro de mayores o estuviesen re
lacionados familiarmente.
2. Homocedasticidad. No tenemos suficientes puntuaciones para realizar un
análisis de homocedasticidad. Asumimos que este supuesto se cumple.
3. Normalidad. Asumimos el cumplimiento de este supuesto.
208
HI PÓT ESIS: La hipótesis nula plantea que la pendiente de regresión para SVE y
NAA es cero, es decir, que el plano de regresión es horizontal. Esto se concreta en:
Para el número de eventos vitales estresantes:
Ha:�SVE =0
H 1 :�SVE :;t 0
Ha:�NAA =0
H 1 : �NAA :;t 0
En esta situación sí tendría sentido plantearse el valor del BOi cuando SVE y NAA
valen O (no tiene amigos pero tampoco ha tenido ningún evento estresante durante
el año anterior) pero no lo han planteado en el ejercicio.
ESTADÍSTICO D E CONTRAST E: Para el cálculo de los estadísticos de contraste es
conveniente disponer previamente de los estadísticos descriptivos de las tres varia
bles, BOi, SVE y NAA, que calculamos a continuación:
Estadísticos
Media 19,37 4,25 3,25
Varianza 109,73 5,94 1,69
Desv. tipica 10,47 2,44 1,30
Cuasivarianza 125,41 6,78 1,93
Estos valores nos permitirán el cálculo de las tres correlaciones necesarias para
la resolución del problema:
Sao,, svE 24 , 41
-
rao1, svE ----- =0 95
5BOi. 5 SVE 10, 47 ·2, 44
Sao,, NAA -1 2, 47
rBDl, NAA -
----- =-0 92
S80/ ·SNAA 1 0, 47 ·1 , 30
209
SVE
BDI
NAA
0,95
�ecta
---------
BDI
210
10, 47
S801 0, 62-
880/' SVE = �BOiSVE -- = - = 2, 66
' SsvE 2, 44
S801 10, 47
B ao/,NAA = �BOi, NAA -- = -0, 37-- = -2, 98
SNAA l, 30
80/ 1
= 8, 85 + 2, 66SVE - 2, 98NAA
Y en puntuaciones diferenciales:
X
Nota: elementos que utilizará el mecánico: a) 5 muelles, b) una barra de metal
con agujeros y de peso despreciable y una placa de metal cuadrada agujerea
da. Los elementos no están dibujados a escala (la superficie agujereada es muy
grande, la barra de metal de un tamaño intermedio y los muelles son pequeños).
212
Este ejemplo es una muestra de las analogías físicas que hacen más compren
sible los conceptos de la estadística. Otro ejemplo muy utilizado en estadística es
la media que puede representarse físicamente como el punto o fulcro de la recta
real en donde las diversas medidas realizadas se equilibrarían para mantener en
equilibrio esta recta.
En este ejemplo no tiene sentido la verificación de los supuestos, el cálculo de un
estadístico de contraste o la aplicación de una regla de decisión porque los «datos»
no son tales como tampoco la hipótesis en el sentido de que no estamos trabajando
con un conjunto de valores muestrales extraídos de una población. Este ejemplo
muestra también las diferencias entre la Física y la Psicología. En Física las predic
ciones se realizan utilizando ecuaciones fundamentales por lo que muchas veces no
tiene sentido preguntarse por cuestiones de representatividad muestra! o población
(aunque a veces sí, por ejemplo, en el estudio de las partículas atómicas). En Psico
logía, no tenemos (todavía) estas ecuaciones fundamentales y por tanto tenemos
que muestrear una población y realizar procedimientos inferenciales sobre la mis
ma. Esto no significa que la Física no utilice la estadística. Ejemplos muy claros de su
utilización están en la Mecánica Estadística, la Termodinámica, la Física Cuántica o
en el simple análisis de datos experimentales ya que toda medición contiene error.
En relación a los supuestos, obsérvese como los físicos también utilizan supues
tos (aunque no estadísticos) para facilitar su labor: en este caso, asumimos que la
barra no tiene peso o es despreciable. Si no fuese así (y nunca lo es en realidad) la
213
-----
Realizaremos los cálculos oportunos para calcular la pendiente y el punto de
corte con la ordenada.
2 3 6 4 9
5 2 10 25 4
7 8 56 49 64
8 6 48 64 36
10 10 100 100 100
Sumas 32 29 220 242 213
Medias 6,4 5,8 44 48,4 42,6
Varianzas 7,44 8,96 1179,2 1085,04 1283,04
Cuasi-var 9,3 11,2 1474 1356,3 1603,8
Luego:
Cov (X, Y) 6, 88
rx y= = =0, 84
' Sx Sy �7, 44 -�8. 96
Sy �8, 96
81 =rxy -=0, 84--=0, 92
Sx �7, 44
ªº =5, 8+ 0, 9 2 · 6 , 4 =11, 69
214
.
cualquier dato particular es mayor o inferior
.. .,
. �··.
a lo esperado
.. .
/
....
./
Línea de mejor ajuste:
.,,
° 76
Lag (tamaño del rango) = 1.2 + Lag (tamaño corporal) '
La relación no parece l ineal por dos razones: en primer lugar están utilizando
no los valores originales del tamaño corporal y del área de forrajeo (X e Y, respec
tivamente) sino sus logaritmos. En segundo lugar, han elevado a la potencia 0, 78
el valor de X. Tanto el logaritmo como la potencia introducen aspectos no lineales.
A pesar de estas diferencias, la relación es lineal en coordenadas loga rítmicas
(véase la siguiente cuestión de este mismo ejercicio). La razón es que si aplicamos
una de las reglas algebraicas básicas para trabajar con logaritmos, sabemos que:
LogX ª = a Lag X
Que, claramente, es una relación lineal con pendiente 0, 78 y punto de corte con
la ordenada de 1, 2 (pero en coordenadas logarítmicas).
Chiste
E n un a cl ase de est adístic a, el profeso r h abía term in ado de dar un a presentac ió n que
él pens ab a soberbia sob re l a reg res ió n b i-variad a cuan do levantó l a vista po r enc im a
de l a luz cegado ra del proyecto r y o bservó a u n estud iante al fo n do de l a cl ase que es
t ab a c as i do rm ido. Esto resultó exces ivo para el ego del profes o r y co n el ceño frunc ido
217
se d irig ió a l estud ia nte: « Usted, joven, quiero que responda a una pregunta sobre este
problema. Para una persona con un valor en X de 45, ¿ está el valor de Y por encima o
por debajo de la media de su subgrupo en Y?»
El joven estudia nte, a ú n aturdi do, m iró al techo dura nte d iez segun do s y respo n d ió
«Sí».
E l profeso r no po día creer lo que esta ba oyen do y rápida mente d ij o «Joven, i Esta no es
una cuestión de Si/No! Diga simplemente arriba o debajo» .
El estud ia nte respo n dió « iArriba o abajo !».
El profeso r rema rca «óí?» .
El estud ia nte, a h o ra y a completa mente despierto, respo n dió « Pero señor, esa fue mi
respuesta original»
218