Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pruebas de Hipótesis
Pruebas de Hipótesis
PRUEBA DE HIPTESIS
H o; = 50 cm/s
H 1; 50 cm/s
H o; = 50 cm/s
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin
o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor
del parmetro de la poblacin especificado en la hiptesis nula se determina en una de
tres maneras diferentes:
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe
el nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis
dependen del empleo de la informacin contenida en la muestra aleatoria de la
poblacin de inters. Si esta informacin es consistente con la hiptesis, se concluye
que sta es verdadera; sin embargo si esta informacin es inconsistente con la
hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la verdad o
falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a
menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en
muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de
prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin
equivocada.
H o; = 50 cm/s
H 1; 50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que
se observa cual es la rapidez de combustin promedio muestral. La media muestral es
un estimador de la media verdadera de la poblacin. Un valor de la media muestral
que este prximo al valor hipottico = 50 cm/s es una evidencia de que el
verdadero valor de la media es realmente 50 cm/s; esto es, tal evidencia apoya la
hiptesis nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s
constituye una evidencia que apoya la hiptesis alternativa H1. Por tanto, en este caso,
la media muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si <48.5
>51.5, entonces se acepta la hiptesis alternativa H1; 50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la regin
crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5
51.5 forman la regin de aceptacin. Las fronteras entre las regiones crtica y de
aceptacin reciben el nombre de valores crticos. La costumbre es establecer
conclusiones con respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de
H1 si el estadstico de prueba cae en la regin crtica, de lo contrario, no se rechaza Ho.
11.3 Error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es
verdadera. Tambin es conocido como nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del
5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de
significancia sera del 10%.
11.4 Error tipo II error se define como la aceptacin de la hiptesis nula cuando
sta es falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones
diferentes que determinan si la decisin final es correcta o errnea.
1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parmetros
de los estadsticos. As mismo se debe determinar en este punto informacin
implcita como el tipo de muestreo y si la poblacin es finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del
problema. El ensayo de hiptesis est en funcin de parmetros ya que se
quiere evaluar el universo de donde proviene la muestra. En este punto se
determina el tipo de ensayo (unilateral o bilateral).
4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor
crtico, el cual se obtiene dependiendo del valor de (Error tipo I o nivel de
significancia) o en funcin del estadstico lmite de la distribucin muestral. Cada
una de las hiptesis deber ser argumentada correctamente para tomar la
decisin, la cual estar en funcin de la hiptesis nula o Ho.
5. Calcular el estadstico real, y situarlo para tomar la decisin.
6. Justificar la toma de decisin y concluir.
11.6 DECISIN ESTADSTICA
Suponiendo que H0 es cierta, podramos basarnos en la distribucin muestral del
estadstico de contraste para saber cul es el valor esperado para esa
distribucin. En la medida en que el valor observado para una muestra aleatoria
se aproxime al valor que cabra esperar si H0 es cierta, habremos obtenido un
resultado compatible con H0. Si, por el contrario, encontramos para una muestra
aleatoria un valor del estadstico de contraste que se aleja del valor que cabra
esperar, habremos obtenido un resultado muy raro, poco probable bajo el
supuesto de que H0 sea cierta, y podramos dudar de la veracidad de sta.
Por tanto, en caso de que el valor generado por la muestra sea compatible con
H0, mantendremos la hiptesis nula como cierta. En caso contrario,
rechazaremos la hiptesis nula y aceptaremos la hiptesis alternativa. Es decir,
la decisin estadstica consiste en mantener o rechazar la hiptesis nula, en
funcin de los resultados obtenidos al calcular el valor de un estadstico de
contraste para una muestra aleatoria extrada de la poblacin.
Los valores del estadstico de contraste que se alejan mucho del valor
esperado bajo Ho constituyen la denominada regin de rechazo (o zona crtica).
En cambio, los valores que: no se alejan tanto de ese valor constituyen la regin
de aceptacin. Los valores del estadstico de contraste que delimitan la regin de
rechazo se denominan valores crticos.
La regin de rechazo puede presentar dos formas: cuando consideramos los
valores que se alejan de H0 por ser muy grandes y los valores que se alejan
por ser muy pequeos, estamos ante un contraste bilateral, puesto que la
regin de rechazo se encuentra a ambos extremos de los valores esperados
bajo H0; cuando consideramos que para rechazar la hiptesis nula nicamente
nos sirven los valores que se alejan de H0 en un sentido, estaremos ante
un contraste unilateral. Si en un contraste unilateral, la regin de rechazo est
constituida por los valores que se distancian de H0 por ser muy grandes,
hablaremos de un contraste unilateral derecho. Del mismo modo, cuando la
regin de rechazo corresponda a los valores que se distancian de H0 por ser
muy pequeos, hablaremos de contraste unilateral izquierdo.
Puesto que conocemos la distribucin muestral del estadstico de
contraste, podemos hablar de las regiones de aceptacin y de rechazo en
trminos de probabilidad. A la probabilidad de que una muestra aleatoria
genere un valor para el estadstico de contraste que se encuentre dentro de la
regin de rechazo la llamamos nivel de significacin y suele nombrarse
mediante la letra . A la probabilidad de que la muestra genere un valor de
estadstico que se site fuera de la regin de rechazo se le denomina nivel de
confianza, y se representa mediante 1 - . Las probabilidades pueden
representarse mediante reas bajo la curva de la distribucin muestral del
estadstico de contraste. En el contraste unilateral, el rea se situar en la
parte derecha de la curva (ver figura 1) o en la parte izquierda, segn el caso.
Cuando el contraste es bilateral, el rea se reparte en dos reas iguales, de
una extensin correspondiente a /2, situadas en cada extremo de la curva
(ver figura 2).
Para tomar la decisin de rechazar o no la hiptesis nula es necesario
fijar un criterio, es decir, delimitar claramente cul va a ser el tamao de la
regin de rechazo. En general, en Ciencias Sociales se toman, de forma
convencional, los niveles de significacin de = 0.05 = 0.01. Es decir, se
fijan regiones de rechazo constituidas respectivamente por el 5% el 1% de
los valores ms alejados de H0.
Volviendo al ejemplo que hemos venido desarrollando, si establecemos un nivel
de significacin = 0.05, podemos delimitar la regin de rechazo y la regin de
aceptacin en la distribucin muestral de Z. Sabemos que Z se distribuye segn
N(0,1), por lo que su valor esperado es Z = 0. Si encontramos valores de Z que
se alejan de 0, cabe pensar que tal vez el valor esperado para no sea 1 -
2 = 0, tal y como habamos supuesto al considerar Z como estadstico de
contraste, es decir, cabe dudar de que la hiptesis nula sea cierta. Los valores
ms incompatibles con la veracidad de H0 sern los que se alejan del 0 por la
derecha y los que se alejan de 0 por la izquierda. Es decir, estaremos
Siempre que se cumplan ciertos supuestos, podemos conocer la distribucin muestral del
estadstico de contraste. A partir de la distribucin muestral que presenta el estadstico de
contraste cuando consideramos a la hiptesis nula cierta, podremos tomar decisiones acerca de
la misma.
Como acabamos de afirmar, para conocer la distribucin muestral del estadstico de contraste es
necesario contar con ciertos supuestos. Habitualmente, estos supuestos se refieren a dos
aspectos:
a) Caractersticas de los datos. Se trata de condiciones que deben cumplir los datos, tales como,
por ejemplo, presentar un determinado nivel de medida o cumplir el supuesto de independencia,
al que nos referamos en el captulo 9.
Por tanto, el valor tipificado de la diferencia , que resulta de restarle la media y dividir por la
desviacin tpica
Del mismo modo, podemos atribuir una probabilidad al valor observado para el estadstico de
contraste. Esta sera la probabilidad de que el estadstico de contraste asuma el valor observado
o un valor ms extremo que ste. A esta probabilidad se le denomina grado de significacin y
viene expresada por la letra minscula p.
Por todo lo dicho anteriormente, la decisin estadstica tambin puede tomarse a partir de la
comparacin entre las probabilidades p (grado de significacin) y a (nivel de significacin). A cada
valor del estadstico de contraste se asocia una probabilidad p, a partir de la cual podremos
decidir sobre la hiptesis nula de acuerdo con el siguiente criterio:
Generalmente, los programas estadsticos ofrecen el grado de significacin, a partir del cual
podemos decidir si con un nivel de significacin previamente fijado es posible rechazar o no la
hiptesis nula.
[D]
Es decir, la probabilidad asociada al valor observado Z = 1.973 es p = O.O48. Por tanto, bastar
comparar este grado de significacin con =0.05 para tomar la decisin. As, como 0.048 < 0.050,
podremos rechazar la hiptesis nula y llegamos, por tanto, a la misma decisin que cuando nos
basbamos en la comparacin del valor observado Z = 1.973 con el valor crtico Zc =1.96.
11.9 ERRORES
Si rechazamos una hiptesis nula por considerar que un valor tan extremo como el valor
observado en el estadstico de contraste es poco probable (P<), existe una posibilidad, aunque
pequea, de estar cometiendo un error Si como ocurra en nuestro ejemplo, la probabilidad
asociada al estadstico de contraste es p = 0.048, ello significa que los datos recogidos son poco
compatibles con H0. Puesto que es muy improbable que siendo H0 cierta encontremos un valor
tan extremo como ste, nuestra postura es la de sospechar acerca de la veracidad de la hiptesis
nula y, en consecuencia, tomamos la decisin de rechazarla.
Sin embargo, siendo la hiptesis nula cierta, este resultado sera posible en un 4.8% de los casos.
Por ese motivo, cuando tomamos la decisin de rechazar la hiptesis nula estamos cometiendo
un error del 4.8%. A este error se le denomina error tipo I, y consiste en rechazar una hiptesis
nula que en realidad es cierta.
Al llevar a cabo una prueba de decisin estadstica, siempre tratamos de que el error cometido
sea lo ms pequeo posible. De ah, que habitualmente fijemos niveles de significacin de 0.05
0.01. Slo si la probabilidad p asociada al valor observado se encuentra por debajo de estos
niveles, rechazaremos H0. El grado de significacin p es el error cometido al rechazar la hiptesis
nula, y el nivel de significacin representar el mximo error tolerado al rechazar la hiptesis
nula.
Al riesgo de rechazar la hiptesis nula en el caso en que sta no es falsa se le denomina riesgo
La confianza en la decisin de rechazar H0, cuando trabajamos con un riesgo , es 1-.
Si fijamos = 0.05, significa que estamos dispuestos a asumir un error mximo del 5% al
rechazar la hiptesis nula. Y si rechazamos H0 lo estaremos haciendo con una confianza del 95%.
Si el valor de p ascendi a 0.048, cometemos un error del 4.8%, que se encuentra por debajo del
5% de error mximo permitido en el rechazo de H0.
En el caso en que la probabilidad asociada a H 0 resultara alta (mayor que 0.05) hubiramos
mantenido la hiptesis nula, por considerar que sta no parece muy improbable y que los
resultados obtenidos son compatibles con ella.
Si en realidad tal hiptesis es falsa y nosotros la mantenemos, habramos cometido un error tipo
II. El riesgo de cometer tal error se denomina riesgo .
Por tanto, son dos los tipos de errores que podemos cometer al mantener o rechazar, basndonos
en los datos de los que disponemos, una hiptesis nula:
ERROR TIPO II: Consiste en mantener una hiptesis nula que es falsa.
En la tabla 1, recogemos las situaciones en las que se cometen estos tipos de errores.
Rechazamos H0 No rechazamos H0
H0 es verdadera ERROR TIPO I No hay error
(Riesgo )
(Riesgo )
A la probabilidad de rechazar una hiptesis nula cuando efectivamente es falsa, se le
denomina potencia de la prueba. Esta probabilidad es 1-.
- Las variables consideradas son cuantitativas continuas, medidas por lo menos en una escala de
intervalos.
- Las muestras consideradas proceden de poblaciones en las que las variables se distribuyen
segn la ley normal.
- Las muestras consideradas tienen un tamao grande. Consideraremos grande, una muestra de
tamao superior a 30 individuos (n>30).
La significacin de los resultados que obtengamos depender del cumplimiento efectivo de tales
condiciones. Este tipo de pruebas de contraste reciben la denominacin de pruebas paramtricas.
En el caso de otra serie de pruebas no se hacen tantas suposiciones como en las anteriores
acerca de la poblacin, por lo que pueden ser aplicadas sin el cumplimiento rgido de tales
condiciones previas. Este tipo de pruebas se denominan pruebas no paramtricas.
Las pruebas no paramtricas no hacen ningn tipo de suposicin acerca de la forma exacta de la
poblacin en la que fueron extradas las muestras. A lo sumo, se precisa que la distribucin sea
continua, o simtrica, pero no se llega a predeterminar rgidamente la forma de la distribucin,
como ocurre cuando se exige que ste se adapte a la curva normal. Podemos relacionar las
ventajas asociados al uso de las pruebas no paramtricas:
1. Rechazar H0 si F Fn1-1,n2-1
2. Rechazar H0 si F 1-Fn1-1,n2-1
3. Rechazar H0 si F /2Fn1-1,n2-1 F 1- /2Fn1-1,n2-1
Ejemplo 11.2
Pretendemos determinar si dos tems A y B de un cuestionario detectan del mismo
modo las diferencias individuales en una poblacin de alumnos de EGB. Para ello
extraemos dos muestras de 31 y 30 alumnos a las que presentamos los tems A y B
respectivamente. Si las desviaciones tpicas observadas en ambas muestras son
SA = 0.56 y SB = 0.89, podemos afirmar que ambos tems difieren en su capacidad
de detectar las diferencias? ( = 0.05)
La capacidad de detectar las diferencias se traduce en que el tem es capaz de dar
puntuaciones diferentes para alumnos con distintos niveles en la capacidad medida.
Es decir, un tem que detecte diferencias ser el que arroje puntuaciones diferentes
entre s, puntuaciones dispersas. El modo en que medimos la dispersin de un
grupo de puntuaciones es calculando su varianza. Por tanto, para ver si ambos
tems detectan del mismo modo las diferencias individuales lo que haremos ser
comparar si las poblaciones de puntuaciones obtenidas mediante los mismos
poseen distinta varianza. Plantearemos las siguientes hiptesis estadsticas:
H0: 12 = 22
H1: 12 22
Utilizaremos como estadstico de contraste el cociente de varianzas insesgadas F =
S12/S22. En consecuencias, previamente habr que calcular las varianzas
insesgadas alcanzadas en ambas muestras de alumnos. Recurdese que podemos
calcular la varianza insesgada a partir de la varianza sesgada. Bastar para ello,
con dividir por el tamao n-1 y multiplicar por m. Vemoslo en el caso que nos
ocupa:
Contrastes sobre 1 - 2
Distinguiremos entre los casos en que las dos muestras correspondan a
observaciones independientes o dependientes. Consideremos que las
observaciones pertenecientes a dos muestras son dependientes cuando se trata,
por ejemplo, de sujetos apareados o mediciones realizadas sobre un mismo grupo
de sujetos en dos momentos distintos. Si comparamos las puntuaciones obtenidas
por un grupo de sujetos antes de despus de la aplicacin de un determinado
programa de intervencin, estaremos ante muestras dependientes.
Otro ejemplo se dara cuando por determinadas razones los sujetos estn
apareados, cmo ocurrira si en lugar de medir las puntuaciones antes y despus
de la aplicacin de un programa, decidimos constituir un grupo experimental y otro
de control para comparar los resultados alcanzados tras el mismo asegurndonos
de que las posibles diferencias no son debidas a una diferente capacidad intelectual
entre los sujetos de ambos grupos. Para conseguir la igualdad de los grupos con la
variable inteligencia aparearamos a los sujetos, haciendo que por cada sujeto del
grupo experimental haya uno de igual C.I. en el grupo control.
Ejemplo 11.3
Para determinar si los efectos de dos programas A y B de entrenamiento en clculo mental son
similares, hemos utilizado cada uno de estos programas con una muestra de alumnos. Las
muestras tenan tamaos nA = 25 y nB = 28. Tras aplicar una prueba de rendimiento en
matemticas hemos obtenido en cada uno de los grupos medias = 7.2 y = 6.8, y varianzas
SA2 = 2.4 y SB2 = 1.7. Podemos afirmar que el programa A conduce a niveles de rendimiento
superiores que el programa B? ( = 0.05)
Puesto que se trata de comprobar si la poblacin de alumnos que siguen el programa A tiene
mejor rendimiento que la poblacin de alumnos que siguen el programa B, las hiptesis
estadsticas en este ejemplo son:
H0: A B
H1: A > B
H0: A2 = B2
H1: A2 B2
Para calcular el valor del estadstico F, es necesario disponer de las varianzas insesgadas para
las dos muestras. A partir de las varianzas proporcionadas en el problema, obtendremos las
respectivas varianzas insesgadas y calcularemos F:
Comparando este valor observado con los valores crticos 0.025F24,27 y 0.975F24,27 . El segundo de
estos valores aparece en las tablas de la distribucin F, siendo 0.975F24,27 = 2.19. En cambio, no
tenemos los valores de F para reas tan pequeas como 0.025. Sin embargo, este valor puede
ser calculado con facilidad conociendo la equivalencia
Fn1,n2 = 1/1-Fn2,n1
Por tanto los valores crticos son 0.45 y 2.19. Puesto que el valor observado F = 1.42 se
encuentra fuera de la regin de rechazo, mantendremos H 0 y consideraremos que se da
homoscedasticidad de varianzas.
Con este resultado, podemos seleccionar el estadstico adecuado para llevar a cabo el contraste
de medias planteado inicialmente. Calcularemos el valor de T, que se distribuye con 51 grados de
libertad (nA+ nB-2).
La regin de rechazo se situar en el extremo derecho de la distribucin muestral, puesto que los
valores de T que resultan menos probables suponiendo H 0 cierta son aqullos que provienen de
numeradores positivos (es decir, cuando ). En este caso, el valor crtico es0.95T51 =
1.6.
Al comparar el valor observado T = 1 con el valor crtico, advertimos que aqul no se encuentra
incluido en la regin de rechazo, y por tanto, no podemos afirmar que los alumnos que siguieron
el mtodo A presenten un nivel de rendimiento mayor que los que siguieron el mtodo B.
11.16 CONTRASTES NO
PARAMTRICOS
1. Introduccin.
2. Contrastes para una muestra (prueba de Kolmogorov).
3. Contrastes para dos muestras (pruebas de Wilcoxon y Mann-Whitney).
4. Contrastes para k muestras independientes (pruebas de chi-2 y Kruskal-
Wallis).
5. Contrastes para k muestras relacionadas (pruebas de Cochran y Friedman).
INTRODUCCIN
A lo largo de las siguientes pginas estudiaremos algunas de las pruebas no
paramtricas de mayor uso en la investigacin educativa. Debemos recordar que
dichas pruebas han de emplearse cuando no se cumplen los denominados
supuestos paramtricos. Teniendo en cuenta los criterios de uso ms frecuente,
toda prueba o contraste es considerado no paramtrico si se da alguna de las
siguientes situaciones:
- Los datos a analizar estn medidos en una escala nominal u ordinal.
- Se utilizan datos medidos a nivel de intervalo o razn, pero la hiptesis formulada
no est referida a parmetros de las distribuciones poblacionales.
- El estadstico de contraste empleado no asume supuestos de la poblacin que han
de cumplirse.
- El tamao de la muestra es muy pequeo.
Estudiaremos distintas pruebas de contraste, en el caso de que analizamos los
datos de una muestra, de dos y de varias, ya sean independientes o relacionadas.
[D]
Por lo tanto, el estadstico W se transforma en una puntuacin tpica y sigue una
distribucin normal con media de 0 y desviacin tpica de 1, y podremos obtener la
probabilidad asociada al mismo a partir de la tabla de valores de la distribucin
normal.
PROBLEMAS RESUELTOS
Problema 1
Una Escala de Inteligencia, en la que pueden obtenerse valores de 0 a 8, arroja
puntuaciones que se distribuyen normalmente N(4,l). Para confirmarlo, pasamos la
Escala a una muestra de 10 sujetos, obteniendo los resultados que aparecen a
continuacin. Podemos decir que estos resultados confirman la distribucin normal
en la poblacin?
Puntuaciones: 1 4 6 5 3 2 5 6 4 7
Solucin 1
1. Hiptesis estadsticas:
Hiptesis nula: No existen diferencias entre la distribucin observada y la
distribucin normal.
H0: F(xi) = S(xi)
Hiptesis alternativa: Hay diferencias entre la distribucin observada y la
distribucin normal.
H1: F(xi) S(xi)
2. Estadstico de contraste
En este caso, el estadstico de contraste es D, definido como la diferencia mxima
entre la distribucin de proporciones observada y la terica. Por tanto, hay que
construir las distribuciones F(xi) y S(xi). Los resultados se presentan en la tabla
siguiente, en las que la primera columna corresponde a las puntuaciones de los
sujetos, la siguiente a las puntuaciones tpicas, y seguidamente, los valores de F(xi)
y S(xi). La ltima columna presenta la distancia entre F(xi) y S(xi).
xi z F(xi) S(xi) /F(xi) - S(xi)/
7 3 0.9986 1.0000 0.0014
6 2 0.9972 0.9000 0.0972
5 1 0.8413 0.7000 0.1413
4 0 0.5000 0.5000 0.0000
3 -1 0.1587 0.3000 0.1413
2 -2 0.0228 0.2000 0.1772
1 -3 0.0014 0.1000 0.0986
Problema 2
Un pedagogo desea probarla hiptesis de que el procedimiento psicolgico e
inductivo (trabajar ante ejemplos para, de ah, elevarse a la teora musical) es ms
eficaz que el lgico (primero la teora y luego las aplicaciones prcticas).
Como acta con dos grupos (A y B), selecciona a 10 sujetos del grupo A y otros 10
del B, emparejados en rendimiento musical previo, en actitud y en aptitudes
musicales. Decide al azar que en el A aplicar el procedimiento psicolgico y en el
B el lgico. Para la evaluacin de resultados utiliza un instrumento de medida que
slo denota que unas diferencias iguales entre los nmeros que no implican
diferencias idnticas en las cuantas de los atributos. Obtiene los siguientes datos
(ficticios):
A B
16 4
12 18
22 10
16 14
14 12
10 14
20 10
18 12
10 4
22 12
Puede afirmar que hay que diferencias entre los dos grupos? ( = 0.05)
Solucin 2
1. Hiptesis:
Hiptesis nula: El procedimiento psicolgico produce resultados inferiores o iguales
al procedimiento lgico.
Hiptesis alternativa: El procedimiento psicolgico produce resultados superiores al
procedimiento lgico.
2. Estadstico de contraste.
Para el clculo del estadstico W, deberemos calcular previamente las diferencias
entre las puntuaciones de los dos grupos. Estas diferencias o distancias quedan
recogidas en la tabla siguiente:
Problema 3
Para determinar si la asistencia a un curso de ofimtica modifica el estilo cognitivo,
se seleccionan dos grupos de 10 alumnos, uno de los cuales sigui el curso (grupo
experimental) mientras que al otro no se le aplic ningn tratamiento (grupo
control). Tras la realizacin del curso, mediante una escala adecuada se medi el
estilo cognitivo de-ambos grupos,-variable que-no se distribuye normalmente en la
poblacin. Podemos afirmar que los dos grupos son diferentes en cuanto a estilo
cognitivo despus de haber finalizado el curso?
Grupo experimental 75 46 52 45 75 62 48 85 63 84
Grupo control 39 49 28 47 35 25 69 34 67 32
Solucin 3
Ya en el enunciado del problema, se nos dice que los datos son siguen
una distribucin normal por lo que utilizaremos un contraste no
paramtrico. Al tratarse de dos muestras independientes, la prueba ms
adecuada es la prueba de Mann-Whitney. Las hiptesis que vamos a
contrastar son:
H0: No existen diferencias entre el grupo experimental y el grupo control.
H1: Existen diferencias significativas entre el grupo experimental y el grupo
control.
Fijamos un nivel de significacin (0.05) y calculamos los estadsticos T y U:
X Rango
25 1
28 2
32 3
34 4
35 5
39 6
45 7*
46 8*
47 9
48 10*
49 11
52 12*
62 13*
63 14*
67 15
69 16
75 17.5*
84 19*
85 20*
[D]
[D]
Buscamos en la tabla para la prueba Mann-Whitney, y encontramos que"
para tamaos de 10 sujetos en ambas muestras y T=120.5, la probabilidad
asociada es 0.124. Debemos tener en cuenta que nuestro contraste es
bilateral, por lo que la probabilidad buscada ser el doble de la que se
recoge en la tabla, esto es, 0.248. Como p>0.05 no podemos rechazar la
hiptesis nula con una confianza del 95%, es decir, los grupos no son
diferentes en estilo cognitivo.
Problema 4
En el marco de un estudio sobre las perspectivas de empleo en las mujeres se
recogen datos acerca de la situacin laboral de una muestra aleatoria formada por
89 mujeres y 71 hombres. Podemos afirmar con una confianza del 98% que la
situacin laboral de hombres y mujeres es distinta?
Empleados Subempleados En paro
Mujeres 25 18 46
Hombres 35 15 21
Solucin 4
Puesto que los datos nos vienen dados en forman de frecuencias, la
prueba ms adecuada en este caso es la prueba de chi cuadrado.
Tendremos que comparar las frecuencias observadas, recogidas en el
estudio, con las frecuencias que cabra esperar bajo el supuesto de que no
hubieran diferencias ente las proporciones de las dos muestras. Estas
frecuencias esperadas se calculan como el producto de las frecuencias
marginales dividido por el total de sujetos. A continuacin se reflejan las
frecuencias esperadas:
Empleados Subempleados En
paro
Mujeres 33.38 18.36 37.27
Hombres 26.63 14.64 29.73
[D]
[D]
El estadstico de contraste chi cuadrado se distribuye segn (s-l)(k-l)
grados de libertad, siendo s y k respectivamente el nmero de filas y
columnas de la tabla de contingencia. Consultando la tabla
correspondiente, comprobamos que el valor crtico para a = 0.02 y para (2-
1) y (3-1) grados de libertad es
0.9822 = 7.824
Por tanto, dado que el valor observado es mayor que el valor crtico, y
queda incluido en la regin de rechazo, podemos rechazar la hiptesis
nula con una confianza del 98%. En consecuencia, podemos afirmar que
existen diferencias la situacin laboral entre hombres y mujeres.
Problema 5
Hemos recogido el tamao de los centros acogidos a tres programas de
experimentacin, que cuentan con la participacin de 4, 3 y 4 centros
respectivamente. Si el nmero de unidades de cada uno de estos centros es el que
se muestran a continuacin, podemos afirmar que el tamao no marca diferencias
entre los centros implicados en los tres programas? ( = 0.05)
Programa A Programa B Programa C
20 24 23
19 22 15
16 28 18
21 26
Solucin 5
Dado que el nmero de casos es muy pequeo, la prueba idnea ser una prueba
no parmetrica. Puesto que tenemos que tres muestras cuyos datos no se
encuentran relacionados, la prueba a utilizar ser la de Kruskal-Wallis. Las hiptesis
a contrastar son las siguientes:
H0: No existen diferencias entre los k grupos.
H1: Existen diferencias significativas entre los k grupos.
Para calcular el estadstico de contraste, debemos ordenar las puntuaciones, como
si fueran una sola muestra:
Programa A Programa B Programa C
5 9 8
4 7 1
2 11 3
6 10
Y calculamos la suma de rangos para cada una de las muestras:
R1 = 5 + 4 + 2 + 6 = 17
R2 = 9 + 7 + 11 = 27
R3 = 8 + 1 + 3 + 10 = 22
La expresin del estadstico U es la siguiente:
[D]
Sustituyendo, obtenemos que U es:
[D]
Buscamos en la tabla correspondiente la probabilidad asociada para n1 = 4, n2 = 3 y
n3 = 4, y encontramos que es 0.102. Por tanto, no podemos rechazar la hiptesis
nula, puesto que la probabilidad observada es mayor que nuestro nivel de
significacin (0.05).
Problema 6
Se pretende estudiar si determinados factores inciden de distinto modo en no
presentarse a los exmenes parciales de una asignatura. Se eligen aleatoriamente
7 sujetos matriculados, registrando para ellos la presencia o ausencia de faltas de
asistencia reiteradas (factor A), el cumplimiento o incumplimiento de tareas (factor
B) y la asistencia o no a tutoras (factor C). Todos estos aspectos son codificados
con 1 en el caso positivo y 0 en el negativo. Podemos afirmar con una confianza
del 98% que los tres factores estn presentes de modo diferente en los alumnos
que no se presentaron a los exmenes parciales?
Solucin 6
En este problema, las muestras estn formadas por puntuaciones apareadas o
relacionadas de carcter dicotmico, por lo tanto, la prueba apropiada es la de
Cochran. El primer paso ser formular las hiptesis:
H0: No existen diferencias entre los tres factores.
H1: Existen diferencias significativas entre los tres factores.
El nivel de significacin ya nos viene fijado en el enunciado del problema: 98% de
confianza, por lo tanto, = 0.02. El estadstico de contraste que emplearemos ser
la Q de Cochran, que exige disponer la informacin de forma que los sujetos sean
las filas y los grupos o muestras sean las columnas.
Alumno Factor A Factor B Factor C Li Li2
1 1 0 0 1 1
2 1 0 0 1 1
3 0 0 1 1 1
4 1 0 1 2 4
5 1 1 1 3 9
6 1 0 1 2 4
7 0 1 0 1 1
Gi 5 2 4 11 21
[D]
[D]
El estadstico Q sigue una distribucin de chi cuadrado con k-1 grados de libertad.
Por lo tanto, el valor crtico que delimita la regin de rechazo ser
0.9822 = 7.824
Puesto que el valor observado Q = 2.33 no entra en la regin de rechazo,
mantenemos la hiptesis nula y no podemos afirmar con una confianza del 98% que
existan diferencias significativas entre los tres factores.
Problema 7
La asociacin de padres de un centro convoca sucesivamente tres reuniones
dirigidas a los padres de alumnos de un mismo grupo o clase, en las que se
abordaron respectivamente temas relacionados con el apoyo de la familia al estudio
(Tema A), el juego y el tiempo libre de los nios (Tema B), y la participacin de los
padres en el centro (Tema C). Si contamos los datos de asistencia a cada una de
las tres reuniones para los padres de alumnos de 6 clases, podemos afirmar que
los tres temas atrajeron de modo distinto a los convocados? ( = 0.05)
Tema A Tema B Tema C
3 2 1
3 2 1
3 1 2
2 3 1
3 2 1
3 2 1
Solucin 7
Dado que el nmero de sujetos es pequeo, deberemos utilizar una prueba no
paramtrica, y puesto que los casos se hayan relacionados, la prueba ms idnea
es el anlisis de la varianza de dos clasificaciones por rangos de Friedman. En
primer lugar, plantearemos las hiptesis:
H0: No existen diferencias entre en la atraccin a los tres temas.
H1: Existen diferencias significativas entre en la atraccin a los tres temas.
El estadstico de contraste que emplearemos ser:
[D]
Por lo tanto, calcularemos la suma de rangos para cada columna:
Tema A Tema B Tema C
3 2 1
3 2 1
3 1 2
2 3 1
3 2 1
3 2 1
RA = 17, RB = 12 y RC = 7. Sustituyendo:
[D]
Comparamos el valor observado con el que nos ofrece la tabla, teniendo en cuenta
que X2 sigue una distribucin de chi cuadrado con k-1 grados de libertad. Por tanto,
el valor crtico ser
0.9522 = 5.991
Puesto que el valor observado es mayor que el crtico, aqul entra en la regin de
rechazo, por lo que podemos rechazar con una confianza del 95% que existen
diferencias significativas en cuanto a la atraccin a los distintos temas.
a = 0,01
H0 es aceptada, ya que zprueba (-0,93) es menor que ztabla (2,326), por lo que no
es cierto que ms del 3% de la poblacin no conoce el nuevo producto.
En Excel
b)
a = 0,01
H0 es rechazada, ya que zprueba (1,13) es menor que ztabla (2,326), por lo que es
cierto que menos del 2% de la poblacin no conoce el nuevo producto.
2) Cuando las ventas medias, por establecimiento autorizado, de una marca de
relojes caen por debajo de las 170,000 unidades mensuales, se considera razn
suficiente para lanzar una campaa publicitaria que active las ventas de esta marca.
Para conocer la evolucin de las ventas, el departamento de marketing realiza
una encuesta a 51 establecimientos autorizados, seleccionados aleatoriamente, que
facilitan la cifra de ventas del ltimo mes en relojes de esta marca. A partir de estas
cifras se obtienen los siguientes resultados: media = 169.411,8 unidades.,
desviacin estndar = 32.827,5 unidades. Suponiendo que las ventas mensuales
por establecimiento se distribuyen normalmente; con un nivel de significacin del 5
% y en vista a la situacin reflejada en los datos. Se considerar oportuno lanzar
una nueva campaa publicitaria?
Datos:
n = 51
Solucin:
H0: ( = 170000
H1: ( < 170000
a = 0,05
Se rechaza Ho, porque zprueba (-0,12) es menor que ztabla (1,645), por lo tanto se
acepta H1: ( < 170000, y se debe considerar oportuno lanzar una nueva campaa
publicitaria.
En Excel
Solucin:
H0: ( = 40
H1: ( > 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
H0 es aceptada, ya que tprueba (2,83) es menor que ttabla (3,499), por lo que no es
acertado pensar que estn realizando un nmero de visitas promedio superior a 40.
En Excel
4) Un investigador de mercados y hbitos de comportamiento afirma que
el tiempo que los nios de tres a cinco aos dedican a ver la televisin cada
semana se distribuye normalmente con una media de 22 horas y desviacin
estndar 6 horas. Frente a este estudio, una empresa de investigacin de
mercados cree que la media es mayor y para probar su hiptesis toma una muestra
de 64 observaciones procedentes de la misma poblacin, obteniendo como
resultado una media de 25. Si se utiliza un nivel de significacin del 5%. Verifique si
la afirmacin del investigador es realmente cierta.
Datos:
n = 64
a = 5% = 0,05
Solucin:
H0: ( = 22
H1: ( > 22
a = 0,05
Se rechaza Ho, porque zprueba (4) es mayor que ztabla (1,645), por lo tanto el
tiempo que los nios de tres a cinco aos dedican a ver la televisin es mayor de 22
horas, lo que implica que la empresa de investigacin de mercados tiene la razn.
En Excel
Donde
31 1,604
28,2 2,351
30 0,071
Total 4,026
Varianza de las medias aritmticas
Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.
F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%
Como Fprueba es menor que Ftabla , H0 se acepta, por lo tanto no existen
diferencias reales entre la bateras.
En Excel
Donde
45,8 1,604
45 0,218
42,8 3,004
Total 4,827
Varianza de las medias aritmticas
Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.
F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%
Donde
30 0,071
30,4 0,444
28,8 0,871
Total 1,387
Varianza de las medias aritmticas
Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.
F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%
Donde
45,2 0,444
44,2 0,111
44,2 0,111
Total 0,667
Varianza de las medias aritmticas
Planteamiento de hiptesis
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.
F tabla
Grados de libertad:
Numerador: k-1 = 3-1 =2
Denominador: k(n-1) = 3(5-1) =12
Nivel de significacin del 1%
Como F prueba es menor que F tabla , H0 se acepta, por lo tanto no existen
diferencias reales entre la bateras.
Resumen de las varianzas
B:
C: