Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guia para Interpretar Estadisticos TODAS PDF
Guia para Interpretar Estadisticos TODAS PDF
RESULTADOS EN EL CONTRASTE DE
HIPTESIS ESTADSTICAS
(Estadstica Paramtrica y No Paramtrica)
NDICE
1. ESTADSTICA DESCRIPTIVA E INFERENCIA ESTADSTICA ....................................................................... 2
1.1 Variables en la investigacin .......................................................................................................................... 3
1.2 Formulacin de hiptesis estadsticas ........................................................................................................... 5
1.3 Distribucin Muestral..................................................................................................................................... 6
1.4 Estadsticos de contraste y probabilidad asociada........................................................................................ 7
Nivel de significacin ....................................................................................................................................... 9
1.5 Clasificacin de Anlisis estadsticos para el contraste de hiptesis. ........................................................ 10
Grupos Relacionados vs. Grupos Independientes ........................................................................................ 12
1.6 Software para el contraste de hiptesis y anlisis de datos. ....................................................................... 13
2. PRUEBAS ESTADSTICAS (PARAMTRICAS Y NO PARAMTRICAS) ...................................................... 14
2.1 Pruebas paramtricas de Diferencias entre grupos .................................................................................... 14
2.1.1 Diferencias entre las puntuaciones de DOS grupos INDEPENDIENTES. Prueba T de Student ...... 14
2.1.2 Diferencias entre las puntuaciones de TRES o ms grupos INDEPENDIENTES. Anlisis de
Varianza (ANOVA) ......................................................................................................................................... 16
2.1.3 Diferencias entre las puntuaciones de DOS grupos RELACIONADOS. Prueba T de Student .......... 18
2.1.4 Comparacin de un nico grupo. Prueba T de Student ...................................................................... 19
2.2 Pruebas paramtricas de Relacin entre variables.....................................................................................20
2.2.1 Correlacin entre dos variables cuantitativas. Pearson ......................................................................20
2.3 Pruebas No paramtricas de Diferencias entre grupos .............................................................................. 23
2.3.1 Diferencias entre las puntuaciones de DOS grupos INDEPENDIENTES. Prueba U de MannWhitney........................................................................................................................................................... 23
2.3.2 Diferencias entre las puntuaciones de TRES o ms grupos independientes. Prueba H de KruskalWallys.............................................................................................................................................................. 25
2.3.3 Diferencias entre las puntuaciones de DOS grupos relacionados. Prueba W de Wilcoxon. ............. 26
2.3.4 Diferencias entre las puntuaciones de DOS grupos relacionados. Prueba McNemar ...................... 27
2.3.5 Comparacin de un nico grupo. Chi-Cuadrado como bondad de ajuste. ........................................ 28
2.4 Pruebas No Paramtricas de relaciones entre variables ............................................................................ 29
2.4.1 Correlacin entre dos variables cualitativas ordinales. Spearman, tau-b, tau-c y gamma ...............30
2.4.2 Correlacin entre dos variables cualitativas nominales. Chi-Cuadrado para la independencia ...... 31
2.4.2 Correlacin entre una variable cualitativa nominal dicotmica y una variable cuantitativa ........... 33
Esta gua pretende llevar a cabo una introduccin a los conceptos bsicos del contraste de hiptesis
estadstico. Con su lectura se puede dar respuesta a dos preguntas fundamentales: Qu tipo de
anlisis estadstico es adecuado para analizar los datos? y cmo se interpreta esa informacin
estadstica?
Univariada
Descriptiva
Bivariada
(Correlaciones)
Estadstica
Pruebas
Paramtricas
Inferencial
(Contraste de
Hiptesis)
Pruebas No
Paramtricas
Esta gua se centra en el segundo grupo de anlisis estadsticos que se utilizan para llevar a cabo el
contraste de hiptesis. Tambin se incluyen los estadsticos para analizar la relacin entre
variables, aunque usualmente se clasifican dentro del grupo de estadsticos descriptivos y se
denominan estadsticos descriptivos bivariados.
La estadstica descriptiva incluye una parte de anlisis de cada variable por separado (univariada) y
otra para establecer relaciones entre pares de variables (bivariada).
La estadstica descriptiva bivariada tambin se puede considerar estadstica inferencial si la
finalidad de la investigacin es generalizar los resultados de correlacin a la poblacin. Si la
2
investigacin no tiene ese objetivo y solo pretende describir un grupo de sujetos, las correlaciones
son estadsticos descriptivos.
Esa inferencia, por tanto, permite la generalizacin de los resultados de una muestra a la poblacin
en trminos de probabilidad. Esta generalizacin de los resultados depender principalmente del
proceso de seleccin muestral que debe garantizar la representatividad de la muestra.
Antes de comenzar con la descripcin de las diferentes pruebas que se utilizan para el contraste de
hiptesis en estudios con datos empricos, conviene introducir algunos conceptos bsicos.
Razn
Intervalo:
Ordinal
Nominal:
Las escalas nominales y ordinales miden variables de naturaleza cualitativa y las de intervalo y
razn las de naturaleza cuantitativa. Por tanto, la recogida de informacin cuantitativa puede
producir variables de naturaleza cuantitativa y cualitativa:
3
Ordinales: Si sus valores se pueden ordenar pero no hay la misma distancia entre las
diferentes categoras de la variable, es decir, permiten establecer relaciones de mayor,
menor o igual. Por ejemplo el grado de satisfaccin Intensidad del dolor (leve, moderado,
intenso), las notas (suspenso, aprobado, notable, sobresaliente), etc.
B) Cuantitativas o Numricas: son variables que pueden ser medidas de forma numrica y, por
tanto, sus valores corresponden a cantidades y tiene sentido hacer operaciones algebraicas con
ellos. Este grupo incluye variables:
Discretas: si toma nicamente valores enteros: n de hijos, edad (n de aos), notas (de 0
a 10), etc.
Continuas: Si entre dos valores, son posibles infinitos valores intermedios: altura, peso,
puntuaciones en test estandarizados, presin intraocular, etc.
Otra forma de clasificacin de variables es segn el papel o funcin que desempea en una
investigacin. Desde esta perspectiva es posible diferenciar entre:
Independientes: es una variable que funciona como un estmulo para provocar cambios.
Tambin se suele identificar con el agente o con la posible causa de que otras variables
cambien o varen. Por ejemplo, si la hiptesis es: los estudiantes que reciben un programa
de mejora de la creatividad obtienen mejores resultados en comprensin lectora que
aquellos que siguen la enseanza tradicional, es recibir o no el programa de creatividad la
variable que antecede a los resultados en comprensin lectora y, por tanto, ser la variable
independiente que, en este caso, tiene dos valores: mtodo de creatividad o enseanza
tradicional.
Tambin conviene tener en cuenta que cuando se estudia nicamente la relacin entre variables
mediante coeficientes de correlacin, no se diferencia entre dependiente e independiente porque
un coeficiente de correlacin no indica que variable antecede a otra o cul es la causa.
Finalmente, las variables independientes tambin reciben una doble categorizacin: Son
variables activas si el investigador puede manipular de forma directa, es decir, es el investigador
4
quien decide qu niveles o modalidades tiene esa variable y permite distribuir a los sujetos de
forma aleatoria en esos niveles, como diferentes dosis de medicamento o diferentes modalidades de
un programa de intervencin (control, experimental). En cambio, son variables asignadas si no
pueden ser manipuladas por el investigador, es decir, son caractersticas propias de los sujetos
como el gnero, nivel educativo, edad, etc.
Para el caso en el que la hiptesis trata de analizar las diferencias entre grupos de sujetos distintos,
por ejemplo, diferencias en matemticas en funcin del gnero, quedara formulada de la siguiente
forma:
Mediante el anlisis estadstico adecuado se busca evidencia para aceptar o rechazar la hiptesis
nula. En caso de ser rechazada, la hiptesis alternativa debe aceptarse.
50%
0,5
0,25
0
5000 LANZAMIENTOS
Cuando se trabaja con variables cuantitativas y se cuenta con un tamao suficiente, su distribucin
muestral adquiere forma de campana de Gauss que se denomina distribucin normal o tambin
conocida como distribucin Z.
68,28%
95%
99%
-2,58
-1,96
-1
+1
+1,96
+2,58
Con esta distribucin es posible saber exactamente cul es la probabilidad de que un sujeto obtenga
un valor determinado en la variable y tambin que habr ms probabilidades de que se obtengan
valores prximos a la media que los valores extremos, es decir, un mayor nmero de casos se
situar en esos valores cercanos a la media y habr menos casos en los valores extremos. Y conocer
adems cuntos casos hay entre dos valores de la variable, por ejemplo, hay un 50% de casos a un
lado y otro de la media (en la distribucin normal media, mediana y moda tienen el mismo valor),
entre la puntuacin de -1,96 y la de +1,96 se encuentran el 95% de los sujetos.
El valor representativo o esperado de las variables cuantitativas, es decir, el valor que tiene una
mayor probabilidad de ocurrencia, es la media. Y en consecuencia, cuando se contrastan
hiptesis con variables cuantitativas se utiliza ese estadstico como referencia: la
media. Por ejemplo, una de las posibles hiptesis que podra comprobarse es si las chicas y los
chicos difieren en sus resultados de creatividad y, para averiguarlo, se compararan los resultados
medios de ambos grupos para comprobar esas diferencias.
La media tiene su distribucin muestral que se asemeja a la curva normal, pero no es el nico tipo
de distribucin existente. Cuando se trabaja con variables cualitativas nominales se comparan las
frecuencias o proporciones, si se emplean variables ordinales se analizan rangos, etc. Incluso
cuando se calcula una correlacin, tambin cuenta con una distribucin muestral asociada a los
valores obtenidos. Otras distribuciones conocidas son la binomial, F de Senedor, chi-cuadrado, T
de Student, etc.
Por tanto, cuando contrastamos hiptesis utilizando muestras es necesario comparar esos valores
con los de la distribucin para confirmar que ese resultado se producira tambin en la poblacin. Y
contar con un tipo de variables u otras determinar la distribucin muestral de referencia.
Utilizar variables cuantitativas que cumplen con los requisitos de normalidad, como ya se
mencion en el tema anterior, es uno de los supuestos que se deben cumplir para utilizar pruebas
estadsticas paramtricas. En cambio, si la distribucin de puntuaciones no cumple con la
normalidad se debern emplear pruebas no paramtricas.
La decisin de emplear un tipo de pruebas u otras depende de las caractersticas de las variables
que forman parte de la investigacin. Para utilizar pruebas paramtricas las variables deben
cumplir una serie de supuestos:
Por tanto, adems del tipo de hiptesis a contrastar (relacin o diferencias entre grupos), es la
naturaleza de las variables (cuantitativa o cualitativa) y el tamao muestral, los que determinan la
prueba estadstica adecuada para analizar la informacin. En funcin de esa naturaleza, los
estadsticos se clasifican dentro de esas dos categoras generales:
A. Estadsticos Paramtricos
1. Diferencias entre grupos: T de Student y F de Snedecor (ANOVA)
2. Correlacin: Pearson
B. No Paramtricos
1. Diferencias entre grupos: U de Mann-Whitney, H de Kruskal-Wallys y W de
Wilcoxon
2. Correlacin: Spearman, Tau b, Tau c, Gamma y Chi-cuadrado, biserial-puntual
El estadstico siempre va acompaado de un valor de probabilidad asociado. Normalmente se
nombra como sig. (bilateral) o P-valor. Este valor es el que determina si el estadstico calculado ha
resultado significativo.
NIVEL DE SIGNIFICACIN
Cada estadstico estimado en un contraste de hiptesis, ya sea paramtrico o no paramtrico, de
correlacin o comparacin, siempre se acompaa de su probabilidad de ocurrencia de la hiptesis
nula (p-valor).
Esta probabilidad asociada al estadstico indica el nmero de ocasiones (cuntas veces de cada 100,
es una proporcin) que se cumplir la hiptesis nula. Ese valor se debe comparar con un valor de
probabilidad, elegido por el investigador, que establece el lmite para considerar que una hiptesis
se cumple. Ese valor de comparacin es el nivel de significacin o nivel de error que se espera
cometer () y en investigacin social no debe superar el 5%, es decir, una probabilidad de 0,05.
Para aceptar la hiptesis nula deber cumplirse ms del 5% de las ocasiones, por tanto, debe tener
una probabilidad asociada que supere el 0,05.
Unos valores bajos de probabilidad asociada al estadstico inferior o igual al nivel de error (5% o
inferior o igual a 0,05) sealarn que la hiptesis nula no se cumple el nmero suficiente de
ocasiones y, en consecuencia, deber rechazarse y, por tanto, aceptar la hiptesis alternativa. En
cambio, si la probabilidad supera ese valor deber aceptarse.
Ese 5% (=,05) es el lmite establecido por consenso en investigacin. No obstante, si el resultado
de la probabilidad es igual o inferior al 1% (p = ,01) indica que la hiptesis nula solo ocurre una de
cada 100 veces. Si esa probabilidad es del 0,1% (p= ,001) nos indica que ocurre una de cada 1000
ocasiones. Cuanto ms bajo sea el nivel de significacin ms seguridad habr al rechazar la
hiptesis nula.
Siempre que se realiza un contraste de hiptesis estadstico hay cierta probabilidad de error. Ese
5% indica tambin el error que se asume en el contraste de hiptesis. Utilizar este punto de corte
del valor de la probabilidad conlleva asumir un 95% de nivel de confianza, pero es posible aunque
poco probable que rechacemos una hiptesis nula cuando es cierta, o que la aceptemos cuando es
falta. Los distintos tipos de error que pueden cometerse se resumen en la siguiente tabla:
Realidad
H0 cierta
H0 Falsa
No Rechazo H0
Correcto
El tratamiento no tiene efecto y
as se decide.
Robustez estadstica
Error de tipo II
El tratamiento si tiene efecto
pero no lo percibimos.
Probabilidad
Rechazo H0
Acepto H1
Error de tipo I
El tratamiento no tiene efecto
pero se decide que s.
Probabilidad
Correcto
El tratamiento tiene efecto y el
experimento lo confirma.
Potencia estadstica
Por tanto, cuando se rechaza la hiptesis nula es porque tiene poca probabilidad de ocurrencia. En
un anlisis de correlacin la hiptesis nula se formula en trminos de negacin de la relacin entre
las variables de rendimiento. Y, por tanto, la obtencin de un valor de probabilidad inferior a 0,05
quiere decir que esa falta de relacin, la hiptesis nula, ocurre menos del 5% de las veces y debe ser
rechazada. En el otro 95% de los casos la relacin es significativa. De forma opuesta, cuando el
valor de probabilidad supera ese 0,05 la hiptesis nula tiene una probabilidad de ocurrencia
suficiente para no ser rechazada.
Paramtrica
Variables Cuantitativas
(Pearson)
Cualitativas Ordinales
Descriptiva Bivariada
(Spearman, taub,
tauc, gamma)
(Correlacin)
No Paramtrica
Nominal dicotmica y
cuantitativa (biserialpuntual)
chi-cuadrado, phi y v
de Cramer (distinto
nmero de categoras)
Cualitativas Nominales
Coeficiente de
contingencia, phi y v
de Cramer (mismo
nmero de categoras
10
T de Student para
una muestra
1 grupo
Independientes
(T de Student)
Paramtrica
2 grupos
Relacionados
(T de Student)
Independientes
(ANOVA)
Ms de dos grupos
Relacionados
(ANOVA de medidas
repetidas)
1 grupo
VD. Ordinal o
Nominal (ChiCuadrado como
bondad de ajuste)
VD. Ordinal
(U de MannWhitney)
Independientes
VD. Nominal
(Chi-cuadrado para
la independencia)
2 grupos
VD y VI
dicotmicas
(Coeficiente de
Contingencia)
VD. Ordinal (W de
Wilcoxon)
No Paramtrica
Relacionados
Variables
dicotmicas
(Mc Nemar)
VD. Ordinal (H de
Kruskal Wallis)
Independientes
VD Nominal
(Chi-cuadrado para
la independencia)
Ms de dos grupos
VD. Ordinal
(Q de Cochran)
Relacionados
VD y VI nominal
(Friedman)
11
Todas las pruebas paramtricas y no paramtricas se describen en esta gua excepto aquellas que se
utilizan para comparar ms de dos grupos relacionados (ANOVA de medidas repetidas, Friedman y
Q de Cochran). Se excluyen debido a su alta complejidad de interpretacin y porque son poco
utilizadas en este campo de estudio. Las pruebas para grupos relacionados, tanto paramtricas
como no paramtricas, normalmente comparan nicamente dos grupos: un pretest con un postest.
Para evitar este problema se mide inicialmente a los sujetos en razonamiento verbal y se
distribuyen en los grupos en funcin de sus niveles. Cada grupo cuenta con un individuo de cada
nivel de razonamiento verbal, estn emparejados (ver Figura 10) y los grupos son equivalentes,
estn relacionados. De esta forma, la media en razonamiento verbal es igual en ambos grupos y no
afectar a los resultados de matemticas.
12
La otra opcin, ya mencionada, para forma grupos relacionados es la utilizacin de los mismo
sujetos en varias ocasiones de medida, es decir, la comparacin de los resultados de un pretest con
un postest.
PSPP: alternativa gratuita a SPSS. Es posible hacer los anlisis estadsticos ms habituales
en investigacin. La desventaja es que los grficos no son editables. Hay versiones para
Windows
(http://pspp.awardspace.com/),
Mac
(http://lavergne.gotdns.org/projects/pspp/) y Linux (http://mirrors.nfsi.pt/gnu/pspp/)
13
Conviene recordar, que toda hiptesis nula tiene una hiptesis alternativa en el caso de que sea
rechazada. En este caso:
El tipo de prueba estadstica podr variar en funcin del nmero de grupos a comparar, en el
ejemplo anterior la variable gnero tiene dos nicos grupos (mujer-hombre). Y tambin en funcin
de si los grupos son relacionados o independientes.
Los resultados proporcionados por el complemento de Excel para el anlisis de datos EZAnalyze
aparecen en la Tabla 2 y la Figura 11
La primera parte de los resultados muestra los estadsticos descriptivos (media, desviacin tpica y
tamao de los grupos (N)) para cada grupo. En este caso el grupo uno son las mujeres y el dos los
varones. Se observa que la media de las mujeres (7,750) es mayor a la de los varones (4,385).
Para conocer si esas diferencias entre las medias de ambos grupos, que muestran los estadsticos
descriptivos, son significativas debe observarse la probabilidad asociada al estadstico T, es decir,
su probabilidad de ocurrencia. En la tabla aparece con la letra P y su valor es de 0,000.
Como el valor de la probabilidad asociada al estadstio T es inferior al nivel de error (0,05) debe
rechazarse la hiptesis nula y aceptar la alternativa. Es decir, se confirman las diferencias en las
puntuaciones medias de mujeres y varones en el nivel de conocimientos de otras culturas.
La tabla tambin informa sobre la diferencia entre las medias de los dos grupos (mean difference).
En este caso hay 3,365 puntos de diferencia a favor de las mujeres. Por tanto, las mujeres tienen un
mayor conocimiento de otras culturas que los varones.
EZAnalyze Results Report - Independent T-Test of group 1 and 2 on INFORMA
SEXO
Mean:
Std. Dev:
N:
1 (Mujeres)
7,750
1,212
48
2 (Varones)
4,385
2,180
52
Mean Difference:
3,365
Probabilidad
T-Score:
9,434
asociada
Eta Squared:
,471
P:
,000
The observed difference between the group means is significant
Tabla 2. Prueba T de diferencias entre dos grupos. Resultados EZAnalyze
15
Los resultados que arroja el programa EZAnalyze se muestran en la Tabla 3, Tabla 4 y Figura 12.
En la primera de ellas (Tabla 3) aparecen los estadsticos descriptivos de cada grupo (media,
desviacin tpica y tamao de los grupos) y tambin una media global de xenofobia (grand mean).
Se observa que la media global es de 35 puntos aproximadamente. Si se analizan los grupos por
separado, el grupo 2 (contactos sistemticos) obtienen la menor puntuacin media en xenofobia
con un valor de 30 puntos. El grupo con contacto nulo (grupo 1) tiene menor media (35,459) que
los que tienen un contacto ocasional (grupo3).
16
Esta misma tabla se muestra tambin los resultados del ANOVA. Para comprobar si existen
diferencias entre los grupos se observa el valor de la probabilidad asociada al estadstico F de
Snedecor (P). Esta probabilidad tiene un valor de 0,001, valor inferior a 0,05. Como la
probabilidad de ocurrencia de la hiptesis nula es muy baja debe ser rechazada y, por tanto,
aceptar la alternativa y afirmar diferencias entre los grupos.
EZAnalyze ANOVA Report - ANOVA of AXENOFO by CONTACT
0 cases were removed due to missing data
Grand Mean
N
35,050
100
CONTACT(group)
1
2
3
N
37
32
31
Group Mean
35,459
30,000
39,774
Std Deviation
9,873
9,333
10,459
Source of Variance
Between Groups
Within Groups
Total
ANOVA Table
SS
1514,141
9490,609
11004,750
DF
2,000
97,000
MS
757,071
97,841
F
7,738
P
,001
Eta Squared
,138
The ANOVA results indicate that at least two of the groups differed significantly
Tabla 3. Prueba F de Snedecor (ANOVA)
Como en este caso se cuenta con ms de dos grupos, la prueba F de Snedecor no informa entre qu
grupos se producen las diferencias. Para averiguarlo debe observarse la tabla de contrastes
posteriores (Tabla 4). En esta tabla se comparan las diferencias entre cada grupo por separado, es
decir, el grupo 1 con el grupo 2, el grupo 1 con el grupo 3 y el grupo 2 con el grupo 3.
La forma de interpretar los contrastes posteriores es igual que la de cualquier otro contraste de
hiptesis. En realidad, no son ms que pruebas T de Student para cada par de grupos observados.
Debe observarse por tanto, la probabilidad asociada a ese estadstico T (P-Unadjusted). Si ese valor
es inferior a 0,05, las diferencias entre las puntuaciones de los dos grupos son significativas.
En este ejemplo se han encontrado diferencias significativas entre los grupos 1 y 2 y entre los
grupos 2 y 3. En cambio, las diferencias no son estadsticamente significativas entre los grupos 1 y
3. Esta tabla tambin ofrece informacin sobre el valor exacto de esa diferencia de medias en la
columna mean difference
Post Hoc tests
Group_1
Comparison
Mean Difference
T-Value
P - Unadjusted
P - Bonferroni
Eta Squared
1 and 2
1 and 3
5,459
4,315
2,349
1,747
,022
,085
,065
,256
,076
,044
2 and 3
9,774
3,917
,000
,001
,201
Group_2
Finalmente los resultados se acompaan de un grfico de barras que muestra las medias en
xenofobia de los tres grupos comparados (Figura 12).
17
Los resultados de la prueba T para grupos relacionados aparecen en la Tabla 5 y Figura 13. La
informacin que incluye esta tabla es similar al resto de contrastes. En primer lugar, las medias y
desviaciones tpicas de las puntuaciones en el pretest y en el postest. Puede comprobarse que la
puntuacin es ms alta en el postest (11,690).
De la misma forma que en los casos anteriores, para verificar si esas diferencias entre pretest y
postest son estadsticamente significativas debe observarse el valor de probabilidad asociado al
estadstico, es decir, P. Al estar por debajo de 0,05, concretamente es igual 0,000, la hiptesis nula
tiene poca probabilidad de ocurrencia y debe rechazarse. Por tanto, las diferencias entre pretest y
18
postest son significativas, siendo ms altas en el postest. Esto quiere decir que el programa de
educacin intercultural ha mejorado el nivel de conocimientos sobre otras culturas y religiones.
EZAnalyze Results Report - Paired T-Test of INFORMA2 with INFORMA3
Mean:
Std. Dev.:
INFORMA2 (pretest)
8,850
2,409
INFORMA3 (postest)
11,690
2,770
N Pairs:
100
Mean Difference:
-2,840
SE of Diff.:
,208
Eta Squared:
,650
T-Score:
13,636
P:
,000
The difference between INFORMA2 and INFORMA3 is significant
Tabla 5. Resultados prueba T para dos grupos relacionados
Los resultados se acompaan de un grfico de barras que plasma las medias de las puntuaciones
pretest y postest.
Los resultados de esta prueba se presentan mediante una tabla y un grfico (Tabla 6 y Error! No se
encuentra el origen de la referencia.). La tabla incluye los estadsticos descriptivos de la muestra en la
variable objeto de estudio (nivel de vocabulario). Incluye la media (16,583), la desviacin tpica
(6,344) y el nmero de sujetos (36). El valor de la columna NTV es el valor de comparacin, en este
caso, una media de 15 puntos en nivel de vocabulario.
Para confirmar que las dos medias son distintas se debe poner atencin en el valor de T (T-score) y
su probabilidad asociada (P). Una probabilidad inferior a 0,05 indica que las diferencias son
estadsticamente significativas. Pero no ocurre as, el valor de probabilidad es 0,143 y supera, por
tanto, el 0,05.
EZAnalyze Results Report - One Sample T-Test
N Valid:
N Missing:
Mean:
Std. Dev:
6,344
Mean Diff:
T-Score:
Eta
Squared:
P:
1,583
1,497
,060
NTV
15,00
0
,143
Tabla 6 y Figura 14. Resultados prueba T para una muestra.
Se debe aceptar por tanto la hiptesis nula formulada. No es posible afirmar la existencia de
diferencias estadsticamente significativas entre las dos medias comparadas.
Y, por tanto, la hiptesis alternativa es la que afirma la existencia de relacin entre las variables:
De la misma forma que en los anlisis de diferencias entre grupos, el tipo de prueba estadstica
depender de las caractersticas de las variables analizadas y del tamao muestral. Cuando las dos
variables correlacionadas son cuantitativas y se cuenta con al menos 30 casos, el estadstico
adecuado es la correlacin de Pearson.
Este estadstico puede tomar valores entre -1 y +1. El cero quiere decir ausencia de correlacin. A
medida que el valor se acerca a los extremos (-1 o +1) la correlacin es ms potente. El signo seala
la direccionalidad de la correlacin. Un valor negativo quiere decir que a medida que aumentan los
valores de una variable disminuyen los de la otra (correlacin inversa). En cambio, si el valor es
positivo, a medida que aumentan unos tambin lo hacen los otros y viceversa (correlacin directa).
Por ejemplo, si se seleccionan 30 individuos y se mide su peso y altura. Utilizando estas dos
variables como referencia es posible elaborar un grfico de dispersin como el siguiente (Figura
15):
Este grfico representa con un punto a cada uno de los sujetos estudiados. Este punto representa
su altura y peso concretos y observando su forma de agrupacin es posible averiguar la existencia
de cierta tendencia en los datos, como se muestra en el Figura 16.
21
A simple vista puede observarse una relacin directa entre las variables peso y altura, es decir, a
media que la altura es mayor tambin lo es el peso. Aunque los grficos de dispersin permiten
observar el sentido de la relacin (ver Figura 17), para conocer el grado exacto de la relacin es
necesario calcular un ndice de correlacin.
,500
100,000
,000
El valor de la correlacin entre las dos variables analizadas es de 0,5. Es por tanto un valor de
relacin positivo y con intensidad media. La correlacin se complementa con la probabilidad
asociada al estadstico (P), que en este caso es de 0,000. De la misma forma que en los contrastes
de medias, es necesario que esta probabilidad asociada se encuentre por debajo de 0,05 para
concluir que el valor de la correlacin es significativo. En caso de que la probabilidad supere el 0,05
la correlacin no sera significativa, independientemente del valor del coeficiente de Pearson.
22
La tabla de correlacin se acompaa del grfico de dispersin (Figura 18) de las dos variables
analizadas. En este grfico puede observarse la tendencia de la relacin. En este caso positiva y
media.
23
Uno de los casos en los que se aplica este tipo de prueba es cuando los dos grupos a comparar
tienen menos de 30 casos. A continuacin se incluye un ejemplo concreto.
El objetivo es comparar los resultados en la variable comprensin lectora en funcin de s los
estudiantes han asistido o no a educacin preescolar. La variable comprensin lectora es una
variable cuantitativa obtenida a partir de un test, pero slo se cuenta con 16 sujetos que han
asistido a preescolar y 18 que no.
Las hiptesis a contrastar son las siguientes:
Los resultados del anlisis se presentan en dos tablas distintas (Tabla 8 y Tabla 9). La primera de
ellas muestra los resultados descriptivos para los dos grupos analizados. Es posible identificar el
rango promedio en la variable comprensin lectora de ambos grupos. En este caso, los estudiantes
que si asistieron a preescolar obtienen un mayor rango en compresin lectora (22,56), frente al 13
obtenido por los que no asisten. Como ya se ha mencionado un mayor rango equivale a una mayor
puntuacin en esa variable. No obstante, para conocer si esas diferencias iniciales son significativas
debe observarse la Tabla 9.
Asistencia a Preescolar N Mean Rank Sum of Ranks
Comprensin lectora (0-30) S
16
22,56
361,00
No
18
13,00
234,00
Total
34
Tabla 8. Rangos. Prueba U
El rechazo o aceptacin de la hiptesis nula depende del valor del estadstico calculado, en esta
caso U, y su probabilidad asociada. De la misma forma que el resto de pruebas estadstica, para que
los resultados sean significativos, es decir, rechazar la hiptesis nula y afirmar la diferencia entre
las puntuaciones de la variable dependiente, el valor de esa probabilidad debe ser inferior a 0,05.
24
Esto ndica que la hiptesis nula planteada tiene pocas probabilidades de ocurrencia y, por tanto,
debe ser rechazada.
Comprensin lectora (0-30)
Mann-Whitney U
63,000
Wilcoxon W
234,000
Z
-2,799
Asymp. Sig. (2-tailed)
,005
a. Not corrected for ties.
Tabla 9. Prueba U de Mann-Whitney
En este caso se pueden afirmar diferencias en la variable dependiente (comprensin lectora) entre
los grupos. El valor de la probabilidad asociada es igual a 0,005, inferior al 0,05 que se utiliza como
margen de error.
Para conocer qu grupo ha obtenido mayores puntuaciones en la variable dependiente debe
observarse la tabla de rangos. Un mayor rango ndica que ese grupo obtiene mayores puntuaciones
en la variable dependiente.
En este caso se cuenta con tres grupos de comparacin pero los resultados son los mismos que se
obtienen con la prueba U de Mann-Whitney. Una primera tabla de rangos que describe las
puntuaciones medias de los tres grupos (Tabla 10) y otra para los resultados concretos del contraste
de hiptesis (Tabla 11).
Nivel socioeconmico N Mean Rank
Comprensin lectora (0-30)Alto
12 23,00
Medio
12 18,83
Bajo
12 13,67
Total
36
Tabla 10. Rangos. Prueba H
Se aplica la prueba no Paramtrica porque los grupos a comparar nicamente cuentan con 12 casos
cada uno. En la tabla anterior se observa que el grupo de nivel socioeconmico alto es el que mayor
rango promedio obtiene, con un valor de 23.
Para comprobar si las diferencias encontradas en la tabla de rangos son estadsticamente
significativas, se debe observar la Tabla 11.
25
Test Statisticsa
Comprensin lectora (0-30)
Chi-Square
4,738
df
2
Asymp. Sig.
,094
a. Kruskal Wallis Test
Tabla 11. Prueba H de Kruskal Wallis
Los resultados del contraste aparecen en dos tablas (Tabla 12 y Tabla 13). En la primera se
muestran los rangos diferenciados en tres categoras. En primer lugar los rangos negativos que
indican los casos en los que la puntuacin del pretest es mayor que la del postest; en segundo lugar,
los rangos positivos que indican cuando la puntuacin del postest es mayor a la del pretest; y,
finalmente, los empates.
En este ejemplo hay 0 rangos negativos, 3 positivos y 33 empates. Por tanto, en ningn caso la
puntuacin del pretest es mayor que la del postest; en 3 casos ocurre al revs, es mayor el postest; y
en la mayora de los casos (33) se obtiene la misma puntuacin en el pretest y en el postest.
Rangos Negativosa
Rangos Positivosb
Empatesc
Total
N
0a
3b
33c
36
Media de
Rangos
,00
2,00
Suma de
Rangos
,00
6,00
26
N
0a
3b
33c
36
Rangos Negativosa
Rangos Positivosb
Empatesc
Total
a. Nivel de Vocabulario (postest) < Nivel de Vocabulario (pretest)
b. Nivel de Vocabulario (postest) > Nivel de Vocabulario (pretest)
c. Nivel de Vocabulario (postest) = Nivel de Vocabulario (pretest)
Tabla 12. Rangos. Prueba W de Wilcoxon
Media de
Rangos
,00
2,00
Suma de
Rangos
,00
6,00
El valor de probabilidad asociada al estadstico calculado es de 0,083, valor que se encuentra por
encima de 0,05. Por tanto, debe aceptarse la hiptesis nula y no se pueden afirmar diferencias
entre las puntuaciones de pretest y postest.
Los resultados del contraste aparecen en dos tablas (Tabla 14 y Tabla 15). La primera es una tabla
de contingencia que analiza el nmero de casos que hay en las distintas categoras de las variables
(cuntos casos no superan el pretest y postest; cuntos no superan el pretest y s el postest; cuntos
casos superan el pretest y el postest; cuntos casos superan el pretest, pero no el postest). La
segunda tabla indica si los cambios entre pretest y postest son significativos.
Tabla de contingencia VOCA_Pre * VOCA_Post
27
VOCA_Pr No
Recuento
e
Supera % dentro de COM2
Supera Recuento
% dentro de COM2
Total
Recuento
% dentro de COM2
Tabla 14. Tabla
VOCA_Post
No Supera Supera
10
7
58,8%
41,2%
5
8
38,5%
61,5%
15
15
50,0%
50,0%
de contingencia
Total
17
100,0%
13
100,0%
30
100,0%
Para comprobar si los cambios entre pretest y postest son estadsticamente significativos debe
observarse la siguiente tabla:
Pruebas de chi-cuadrado
Sig. exacta
Valor
(bilateral)
Prueba de McNemar
,774a
N de casos vlidos
30
a. Utilizada la distribucin binomial
Tabla 15. Prueba de mcnemar
El resultado de la prueba indica que la probabilidad asociada al estadstico (o,774) supera al nivel
de error asumido (0,05) y, por tanto, debe aceptarse la hiptesis nula y afirmar que no hay un
mayor nmero de casos que supere la prueba de vocabulario en el postest que en el pretest.
Los resultados de esta prueba se presentan en dos tablas (Tabla 16 y Tabla 17). En la primera
aparecen las frecuencias observadas (Observed N) que es el n de sujetos en cada categora de la
variable analizada, por ejemplo, hay 9 casos con madurez lectora baja y 19 con media; las
frecuencias esperadas (Expected N) si las categoras tuvieran el mismo n de casos, 12 casos en
cada categora; y el residual que es la diferencia entre las observadas y las esperadas. La segunda
tabla incluye los resultados del estadstico chi-cuadrado y su probabilidad asociada:
Observed N Expected N Residual
28
Baja
12,0
-3,0
19
12,0
7,0
Alta
12,0
-4,0
Total
36
Media
Rho de Spearman: se utiliza cuando las variables tienen naturaleza cualitativa ordinal o
tambin con variables cuantitativas pero con muestras pequeas (menos de 30 casos).
Otras alternativas a este coeficiente son Tau b y Tau c y gamma.
29
Hiptesis nula: Las variables madurez lectora y nivel de vocabulario, ambas con tres
categoras (baja-media-alta) no estn relacionadas.
Hiptesis alternativa: Las variables madurez lectora y nivel de vocabulario, ambas con
tres categoras (baja-media-alta) S estn relacionadas.
A modo de ejemplo, se han calculado los cuatro coeficientes posibles entre variables ordinales. En
la prctica nicamente se necesita uno de ellos. El ms utilizado es Spearman (Tabla 18).
Spearman's
rho
Categorizacin Madurez
Lectora
Categorizacin
Madurez Lectora
1,000
Categorizacin Nivel de
Vocabulario
,916**
Correlation
Coefficient
Sig. (2-tailed)
.
N
36
Categorizacin Nivel de Correlation
,916**
Vocabulario
Coefficient
Sig. (2-tailed)
,000 .
N
36
**. Correlation is significant at the 0.01 level (2-tailed).
Tabla 18. Correlacin de Spearman entre Madurez lectora y nivel de vocabulario categorizadas.
,000
36
1,000
36
De la misma forma que en el resto de contraste de hiptesis, debe observarse el valor del
coeficiente, junto con el valor de la probabilidad asociada. Si ese valor es inferior a 0,05 el valor de
la correlacin es significativo. En caso contrario no se podr confirmar la relacin entre las
variables estudiadas.
En este caso, el coeficiente de Spearman es igual a 0,916 y la probabilidad asociada al estadstico
(sig. (2-tailed) es 0,000, valor inferior a 0,05. Por tanto, la correlacin es significativa.
El programa SPSS marca con un asterisco (*) las correlaciones que son significativas considerando
un nivel de error de 0,05 y con dos (**) las que lo son con 0,01, es decir, con un nivel de confianza
del 95% o del 99%
30
En la tabla de resultados (Tabla 18) aparecen dos coeficientes de correlacin porque es una tabla
simtrica. Incluye los valores de correlacin entre madurez lectora y nivel de vocabulario y tambin
entre nivel de vocabulario y madurez lectora.
El resto de coeficientes de correlacin para variables ordinales (Tabla 19) muestran valores muy
similares:
Asymp. Std.
Value
Error
Approx. T Approx. Sig.
Ordinal by Ordinal Kendall's tau-b
,902
,051
8,947
,000
Kendall's tau-c
,813
,091
8,947
,000
Gamma
1,000
,000
8,947
,000
N of Valid Cases
36
Tabla 19. Correlacin tau-b, tau-c y gamma entre Madurez lectora y nivel de vocabulario categorizadas.
Todos los coeficientes resultan significativos. Los valores de probabilidad asociada (Approx. Sig.)
son inferiores a 0,05. Un anlisis en profundidad de cada uno de ellos indican que tau-b es el que
obtiene un valor ms parecido a Spearman (Tau-b= 0,902 y Spearman= 0,916). El coeficiente
Gamma indica una correlacin perfecta entre las variables, con un valor de 1. En cambio, tau-c es el
ms conservador de los tres, con un valor de 0,813. No obstante, las diferencias entre coeficientes
son mnimas. En todos los casos la intensidad de la correlacin es alta.
2.4.2 CORRELACIN ENTRE DOS VARIABLES CUALITATIVAS NOMINALES. CHICUADRADO PARA LA INDEPENDENCIA
Finalmente, el coeficiente de correlacin chi-cuadrado se utiliza cuando las variables analizadas
tienen naturaleza cualitativa (por ejemplo, lateralidad (izquierda-derecha) o sexo (mujer-varn),
etc.). Tambin se emplea cuando se correlaciona una variable cualitativa nominal con otra ordinal.
El coeficiente chi-cuadrado se interpreta de forma distinta al resto de coeficientes de correlacin
porque no hay valores negativos.
En los coeficientes de Pearson, Spearman, tau-b, tau-c y gamma los valores oscilan entre -1 y +1. En
el caso de chi-cuadrado nicamente puede indicarse si la correlacin es significativa o no, en
funcin de la probabilidad asociada. Si es inferior a 0,05 ser una relacin significativa.
nicamente pueden compararse coeficientes chi-cuadrado entre s y, en ese caso, un mayor valor
quiere decir una relacin ms potente entre las variables.
Las hiptesis a contrastar son las siguientes:
Los resultados se distribuyen en dos tablas. La primera (Tabla 20) es una tabla de contingencia que
muestra el nmero de sujetos con los que cuenta cada una de las categoras de las variables. O ms
bien, del cruce de categoras de las dos variables analizadas.
En este ejemplo, cuntos alumnos han asistido a preescolar y tienen un nivel de vocabulario bajo (1
caso), cuntos medio (9 casos) y cuntos un nivel alto (6 casos). La tabla tambin proporciona la
misma informacin para los que no han asistido a preescolar, 6 casos tienen un nivel de
vocabulario bajo, 11 medio y 1 alto.
31
Analizando la tabla de contingencia se observa cierta tendencia. Hay un mayor nmero de casos
con nivel de vocabulario alto y que han asistido a preescolar. En cambio, los que no han asistido a
preescolar tienen un mayor nmero de casos con nivel de vocabulario bajo.
Categorizacin Nivel de Vocabulario
Baja
Media
Alta
Total
Asistencia a Preescolar S
1
9
6
16
No
6
11
1
18
Total
7
20
7
34
Tabla 20. Tabla de contingencia de Asistencia a preescolar y nivel de vocabulario
Los resultados tambin incluyen un grfico de barras (Figura 20) con la misma informacin que la
tabla de contingencia:
Para confirmar est relacin debe observarse la tabla de chi-cuadrado (Tabla 21). Este coeficiente
no analiza rangos, estudia el nmero de casos de casos de cada categora y su posible tendencia. En
la tabla aparecen varios coeficientes pero debe observare nicamente chi-cuadrado (chi-square).
La manera de conocer si el estadstico chi-cuadrado ha resultado significativo es la misma que en el
resto de contrastes de hiptesis. Valores de probabilidad (Asymp. Sig. (2-sided)) inferiores a 0,05
indican que la relacin ha resultado significativa. Por tanto, las dos variables cualitativas
estudiadas estn correlacionadas.
En este ejemplo la probabilidad asociada a chi-cuadrado es de 0,027, un valor inferior al 0,05. Por
tanto, las variables asistencia a preescolar y nivel de vocabulario estn relacionadas. No es posible
conocer la intensidad de la relacin a no ser que se compare con otros coeficientes chi-cuadrado.
Chi-cuadrado no tiene intervalos establecidos como el coeficiente de correlacin de Pearson que
oscila entre -1 y +1. En ese caso, un mayor de chi indica mayor intensidad de la relacin entre
variables.
Pearson Chi-Square
Likelihood Ratio
Value
7,250a
8,007
df
32
Linear-by-Linear
6,957
1
,008
Association
N of Valid Cases
34
a. 4 cells (66,7%) have expected count less than 5. The minimum
expected count is 3,29.
Tabla 21. Prueba Chi-cuadrado
Hay una adaptacin del coeficiente de correlacin chi-cuadrado que se utiliza cuando las dos
variables cualitativas analizadas tienen el mismo nmero de categoras. Por ejemplo, si tratamos de
relacionar el gnero (Mujer-Hombre) con la variable sociabilidad (alta sociabilidad-baja
sociabilidad). Es el coeficiente de contingencia
Los resultados tambin se presentan en dos tablas. La primera es una tabla de contingencia (Tabla
22) que representa las frecuencias de cada categora obtenida con el cruce de las dos variables. En
este caso: mujeres con alta sociabilidad, mujeres con baja sociabilidad, varones con alta
sociabilidad y varones con baja sociabilidad. La segunda (Tabla 23) muestra los resultados
concretos del coeficiente de contingencia y su probabilidad asociada.
Extroversin y sociabilidad
Alta sociabilidad Baja sociabilidad Total
SEXO Mujer
30
18
48
Varn
25
27
52
Total
55
45 100
Tabla 22. Tabla de contingencia de sexo y sociabilidad
Los valores del coeficiente de contingencia oscilan entre 0 y 1. Valores cercanos a 1 indican una
relacin muy potente entre las variables y cercanos a 0 indican ausencia de relacin. No es posible
diferenciar entre relacin directa o inversa. No obstante, para que el coeficiente resulte significativo
el valor de la probabilidad asociada debe ser inferior a 0,05.
Value Approx. Sig.
Nominal by Nominal Contingency Coefficient ,143
,148
N of Valid Cases
100
Tabla 23. Coeficiente de Contingencia.
En este ejemplo, el valor del coeficiente de contingencia es 0,143 y la probabilidad asociada es igual
a 0,148. Este valor de probabilidad es superior a 0,05 y, por tanto, la relacin entre las variables
sexo y sociabilidad no resulta significativa.