Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Primera Edicin, 2002.
2002 Francisco Jurez Garca
Instituto Nacional de Psiquiatra Ramn de la Fuente,
Direccin de Investigacin Epidemiolgicas y Psicosociales
Calzada Mxico Xochimilco 101,
Col. San Lorenzo Huipulco,
14370 Mxico, D. F.
Tel.: 56 55 28 11 ext. 202 fax: 55 13 34 46
e-mail: pacojg@imp.edu.mx
Reservados todos los derechos
ISBN: 968-7652-41-1
Impreso en Mxico / Printed in Mexico
Agradeceremos todos los comentarios relativos a esta gua, estos deben ser enviados a la direccin
arriba mencionada.
El presente trabajo debe ser citado como sigue:
Jurez, F., Villatoro, J. A. y Lpez, E. K. (2002). Apuntes de Estadstica Inferencial. Mxico, D. F.:
Instituto Nacional de Psiquiatra Ramn de la Fuente.
Contenido
Presentacin ................................................................................................................................ i
Agradecimientos ......................................................................................................................... ii
ndice de Tablas ........................................................................................................................ iii
Conceptos Bsicos ...................................................................................................................... 1
Medicin ............................................................................................................................. 2
Niveles de Medicin ........................................................................................................... 2
Estadstica Descriptiva ....................................................................................................... 4
Curvas de Distribucin de Frecuencias ........................................................................ 5
Distribucin Normal o Curva Normal (Campana de Gauss) ....................................... 5
Calificaciones z o estandarizadas ................................................................................. 6
Estadstica Inferencial ......................................................................................................... 8
Estadstica Inferencial Univariada ............................................................................... 8
Tipos de problema .................................................................................................. 8
Estadstica Multivariada ............................................................................................... 9
Estadstica Paramtrica ................................................................................................ 10
Estadstica No Paramtrica ........................................................................................... 10
Planteamiento de hiptesis estadstica ......................................................................... 10
Hiptesis de Problemas de Comparacin ............................................................... 10
Hiptesis de Problemas de Asociacin .................................................................. 11
Construccin de hiptesis de acuerdo al nivel de medicin ................................... 12
Cul es el sentido del nivel de significancia o la probabilidad? ................................. 13
Decisin estadstica ...................................................................................................... 13
Grados de libertad ........................................................................................................ 15
Reglas de decisin ........................................................................................................ 15
Estadstica Inferencial Univariada: Pruebas Estadsticas Seleccionadas ................................. 17
Cmo Presentar Resultados Anlisis Estadsticos ............................................................. 17
Criterios importantes para seleccionar el tipo de prueba en un estudio ............................. 18
Pruebas de Comparacin .................................................................................................... 19
Prueba t de Student ....................................................................................................... 19
Prueba t de Student para grupos independientes .................................................... 19
La prueba t para muestras independientes en el paquete estadstico SPSS ...... 21
Reporte de resultados de la prueba t ................................................................. 22
Prueba t de Student para muestras relacionadas ..................................................... 23
La prueba t de Student para muestras relacionadas en
el paquete estadstico SPSS .............................................................................. 25
Reporte de resultados de la prueba t para muestras relacionadas .................... 25
Prueba U de Mann-Whitney ......................................................................................... 27
La prueba U de Mann-Whitney en el paquete estadstico SPSS ............................ 29
Reporte de resultados de la prueba U de Mann Whitney ....................................... 30
Presentacin
El presente trabajo va dirigido a psiclogos en formacin y para todos
aquellos interesados en la investigacin en psicologa y reas afines,
donde la estadstica es una de las principales herramientas.
Fue escrito para servir de apoyo al profesor en cursos introductorios de
estadstica inferencial, sin embargo, est diseado como una gua de
autoaprendizaje y material de consulta, ya que se explica la forma de
seleccionar la prueba estadstica de acuerdo con los problemas de
investigacin que se plantean en las reas psicolgica y social.
Se exponen adems los pasos necesarios para obtener diversas pruebas
estadsticas univariadas e interpretar los resultados conseguidos, de
manera que sea posible responder a las preguntas de investigacin
planteadas. Se incluyen ejemplos de los datos que brinda el paquete
estadstico SPSS versin 10 y una seccin sobre cmo reportar los
hallazgos.
Espero que este esfuerzo sea de especial utilidad para quienes inician su
formacin y para los profesores que los introducen en esta rea.
Francisco Jurez
Diciembre de 2001
Agradecimientos
Al grupo del Seminario de Estadstica de la maestra y del doctorado en
Ciencias de la Salud Mental Pblica (febrero a agosto de 2001), de la
Facultad de Medicina, UNAM e Instituto Nacional de Psiquiatra Ramn
de la Fuente Muiz, del maestro Jorge Villatoro, por su aportacin a la
seccin de Conceptos Bsicos:
Consuelo Garca Andrade, Jos Javier Elizalde Gonzlez, Juan Luis
Durn Casas, Mara de Lourdes Eriksen Persson, Mara Elena Rivera
Heredia, Mara Teresa Espinosa Melndez, Martha Cordero
Oropeza, Nivaldo Linares Prez y Yara Amelia Brom Valladares.
A las Psiclogas Pamela Vernica Esquivel Reyes y Daniela Verderi
Muuzuri, integrantes del grupo 33 de Estadstica Inferencial, de la
Licenciatura en Psicologa (agosto a diciembre de 2001), Universidad
Intercontinental, por sus contribuciones al mejoramiento del material.
A la maestra Elsa Karina Lpez Lugo, la licenciada Nora Anglica
Martnez Vlez y la licenciada Luca Vzquez Prez, por brindar su
tiempo al hacer la revisin de este documento y ofrecer sus ideas para ser
incluidas en el mismo.
Muy especialmente al maestro Jorge Ameth Villatoro Velzquez, por sus
conocimientos y comentarios, que forman parte de estos apuntes.
ii
ndice de Tablas*
Tabla de Valores Crticos para la Prueba t ............................................................................... 21
Tabla de Valores Crticos para U ............................................................................................. 29
Valores crticos de T+ para la prueba de rangos asignados de Wilcoxon de una cola .............. 32
Valores crticos de Chi Cuadrada a los Niveles de significancia de 0.05 y 0.01 ..................... 37
Valores crticos de 5% y 1 % para la distribucin de F ........................................................... 47
Valores crticos para el anlisis de varianza unifactorial por rangos
de Kruskal-Wallis (KW) ........................................................................................................... 53
Valores crticos de z para el nmero de comparaciones mltiples
con hiptesis bidireccional ....................................................................................................... 54
Valores crticos para la prueba estadstica de anlisis de varianza
de dos clasificaciones por rangos de Friedman (Fr) ................................................................. 59
Valores crticos de z para el nmero de comparaciones mltiples
con hiptesis bidireccional ....................................................................................................... 60
Valores crticos de r para diferentes niveles de significancia .................................................. 70
Valores crticos del coeficiente de correlacin de Spearman (rS)
de rangos ordenados, para una prueba bidireccional ................................................................ 75
Se presentan slo ejemplos de cmo localizar los valores crticos para cada prueba, para revisar las tablas completas se
puede acudir a:
Downie, M. y Heath, R. (1973). Mtodos estadsticos aplicados. Mxico: Harper & Row Latinoamericana.
Siegel, S. (1990). Estadstica no paramtrica (3ra. ed.). Mxico: Editorial Trillas.
iii
iv
Conceptos Bsicos
La estadstica es un conjunto de procedimientos para reunir, clasificar, codificar, procesar, analizar y
resumir informacin numrica adquirida sistemticamente (Ritchey, 2002). Permite hacer inferencias
a partir de una muestra para extrapolarlas a una poblacin.
Aunque normalmente se asocia a muchos clculos y operaciones aritmticas, y aunque las
matemticas estn involucradas, en su mayor parte sus fundamentos y uso apropiado pueden
dominarse sin hacer referencia a habilidades matemticas avanzadas. De hecho se trata de una forma
de ver la realidad basada en el anlisis cuidadoso de los hechos (Ritchey, 2002). Es necesaria sin
embargo la sistematizacin para reducir el efecto que las emociones y las experiencias individuales
puedan tener al interpretar esa realidad.
De esta manera la estadstica se relaciona con el mtodo cientfico complementndolo como
herramienta de anlisis y, aunque la investigacin cientfica no requiere necesariamente de la
estadstica, sta valida muchos de los resultados cuantitativos derivados de la investigacin.
La obtencin del conocimiento debe hacerse de manera sistemtica por lo que deben planearse todos
los pasos que llevan desde el planteamiento de un problema, pasando por la elaboracin de hiptesis
y la manera en que van a ser probadas; la seleccin de sujetos (muestreo), los escenarios, los
instrumentos que se utilizarn para obtener los datos, definir el procedimiento que se seguir para
esto ltimo, los controles que se deben hacer para asegurar que las intervenciones son las causas ms
probables de los cambios esperados (diseo); hasta la eleccin del plan de anlisis idneo para el tipo
de datos que se estn obteniendo, es aqu donde la estadstica entra en el estudio, aunque pueden
existir otras herramientas de anlisis si se est haciendo una investigacin de corte cualitativo.
Una buena planeacin permitir que los resultados puedan ser reproducidos, mediante la
comprobacin emprica, por cualquier investigador interesado en refutar o comprobar las
conclusiones que se hagan del estudio. De esta manera tambin se lograr la prediccin de los
fenmenos que se estn estudiando, ayudando a conocer y prevenir los problemas sociales e
individuales que forman parte del objeto de estudio de la psicologa.
El tratamiento de los datos de la investigacin cientfica tiene varias etapas:
En la etapa de recoleccin de datos del mtodo cientfico, se define a la poblacin de inters y se
selecciona una muestra o conjunto de personas representativas de la misma, se realizan experimentos
o se emplean instrumentos ya existentes o de nueva creacin, para medir los atributos de inters
necesarios para responder a las preguntas de investigacin. Durante lo que es llamado trabajo de
campo se obtienen los datos en crudo, es decir las respuestas directas de los sujetos uno por uno, se
codifican (se les asignan valores a las respuestas), se capturan y se verifican para ser utilizados en las
siguientes etapas.
Medidas de
tendencia central y
dispersin
Compara
Nominal
y
moda, porcentaje
Proporciones
Ordinal
!
moda, porcentajes,
mediana
Medianas
Nivel
moda, porcentajes,
mediana, media,
Distancias
desviacin estndar
Intervalar LJXDOHV
varianza, curtsis,
>, <, 0 relativo
sesgo, rango, decles,
cuartiles, percentiles
Igual a
Razn o
intervalar, 0
igual a intercalar
proporcin
absoluto
Anlisis
Ejemplo
Inferencial no paramtrica:
Presencia de estrs
X, McNemar, Coeficiente
(si o no), Religin
Phi
Inferencial no paramtrica:
Calidad (Buena,
U de Mann Whitney.
mediana, mala),
Kolmogorov Smirnoff,
Nivel
Friedman, Wilcoxon, prueba
socioeconmico
de los signos, correlacin
(alto, medio, bajo)
Spearman
Medias
Inferencial paramtrica: t de
Student, ANOVA, regresin,
correlacin Pearson
Temperatura,
atributos
psicolgicos
Igual a
intervalar
Igual a intervalar
Las variables intervalares y de razn se pueden incluir en operaciones aritmticas y para efectos de
anlisis estadsticos se consideran con las mismas propiedades y se clasifican en un rubro general
llamado nivel escalar.
Las variables ordinales, por otro lado, aparentemente no se pueden sumar, pero cuando se tiene una
escala con reactivos calificados en un nivel ordinal, al ser sumados el resultado de esta suma puede
ser considerado como intervalar, ya que matemticamente se comporta como tal.
Descriptiva
Estadstica
Univariada
(una VI y una VD)
Inferencial
Multivariada
Curvas de Distribucin de Frecuencias
Las curvas de distribucin de frecuencias derivan de histogramas o polgonos de frecuencias que se
sustituyen por una curva suavizada, el rea bajo la curva representa al total de los casos en la
poblacin y es igual a una proporcin de 1 o un porcentaje igual al 100% (Ritchey, 2002).
Distribucin Normal o Curva Normal (Campana de Gauss)
La curva normal es un modelo terico o ideal sobre cmo debe comportarse la distribucin de las
variables en una muestra, se obtuvo de una ecuacin matemtica.
Representa una curva de distribucin de frecuencias en la que la mediana, la moda y la media de una
variable son iguales entre s, tiene forma de campana (Ritchey, 2002). Su utilidad puede ayudarnos a
entender situaciones reales.
Muchas variables relacionadas a atributos psicolgicos, como la inteligencia medida en trminos de
Coeficiente Intelectual (CI), se distribuyen en la poblacin tomando la forma de la curva normal, en
que la mayora de los casos se encuentran en el centro (Moda), existiendo pocos casos en los
5
X X
s
Es decir, qu tanto se aleja la puntuacin del sujeto de la media, y luego se compara con la desviacin
estndar, en otras palabras, se estandariza.
Al analizar la curva normal en trminos de puntuaciones z, y recordando que el rea bajo la curva
representa el 100% de los casos, una desviacin estndar tomada a cada lado de la media incluye un
rea de 68.26% de la total. Toda el rea incluida por 2 unidades de desviacin estndar a ambos lados
de la media comprenden el 95.44% de los casos, si se contina a la tercer desviacin estndar a cada
lado de la media, se toma otra parte igual a 2.15% del rea total. La suma de todas las reas abarcadas
por estas 6 unidades de desviacin estndar es igual a 99.74% del total. El 95% del rea bajo la curva,
est entre 1.96 y 1.96 desviaciones estndar, el 99% entre -2.58 y 2.58 y el 99.9% entre 3.90 y
3.90, estos tres grupos de desviaciones son particularmente importantes en la estadstica inferencial
como se ver ms adelante.
Para interpretar el rea bajo la curva.
x El rea bajo la curva representa el 100%. La mitad representa el 50% de cada lado
x El rea bajo la curva es igual a 1 (convertida en trminos de proporcin)
x Para conocer el rea bajo la curva se necesitan las puntuaciones z
34.13%
-3
-2
-1
0
+1
+2
+3
68.26%
95%
99%
Utilizando esta informacin se puede calcular el rea comprendida entre dos puntos con base en las
puntuaciones crudas. Por ejemplo: Una poblacin de 1000 sujetos, tiene una media de edad de 75
aos y una desviacin estndar de 8, cuantas personas tienen entre 67 y 75 aos?
34.13%
341
51
59
67
75
83
91
99
z
ASOCIACIN
Aqu se puede o no tener una
variable dependiente, pero eso no
es relevante pues slo se busca
saber la relacin existente entre
dos variables
a) Asociacin.- En este tipo de problemas slo hay dos eventos que se relacionan o asocian
(correlacin)
b) Comparacin.- Tambin llamada prueba de hiptesis. Se comparan grupos o mediciones e
intervienen dos tipos de variables
Variable dependiente (V. D.), es el fenmeno o proceso que se va a medir, sus variaciones
dependen de la variable independiente
Variable independiente (V. I.), es la variable que identifica los tratamientos empleados para
influir sobre la variable dependiente, esta variable define los grupos que van a ser comparados
Cmo saber si el problema es de asociacin o comparacin?
1) Se tienen grupos?
Si la respuesta es: NO, entonces es poco probable que sea de comparacin, pero no imposible.
Si la respuesta es: SI, se est comparando.
2) Hay Tratamientos (Tx)? (Se hace un experimento o intervencin?)
Si la respuesta es SI: se est comparando
Si la respuesta es NO: casi seguro es de asociacin
8
Estadstica Inferencial
No paramtrica
Paramtrica
La estadstica paramtrica necesita cumplir con cuatro requisitos para poderse aplicar:
1. La variable dependiente debe distribuirse normalmente (campana de Gauss) o muy similar
2. Homocedasticidad u homogeneidad de varianzas o varianzas iguales: que cuando se comparan
grupos estos tengan la misma dispersin con respecto a la media de la variable dependiente
3. Asignacin y Seleccin aleatoria de los grupos (muestreo completamente al azar)
4. Que la variable dependiente est medida a nivel intervalar o de razn
Estos requisitos deben ser cubiertos para poder generalizar con base en los estimadores y hacer
conclusiones de una muestra a la poblacin.
Por otro lado, la Estadstica No Paramtrica:
1. Est libre de curva, no necesita distribuirse como la curva normal
2. Se basa en frecuencias, porcentajes, modas y rangos
3. Su nivel de medicin es ordinal o nominal
Planteamiento de la hiptesis estadstica
La Hiptesis es la respuesta tentativa para la solucin de la pregunta de investigacin.
Al realizar inferencias estadsticas, se acostumbra adoptar un modelo de decisin. Este modelo consta
de cuatro elementos:
x Hiptesis nula (H0)
x Hiptesis alterna (H1)
x Nivel de significancia que ha de utilizarse en la prueba estadstica
x Regla de decisin
Hiptesis para Problemas de Comparacin
En la prueba de hiptesis se trabaja con dos hiptesis estadsticas que deben enunciarse
explcitamente: la hiptesis que debe probarse o hiptesis nula que se establece con el propsito de
ser rechazada, y la hiptesis alterna que es la conclusin a la que se espera llegar.
Con un nivel intervalar o de razn de la V. D. se comparan medias, la hiptesis nula plantea que las
dos medias son iguales:
H0: X 1 = X 2
y la hiptesis alterna plantea que las medias son diferentes:
H1: X 1 X 2
10
La hiptesis alterna afirma que hay correlacin:
H1: r z 0
Construccin de hiptesis de acuerdo al nivel de medicin
Las hiptesis estadsticas tienen que incluir la variable dependiente en primer lugar y la
independiente en seguida. Para la redaccin de dichas hiptesis se toma en cuenta el nivel de
medicin utilizado de las variables del estudio.
Para los problemas de comparacin:
Nivel NOMINAL: Aqu se habla de proporciones y / o categoras.
Cmo es la relacin entre fumar o no y morir por cncer pulmonar?
H0: La proporcin de sujetos que mueren por cncer pulmonar es igual entre fumadores y no
fumadores.
H1: La proporcin de sujetos que mueren por cncer pulmonar es diferente entre fumadores y no
fumadores
Nivel ORDINAL: Aqu se habla de jerarquas y / o niveles.
Cmo es el nivel de creatividad entre los nios de comunidades rurales, urbanas e indgenas?
H0: El nivel de creatividad es igual entre nios de comunidades rurales, urbanas e indgenas.
H1: El nivel de creatividad es diferente entre nios de comunidades rurales, urbanas e indgenas.
Nivel INTERVALAR: Se comparan las medias y tambin se habla de niveles.
Se desea conocer cmo el nivel de estrs de los sujetos afecta su nivel de irritabilidad hacia sus
compaeros de trabajo. Para ello se conformaron tres grupos, bajo estrs, estrs regular y alto estrs,
con 7 profesionistas cada uno, a quienes se les evalu su nivel de irritabilidad preguntndoles en una
HVFDODGHDTXHLQGLTXHFRWLGLDQDPHQWHTXpWDQLUULWDEOHVHPXHVWUDFRQVXVFRPSDxHURVGH
WUDEDMR"
H0: El nivel de irritabilidad hacia los compaeros de trabajo es igual entre los tres grupos de estrs.
H1: El nivel de irritabilidad hacia los compaeros de trabajo es diferente entre los tres grupos de
estrs.
11
H1: X 1 < X 2
Cuando se tienen medianas (nivel ordinal de la V. D.), entonces:
H0: Md1 = Md2
H1: Md1 > Md2
H1: Md1 < Md2
O con proporciones o porcentajes (nivel nominal de la V. D.):
H0: P1 = P2
H1: P1 > P2
H1: P1 < P2
Para esta gua se presentarn nicamente planteamientos para hiptesis de dos colas.
Cul es el sentido del nivel de significancia o la probabilidad?
La probabilidad (p) de que un evento ocurra oscila entre 0 y 1, donde 0 significa la imposibilidad de
ocurrencia y 1 la certeza de que ocurra el fenmeno. Al lanzar al aire una moneda no cargada, la
SUREDELOLGDG GH TXH VDOJD iJXLOD HV GH \ OD SUREDELOLGDG GH TXH OD PRQHGD FDLJD HQ VRO
tambin es de 0.5. Con un dado, la probabilidad de obtener cualquiera de sus lados al lanzarlo es de
1/6=0.1667. La suma de probabilidades siempre es de 1.
Aplicando el concepto de la probabilidad a la distribucin muestral, el rea de sta corresponde a la
probabilidad total (p = 1), y consecuentemente, cualquier rea (porcentaje bajo la curva) comprendida
12
13
14
15
16
Barras o Columnas:
comparar grupos
(porcentajes,
medianas, medias)
100
80
60
40
20
0
1er trim.
2do trim.
3er trim.
4to trim.
60
50
40
30
20
10
0
0
10
20
30
40
17
Escalar
t de
Student
Ordinal
U de Mann
Whitney
X2
Escalar
Anlisis de
Varianza
Ordinal
Kruskall-
Wallis
X2
Ordinal
Escalar
t de Student
para muestras
relacionadas
McNemar
(dicotmica)
Wilcoxon
Anlisis de
varianza para
medidas
repetidas
Friedman
Q de
Cochran
(dicotmica)
Cul es el nivel de
medicin de la variable
dependiente?
Cul es el nivel de
medicin de la variable
dependiente?
Cul es el nivel de
medicin de la variable
dependiente?
Ms de dos
mediciones
Cul es el nivel de
medicin de la variable
dependiente?
Dos
mediciones
Nominal
Ms de dos
grupos
Nominal
Dos grupos
Nominal
18
Escalar
Correlacin
Biserial
Puntual
(rbp)
Spearman
(rs)
Variable 2
Escalar u ordinal
Variable 2
Dicotmica
Variable 1
Dicotmica
Variable 2
Ordinal
Variable 1
Ordinal
Variable 2
Escalar
Variable 1
Escalar
Coeficiente
Phi
Spearman
(rs)
Pearson
(rp)
Ordinal
Nominal
Esta gua fue elaborada con base en datos proporcionados por el Mtro. Jorge Ameth Villatoro Velzquez, Instituto Nacional de Psiquiatra
Pruebas de Comparacin
Prueba t de Student
La prueba t de Student es una prueba paramtrica de comparacin de dos muestras, es decir necesita
cumplir las siguientes caractersticas:
x Seleccin completamente aleatoria de los grupos
x Homocedasticidad (homogeneidad de las varianzas de la variable dependiente en ambos
grupos)
x Distribucin normal de la variable dependiente en los dos grupos
x Nivel intervalar de la variable dependiente
Su funcin es comparar dos grupos de puntuaciones (medias aritmticas) y determinar que la
diferencia no se deba al azar (que las diferencia sea estadsticamente significativa).
Esta prueba tiene dos modalidades, una para muestras independientes y otra para grupos
relacionados.
La prueba t para muestras independientes se calcula mediante la siguiente frmula:
x1 x2
t
sDx
dnde:
x1 , x2 = medias de los grupos
sDx = error estndar de la diferencia entre medias
Para calcular el error estndar de la diferencia entre medias:
x12 x22 1 1
sDx
n1 n2 2 n1 n2
Para calcular la suma de cuadrados de X:
x
Para calcular los grados de libertad:
X
gl = n1 + n2 2
Problema para explicar el procedimiento para calcular la prueba t para muestras independientes:
Se desea probar dos mtodos de enseanza del idioma ingls (mtodo tradicional y mtodo
multimedia), para lo cual al final de cada uno de los cursos se aplic una prueba de conocimientos.
Los puntajes obtenidos por los sujetos asistentes a cada uno de los cursos se muestran a continuacin,
donde X1 son las calificaciones del primer grupo (mtodo tradicional) y X2 las del segundo (mtodo
multimedia):
19
X2
38
26
24
24
30
22
X 2 = 164
X 12
676
576
324
289
324
400
324
X12 = 2913
X 22
1444
676
576
576
900
484
2
X 2 = 4656
n1 = 7
x1 = 20.14
n2 = 6
x2 = 27.33
Procedimiento:
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se va a probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
2 grupos independientes
Nivel de medicin intervalar
H0: El nivel de conocimientos del idioma ingls es igual entre el grupo del curso tradicional
(grupo 1) y el grupo del curso multimedia (grupo 2)
Prueba estadstica: Prueba t para grupos independientes
2. Se deben elevar al cuadrado los puntajes obtenidos por el grupo 1 (X1) y los del grupo 2 (X2) y
escribirlos en la columna X 12 para los puntajes elevados al cuadrado del grupo 1 y X 22 para los
puntajes elevados al cuadrado del grupo 2.
3. Sumar los puntajes obtenidos por el grupo 1 ( X 1 ) y por el grupo 2 ( X 2 ), as como los
puntajes elevados al cuadrado de cada grupo ( X 12 y X 22 ).
x12
x
2
2
1412
19881
2913
2913 2840.14 = 72.86
7
7
1642
26896
4656
4656
4656 4482.67 = 173.33
6
6
x12 = 73
x22 = 173
2913
5. Obtener el error estndar de la diferencia entre medias ( sDx )
sDx
20
73 173 1 1
7 6 27 6
246
0.143 0.167
11
22.36360.3100
6.9327 = 2.63
Prueba T
Mtodo de enseanza
Tradicional
Mult imedia
N
7
6
Media
20.14
27.33
Desv iacin
tp.
3.48
5.89
Error tp. de
la media
1.32
2.40
En la siguiente seccin se tiene a la prueba estadstica propiamente dicha:
Inicialmente se hace una prueba de homogeneidad de varianzas entre los dos grupos a comparar, que
es uno de los requisitos de las pruebas paramtricas como la prueba t. Se debe decidir si hay o no
varianzas iguales probando la siguiente H0: s12 s22 . Esto se hace mediante la prueba F de Levene
para homogeneidad de varianzas, cuyos valores se muestran en la tabla siguiente encerrados en un
valo. La regla de decisin es: si el nivel de significancia calculado es menor o igual (d) a 0.05 se
debe rechazar la H0. En el ejemplo se tiene un valor de F de 1.342 con un nivel de significancia de
0.271 que al ser mayor que 0.05, no permite rechazar la H0 y se asume que hay varianzas iguales.
Una vez superado este punto, se tienen dos renglones de valores, el superior en el que se asumen
varianzas iguales (ver datos encerrados en el rectngulo) y el inferior en que no se asumen varianzas
iguales (ver datos encerrados en el hexgono). Siguiendo el ejemplo: se prob que hay varianzas
21
F
Calif icacin de la prueba
de conocimient os
Se han asumido
v arianzas iguales
No se han asumido
v arianzas iguales
1.342
Sig.
.271
gl
Sig. (bilateral)
Dif erencia
de medias
Error tp. de
la dif erencia
-2.732
11
.020
-7.19
2.63
-12.98
-1.40
-2.623
7.862
.031
-7.19
2.74
-13.53
-.85
Media
Reporte de resultados de la prueba t
Para esta prueba se puede utilizar una grfica de barras con las medias, es importante mencionar los
valores de la prueba estadstica, grados de libertad y el nivel de significancia con que se est
rechazando, o aceptando, la hiptesis nula. Se puede poner el valor de probabilidad obtenido o
simplemente decir que es menor, o mayor, al valor que hayamos elegido para la prueba de hiptesis.
Adems se debe escribir la conclusin a la que se llega. Por ejemplo:
Promedio de Calificaciones en la
En lo que respecta a los mtodos de enseanza, se
Prueba de Conocimientos del Idioma
encontraron diferencias en el nivel de conocimientos del
Ingls por Mtodo de Estudio*
idioma ingls entre el grupo del curso tradicional y el
30
27.33
grupo del curso multimedia (t = -2.732, gl = 11,
25
20.14
p < 0.05). Como puede observarse en la grfica, el grupo
20
que llev el curso multimedia tuvo un promedio ms alto
15
en la prueba (27.33), al compararlo con el grupo asistente
10
al mtodo tradicional (20.14).
5
0
Curso Tradicional Curso Multimedia
Esta descripcin ser la base para hacer la discusin posterior
* t = -2.732, gl = 11, p = 0.02
de los resultados encontrados en el estudio.
22
d
Para calcular los grados de libertad:
D
D n
gl = n - 1
Problema para explicar el procedimiento para calcular la prueba t para muestras relacionadas:
Se desea saber si un taller es efectivo para cambiar el nivel de autoestima de un grupo de pacientes,
para ello se evala la autoestima antes de iniciar el taller y al finalizar el mismo. Los datos obtenidos
se muestran a continuacin, donde X son los puntajes de la primera medicin y Y corresponde a la
segunda medicin, D son las diferencias entre los puntajes de las 2 mediciones:
X
Y
D
D2
18
20
-2
4
16
22
-6
36
18
24
-6
36
12
10
2
4
20
25
-5
25
17
19
-2
4
18
20
-2
4
20
21
-1
1
22
23
-1
1
20
20
0
0
10
10
0
0
8
12
-4
16
20
22
-2
4
12
14
-2
4
16
12
4
16
16
20
-4
16
18
22
-4
16
20
24
-4
16
18
23
-5
25
21
17
4
16
2
D = -40
X = 340
Y = 380
D = 244
x = 17
y = 19
D = -2
n = 20
23
402
244
20
244
1600
20
244 80 164
sD
8.2
2.864
sD
2.864
20 1
2.864
19
2.864
4.359
0.657
2
0.657
3.04
gl = 20 - 1 = 19
9. Buscar el valor de t en tabla con el nivel de significancia de 0.05 y con los grados de libertad
calculados. El valor de t obtenido de las operaciones debe compararse con ese valor de tabla (ver
tabla en la pgina 21). La regla de decisin es: si el valor calculado es mayor o igual que el
valor en tabla se debe rechazar la H0.
Para este ejercicio, con 19 grados de libertad, al nivel de significancia establecido en el valor de
0.05, se tiene un valor en tabla de 2.093, el valor de t calculado es mayor al de tabla (el signo no
debe ser tomado en cuenta) por lo tanto se rechaza H0, entonces: el nivel de autoestima es
diferente entre la primera y segunda mediciones.
24
Prueba T
En la primer seccin se describen las mediciones a comparar y se presenta la correlacin entre las
mismas:
Estadsticos de muestras relacionadas
Par 1
Medicin 1
Medicin 2
Media
17.00
19.00
N
20
20
Desv iacin
tp.
3.80
4.82
Error tp. de
la media
.85
1.08
Medicin 1 y Medicin 2
20
Correlacin
.793
Sig.
.000
En la siguiente seccin se tiene a la prueba estadstica propiamente dicha en la que se describen la
diferencia media, la desviacin estndar de las diferencias, el error estndar de las diferencias, y
finalmente la prueba t:
La regla de decisin es: si el nivel de significancia calculado es menor o igual (d) a 0.05 se debe
rechazar la H0. Siguiendo el ejemplo se observa un valor de t de 3.04 con 19 grados de libertad y
un nivel de significancia de 0.007 (ver los datos en el valo), este valor de significancia es menor que
0.05 por lo que se debe rechazar la H0, entonces se tiene que afirmar que: el nivel de autoestima es
diferente entre la primera y la segunda mediciones.
Prueba de muestras relacionadas
Dif erencias relacionadas
Par 1
Medicin 1 - Medicin 2
Media
-2.00
Desv iacin
tp.
2.94
Error tp. de
la media
.66
t
-3.044
gl
19
Sig. (bilateral)
.007
25
Media
19
17
12
8
4
0
Autoestima Antes
del Taller
Autoestima Despues
del Taller
26
Prueba U de Mann-Whitney
La prueba U de Mann-Whitney pertenece a las pruebas no paramtricas de comparacin de dos
muestras independientes, es decir:
x Es libre de curva, no necesita una distribucin especfica
x Nivel ordinal de la variable dependiente
Se utiliza para comparar dos grupos de rangos (medianas) y determinar que la diferencia no se
deba al azar (que la diferencia sea estadsticamente significativa).
Se calcula mediante la siguiente frmula:
n n 1
U n1n2 x x
Rx
2
dnde:
n1, n2 = nmero de casos de cada grupo
Rx = suma de rangos de cada grupo
nx
= nmero de casos de cada grupo
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estrs entre enfermeras de terapia intensiva (X1) y las
de urgencias (X2), el nivel de estrs se midi en una escala de 0 = nada, 1 = bajo, 2 = medio, 3 = alto,
4 = muy alto, las calificaciones se muestran a continuacin:
X1
X2
R1
R2
3
4
11.5
13
2
3
8
11.5
1
2
3.5
8
1
2
3.5
8
0
1
1
3.5
2
2
8
8
1
3.5
R1 = 39
R2 = 52
n1 = 7
n2 = 6
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se debe probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
2 grupos independientes
Nivel de medicin ordinal
H0: El nivel de estrs es igual entre enfermeras de terapia intensiva (grupo 1) y enfermeras de
urgencias (grupo 2)
Prueba estadstica: Prueba U de Mann Whitney
27
Rango
1
2
3
4
5
6
7
8
9
10
11
12
13
al valor ms pequeo el rango 1, el valor ms pequeo posible es el 0
el rango para los 1 es igual a
23 45
3.5
En el caso de que existan valores
4
repetidos
(llamados
tambin
para el 2 debe considerarse que empates), el rango que les
en el orden sigue es el 6:
corresponde es igual al promedio
6 7 8 9 10
de los rangos, es decir: la suma de
8
los lugares asignados de manera
5
secuencial entre el nmero de veces
y para 3, empezando con el 11: que se repite cada nmero
11 12
11.5
2
el ltimo rango respetando la secuencia es el 13, que le corresponde
al valor 4
3.5
11.5
3. Cada uno de los rangos se debe colocar en la columna correspondiente, R1 para el grupo 1 y R2
para el segundo grupo. Una vez asignados los rangos se deben sumar para cada grupo por
separado ( R1 .y R2 ).
Esta operacin puede verificarse mediante la siguiente frmula:
N N 1
R1 R2
2
39 52
1314
2
91 = 91
4. A continuacin debe calcularse el valor de U para cada grupo:
78 39 42 56 39
7(7 1)
U1 7 6
39 42
2
2
2
U2
76 6(6 1) 52
2
42
67 52
2
42
42 28 39
31
42
52 42 21 52 11
2
5. Se debe encontrar el valor crtico de U en la tabla que se presenta en la pgina siguiente, con un
nivel de significancia establecido a 0.05 para una prueba de 2 colas, utilizando el nmero de casos
de cada grupo (n1 y n2). Una vez hecho sto, se debe elegir el valor de U ms bajo y compararlo
con el valor de U en tabla. La regla de decisin es: si el valor de U calculado es menor o igual
al de tabla, se rechaza la hiptesis nula.
En este caso con n1 = 7 y n2 = 6, se tiene un valor de U en tabla = 6, el valor obtenido (11) es
mayor a este valor por lo que no se puede rechazar la hiptesis nula, se concluye que: el nivel de
estrs es igual entre enfermeras de terapia intensiva y enfermeras de emergencia.
28
n2
n1 1 2 3 4 5
1
2
3
4
5
6
7
8
9
10
- - -
- - -
- - -
- - -
- - 0
- - 1
- - 1
- 0 2
- 0 2
0 3
-
-
-
0
1
2
3
4
4
9 10
11
- -
- -
0 1
1 2
2 3
3 5
5 6
6 8
7 10
8
-
-
1
3
5
6
8
10
12
-
0
2
4
6
8
10
13
-
0
2
4
7
-
0
-
0
3
11
76
11 21
10
10 10
1.43
7
4214
588
49
12
12
2a. La regla de decisin es: si la calificacin z es mayor o igual a 1.96 (sin tomar en cuenta el
signo) se rechaza la hiptesis nula, esto es porque este valor equivale al 95% del rea bajo la
curva normal (nivel de significancia de 0.05). Con un valor menor no podemos rechazar la
hiptesis nula.
z
2
767 6 1
12
En este caso, al tener una z de 1.43 menor a 1.96 se acepta la hiptesis nula, por lo que: el nivel
de estrs es igual entre los dos grupos de enfermeras.
La prueba U de Mann-Whitney en el paquete estadstico SPSS se encuentra en Analizar /
Pruebas no paramtricas/2 muestras independientes, los resultados para el ejemplo anterior seran
los siguientes:
Pruebas no paramtricas
Prueba de Mann-Whitney
Rangos
Niv el de estrs
Grupo
Enf ermeras de
terapia intensiv a
Emf ermeras de
urgencias
Total
Rango
promedio
Suma de
rangos
5.57
39.00
8.67
52.00
13
29
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilat eral)
Sig. exacta [2*(Sig.
unilat eral)]
Niv el de
estrs
11.000
39.000
-1.494
.135
a
.181
Reporte de resultados de la prueba U de Mann Whitney
Para esta prueba se puede utilizar una grfica de barras con las medianas, aunque se puede utilizar el
rango promedio, obtenido de dividir la suma de rangos de cada grupo entre la cantidad de casos en el
grupo, sin embargo este dato es de difcil interpretacin. Se deben mencionar los valores de la prueba
estadstica (U o z), y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis
nula. Se puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o mayor,
al valor que hayamos elegido para la prueba de hiptesis.
Nivel de Estrs entre Enfermeras de
Adems se debe escribir la conclusin a la que se llega. Por
Terapia Intensiva y de Urgencias*
ejemplo:
2
Mediana
1.5
1
0.5
0
Terapia intensiva
Urgencias
* z = -1.494, p = 0.135
30
Prueba de Wilcoxon
La prueba de rangos asignados de Wilcoxon pertenece a las pruebas no paramtricas de comparacin
de dos muestras relacionadas, es decir:
x Es libre de curva, no necesita una distribucin especfica
x Nivel ordinal de la variable dependiente
Se utiliza para comparar dos grupos relacionados de rangos (medianas) y determinar que la diferencia
no se deba al azar (que la diferencia sea estadsticamente significativa).
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estrs laboral de los trabajadores de una empresa
antes y despus de la implementacin de un programa de mejoramiento del ambiente laboral; el nivel
de estrs se midi en una escala de 0 = nada, 1 = bajo, 2 = medio, 3 = alto, 4 muy alto, las
calificaciones se muestran a continuacin:
X
3
3
2
2
2
2
1
Y
4
2
1
1
0
2
3
n = 7
D
-1
1
1
1
2
0
-2
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se debe probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
2 grupos relacionados
Nivel de medicin ordinal
H0: El nivel de estrs laboral de los trabajadores es igual antes y despus de implementar el
programa de mejoramiento del ambiente laboral.
Prueba estadstica: Wilcoxon
Rango
2. Se debe obtener la diferencia (D) entre los Ordenar las
diferencias
En el caso de que existan valores repetidos, el
puntajes de inicio (X) y de la segunda medicin mayores a 0 rango que les corresponde es igual a la suma de los
lugares asignados entre el nmero de veces que se
(Y), es decir: restar a las calificaciones de la
D
repite cada uno*
primera medicin los de la segunda. A estas
-1
1
para los 1:
diferencias se les debe asignar un rango
1
2
1 2 3 4
ordenando los datos sin considerar el signo de la
2.5
1
3
diferencia, deber empezarse con el valor ms
4
1
4
pequeo dndole el rango 1, no deben
-2
5
56
considerarse las diferencias iguales a 0
para el 2:
5.5
2
6
2
(empates), cuando esto sucede se debe ajustar el
* Ver el tratamiento de rangos en la prueba U de Mann
nmero de sujetos a: n 1, por cada empate.
Whitney para una explicacin ms detallada
31
PT
N N 1
4
T
VT
N N 1(2 N 1)
24
T PT
VT
0.6250
0.3750
0.2500
0.5625
0.1250
0.4375
0.3125
0.1875
0.5000
0.1250
0.4063
10
0.0625
0.3125
11
0.2188
0.5000
12
0.1563
0.4219
13
0.0938
0.3438
14
0.0625
0.2813
0.5313
15
0.0313
0.2188
3. Calcular la z con:
PT
VT
13
66 1
42
13
13 10.5 2.5
4
4
66 1(2)(6) 1
4213
24
24
32
2.5
4.77
0.53
546
24
22.75
4.77
Pruebas no paramtricas
Prueba de los rangos con signo de Wilcoxon
Rango
Suma de
En primer lugar se muestra la
N
promedio
rangos
a
Estrs laboral al iniciar el
Rangos negativos
2
4.0
8.0
asignacin de rangos positivos,
programa - Estrs
0
0
Rangos positivos
4 b
3.2
13.0
negativos y empates, as como
laboral
al finalizar el programa
5
0
Empates
1 c
la suma de rangos positivos y
Total
7
negativos.
a. Estrs laboral al iniciar el programa < Estrs laboral al finalizar el programa
b. Estrs laboral al iniciar el programa > Estrs laboral al finalizar el programa
c. Estrs laboral al finalizar el programa = Estrs laboral al iniciar el programa
Posteriormente
se
presenta la prueba estadstica
b
Estadsticos de contraste
en este caso el valor de la razn z, as como el
Estrs
nivel de significancia de la prueba (ver valores
laboral
al iniciar
en el valo). La regla de decisin es: si valor
el
programa
de significancia es menor o igual a 0.05 se
- Estrs
debe rechazar la hiptesis nula. En este caso
laboral
al finalizar
elprograma
no se puede rechazar H0 porque el nivel de
Z
-.541 a
significancia de 0.589 es mayor a 0.05, por lo
Sig. asintt.
.589
tanto: el nivel de estrs laboral de los
(bilateral)
trabajadores es igual antes y despus de
a. Basado en los rangos
negativos.
implementar el programa de mejoramiento del
b. Prueba de los rangos con signo de
Wilcoxon
ambiente laboral.
Rangos
33
Mediana
Reporte de resultados de la prueba de Wilcoxon
Para esta prueba se puede utilizar una grfica de barras o
lneas (ms adecuada para ver variaciones entre mediciones)
con las medianas. Se deben mencionar los valores de la
prueba estadstica y el nivel de significancia con que se est
rechazando, o aceptando, la hiptesis nula. Se puede poner el
valor de probabilidad obtenido o simplemente decir que es
menor, o mayor, al valor que hayamos elegido para la prueba
de hiptesis. Adems se debe escribir la conclusin a la que
se llega. Por ejemplo:
1.5
1
0.5
0
Estrs laboral antes
del programa
Estrs laboral
despus del
programa
* z = -0.541, p = 0.589
34
La prueba de Chi cuadrada o Ji cuadrada (X2) pertenece a las pruebas no paramtricas de
comparacin de dos o ms muestras independientes:
x No se distribuye normalmente, se utiliza la distribucin asinttica de Chi cuadrada
x Nivel nominal de la variable dependiente
Se usa para comparar dos o ms grupos independientes de proporciones organizadas en una tabla de
contingencia y determinar que las diferencias no se deban al azar (que las diferencias sean
estadsticamente significativas).
La formula para calcular la X2 es la siguiente:
f fe 2
X2 o
fe
Donde fo son las frecuencias observadas para cada una de las celdas de la tabla y fe son las
frecuencias esperadas para cada una de estas celdas.
Problema para explicar el procedimiento:
Se desea saber si las prcticas de crianza son diferentes entre padres de una orientacin poltica
conservadora y padres de orientacin poltica liberal, las prcticas de crianza estn clasificadas como
no rgida, moderada y autoritaria:
Es un problema de Comparacin
2 grupos independientes
Nivel de medicin de la variable dependiente: nominal
H0: La proporcin de padres que emplean prcticas de crianza no rgida, moderada y autoritaria es
igual entre los que tienen una orientacin poltica conservadora y los que tienen una orientacin
liberal.
Prueba estadstica: Chi cuadrada
1. En primer lugar debe generarse una tabla de contingencia en la que por regla general los grupos
son representados en las columnas y las categoras de la variable dependiente estarn
representadas en los renglones. La tabla siguiente, representa los datos cruzados del tipo de
orientacin poltica (Variable Independiente en las columnas) por el tipo de prctica de crianza
que llevan a cabo (Variable Dependiente en los renglones). En cada celdilla se captura las
frecuencias observadas (fo), obtenidas de las respuestas de los padres segn su orientacin poltica
(ver las frecuencias en cursivas).
Conservadores
Liberales
Total
No rgida
6
13.8
24
16.2
30
Moderada
13
12.9
15
15.1
28
Autoritaria
21
13.3
8
15.7
29
Total
40
47
N = 87
2. A continuacin se deben sumar los totales marginales por cada rengln, por cada columna y
obtener el nmero total de casos (N).
35
36
0.05
3.841
5.991
7.815
9.488
11.070
12.592
14.067
0.01
6.635
9.210
11.345
13.277
15.086
N AD BC
2
A B C D A C B D
X2
96
13
109
Fumaron
48
20
68
Total
144
33
N = 177
177
177 >9620 1348@
2
96 1348 2096 4813 20
177>1207.5@
35221824
1771458056.25
35221824
258075956.25
35221824
177>1296 88.5@
35221824
7.33
37
Tablas de contingencia
Tabla de contingencia Tipo Practicas de crianza * Orientacin poltica de los padres
Tipo Practicas
de crianza
No rgida
Moderada
Autoritaria
Total
38
Recuent o
% de Tipo Pract icas
de crianza
% de Orientacin
poltica de los padres
% del total
Recuent o
% de Tipo Pract icas
de crianza
% de Orientacin
poltica de los padres
% del total
Recuent o
% de Tipo Pract icas
de crianza
% de Orientacin
poltica de los padres
% del total
Recuent o
% de Tipo Pract icas
de crianza
% de Orientacin
poltica de los padres
% del total
Total
30
20.0%
80.0%
100.0%
15.0%
51.1%
34.5%
6.9%
13
27.6%
15
34.5%
28
46.4%
53.6%
100.0%
32.5%
31.9%
32.2%
14.9%
21
17.2%
8
32.2%
29
72.4%
27.6%
100.0%
52.5%
17.0%
33.3%
24.1%
40
9.2%
47
33.3%
87
46.0%
54.0%
100.0%
100.0%
100.0%
100.0%
46.0%
54.0%
100.0%
La primera parte es la tabla
de contingencia con las
frecuencias, los porcentajes
respecto a los renglones, a las
columnas y al total, estos
datos nos ayudan a describir
las distribuciones de las
proporciones.
Tablas de contingencia
Tabla de contingencia Recay con el cigarro * Bebedores
Total
Recay con No
Recuent o
109
el cigarro
% de Recay
88.1%
11.9%
100.0%
con el cigarro
% de Bebedores
66.7%
39.4%
61.6%
Primero la tabla con frecuencias y
% del total
54.2%
7.3%
61.6%
Si
Recuent o
48
20
68
porcentajes, siguiendo el segundo
% de Recay
problema planteado se tiene
70.6%
29.4%
100.0%
con el cigarro
% de Bebedores
33.3%
60.6%
38.4%
% del total
27.1%
11.3%
38.4%
Total
Recuent o
144
33
177
% de Recay
81.4%
18.6%
100.0%
con el cigarro
% de Bebedores
100.0%
100.0%
100.0%
% del total
81.4%
18.6%
100.0%
Seguida de la prueba
Pruebas de chi-cuadrado
estadstica, sin embargo,
Sig. asinttica
Sig. exacta
Sig. exacta
se agregan dos conjuntos
Valor
gl
(bilateral)
(bilateral)
(unilateral)
Chi-cuadrado de Pearson
8.441b
1
.004
de valores, la correccin
Correccin por
a
7.327
1
.007
de continuidad y la prueba
continuidad
exacta de Fisher, se debe
Razn de v erosimilitud
8.223
1
.004
Estadst ico exacto de
recordar que la correccin
.005
.004
Fisher
por continuidad se calcula
Asociacin lineal por
8.393
1
.004
lineal
para una interpretacin
N de casos v lidos
177
ms exacta, por ello se
a. Calculado slo para una tabla de 2x2.
debe usar ese valor para
b. 0 casillas (. 0%) tienen una f recuencia esperada inf erior a 5. La f recuencia mnima esperada
tomar una decisin (ver
es 12.68.
datos encerrados en el
2
rectngulo), en este caso X de 7.327 con gl = 1 y una significancia = 0.007, la regla de decisin
indica que el nivel de significancia debe ser menor o igual a 0.05 para rechazar la hiptesis
nula, como vemos la significancia obtenida (0.007) es menor que 0.05, por lo que se rechaza la
hiptesis nula, entonces: la proporcin de fumadores que recayeron en el consumo de tabaco es
diferente entre bebedores y no bebedores.
Bebedores
No
Si
96
13
39
Bebedores
* X2 = 7.327, gl = 1, p = 0.007
40
La prueba de McNemar es una prueba no paramtrica de comparacin de dos muestras relacionadas:
x Es libre de la curva normal, se ajusta a la distribucin de Chi cuadrada
x Nivel nominal (slo variables dicotmicas) de la variable dependiente
Se utiliza para comparar dos grupos relacionados de proporciones organizadas en una tabla que
representa los cambios en las respuestas de los sujetos entre una primera medicin y una posterior, y
determinar que las diferencias no se deban al azar (que las diferencias sean estadsticamente
significativas).
Los datos se organizan en una tabla como la siguiente:
Despus
-
+
Antes
Los signos + y representan las dos categoras de la variable en cada medicin, obsrvese que las
respuestas que se mantienen en ambas mediciones se encuentran en la celdilla A (- y -) y en la D (+ y
+), las celdas donde hay cambio (-, + y +, -) son la B y la C.
La formula para calcular la X2 es la siguiente:
B C 1
BC
Para la prueba de McNemar siempre se tiene un grado de libertad (gl = 1)
X
Donde B y C son las celdillas en las que se esperan los cambios, esta frmula incluye una correccin
de continuidad que mejora la estimacin de la X2, esto se hace, como se aprecia en la frmula, al
restar 1 al valor absoluto de la resta de B C (quitando el signo resultante de la resta).
Problema para explicar el procedimiento:
Se desea saber si cambi la preferencia por Fox o Crdenas despus del debate televisado, para ello
se pregunt a un grupo de posibles votantes por cul candidato votara antes del da del debate, al da
siguiente del debate se volvi a preguntar a los mismos sujetos por quin votaran, los resultados se
muestran a continuacin:
Es un problema de Comparacin
2 grupos relacionados
Nivel de medicin de la variable dependiente: nominal (dicotmica)
H0: La proporcin de posibles votantes que prefieren a Fox o a Crdenas es igual antes y despus
del debate.
Prueba estadstica: McNemar
41
Fox
20
26
Crdenas
23
26 8 1
26 8
17 2
34
289
34
8.5
Se debe buscar el valor crtico de X2 en la tabla de valores de Chi cuadrada (ver pgina 36) con un
grado de libertad y al nivel de significancia establecido para probar la H0, La regla de decisin para
rechazar la hiptesis nula es: el valor obtenido debe ser mayor o igual a la chi cuadrada en la
tabla.
El valor de X2 en tabla con 1 grado de libertad al nivel de significancia igual a 0.05 es 3.841. En este
ejemplo se encontr que la X2 es igual a 8.5, mayor a la de tabla, por esa razn se rechaza la hiptesis
nula, entonces: la proporcin de posibles votantes que prefieren a Fox o a Crdenas es diferente antes
y despus del debate televisado.
McNemar en el paquete SPSS
En el paquete estadstico se tiene la prueba de McNemar en Analizar / Pruebas no paramtricas / 2
muestras relacionadas se presentan resultados como los siguientes:
Prueba de McNemar
Tablas de contingencia
Preferencias antes del debate y
Preferencias despus del debate
Pref erencias
antes del debate
1
2
42
N
Chi-cuadrado a
Sig. asintt.
Pref erencias
antes del
debate y
Pref erencias
despus del
debate
77
8.500
.004
Finalmente se presenta el valor de Chi cuadrada y la significancia
asociada (ver datos encerrados en el valo), la regla de decisin es:
el nivel de significancia debe ser menor o igual a 0.05 para
rechazar la hiptesis nula. Se tiene que, al tener una significancia
de 0.004, menor a 0.05, se rechaza la hiptesis nula. Entonces: la
proporcin de posibles votantes que prefieren a Fox o a Crdenas es
diferente antes y despus del debate televisado.
Reporte de resultados de la prueba de McNemar
Para esta prueba se puede utilizar una grfica de barras o lneas (ms adecuada para ver variaciones
entre mediciones) con los porcentajes obtenidos en cada medicin. Se deben mencionar los valores de
la prueba estadstica y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis
nula. Se puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o mayor,
al valor que hayamos elegido para la prueba de hiptesis. Adems se debe escribir la conclusin a la
que se llega. Por ejemplo:
Se encontr que la proporcin de posibles votantes que
prefieren a Fox o a Crdenas es diferente antes y despus
del debate televisado (X2 = 8.5, p < 0.01).
Como puede apreciarse en la grfica, aument el
porcentaje de posibles votantes por Crdenas entre la
primera y segunda medicin, mientras que disminuy la
proporcin de posibles votantes por Fox.
Estos datos se utilizarn para hacer la discusin posterior de
los resultados encontrados en el estudio
% 40
20
63.6
59.7
36.4
40.3
Fox
Crdenas
0
Antes del debate
Despus del
debate
* X2 = 8.5, p = 0.004
43
44
Uno de los usos del anlisis de varianza (ANOVA por sus iniciales en ingls) es el comparar tres o
ms grupos independientes, es una prueba paramtrica, es decir necesita cumplir las siguientes
caractersticas:
x
x
x
x
El anlisis de varianza agrupa una variedad de mtodos para anlisis de datos de diseos estadsticos
muy complicados, tanto que han merecido la publicacin de diversos libros en que se describen esos
mtodos y sus aplicaciones prcticas. En este caso, se presenta la utilizacin ms simple de esta
prueba: ANOVA de una va o factor (una sola variable independiente) para probar una hiptesis
basada en las medias de tres o ms grupos independientes.
La prueba F se calcula mediante la siguiente frmula:
CM int er
CM int ra
dnde CMinter es el cuadrado medio intergrupos y CMintra es el cuadrado medio intragrupos, para
calcular ambos datos se deben obtener los siguientes valores:
1. Suma de cuadrados total (SCT):
X
SCT
X X
2
SCint er
SCT SCint er
45
12
18
16
8
6
12
10
X 1 = 82
n1 = 7
6
4
14
4
6
12
14
X
2 = 60
18
17
16
18
12
17
10
X
3 = 108
X
=250
n2 = 7
n3 = 7
N = 21
144
324
256
64
36
144
100
X 12 = 1068
36
16
196
16
36
144
196
X
22 = 640
325
289
256
324
144
289
100
X
32 = 1727
2
X
=3435
Pasos a seguir para el clculo de F
1. Una vez que se tienen los puntajes (X1, X2 y X3) se deben elevar al cuadrado para cada grupo ( X 12 ,
X 22 y X 32 ), se deben sumar los puntajes por grupo ( X 1 , X 2 y X 3 ) y hacer un total de
estas sumatorias ( X ), posteriormente sumar los puntajes elevados al cuadrado por grupo
( X 12 , X 22 y X 32 ) y tambin hacer un total de estas sumatorias ( X 2 )
2. Determinaremos el nmero de casos por grupo (n1, n2 y n3) y la suma de casos total (N) para
X )
despus obtener las medias por grupo ( X 1 , X 2 y X 3 ) y el promedio total ( X T
N
3. Teniendo los datos anteriores se deben obtener los valores necesarios para calcular la prueba F
utilizando las frmulas descritas anteriormente:
c
d
SCT
SCint er
3435
250 2
21
3435
62500
21
82 2 60 2 108 2 250 2
7
7
21
7
7
7
21
7
e
f
46
SCint ra
CM int er
165
2
82.5
CM int ra
293.8
16.3
18
glinter = 3 1 = 2
glintra = (7 1) + (7 1) + (7 1) = 6 + 6 + 6 = 18
glT = 21 1 = 20
5.06
Los datos calculados deben ser organizados en una tabla como la siguiente:
Fuentes de Variacin
gl
Suma de Cuadrados Cuadrado medio
Intergrupos
2
165
82.5
Intragrupos
18
293.8
16.3
Total
20
458.8
F
5.06
10
11
12
14
16
20
24
30
40
50
75
100
200
500
f2
161
200
216
225
230
234
237
239
241
242
243
4.052 4.999 5.403 5.625 5.764 5.859 5.928 5.981 6.022 6.056 6.082
244
6.106
245
246
248
249
250
251
252
253
253
254
254
254
6.142 6.169 6.208 6.234 6.258 6.286 6.302 6.323 6.334 6.352 6.361 6.366
18.51 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.39 19.40
98.49 99.00 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.40 99.41
19.41
99.42
19.42 19.43 19.44 19.45 19.46 19.47 19.47 19.48 19.49 19.49 19.50 19.50
99.43 99.44 99.45 99.46 99.47 99.48 99.48 99.49 99.49 99.49 99.50 99.50
10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78 8.76
8.74
8.71 8.69 8.66 8.64 8.62 8.60 8.58 8.57 8.56 8.54 8.54 8.53
34.12 30.82 29.46 28.71 28.24 27.91 29.67 27.49 27.34 27.23 27.13 217.05 26.92 26.83 26.69 26.60 26.50 26.41 26.35 26.27 26.23 26.18 26.14 26.12
7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.93
21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.54 14.45
5.91
14.37
5.87 5.84 5.80 5.77 5.74 5.71 5.70 5.68 5.66 5.65 5.64 5.63
14.24 14.15 14.02 13.93 13.83 13.74 13.69 13.61 13.57 13.52 13.48 13.46
6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74
16.26 13.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.05
4.70
9.96
4.68
9.89
4.64
9.77
4.60
9.68
4.56
9.55
4.53
9.47
4.50
9.38
4.46
9.29
4.44
9.24
4.42
9.17
4.40
9.13
4.38
9.07
4.37
9.04
4.36
9.02
5.99 5.14
13.74 10.92
4.76
9.78
4.53
9.15
4.39
8.75
4.28
8.47
4.21
8.26
4.15
8.10
4.10
7.98
4.06
7.87
4.03
7.79
4.00
7.72
3.96
7.60
3.92
7.52
3.87
7.39
3.84
7.31
3.81
7.23
3.77
7.14
3.75
7.09
3.72
7.02
3.71
6.99
3.69
6.94
3.68
6.90
3.67
6.88
5.59
12.25
4.74
9.55
4.35
8.45
4.12
7.85
3.97
7.46
3.87
7.19
3.79
7.00
3.73
6.84
3.68
6.71
3.63
6.62
3.60
6.54
3.57
6.47
3.52
6.35
3.49
6.27
3.44
6.15
3.41
6.07
3.38
5.98
3.34
5.90
3.32
5.85
3-29
5.78
3.28
5.75
3.25
5.70
3.24
5.67
3.23
5.65
5.32
11.26
4.46
8.65
4.07
7.59
3.84
7.01
3.69
6.63
3.58
6.37
3.50
6.19
3.44
6.03
3.39
5.91
3.34
5.82
3.31
5.74
3.28
5.67
3.23
5.56
3.20
5.48
3.15
5.36
3.12
5.28
3.08
5.20
3.05
5.11
3.03
5.06
3.00
5.00
2.98
4.96
2.96
4.91
2.94
4.88
2.93
4.86
5.12
10.56
4.26
8.02
3.86
6.99
3.63
6.42
3.48
6.06
3.37
5.80
3.29
5.62
3.23
5.47
3.18
5.35
3.13
5.26
3.10
5.18
3.07
5.11
3.02
5.00
2.98
4.92
2.93
4.80
2.90
4.73
2.86
4.64
2.82
4.56
2.80
4.51
2.77
4.45
2.76
4.41
2.73
4.36
2.72
4.33
2.71
10 4.96
10.04
4.10
7.56
3.71
6.55
3.48
5.99
3.33
5.64
3.22
5.39
3.14
5.21
3.07
5.06
3.02
4.95
2.97
4.85
2.94
4.78
2.91
4.71
2.86
4.60
2.82
4.52
2.77
4.41
2.74
4.33
2.70
4.25
2.67
4.17
2.64
4.12
2.61
4.05
2.59
4.01
2.56
3.96
2.55
3.93
11
4.84
9.65
3.98
7.20
3.59
6.22
3.36
5.67
3.20
5.32
3.09
5.07
3.01
4.88
2.95
4.74
2.90
4.63
2.86
4.54
2.82
4.46
2.79
4.40
2.74
4.29
2.70
4.21
2.65
4.10
2.61
4.02
2.57
3.94
2.53
3.86
2.50
3.80
2.47
3.74
2.45
3.70
2.42
3.66
2.41
12
4.75
9.33
3.88
6.93
3.49
5.95
3.26
.5.41
3.11
5.06
3.00
4.82
2.92
4.65
2.85
4.50
2.80
4.39
2.76
430
2.72
4.22
2.69
4.16
2.64
4.05
2.60
3.98
2.54
3.86
2.50
3.78
2.46
3.70
2.42
3.61
2.40
3.56
2.36
3.49
2.35
3.46
2.32
3.41
13
4.67
9.07
3.80
6.70
3.41
5.74
3.18
5.20
3.02
4.86
2.92
4.62
2.84
4.44
2.72
4.30
2.77
4.19
2.63
4.10
2.63
4.02
2.60
3.96
2.55
3.85
2.51
3.78
2.46
3.67
2.42
3.59
2.38
3.51
2.34
3.42
2.32
3.37
2.28
3.30
2.26
3.27
14
4.60
8.86
3.74
6.51
3.34
5.56
3.11
5.03
2.96
4.69
2.85
4.46
2.77
4.28
2.70
4.14
2.65
4.03
2.60
3.94
2.56
3.86
2.53
3.80
2.48
3.70
2.44
3.62
2.39
3.51
2.35
3.43
2.31
3.34
2.27
15
4.54
8.68
3.68
6.36
3.29
5.42
3.06
4.89
2.90
4.56
2.79
4.32
2.70
4.14
2.64
4.00
2.59
3.89
2.55
3.80
2.51
3.73
2.48
3.67
2.43
3.56
2.39
3.48
2.33
16
4.49
8.53
3.63
6.23
3.24
5.29
3.01
4.77
2.85
4.44
2.74
4.20
2.66
4.03
2.59
3.89
2.54
3.78
2.49
3.69
2.45
3.61
2.42
17
4.45
8.40
3.59
6.11
3.20
5.18
2.96
4.67
2.81
4.34
2.70
4.10
2.62
3.93
2.55
3.79
2.50
3.68
2.45
3.59
2.41
18
4.41
8.28
3.55
6.01
3.16
5.09
2.93
4.58
2.77
4.25
2.66
4.01
2.58
3.85
2.51
3.71
2.46
19
4.38
8.18
3.52
5.93
3.13
5.01
2.90
4.50
2.63
2.55
20
4.35
8.10
3.49
2.87
4.43
4. Se debe encontrar el valor crtico de F en la tabla, para ello se tiene que identificar, entre el
cuadrado medio intergrupos y el cuadrado medio intragrupos, cul es el mayor; en las columnas
se debe buscar con los grados de libertad correspondientes al cuadrado medio mayor y en los
renglones los grados de libertad del cuadrado medio menor. Se debe elegir un valor de acuerdo
con el nivel de significancia elegido para la prueba de la H0. La regla de decisin para Anlisis
de Varianza es: si el valor calculado es mayor o igual al valor de tabla, se rechaza la
hiptesis nula.
47
2.12
9.8596
4.6571
2.97
47.0596
4.6571
10.1
3.72 2
16.3 14
49
6.86 2
16.3 14
49
13.8384
16.30.2857
47.0596
16.30.2857
Se debe hacer un ajuste sobre el nivel de significancia, para corregir el efecto Bonferroni,
multiplicando el valor de F en tabla, encontrado para la prueba general, por el nmero de grupos
menos 1 (k 1), para este caso el valor en tabla es 3.55 para el nivel de significancia de 0.05 con 2 y
18 grados de libertad, el ajuste se hara como sigue:
Ftabla ajustado = (3.55)(3 1) = (3.55)(2) = 7.1
Las hiptesis nulas que se estn probando son: X 1 = X 2 , X 1 = X 3 y X 2 = X 3 . La regla de
decisin es: el valor de F de cada comparacin debe ser mayor o igual al valor de tabla ajustado
para rechazar la hiptesis nula. Como se puede apreciar, slo el valor de F para la comparacin
entre el grupo 2 y el grupo 3 es mayor al valor de tabla ajustado, por lo que el nivel de conocimientos
48
ANOVA de un factor
Calif icacin en el Examen de Conocimientos
Interv alo de conf ianza para
En primer lugar se
la media al 95%
presentan las esta-
Desv iacin
Lmite
N
Media
tpica
Error tpico Lmite inf erior
superior
Mnimo
Mximo
dsticas descriptivas
Mult imedia
7
11.71
4.23
1.60
7.80
15.63
6
18
para los grupos.
Tradicional
7
8.57
4.58
1.73
4.34
12.80
4
14
Ambos
7
15.43
3.15
1.19
12.51
18.35
10
18
Total
21
11.90
4.78
1.04
9.73
14.08
4
18
Lo siguiente es la prueba de homogeneidad de
Prueba de homogeneidad de varianzas
varianzas entre los grupos, H0: s12 s 22 s32 , la
Calif icacin en el Examen de Conocimientos
regla de decisin es: si el nivel de significancia
Estad st ico
es menor o igual al establecido se rechaza la
de Lev ene
gl1
gl2
Sig.
H0, en este caso el nivel de significancia (0.306)
1.264
2
18
.306
es mayor a 0.05, por lo que no se rechaza H0,
entonces: las varianzas de los
ANOVA
grupos son iguales.
Calif icacin en el Examen de Conocimientos
A continuacin se muestran los
Suma de
Media
cuadrados
gl
cuadrtica
F
Sig.
resultados de la prueba F (suma
Inter-grupos
164.952
2
82.476
5.069
.018
de cuadrados, grados de libertad,
Intra-grupos
292.857
18
16.270
cuadrados medios), el valor de F
Total
457.810
20
y la significancia que son los
datos que se utilizan para la regla de decisin (ver datos en el valo), la regla es: si el nivel de
significancia encontrado es menor o igual a 0.05 se rechaza H0.
La significancia de la prueba F (D = 0.018) es menor a 0.05 por lo que se rechaza H0, entonces: el
nivel de conocimientos adquiridos en biologa es diferente entre el grupo del curso multimedia, el
grupo del curso tradicional y el grupo del curso que emplea ambos mtodos.
Pruebas post hoc
Para finalizar se
Comparaciones mltiples
presentan los resul-
Variable dependient e: Calif icacin en el Examen de Conocimientos
Bonf erroni
tados de las compa-
Interv alo de conf ianza al
95%
raciones posteriores,
Dif erencia de
Lmite
primero la compara-
(I) Mt odo de Enseanza (J) Mtodo de Enseanza
medias (I-J)
Error tpico
Sig.
Lmite inf erior
superior
Mult imedia
Tradicional
3.14
2.16
.486
-2.55
8.83
cin del grupo 1 con el
Ambos
-3.71
2.16
.306
-9.40
1.98
grupo 2 y 3, despus el
Tradicional
Mult imedia
-3.14
2.16
.486
-8.83
2.55
Ambos
-6.86*
2.16
.016
-12.55
-1.17
2 con el 1 y el 3, y al
Ambos
Mult imedia
3.71
2.16
.306
-1.98
9.40
Tradicional
ltimo el 3 con el 1 y 2
6.86*
2.16
.016
1.17
12.55
*. La dif erencia entre las medias es signif icativ a al niv el .05.
(ver flechas).
Descriptivos
49
Media
Esta descripcin ser la base para hacer la discusin posterior de los resultados encontrados en el
estudio.
50
La prueba de Kruskal Wallis pertenece a las pruebas no paramtricas de comparacin de tres o ms
muestras independientes, es decir:
x Es libre de la curva normal, se usa la distribucin de chi cuadrada
x Nivel ordinal de la variable dependiente
Se utiliza para comparar tres o ms grupos de rangos (medianas) y determinar que las diferencias no
se deban al azar (que las diferencias sean estadsticamente significativas).
Se calcula mediante la siguiente frmula:
12
KW
nR 2 3N 1 ................................... (1)
N N 1
dnde:
N = nmero total de casos
n = nmero de casos de cada grupo
R = promedio de rangos de cada grupo
Sin embargo, si cuando se hace la asignacin de rangos hay observaciones empatadas, se debe hacer
una correccin a la frmula anterior como sigue:
12
nR 2 3N 1
N N 1
.................................. (2)
KW
T
1 3
N N
dnde:
T t 3 t
dnde:
t = nmero de empates en cada conjunto de rangos repetidos
Problema para explicar el procedimiento:
En un hospital, se desea probar si hay diferencias en el nivel de estrs entre enfermeras de terapia
intensiva (X1), las de ciruga (X2) y las de urgencias (X3); el nivel de estrs se midi en una escala de
0 = nada, 1 = bajo, 2 = medio, 3 = alto, 4 = muy alto, las calificaciones se muestran a continuacin:
X1
3
2
1
1
0
2
1
n1 = 7
X2
3
3
4
4
2
2
1
n2 = 7
X3
4
3
2
4
3
4
n3 = 6
R1
13
8
3.5
3.5
1
8
3.5
R1 = 40.5
R2
13
13
18
18
8
8
3.5
R2 = 81.5
R3
18
13
8
18
13
18
R3 = 88
N = 20
R1 = 5.79
R2 = 11.64
R3 = 14.67
51
Rango
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
3.5
13
18
al valor ms pequeo el rango 1, el valor ms bajo posible es el 0
el rango para los 1 es igual a
23 45
3.5
4
para el 2 debe considerarse que
en el orden sigue es el 6:
En el caso de que existan valores
6 7 8 9 10
repetidos
(llamados
tambin
8
empates), el rango que les
5
corresponde es igual al promedio
para 3, empezando con el rango de los rangos, es decir: la suma de
los lugares asignados de manera
11 12 13 14 15
11:
13 secuencial entre el nmero de veces
5
que se repite cada nmero
para 4, empezando con el lugar
16 17 18 19 20
16:
18
5
2a. Se considera a cada nmero repetido como un conjunto de observaciones empatadas y el nmero
de veces que se repiten es el valor t, como vemos en la tabla anterior el primer conjunto es el
correspondiente a los unos, con un rango empatado igual a 3.5, stos se repiten 4 ocasiones por lo
que le valor t para el conjunto de unos es igual a 4. Siguiendo este procedimiento, t para el rango
8 correspondiente a la calificacin 2 es 5, despus el del rango 13 de la puntuacin igual a 3 es 5
y finalmente el rango 18 para los 4 tiene un valor t igual a 5.
Se pueden resumir estos datos, obtener el valor de T y T , como sigue:
Conjunto
t
t3
T t 3 t
52
1 (3.5)
4
64
60
2 (8)
5
125
120
3 (13)
5
125
120
4 (18)
5
125
120
T = 420
>
12
7 5.792 7 11.642 614.672 320 1
2020 1
KW
420
1 3
20 20
12
>733.52 7 135.49 6215.21@ 321
2021
KW
420
1
8000 20
KW
12
234.64 948.43 1291.26 63 0.02862474.33 63
420
420
1 0.053
1
7980
= 8.18
70.77 63
0.95
7.77
0.95
D
0.05
4.71
5.14
5.36
5.60
5.33
5.21
5.44
5.73
5.34
5.71
5.64
5.78
5.99
0.01
7.20
6.44
6.75
7.27
7.54
7.77
7.98
9.21
El valor en la tabla de chi cuadrada al nivel de significancia de 0.05 es igual a 5.991. KW obtenida
es igual a 8.18, mayor a la de tabla por lo que se rechaza la H0, entonces: el nivel de estrs es
diferente entre enfermeras de terapia intensiva, enfermeras de ciruga y enfermeras de urgencias.
53
k k 1 33 1 32
6
3
2
2
2
2
donde k es el nmero de grupos a comparar (3 para el presente ejemplo)
#c
Las diferencias entre los promedios de los rangos para las tres comparaciones son:
R1 R2 5.79 - 11.64 - 5.85 5.85
R1 R3
5.79 - 14.67
- 8.88
8.88
R2 R3
11.64 - 14.67
- 3.03
3.03
Para probar la hiptesis nula de que el nivel de estrs es igual entre cada pareja de grupos a comparar,
debe calcularse el valor crtico de la diferencia con la siguiente frmula, que debe evaluarse para cada
pareja de grupos comparada:
zD / k k 1
N N 1 1
1
12 nu nv
donde:
zD/k(k 1) es el valor de z para k(k 1) al nivel de
significancia establecido
N
es el total de casos de todos los grupos
nu
es el nmero de casos en el primer grupo en la
comparacin
nv
es el nmero de casos en el segundo grupo en
la comparacin
D
0.05
1.960
2.241
2.394
2.498
2.576
2.638
2.690
El valor de z puede ser tomado de la tabla de valores crticos de z, usando el nmero de
comparaciones que tienen que hacerse, donde podemos observar que, para el nivel de significancia de
0.05, con tres comparaciones se tiene un valor de 2.394.
54
2.3943.164
7.58
Para las diferencias entre el grupo 1 y 3, as como para las del 2 y 3, se usa el mismo valor crtico ya
que nu es igual a 7 y nv es igual a 6 para ambas comparaciones, las hiptesis nulas son: Md1 = Md2 y
Md2 = Md3:
2020 1 1 1
2021
0.143 0.167 2.394 420 0.31 2.394 350.31
2.394
2.394
12
12
12
7 6
2.394 10.85
2.3943.294
7.89
Como se puede apreciar, slo la diferencia de los promedios de los rangos entre el grupo 1 y el grupo
3 (8.88) es mayor al valor crtico de la diferencia para la comparacin entre esos grupos (7.89), por lo
que podemos decir que el nivel de estrs es diferente entre estos grupos. Las diferencias encontradas
en la prueba de Kruskal-Wallis son debidas a este resultado.
La prueba de Kruskal-Wallis en el paquete estadstico SPSS se encuentra en Analizar / Pruebas
no paramtricas / k muestras independientes, los resultados para el ejemplo anterior seran los
siguientes:
Prueba de Kruskal-Wallis
Rangos
Niv el de estrs
Grupo
Enf ermeras de terapia
intensiv a
Enf ermeras de ciruga
Enf ermeras de
emergencias
Total
Estadsticos de contrastea,b
Chi-cuadrado
gl
Sig. asintt.
Niv el de
estrs
8.109
2
.017
a. Prueba de Kruskal-Wallis
b. Variable de agrupacin: Grupo
En primer lugar, se presentan los grupos
Rango
comparados, con el nmero de casos y los
N
promedio
rangos promedio, que se obtienen de
7
5.79
dividir la suma de rangos de cada grupo
7
11.64
entre la cantidad de casos en el grupo.
6
14.67
20
Finalmente, se presentan los valores de la chi cuadrada, as como
los grados de libertad y el nivel de significancia de la prueba (ver
datos en el crculo), se debe recordar que en el paquete
estadstico la regla de decisin es: si la significancia es menor
o igual a 0.05 se debe rechazar la hiptesis nula, en este caso
tenemos una significancia de 0.017, menor a 0.05, por lo que se
rechaza la hiptesis nula y debemos concluir que: el nivel de
estrs es diferente entre enfermeras de terapia intensiva,
enfermeras de ciruga y enfermeras de urgencias.
55
56
Mediana
3.5
3
Terapia
intensiva
Ciruga
Urgencias
* X2 = 8.109, gl = 1, p = 0.17
La prueba de Friedman pertenece a las pruebas no paramtricas de comparacin de tres o ms
muestras relacionadas, es decir:
x Es libre de la curva normal, se usa la distribucin de chi cuadrada
x Nivel ordinal de la variable dependiente
Se utiliza para comparar tres o ms grupos de rangos (medianas) relacionados y determinar que las
diferencias no se deban al azar (que las diferencias sean estadsticamente significativas).
Se calcula mediante la siguiente frmula:
12
Fr
R 2 3N k 1 ..................................... (1)
Nk k 1
dnde:
N = nmero total de casos
k = nmero de mediciones
R = suma de rangos de cada medicin
Sin embargo, si cuando se hace la asignacin de rangos hay observaciones empatadas, se debe hacer
una correccin a la frmula anterior como sigue:
2
12 R 2 3N 2 k k 1
.............................................. (2)
Fr
Nk t 3
Nk k 1
k 1
dnde:
t = nmero de empates en cada conjunto de rangos iguales por cada sujeto, se incluyen los
conjuntos con rangos nicos (empates = 1).
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estrs laboral en trabajadores de una empresa antes y
despus de un taller sobre manejo del estrs en el trabajo, adems se realiz medicin de seguimiento
un mes despus de finalizado taller; el nivel de estrs se midi en una escala de 0 = nada, 1 = bajo, 2
= medio, 3 = alto, 4 = muy alto, las calificaciones se muestran a continuacin:
X
Y
Z
Rangos para X Rangos para Y Rangos para Z
3
2
3
2.5
1
2.5
3
1
2
3
1
2
2
1
1
3
1.5
1.5
4
2
2
3
1.5
1.5
3
1
2
3
1
2
3
0
1
3
1
2
1
2
4
1
2
3
N = 7
RX = 18.5
RY = 9
RZ = 14.5
2
2
2
RZ2 = 210.25 R = 633.5
RY = 81
R X = 342.25
57
2
1
1
2
1
0
1
3
2
1
2
2
1
2
3
3
2
4
3
3
4
Sujeto
1
2
3
4
5
6
7
1
1
1.5
1.5
1
1
1
2.5
2
1.5
1.5
2
2
2
2.5
3
3
3
3
3
3
Para los datos del presente ejercicio se tienen 3 mediciones por lo que el rango mnimo por
asignar a las calificaciones por sujeto es 1 y el mximo es el 3. Sin embargo, cuando existen
observaciones repetidas (empates), el rango que les corresponde es igual al promedio de los
rangos, es decir: la suma de los lugares asignados de manera secuencial entre el nmero de veces
que se repite cada nmero, por ejemplo: para el sujeto 1 existe un empate con el 3 que se repite 2
23
veces en las posiciones 2 y 3 por lo que el rango debe ser:
2.5 ; para el tercer sujeto el 1 se
2
repite 2 ocasiones en los lugares 1 y 2, el rango correspondiente debe calcularse como sigue:
1 2
1.5 . Finalmente para el cuarto caso el 2 se repite 2 ocasiones en las posiciones 1 y 2, el
2
1 2
rango correspondiente es:
1.5 (estos son los rangos sombreados en la tabla de arriba).
2
2a. Se considera a cada nmero repetido como observaciones empatadas y el nmero de veces que se
repiten es el valor t, que representa un conjunto de empates por sujeto: el primer conjunto es el
del rango 2.5 del caso 1, que se repite 2 veces, por lo que para este conjunto t es igual a 2; el
segundo conjunto es el correspondiente al rango empatado igual a 1.5 del sujeto 3, que se repite 2
veces, por lo que t para este conjunto es igual a 2 y el tercer conjunto es el correspondiente al
sujeto 4 en el rango 1.5, que se repite 2 veces, con un valor t igual a 2. Es decir, existen tres
conjuntos de empates, cada uno con t igual a 2.
58
Para esta prueba es necesario considerar adems a todos los rangos no repetidos como un
conjunto con t igual a 1, pues se deben incluir en el ajuste de la frmula.
Caso 1
3 (2.5)
Caso 3
1 (1.5)
Caso 4
2 (1.5)
8 8 8 (15)(1)
= 39
3. Una vez obtenidos los rangos, se deben colocar en la columna correspondiente a rangos para X, Y
y Z considerando la posicin original, antes del ordenamiento, de las calificaciones por sujeto. Por
ejemplo, para el sujeto 1: la calificacin en X es 3 y el rango asignado a X para este sujeto es 2.5,
la calificacin en Y es 2 y el rango asignado a Y es 1, finalmente la calificacin en Z es 3 y el
rango asignado a Z para este sujeto es 2.5. Esto debe hacerse para cada caso.
4. Teniendo acomodados los rangos, stos se deben sumar por columna, es decir para cada medicin
( R X , RY y RZ ) y elevar esas sumas al cuadrado ( R X2 , RY2 y RZ2 ).
5. A continuacin debe calcularse el valor de
Friedman, si no hubo rangos empatados se debe
utilizar la frmula (1) y si hay rangos empatados,
como es el caso del presente ejercicio, la frmula
(2):
12633.5 372 33 12
Fr
733 1 73 39
3 1
2
7602 34934
7 34 21 39
2
7602 349316 7602 7056 546
7.28
18
84 9
75
84
2
k
3
N
3
4
5
6
7
8
9
10
11
12
13
D
0.05
6.00
6.50
6.40
7.00
7.14
6.25
6.22
6.20
6.54
6.17
6.00
0.01
8.00
8.40
9.00
8.86
9.00
8.67
9.60
8.91
8.67
9.39
59
RX RZ
RY RZ
18.5 - 9
9.5
18.5 - 14.5
9 - 14.5
9.5
4
- 5.5
5.5
Estas diferencias entre cada pareja de mediciones, deben de compararse con el valor crtico de la
diferencia, obtenido de la siguiente frmula:
Nk k 1
zD / k k 1
6
donde:
zD/k(k 1) es el valor de z para k(k 1) al nivel de significancia establecido
N
es el total de casos
k
es el nmero de mediciones
El valor de z puede ser tomado de la tabla de valores crticos de z, donde podemos observar que para
el nivel de significancia de 0.05 para tres comparaciones, se tiene un valor de 2.394.
El valor crtico de la diferencia, se obtiene al sustituir los valores en la frmula:
2.394
733 1
6
2.394
84
6
2.394 14
2.3943.742
8.958
Valores crticos de z para el nmero de
comparaciones mltiples con hiptesis
bidireccional
D
Nmero de
0.05
comparaciones (#c)
1
1.960
2
2.241
3
2.394
4
2.498
5
2.576
6
2.638
Se deben de probar las siguientes hiptesis nulas: MdX =
MdY, MdX = MdZ y MdY = MdZ, la regla de decisin es: si
el valor de las diferencias entre las mediciones
comparadas es mayor o igual al valor crtico se rechaza
la hiptesis nula.
Como se puede apreciar, slo la diferencia entre la suma de
rangos de la medicin X y la medicin Y (9.5) es mayor al
valor crtico de la diferencia (8.958), por lo que slo en
este caso se rechaza la hiptesis nula y podemos decir que:
el nivel de estrs laboral de los trabajadores es diferente
entre estos grupos. Las diferencias significativas
encontradas en la prueba de Friedman son debidas a este
resultado.
60
Pruebas no paramtricas
Rangos
Rango
promedio
Niv el de estrs antes
del Programa
Niv el de estrs
despues del Programa
Niv el de estrs en el
seguimiento
2.64
1.29
2.07
En primer lugar, se presentan los rangos promedio, que se
obtienen de dividir la suma de rangos entre la cantidad de casos.
Finalmente, se presentan los valores de la chi cuadrada, as como los
N
7
grados de libertad y el nivel de significancia de la prueba (ver datos en
Chi-cuadrado
7.280
el crculo), se debe recordar que en el paquete estadstico la regla de
gl
2
decisin es: si la significancia es menor o igual a 0.05 se debe
Sig. asintt.
.026
rechazar la hiptesis nula.
a. Prueba de Friedman
En este ejemplo es de 0.026, menor a 0.05, por lo que se rechaza la hiptesis nula y debemos concluir
que: el nivel de estrs laboral de los trabajadores es diferente antes del taller para el manejo del estrs
en el trabajo, despus del taller y en el seguimiento.
Nota: Las comparaciones mltiples se pueden hacer mediante la prueba de Wilcoxon, pero se debe
recordar ajustar el nivel de significancia que se obtenga en el anlisis, multiplicndolo por el
nmero de mediciones menos 1: (k 1), si el nivel de significancia, despus de este ajuste, es
menor a 0.05 se rechazar la hiptesis nula de la comparacin correspondiente.
Reporte de resultados de la prueba de Friedman
Para esta prueba se puede utilizar una grfica de barras o lneas (ms adecuada para ver variaciones
entre mediciones) con las medianas, aunque se puede utilizar la media rango, obtenida de dividir la
suma de rangos en cada medicin entre la cantidad de sujetos, aunque este dato es de difcil
interpretacin. Se deben mencionar los valores de la prueba estadstica y el nivel de significancia con
que se est rechazando, o aceptando, la hiptesis nula. Se puede poner el valor de probabilidad
obtenido o simplemente decir que es menor, o mayor, al valor que hayamos elegido para la prueba de
hiptesis. Adems se debe escribir la conclusin a la que se llega. Por ejemplo:
Estadsticos de contrastea
61
62
Mediana
2
1
1
0
Estrs
laboral
antes del
taller
Estrs
laboral
despus del
taller
Seguimiento
* X2 = 7.28, gl = 2, p = 0.026
Prueba Q de Cochran
k 1>k G 2 G 2 @
k L L
dnde:
L = Q~PHURDFLHUWRVUHVSXHVWDVDILUPDWLYDVSRUVXMHWR
G = Q~PHURDFLHUWRVUHVSXHVWDVDILUPDWLYDVHQFDGDPHGLFLyQ
k = nmero de mediciones
Problema para explicar el procedimiento:
Se desea evaluar la efectividad de un programa para eliminar el consumo en usuarios de drogas, para
ello se registra si los usuarios consumen drogas al finalizar el programa (X), y se hace un seguimiento
a 3 (Y) y 6 meses (Z) en que se les vuelve a preguntar si consumen drogas, los datos se muestran a
continuacin, donde 0 significa que no es usuario de drogas y 1 que si las consume:
X
Y
Z
L
L2
0
0
0
0
0
1
1
0
2
4
0
1
0
1
1
0
0
0
0
0
1
0
0
1
1
1
1
0
2
4
1
1
0
2
4
0
1
0
1
1
1
0
0
1
1
0
0
0
0
0
1
1
1
3
9
1
1
1
3
9
1
1
0
2
4
1
1
0
2
4
1
1
0
2
4
1
1
1
3
9
1
1
0
2
4
1
1
0
2
4
L 29
L2 63
GX = 13
GY = 13
GZ = 3
29
G
G X2
169
GY2
169
GZ2
347
63
400
16.667
24
6. Se tiene que encontrar el valor crtico en la tabla de valores crticos de Chi cuadrada (ver pgina
36) ya que la distribucin de esta prueba es similar a la de chi cuadrada, para ellos se tienen que
calcular los grados de libertad que se van a utilizar en la tabla con: gl = k 1, donde k es el
nmero de mediciones, adems de elegir el nivel de significancia para probar la hiptesis nula. La
regla de decisin establece que: si el valor de Q es mayor o igual al valor de la tabla se debe
rechazar la hiptesis nula.
En la tabla, al nivel de significancia de 0.05, con gl = 3 - 1 = 2 para el presente ejemplo, se tiene
un valor igual a 5.991. Q es igual a 16.667, mayor al valor de tabla, por lo que se rechaza la H0,
entonces: la proporcin de usuarios de drogas es diferente al finalizar el programa para eliminar el
consumo y en los seguimientos a 3 y 6 meses.
Q de Cochran en el paquete SPSS
En el paquete estadstico se tiene la prueba Q de Cochran est en Analizar / Pruebas no
paramtricas / k muestras relacionadas. Se presentan resultados como los siguientes:
Pruebas no paramtricas
Prueba de Cochran
Frecuencias
Valor
0
Usa drogas (1era. medicin)
Usa drogas (2da. medicin)
Usa drogas (3era. medicin)
64
1
5
5
15
13
13
3
Estadsticos de contraste
N
Q de Cochran
gl
Sig. asintt .
18
16.667a
2
.000
Reporte de resultados de la prueba Q de Cochran
Para esta prueba se puede utilizar una grfica de barras o lneas (ms adecuada para ver variaciones
entre mediciones) con los porcentajes obtenidos en cada medicin. Se deben mencionar los valores de
la prueba estadstica y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis
nula. Se puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o mayor,
al valor que hayamos elegido para la prueba de hiptesis. Adems se debe escribir la conclusin a la
que se llega. Por ejemplo:
Se encontraron diferencias en la proporcin de
usuarios de drogas al finalizar el programa para
eliminar el consumo y en los seguimientos a 3 y 6
meses (X2 = 16.667, gl = 2, p < 0.001).
Como puede apreciarse en la grfica, la proporcin de
usuarios se mantuvo a los 3 meses del seguimiento y
disminuy en la siguiente medicin a los 6 meses.
Estos datos se utilizarn para hacer la discusin posterior
de los resultados encontrados en el estudio
72.2
72.2
60
% 40
20
16.7
0
Final del
programa
Seguimiento 3
meses
Seguimiento 6
meses
* X2 = 16.667, gl = 2, p = 0.000
65
66
Pruebas de Asociacin
La correlacin refleja si existe relacin o asociacin entre dos variables, no se habla de causalidad por
lo que no hay una variable dependiente y una independiente, aunque puede suceder que una variable
sea antecedente de otra.
El coeficiente de correlacin puede adquirir valores de 1 a 1, incluyendo el cero, sus caractersticas
son:
x El signo indica el sentido de la relacin, una correlacin negativa representa una asociacin
inversamente proporcional, es decir, a medida que una variable se incrementa, la otra
disminuye; por otro lado, en una correlacin positiva o directamente proporcional, a medida
que aumenta una, la otra tambin se incrementa.
x La magnitud de la relacin esta dada por el valor del coeficiente y se interpreta como sigue:
de 0 hasta 0.299 no hay asociacin lineal entre las variables, desde 0.3 hasta antes de 0.499 es
baja, desde 0.5 hasta antes de 0.799 es moderada y desde 0.8 a 1 hay una correlacin alta
entre las variables.
x La ausencia de asociacin lineal no significa necesariamente que las variables no tengan
relacin entre s. Existen muchas variables con una correlacin de tipo curvilneo y debe ser
evaluada de otra manera.
Una forma grfica de ver la relacin entre variables son las grficas de dispersin, donde cada punto
representa el lugar en que se cruzan las calificaciones de la primera variable (X) y la segunda variable
(Y) para cada sujeto. Si se traza una lnea que cruce la mayora de los puntos se puede apreciar el tipo
de relacin (ver la siguiente figura). En las relaciones curvas, para algunas magnitudes de X, Y
incrementa, pero disminuye en otros valores de X.
Tipos de Correlacin
Directamente proporcional
Inversamente proporcional
Sin relacin
X
Correlacin curvilnea
X
Correlacin curvilnea
67
68
La funcin de la correlacin de Pearson es determinar si existe una relacin lineal entre dos variables
a nivel intervalar y que esta relacin no sea debida al azar (que la relacin sea estadsticamente
significativa).
La correlacin de Pearson se calcula mediante la siguiente frmula:
N XY X Y
rP
2
2
N X 2 X N Y 2 Y
>
@>
dnde:
N = nmero de sujetos
X, Y = calificaciones de las variables a relacionar
Problema para explicar el procedimiento para calcular la correlacin de Pearson:
Se desea saber si existe relacin entre la autoestima y la depresin en estudiantes de preparatoria.
Para ello, un investigador aplica una escala de depresin (X) en la que los estudiantes con
calificaciones ms altas tienen mayor depresin; tambin utiliza una escala de autoestima (Y) en la
que los puntajes mayores indican mayor autoestima. Los resultados se muestran a continuacin:
X
Y
X2
Y2
XY
26
8
676
64
208
24
12
576
144
288
18
26
324
676
468
17
29
289
841
493
18
30
324
900
540
7
31
49
961
217
15
19
225
361
285
20
18
400
324
360
18
28
324
784
504
2
2
Y = 201
X = 163
X = 3187
Y = 5055
XY = 3363
X = 26569
2
Y = 40401
2
N = 9
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicin, la prueba estadstica que debe
utilizarse y plantear la hiptesis nula que va a probar de acuerdo al nivel de medicin y tipo de
problema correspondiente.
Es un problema de Asociacin
Nivel de medicin intervalar para ambas variables
H0: No hay relacin lineal entre el puntaje de depresin y el de autoestima en estudiantes de
preparatoria.
Prueba estadstica: Correlacin Pearson
69
rp
30267 32763
28683 2656945495 40401
- 2496
3281.572
-0.761
Valores de r para diferentes
niveles de significancia
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
- 2496
21145094
0.05
.99692
.95000
.8783
.8114
.7545
.7067
.6664
.6319
.6021
.5760
.5529
.5324
5139
.1973
0.01
.999877
.990000
.95873
.91720
.8745
.8343
.7977
.7646
.7348
.7079
.6835
.6614
.6411
.6226
0.001
.9999988
.99900
.99116
.97406
.95074
.92493
.8982
.8721
.8471
.8233
.8010
70
Correlaciones
Correlaciones
Puntaje de depresin
Puntaje de autoestima
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Puntaje de
depresin
1.000
.
9
-.761*
.017
9
Puntaje de
autoestima
-.761*
.017
9
1.000
.
9
35
Estos datos se utilizarn para hacer la discusin posterior
de los resultados encontrados en el estudio
30
25
20
15
10
* r P = -0.761, p = 0.017
0
7
15
17
18
18
18
20
24
26
Forma 2: Relacin entre los Puntajes de
Depresin y Autoestima*
Depresin
rP = -0.761*
Autoestima
* p < 0.05
71
72
La funcin de la correlacin de Spearman es determinar si existe una relacin lineal entre dos
variables a nivel ordinal, y que esta relacin no sea debida al azar (que la relacin sea
estadsticamente significativa). Aunque una de las variables pueda estar medida a nivel intervalar, de
cualquier manera se utiliza esta prueba si una de las dos est medida a nivel ordinal.
La correlacin de Spearman se calcula mediante la siguiente frmula:
6 d 2
.................................................................... (1)
rS 1 3
N N
dnde:
N = nmero de sujetos
d2 = diferencias entre los rangos asignados a las variables elevadas al cuadrado
Sin embargo, cuando al asignar los rangos hay valores repetidos en alguna de las variables se debe
hacer una correccin y usar la frmula que sigue:
T TY
N 3 N 6 d 2 X
2
...................... (2)
r
N
T
2
TY N 3 N TX TY
dnde:
t
dnde:
t = nmero de empates en cada conjunto de rangos iguales para cada variable
Problema para explicar el procedimiento para calcular la correlacin de Spearman:
Se desea saber si existe relacin entre la actitud hacia el psiclogo (X) y la actitud hacia la
psicoterapia (Y), en un grupo de padres de familia. La actitud es evaluada como sigue: 1 = muy
desfavorable hasta 7 = muy favorable. Los resultados se muestran a continuacin:
X
Y
RX
RY
d
d2
6
7
8
9
-1
1
7
5
9
7
2
4
5
4
7
6
1
1
3
2
5
2.5
2.5
6.25
4
6
6
8
-2
4
2
3
3
4.5
-1.5
2.25
2
3
3
4.5
-1.5
2.25
1
2
1
2.5
-1.5
2.25
2
1
3
1
2
4
N = 9
d 2 27
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicin, la prueba estadstica que debe
utilizarse y plantear la hiptesis nula que se va a probar de acuerdo al nivel de medicin y tipo de
problema correspondiente.
Es un problema de Asociacin
Nivel de medicin ordinal para ambas variables
H0: No hay relacin lineal entre la actitud hacia el psiclogo y la actitud hacia la
psicoterapia, en padres de familia.
Prueba estadstica: Correlacin Spearman
73
Rango
1
2
2
1
2
3
3
4
5
6
7
5
6
7
8
9
Datos
ordenados de la
Variable 2 (Y)
Rango
1
2
1
2
4
5
6
7
6
7
8
9
al valor ms pequeo el rango 1, el valor ms bajo posible es el 0
el 2 que se repite 3 veces: En el caso de que existan valores
repetidos (llamados tambin
23 4
empates), el rango que les
3
3
corresponde es igual al promedio
al 3 le corresponde el lugar 5 de los rangos, es decir: la suma
al 4 le corresponde el lugar 6 de los lugares asignados de
al 5 le corresponde el lugar 7 manera secuencial entre el
al 6 le corresponde el lugar 8 nmero de veces que se repite
al 7 le corresponde el lugar 9 cada nmero
2a. Si se tuvieron observaciones empatadas, como en este caso, se debe determinar t para cada
conjunto de observaciones repetidas para cada variable por separado, t es el nmero de veces que
se repite cada calificacin, y T la sumatoria de t3 - t. Al observar los empates por variable, se tiene
para X un conjunto de observaciones repetidas en la calificacin 2 que tienen el rango 3, este se
repite 3 veces por lo que t para este conjunto es igual 3. Para la variable Y, hay dos conjuntos de
tangos empatados, uno en la calificacin 2 con rango asignado igual a 2.5, ste se repite dos veces
por lo que t para este conjunto es igual a 2; el segundo es para la calificacin 3 con rango 4.5
repetido dos veces, por lo que t para este conjunto es igual a 2.
Se pueden resumir estos datos y obtener el valor de T para cada variable como sigue:
Conjuntos
Conjuntos
2 (3)
2 (2.5)
3 (4.5)
de X
de Y
t
3
t
2
2
t3
27
t3
8
8
3
3
TX = 24
TY = 12
24
6
6
t t
t t
Es importante considerar que, si slo una de las variables presenta rangos empatados, el valor de
T para la variable sin empates debe ser igual a 0 (T = 0).
74
9
9
9 627
24 12
2
9 24 12 93 9 2412
2
729 9 162 - 36
2
2
729 9 36729 9 288
540
518400 25920 288
720 162 18
720 2 36720 288
540
492768
540
701.974
0.769
0.05
1.000
0.886
0.786
0.738
0.700
0.648
0.618
0.587
D
0.01
1.000
0.929
0.881
0.833
0.794
0.755
0.727
0.001
1.000
0.976
0.933
0.903
0.873
0.860
.7692.828
2.175
Recurdese que la z es significativa al nivel de 0.05, cuando es mayor o igual a 1.96, por lo que la
regla de decisin es: si el valor de z es mayor o igual a 1.96 se rechaza la hiptesis nula. En
nuestro ejemplo la z (2.175) es mayor a 1.96, entonces: existe relacin lineal entre la actitud hacia el
psiclogo y la actitud hacia la psicoterapia, en padres de familia. Adems la correlacin es moderada
(est en el rango entre 0.5 y 0.8) y directamente proporcional (tiene signo positivo).
75
Correlaciones no paramtricas
Correlaciones
Actitud hacia
el psiclogo
Rho de Spearman
Actitud hacia la
psicoterapia
Coef iciente de
correlacin
Sig. (bilateral)
N
Coef iciente de
correlacin
Sig. (bilateral)
N
1.000
.
9
.769*
.015
9
Actitud hacia
la
psicoterapia
.769*
.015
9
1.000
.
9
Reporte de resultados de la correlacin Spearman
Para esta prueba se puede utilizar una grfica de dispersin poniendo los valores de la primer variable
en X y los de la segunda variable en Y, aunque se puede hacer tambin un diagrama ligando ambas
variables con una flecha doble, esta forma es la que se va a usar para ejemplificar los resultados de la
correlacin Spearman. En cualquiera de las dos opciones se deben mencionar el valor de la prueba
estadstica y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis nula. Se
puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o mayor, al valor
que hayamos elegido para la prueba de hiptesis. Adems se debe escribir la conclusin a la que se
llega. Por ejemplo:
Se encontr una relacin lineal estadsticamente
significativa, moderada y directamente proporcional,
entre la actitud hacia el psiclogo y la actitud hacia la
psicoterapia, en padres de familia (rS = 0.769, p =
0.015) (ver diagrama).
Estos datos se utilizarn para hacer la discusin posterior
de los resultados encontrados en el estudio
76
La funcin de la correlacin Phi es determinar si existe una relacin entre dos variables a nivel
nominal con dos valores cada una (dicotmicas) y que esta relacin no sea debida al azar (que la
relacin sea estadsticamente significativa).
La correlacin Phi se calcula mediante la siguiente frmula:
BC AD
rI
A B C D A C B D
dnde:
A, B, C y D son las frecuencias observadas en una tabla de contingencia de 2 x 2
A
A+B
C+D
A+C B+D
Problema para explicar el procedimiento para calcular la correlacin Phi:
Se desea saber si existe relacin entre el consumo de alcohol del padre y el consumo de alcohol de
estudiantes de preparatoria. Los resultados se resumen en la siguiente tabla de contingencia:
Consumo de alcohol
del padre
No bebedor Bebedor Total
Consumo de No bebedor
alcohol de
Bebedor
estudiantes de
Preparatoria Total
80
30
110
21
30
89
51
N = 140
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicin, la prueba estadstica que debe
utilizarse y plantear la hiptesis nula que va a ser probada de acuerdo al nivel de medicin y tipo
de problema correspondiente.
Es un problema de Asociacin
Nivel de medicin nominal (dicotmico) para ambas variables
H0: No hay relacin entre el consumo de alcohol del padre y el consumo de alcohol de
estudiantes de preparatoria.
Prueba estadstica: Correlacin Phi
2. Se tiene que organizar la informacin en una tabla de contingencia de dos por dos y obtener los
totales por rengln y por columna (A + B, C + D, A + C y B + D).
3. Calcular la correlacin Phi:
930 8021 270 1680
- 1410
1410
rI
0.364
110308951 14978700 3870.233 3870.233
77
X2
140
1408021 309
2
110308951
X2
14978700
14978700
Recurdese que se tiene que comparar la Chi cuadrada obtenida con el valor de tabla de valores
crticos de Chi cuadrada (ver la tabla en la pgina 36), este valor se busca utilizando un grado de
libertad y el nivel de significancia elegido para probar la hiptesis nula. La regla de decisin es:
si el valor de X2 obtenido es mayor o igual al de tabla se rechaza la hiptesis nula.
Con 1 grado de libertad al nivel de significancia de 0.05 se tiene un valor de X2 en tabla de 3.841,
el valor obtenido de X2 (16.783) es mayor al de tabla por lo que se rechaza la hiptesis nula, por
lo tanto la hiptesis nula de la prueba Phi se rechaza tambin, entonces: existe relacin entre el
consumo de alcohol del padre y el consumo de alcohol de estudiantes de preparatoria. Adems
esta relacin es baja (est en el rango de 0.3 a 0.5) y directamente proporcional (tiene signo
positivo).
La correlacin Phi en el paquete SPSS
En el paquete estadstico la Phi se encuentra en Analizar / Estadsticos descriptivos / Tablas de
contingencia, no es tan importante determinar cul de las variables va en las columnas y cul en los
renglones ya que no hay variable dependiente e independiente. Se debe elegir en la seccin de
estadsticas la Phi. Se presentan resultados como los siguientes:
Tablas de contingencia
Tabla de contingencia Consumo de alcohol del estudi ante * Consumo de
alcohol del padre
Recuent o
Consumo de alcohol
del estudiant e
Total
78
No bebedor
Bebedor
Total
110
30
140
La primera parte es la tabla de
contingencia con la distribucin de
frecuencias.
Reporte de resultados de la correlacin Phi
Para esta prueba se puede utilizar un diagrama ligando ambas variables con una flecha doble, adems
se deben mencionar el valor de la prueba estadstica y el nivel de significancia con que se est
rechazando, o aceptando, la hiptesis nula. Se puede poner el valor de probabilidad obtenido o
simplemente decir que es menor, o mayor, al valor que hayamos elegido para la prueba de hiptesis.
Adems se debe escribir la conclusin a la que se llega. Por ejemplo:
Se encontr una relacin estadsticamente
significativa, baja y directamente proporcional, entre
el consumo de alcohol del padre y el consumo de
alcohol de estudiantes de preparatoria. (rI = 0.364, p =
0.000) (ver diagrama).
Estos datos sirven para hacer la discusin posterior de los
resultados encontrados en el estudio
rI = 0.364*
Consumo de
Alcohol de
Estudiantes de
Preparatoria
* p < 0.001
79
80
Referencias Bibliogrficas
Brown, F. G. (2000). Principios de la medicin en psicologa y educacin (1ra. ed.). Mxico: El
Manual Moderno.
Daniel, W. (1999). Bioestadstica. Bases para el anlisis de las ciencias de la salud. Mxico: Ed.
Noriega.
Downie, M. y Heath, R. (1973). Mtodos estadsticos aplicados. Mxico: Harper & Row
Latinoamericana.
Ferrn, M. (1996). SPSS para Windows: Programacin y anlisis estadstico. Madrid: Mc Graw Hill.
Levin, J. (1979). Fundamentos de estadstica en la investigacin social (2da. ed.). Mxico: Editorial
Harla.
Ritchey, F. J. (2002). Estadstica para las Ciencias Sociales: El Potencial de la Imaginacin
Estadstica. Mxico: Mc Graw Hill.
Paquete Estadstico para las Ciencias Sociales (SPSS) para Windows versin 10.0.7 en espaol
[Software de computadora]. (2000). Chicago, E. U.: SPSS, Inc.
Siegel, S. (1990). Estadstica no Paramtrica (3ra. ed.). Mxico: Editorial Trillas.
81
82