Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Captulo I V
Pruebas de hiptesis para
medidas de asociacin
|]
En muchas situaciones es de inters estudiar la relacin entre dos
o ms variables definidas en una poblacin, basados en los resul-
tados encontrados en la muestra. Por ejemplo, podemos estar in-
teresados en estudiar la relacin entre el sexo y el lugar de proce-
dencia de los participantes, entre el sexo y el rendimiento acad-
mico en el curso de lgebra, entre la edad y el tiempo de servicio
de los participantes en el programa de capacitacin. En todos los
casos nos basamos en valores que encontramos en la muestra y nos
preguntamos si dichos valores son estadsticamente significativos.
Para abordar el problema planteado, en cada tipo de si-
tuacin, primero presentaremos la metodologa para calcu-
lar el coeficiente de correlacin en la muestra y luego la metodo-
loga correspondiente a pruebas de hiptesis para el parmetro
poblacional.
El estudio de la relacin entre dos variables cuantitativas se
realizar en el siguiente captulo, juntamente con el tpico de
anlisis regresin.
Prueba de hiptesis para el coeficiente de
correlacin PHI
Cuando se desea estudiar la asociacin entre dos variables de
naturaleza cualitativas dicotmicas, se recomienda obtener el co-
70
eficiente de correlacin phi. Por ejemplo, se desea estudiar la aso-
ciacin entre las variables estado civil y desercin de los estudian-
tes de maestra; entre el sexo de los estudiantes y su opinin respec-
to a la reeleccin del Decano.
Coefi ci ente de correl aci n phi en l a muestra
Se definen:
X: variable dicotmica con valores 0 y 1,
Y: variable dicotmica con valores 0 y 1,
p
x
: proporcin de puntuaciones 1 en la variable X,
q
x
: proporcin de puntuaciones 0 en la variable X,
p
y
: proporcin de puntuaciones 1 en la variable Y,
q
y
: proporcin de puntuaciones 0 en la variable Y,
p
xy
: proporcin de puntuaciones 1 tanto en la variable X como
en la variable Y,
luego, el coeficiente de correlacin phi, , se calcula de la
siguiente manera:
(4.1) .
q p q p
p p p
y y x x
y x xy
Cuando los datos estn tabulados en una tabla de contin-
gencia (tabla que muestra la ocurrencia conjunta de pares de pun-
tuaciones en dos variables), puede calcularse mediante la si-
Valores de la Valores de la Total
variable Y variable X
0 1
1 A B a +b
0 C D c +d
Total a +c b +d
guiente metodologa:
.
) )( )( )( ( d c b a d b c a
ad bc
+ + + +
7
Este coeficiente tomar el valor 1 solamente cuando (a+b) y
(c+d) son iguales (consecuentemente a=d) en una tabla de contin-
gencia de dos por dos; es decir, cuando la proporcin de "unos" es
la misma en X y en Y". entonces Y no puede predecirse perfectamen-
te a partir de X, por lo que algunos estadsticos consideran este
hecho como una desventaja del coeficiente phi.
Prueba de hi ptesi s para el coefi ci ente pobl aci onal phi
Paso 1: La hiptesis nula indica que no existe asociacin entre
las dos variables en la poblacin y la hiptesis alternativa niega
esta afirmacin. Denotemos con
phi
la asociacin o el coeficien-
te de correlacin phi en la poblacin, entonces, las hiptesis son:
0 :
0
phi
H
0 :
1
phi
H
Paso 2: Bajo la hiptesis nula, para un tamao de muestra ma-
yor que 20, la estadstica de prueba n z tiene distribucin
aproximadamente normal con media 0 y varianza 1. Con el va-
lor del coeficiente obtenido en la muestra y bajo la hiptesis nula
se calcula el valor de la estadstica de prueba,
c
z .
Paso 3: Para = 0.05, ( ) 975 . 0 <
terico
z Z P , en la tabla de la
distribucin normal se encuentra el valor de 96 . 1
terico
z . La re-
gin de rechazo es el intervalo (-, -1.96) U(1.96, ).
Paso 4: Si el valor de la estadstica de prueba,, cae en el intervalo
indicado, se rechaza la hiptesis nula.
Ej empl o 4.1
Se ha observado que los estudiantes que inician sus estudios de
maestra presentan mucha dificultad en el primer semestre por
lo que algunos de ellos abandonan sus estudios. A continuacin
7
se presentan los resultados de un seguimiento realizado a 15 estu-
diantes de la maestra en Poltica Social que se matricularon en el
semestre 2004-II y que abandonaron el curso de Herramientas de
Anlisis Cuantitativo. Encontraremos el coeficiente de correla-
cin phi y haremos la prueba de hiptesis correspondiente.
X: estado civil 1: no casado 0: casado
Y: permanencia 0: abandona el curso
1: permanece en el curso hasta el final
Estudiante Estado civil(
i
x ) Permanencia(
i
y )
1 0 0
2 1 1
3 0 1
4 0 0
5 1 1
6 1 0
7 0 0
8 1 1
9 0 0
10 0 1
11 0 0
12 1 1
13 0 0
14 0 0
15 0 0
Solucin
La informacin anterior se resume en el siguiente cuadro:
Valores de la Valores de la variable X
variable Y
0 (casado) 1 Total
1 (permanece) 2 4 6
0 (abandona) 8 1 9
Total 10 5 15
73
y se calculan las respectivas proporciones:
3333 . 0
15
5
p
x
6667 . 0
15
10
q
x
4 . 0
15
6
p
y
6 . 0
15
9
q
y
2667 . 0
15
4
p
xy
que se reemplazan en la frmula:
( )( )( )( )
. 578 . 0
6 . 0 4 . 0 6667 . 0 3333 . 0
) 4 . 0 )( 3333 . 0 ( 2667 . 0
El coeficiente de correlacin phi en la muestra entre estado
civil y desercin vale 0.578. Es estadsticamente significativo el
valor encontrado?. A continuacin responderemos la pregunta
planteada usando la metodologa de pruebas de hiptesis.
Paso 1: La hiptesis nula es que no existe asociacin entre esta-
do civil y desercin en los estudios y la hiptesis alternativa nie-
ga ese enunciado. Si
phi
n
n
n n
S
X X
r
x
bP
(4.2)
Prueba de hi ptesi s para el coefi ci ente de correl aci n
Paso 1: En la hiptesis nula se postula que no existe asociacin
entre las dos variables en la poblacin y la hiptesis alternativa
niega en afirmacin. Si denotamos con
bp
el coeficiente de co-
rrelacin biseral-puntual en la poblacin, entonces, las hiptesis
son:
77
0 :
0
bp
H
0 :
1
bp
H
Paso 2: Bajo la hiptesis nula, la estadstica de prueba
2
1
2
n
r
r
t
bp
bp
tiene distribucin t-Student con ( 2 n ) grados de libertad.
Con el valor del coeficiente de correlacin obtenido en la
muestra y bajo la hiptesis nula se calcula el valor del estadstico
de prueba,
c
t .
Paso 3: Para = 0.05
( ) 975 . 0
) 2 (
<
terico n
t t P
, en la tabla t-Stu-
dent con 2 n grados de libertad se encuentra el valor de
terico
t .
Luego, la regin de rechazo es el intervalo (
terico
t , 8).
Paso 4: Si el valor de la estadstica de prueba,
c
t , cae en el inter-
valo indicado, se rechaza la hiptesis nula.
Ej empl o 4.3
En la 2da y 3ra columnas del siguiente cuadro se presenta los
datos del sexo y estaturas de 15 adolescentes que realizan depor-
tes todos los fines de semana en el Parque Zonal Sinchi Roca.
Vamos a encontrar el coeficiente de correlacin biseral-puntual
y luego haremos la prueba de hiptesis para el coeficiente de co-
rrelacin poblacional.
Denotemos con:
Y: la variable sexo con niveles 0: femenino 1: masculino,
X: la variable estatura de los adolescentes (en pulgadas).
Se crean las variables ficticias:
X
0
: con las estaturas de los adolescentes del sexo femenino,
78
X
1
: con las estaturas de los adolescentes del sexo masculino. Es
decir:
Y se realizan los clculos auxiliares, para luego obtener el co-
eficiente de correlacin biseral-puntual:
75 . 66
8
62 63 66 64 72 65 73 69
1
+ + + + + + +
x
14 . 61
7
60 63 61 60 62 55 67
0
+ + + + + +
x
749 . 4 7 8
x 0 1
s n n
61 . 0
) 14
) 8 )( 7 (
749 . 4
14 . 61 75 . 66
(
15
rbP
Es estadsticamente significativo el valor del coeficiente de
correlacin biseral puntual encontrado en la muestra?. Para res-
ponder la pregunta planteada, procederemos a usar la metodo-
loga de pruebas de hiptesis.
Adolescente Sexo (Y) Estatura (X) X0 X1
1 1 69 - 69
2 0 67 67 -
3 1 73 - 73
4 1 65 - 65
5 0 55 55 -
6 1 72 - 72
7 0 62 62 -
8 0 60 60 -
9 1 64 - 64
10 1 66 - 66
11 1 63 - 63
12 0 61 61 -
13 1 62 - 62
14 0 63 63 -
15 0 60 60 -
79
Paso 1: Se postula como hiptesis nula que no existe asociacin
entre sexo y estatura en la poblacin y la hiptesis alternativa
niega esa afirmacin. Si se denota con
bp
el coeficiente de correla-
cin biseral-puntual en la poblacin, entonces, las hiptesis son:
0 :
0
bp
H
0 :
1
bp
H
Paso 2: El valor de la estadstica de prueba es:
2
1
2
n
r
r
t
bp
bp
c
=
77 . 2
13
) 61 . 0 ( 1
61 . 0
2
c
z
=3.64
Paso 3: Para = 0.05 ( ) 975 . 0 <
terico
z z P , en la tabla normal
se encuentra el valor de
terico
z = 1.96.
Luego, la regin de rechazo es el intervalo (1.96, ).
Paso 4: Como el valor de
c
z = 3.64 cae en el intervalo indicado,
se rechaza la hiptesis nula y concluimos que el coeficiente de
correlacin tetracrico de la poblacin no es nulo, cuando el ni-
vel de significacin es 0.05.
Ej empl o 4.6
Suponga que para una determinada tabla de contingencia 2x2,
85
a=62, b=20, c=10, d=24 y se desea obtener el valor del coeficiente
de correlacin tetracrico.
Como
d a
c b
= 0.1344, para encontrar el valor del coeficiente
se consulta la Tabla A, bajo los valores de la columna 44 . 7
bc
ad
.
Se encuentra que el valor del coeficiente de correlacin tetrac-
rico es negativo,
rt
= -0.67.
Debe prevenirse al lector sobre la posibilidad de cometer se-
rios errores. No debe emplearse el mtodo si
n
d b
n
b a + +
o
se apartan considerablemente de 0.5. Si
n
d b
n
b a + +
o
son ma-
yores que 0.7 o menores que 0.3, tampoco debera utilizarse la
tabla A, y en su lugar, debera emplearse las tablas de Jenkins
(1955).
Cuando las distribuciones subyacentes son normales, sola-
mente esta propiedad confiere superioridad al coeficiente
rt
so-
bre el coeficiente PHI como medida de asociacin.
Ej empl o 4.7
Si deseamos encontrar el coeficiente de correlacin tatracrico
para las variables de la base de DATOS6-tetracrico, se observa
que son 99 estudiantes, donde las notas del curso de estadstica y
del curso de metodologa de investigacin han sido dicotomiza-
das, pues los profesores calificaron con aprobado o desaproba-
do. Obtendremos el coeficiente de correlacin tetracrico.
Y: notas en el curso de estadstica- dicotimizada,
0 desaprob con notas inferiores a 11
1 aprob con notas de 11 o ms
X: notas en el curso de metodologa de investigacin-dico-
tomizada,
0 desaprob con notas inferiores a 11
8(
1 aprob con notas de 11 o ms.
Solucin
Activar el SPSS. Abrir la base de DATOS6-tetracrico y ejecutar
los siguientes comandos:
ANALYZE/ DESCRIPTIVE STATISTICS/ CROSSTABS/ para
ROW escoger NOTAS DE ESTADSTICA y para COLUMNS es-
coger NOTAS DE METODOLOGA/ en FORMAT activar DES-
CENDENT/ CONTINUE/ OK.
El outptup del SPSS muestra el siguiente cuadro:
notas de estadstica * notas de metodologa de la investi-
gacin Crosstabulation
a partir del que se calcula el valor de
d a
c b
= 6.18. En la Tabla E,
al valor 6.18 de
d a
c b
le corresponde el valor
rt
= 0.62 para el coefi-
ciente tetracrico.
Ahora se plantea la siguiente pregunta: Es significativamen-
Count
notas de metodologa
de la investigacin
Total
desaprob Aprob
notas de aprob a=11 b=36 47
estadstica desaprob c=34 d=18 52
Total 45 54 99
87
te diferente de cero el coeficiente de correlacin tetracrico en la
poblacin?. Se deja como ejercicio para el estudiante.
Prueba de hiptesis para el coeficiente de
correlacin biseral
Se usa en situaciones donde se tiene dos variables con distri-
buciones normales subyacentes, una de las cuales ha sido di-
cotomizada.
Una de las situaciones donde se puede obtener el coeficiente
de correlacin biseral es la siguiente. Un profesor desea relacio-
nar el tiempo que los estudiantes emplean en resolver un proble-
ma (X) y la habilidad que tiene para resolver el problema (Y).
El profesor anota el tiempo (X) que cada estudiante demora
en resolver el problema, pero la variable Y no la calific con una
nota en la escala vigecimal o cualquier otra, slo anot que apro-
b (1) si lleg a la solucin correcta y anot no aprob (0) si no
lleg a la solucin correcta.
Coefi ci ente de correl aci n bi seral en l a muestra
Sean las variables continuas Y dicotomizada (1 y 0) y X tambin
dicotomizada (0 y 1).
Calcular:
0 X
: la media de las puntuaciones de la variable X para los que
en Y tienen puntaje "0",
1 X
: la media de las puntuaciones de la variable X para los que
en Y tienen puntaje "1",
X
S : desviacin estndar de la variable X,
n
1
: nmero de unos en Y,
n
0
: nmero de ceros en Y.
Usar la TABLA A, para obtener:
u
: ordenada (es decir la altura) de la unidad de la distribucin
88
normal, en el punto a partir del cual se obtiene el porcentaje
100(
n
n
1
) del rea bajo la curva normal, donde
n n n +
0 1
.
Luego el coeficiente de correlacin biseral muestral es igual a:
.
2
0 1 0 1
,
_
n n u
n
n n
S
X X
r
x
b
(4.4)
Este coeficiente puede ser menor que -1 y mayor que +1.
Estos valores extremos indican que no era cierto que las
puntuaciones X, categorizadas, tienen distribucin normal sub-
yacente o tambin puede indicar fluctuaciones de muestreo cuan-
do
n
es pequeo y produce una distribucin de X marcadamente
platicrtica.
Prueba de hi ptesi s para el coefi ci ente
Paso 1: La hiptesis nula indica que no existe asociacin entre
las dos variables en la poblacin y la hiptesis alternativa niega
dicha afirmacin. Si denotamos con
b
el coeficiente de correla-
cin biseral en la poblacin, entonces, las hiptesis son:
0 :
0
b
H 0 :
1
b
H
Paso 2: Bajo la hiptesis nula, y para tamaos de muestra mayo-
res que 20, la distribucin del coeficiente
rb
es aproximadamen-
te normal con medio cero y desviacin estndar
n u n
n n
1
0 1
. La
estadstica:
n u n
n n
r
z
b
1
0 1
,
_
rb
Es significativamente diferente de cero el coeficiente en-
contrado?. Responderemos con la metodologa de pruebas de
hiptesis.
Paso 1: Enla hiptesis se postula que el coeficiente de correla-
cin biseral en la poblacin,, vale cero y la hiptesis alternativa
niega ese enunciado:
0 :
0
b
H 0 :
1
b
H
Paso 2: Con la informacin obtenida en la muestra:
11
1
n
, 7
0
n ,
3836 . 0 u
, 60 . 0
b
r ,
n u n
n n
1
0 1
=
) 18 )( 3836 . 0 (
1
18
) 7 ( 11
= 0.2995, el valor que toma la
estadstica de prueba es:
9
n u n
n n
r
z
b
c
1
0 1
=
) 18 )( 3836 . 0 (
1
18
) 7 )( 11 (
6 . 0
2995 . 0
6 . 0
= 2.0.
Paso 3: Para = 0.05 ( ) 975 . 0 } <
terico
z z P , en la tabla normal se
encuentra el valor de
terico
z . Luego, la regin de rechazo es el inter-
valo (1.96, ).
Paso 4: Como
c
z = 2.0 cae en el intervalo indicado, la decisin es
rechazar la hiptesis nula con nivel de significacin 0.05.
Ej empl o 4.9
Los datos que se presentan en la base de DATOS7-biseral corres-
ponden a una muestra de 99 alumnos de quinto ao de secunda-
ria, donde el profesor desea saber si estn asociadas las varia-
bles: el tiempo que un estudiante demora en resolver una pre-
gunta y la habilidad que tiene para resolver el problema. Se de-
nota con:
X: el tiempo en minutos que los alumnos gastan en resolver una
pregunta de matemticas,
Y: la habilidad del alumno para llegar a la solucin. A la solu-
cin correcta el profesor le asign 1 y a la solucin incorrec-
ta le asign = 0.
Vamos a estudiar la asociacin entre dichas variables.
Sol uci n
Previamente, en la base de datos se crea: la variable X
0
donde se
guarda los tiempos que demoran en resolver la pregunta, los
alumnos que no llegaron a la solucin correcta y la variable X
1
donde se guarda los tiempos que demoran en resolver la pregun-
ta, los alumnos que llegaron a la solucin correcta.
Con el auxilio del SPSS los clculos auxiliares para encon-
9
ger las variables TIEMPO PARA RESOLVER, X
0
y X
1
/ OPTIONS/
activar MEAN Y STD DEVIATION/ CONTINUE/ OK.
La salidad del SPSS es la siguiente:
donde:
n
1
= 47 n
0
= 52
x1
= 64.13
x
0
= 63.01
4747 . 0
99
47
1
n
n
. En la TABLA A se encuentra el valor de
u
, por-
que:
4747 . 0
99
47
) ( < z Z P
, entonces 982 3 . 0 u .
Luego, el valor del coeficiente de correlacin biseral en la
muestra es:
,
_
n n u
n
n n
s
x x
r
x
b
2
0 1 0 1
1
1
]
1
99 99 ) 99 ( 3982 . 0
) 52 ( 47
168 . 10
01 . 63 13 . 64
2
= 0.07.
Por razones estrictamente acadmicas continuamos con la
prueba de hiptesis, a pesar que sabemos que el valor de la esta-
dstica de prueba va a ser muy pequeo.
Paso 1: El coeficiente de correlacin biseral poblacional entre el
trar el valor del coeficiente de correlacin biseral muestral. Luego
haremos la prueba de hiptesis correspondiente.
Abrir la base de DATOS7-biseral y ejecultar los comandos:
ANALYZE/ DESCRIPTIVE STATISTICS/ DESCRIPTIVES/ esco-
tiempo para
resolver xo X1
N Valid 99 52 47
Mean 63.54 63.0113 64.1310
Std. Deviation 10.168 10.58776 9.76176
93
tiempo empleado y la habilidad para resolver el problema es cero,
frente a la hiptesis que niega esa afirmacin: .
0 :
0
b
H 0 :
1
b
H
Paso 2: Con la informacin obtenida en la muestra obtenemos el
valor de la estadstica de prueba, es decir, para:
n
1
= 47 n
0
= 52
x1
= 64.13
x
0
= 63.01
3982 . 0 u
07 . 0
b
r
n u n
n n
1
0 1
=
) 99 )( 3982 . 0 (
1
99
) 52 ( 47
= 0.126, el valor que toma
la estadstica de prueba es:
n u n
n n
r
z
b
c
1
0 1
126 . 0
07 . 0
= 0.55.
Paso 3: Para = 0.05 ( ) 975 . 0 } <
terico
z z P , el valor de
terico
z es 1.96.
Luego, la regin de rechazo es el intervalo (1.96, ).
Paso 4: Como
c
z = 0.55 no cae en el intervalo indicado, la deci-
sin es no rechazar la hiptesis nula con nivel de significacin
0.05.
Prueba de hipstesis para el coeficiente de
correl aci n de spearman
El coeficiente de correlacin producto-momento calculado a par-
tir de dos series de n posiciones o rangos consecutivos indepen-
dientes, que van de 1 hasta n se conoce con el nombre de coefi-
ciente de correlacin por rangos ordenados de Spearman. En este
caso ambas variables X e Y medidas en la escala ordinales.
Si los datos directos son cuantitativos, estos pueden conver-
tirse en rangos o posiciones.
Por ejemplo, la "posicin u orden de mrito en el saln de
clase" es un ejemplo de conversin de puntuaciones ordenadas
94
en rangos. Es decir, en un grupo de 50 estudiantes se le asigna la
posicin 1 al que alcanz el ms alto puntaje, posicin 2 al si-
guiente,..., y posicin 50 al puntaje mas bajo. Los juicios sobre la
excelencia de una declaracin tambin constituyen un ejemplo
de agrupamiento de posiciones o rangos segn los datos origina-
les. 10 estudiantes recitan una poesa y un juez asigna un "1" a la
mejor declamacin, un "2" a la segunda,..., y 10 a la peor decla-
macin.
Independientemente de cmo se originaron las puntuacio-
nes 1, 2, 3,.............,(
1 n
), n; pueden correlacionarse dos series de
rangos para los mismos individuos.
Coefi ci ente de correl aci n de SPEARMAN en l a muestra
Sean:
x x
n
,....,
1
: rangos asignados a la variable X,
y y
n
,....,
1
: rangos asignados a la variable Y
n: tamao de muestra o nmero de indivduos
y
x
i
i
: diferencia entre el rango asignado a la variable X y el
rango asignado a la variable Y de la i-sima persona.
Si existen dos o ms valores iguales (valores empatados) los
rangos de cada uno de stos son iguales al promedio de los ran-
gos que les correspondera en el caso de que fueran diferentes.
As por ejemplo si las edades de los participantes en un progra-
ma de capacitacin docente son las siguientes: 40 41 42 43 43 44
46, los rangos asignados son: 1, 2, 3, 4.5, 4.5, 6 y 7.
Luego, el coeficiente de correlacin de Spearman se define
de la siguiente manera:
( )
( )
1
6
1
2
2
n
y
x
r
n
i
i
S
(4.5)
1 1
rS
95
su valor no puede ser menor que -1 ni mayor que 1, alcanza
su mximo valor (+1) cuando los individuos ocupan los mismos
rangos o posiciones en X e Y.
Este coeficiente es muy til cuando los datos originales son
rangos o posiciones y cuando se emiten juicios para clasificar indi-
viduos o cosas, pero se recomienda que el tamao de muestra sea
superior a 10.
Pruebas de hi ptesi s para el coefi ci ente
Paso 1: En la hiptesis se postula que no existe asociacin entre
las dos variables en la poblacin y la hiptesis alternativa niega
esa afirmacin. Denotemos con
s
la asociacin o el coeficiente
de correlacin de Spearman en la poblacin, entonces, las hip-
tesis son:
0 :
0
s
H 0 :
0
s
H
Paso 2: Bajo la hiptesis nula, la estadstica de prueba
2
1
2
n
r
r
t
s
s
tiene distribucin t-Student con (n-2) grados de libertad.
Con el valor obtenido en la muestra y bajo la hiptesis nula
se calcula el valor del estadstico de prueba,
c
t .
Paso 3: Para = 0.05,
( ) 025 . 0
) 2 (
>
terico n
t t P o
( ) 975 . 0
) 2 (
<
terico n
t t P
,
en la tabla B-t-Student se encuentra el valor de
c
t .
Luego, la regin de rechazo es el intervalo (
terico
t , ).
Paso 4: Si el valor del estadstico de prueba,
c
t , cae en el inter-
valo indicado, se rechaza la hiptesis nula.
Ej empl o 4.10
9(
Los siguientes datos corresponden a una muestra aleatoria de 12
estudiantes para quienes un juez asign posiciones o rangos en
base a la hostilidad que manifiestan los estudiantes a su profesor
de metodologa de la investigacin y a sus compaeros de clase,
es decir, dos series de rangos. Se desea encontrar el coeficiente de
correlacin de Spearman.
Sea X: la hostilidad manifestada por el estudiante a su pro-
fesor de matemticas donde:
1: es el puntaje asignado al que manifiesta mayor hostilidad al
profesor,
12: es el puntaje asignado al que manifiesta menor hostilidad al
profesor,
Y: la hostilidad manifestada por el estudiante hacia sus otros
compaeros donde:
1: es el puntaje asignado al que manifiesta mayor hostilidad
hacia sus compaeros
12: es el puntaje asignado al que manifiesta menor hostilidad
hacia sus compaeros.
Estudiante Hostilidad Hostilidad a y
x
i
i
( ) y
x
i
i
2
al profesor los compaeros
xi
y
i
1 2 6 - 4 16
2 8 5 3 9
3 12 10 2 4
4 3 7 - 4 16
5 1 3 - 2 4
6 6 4 2 4
7 7 9 - 2 4
8 10 8 2 4
9 4 1 2 4
10 9 11 2 4
11 11 12 - 1 1
12 5 2 3 9
TOTAL 84
. 84
) (
2
y
x
i
i
97
En el siguiente cuadro se presentan los datos y las corres-
pondientes cuentas,
Luego, el valor del coeficiente de correlacin de Spearman es
706 . 0
143
42
1
) 1 144 ( 12
) 84 ( 6
1
rS
La relacin encontrada entre la hostilidad manifiesta a los
compaeros y la hostilidad manifiesta al profesor, es estadstica-
mente significativa?. Responderemos con la metodologa de prue-
bas de hiptesis.
Paso 1: En la hiptesis nula se postula que no existe asociacin
entre las variables hostilidad a los compaeros y hostilidad al
profesor y la hiptesis alternativa esa dicha afirmacin, es decir:
0 :
0
s
H 0 :
0
s
H
Paso 2: El valor de la estadstica de prueba es:
2
1
2
n
r
r
t
s
s
c
=
2 12
706 . 0 1
706 . 0
2
= 3.15.
Paso 3: Para = 0.05
( ) 975 . 0
) 2 (
<
terico n
t t P , en la tabla t-Stu-
dent se encuentra el valor de
terico
t = 2.228. Luego, la regin de
rechazo es el intervalo (2.228, ).
Paso 4: Como el valor de
c
t = 3.15, cae en el intervalo indicado,
se rechaza la hiptesis nula. Al nivel de significacin 0.05 las va-
riables hostilidad al profesor y hostilidad a los compaeros no
estn asociadas.
98
Ejemplo 4.11
En la entrevista personal para ingresar a la carrera docente en
una universidad, participaron 40 postulantes quienes fueron ca-
lificados por dos miembros del jurado. En la base de DATOS7-jura-
do se dispone de la siguiente informacin:
P: postulantes
X1: puntaje asignado a cada postulante por el miembro 1 del ju-
rado,
X2: puntaje asignado a cada postulante por el miembro 2 del ju-
rado,
X: rango que corresponde a las calificaciones del jurado 1,
Y: rango que corresponde a las calificaciones del jurado 2,
y se desea encontrar el coeficiente de correlacin de Spearman.
Sol uci n
Paso1: En la hiptesis nula se postula que los puntajes asigna-
dos por los dos jurados no estn relacionados y la hiptesis alter-
nativa niega esa afirmacin.
0 :
0
s
H 0 :
0
s
H
Paso 2: Obtendremos el valor de la estadstica de prueba me-
diante el soporte del SPSS.
Abrir la base de DATOS7-jurado, donde la informacin est
preparada de acuerdo a las exigencias de la frmula del coefi-
ciente de correlacin de Spearman y ejecutar los siguientes co-
mandos:
Rango a las Rango a las
notas del notas del
jurado 1 jurado 2
Spearman's rho Rango a las Correlation Coefficient 1.000 .332
notas del Sig. (2-tailed)
jurado 1 .036
Rango a las Correlation Coefficient .332 1.000
notas del Sig. (2-tailed) .036
jurado 2
99
ANALYZE/ CORRELATE/ BIVARIATE/ seleccionar las varia-
bles X e Y/ activar SPEARMAN/ OK.
El output del SPSS nos muestra lo siguiente:
Con el valor del coeficiente de correlacin de Spearman de la
muestra 332 . 0
s
r , obtenemos el valor de la estadstica de prueba:
2
1
2
n
r
r
t
s
s
c
=
2 40
332 . 0 1
332 . 0
2
= 2.17
Paso 3: En la tabla t-Student para el nivel de significacin 0.05 y
38 grados de libertad se encuentra el valor terico: 02 . 2
terico
t .
Paso 4: Como el valor de 217
c
t es mayor que el valor terico,
entonces se rechaza la hiptesis nula. Obsrvese la importancia
del tamao de muestra.
Tambin si usamos el criterio del value p_ se llega a la mis-
ma decisin, pues sabemos que si < value p_ se rechaza la hi-
ptesis nula. En el presente caso el valor de value p_ = 0.036 es
menor que = 0.05.
Pruebas de hiptesis para tablas de contingencia
Tabl as bi di mensi onal es para dos vari abl es cual i tati vas
En una muestra de n individuos en quienes se han observado las
variables X e Y, se denota con A
1
, A
2
, , A
k
los k niveles o
modalidades de X y con B
1
, B
2
, , B
r
los r niveles o modalidades
de Y. La distribucin de los individuos considerando las dos
caractersticas, se puede presentar en una tabla de doble en-
trada o en una tabla bidimensional como la siguiente, donde
los niveles de una de las variables ocupa la posicin de las filas y
los niveles de la otra variable ocupa la posicin de las columnas
00
y los valores dentro de la tabla o celdas son las frecuencias absolu-
tas conjuntas.
donde:
f
ij
, es el nmero de elementos con las modalidades Ai y Bj, de-
nominadas frecuencias absolutas conjuntas,
f
i.
, es el nmero de elementos con la modalidad Ai denomina-
da i-sima frecuencia marginal,
f
j .
, es el nmero de elementos con la modalidad Bj denominada
j-sima frecuencia marginal,
Eligiendo X como variable fila e Y como variable columna,
se cumplen las siguientes propiedades:
f f
j
k
i
ij .
1
,
f f
i
r
j
ij .
1
.
1
.
1
.
1 1
n
r
j
j
k
i
i
r
j
ij
k
i
f f f
Al dividir las frecuencias absolutas conjuntas entre el n-
mero total de observaciones se obtienen las frecuencias relativas
conjuntas
hij
correspondiente a las modalidades Ai y Bj, y las co-
rrespondientes frecuencias relativas marginales;
hi.
y
hj .
, las que
Tabla de frecuencias conjuntas absolutas
X Y
B
1
B
2
. B
j
B
r
Total
A
1
f
11
f
12
. f
1j
. f
1r
f
1.
A
2
f
21
f
22
. f
2j
. f
2r
f
2.
.. . .. . . .
A
i
f
i1
f
i2
. f
ij
. f
ir
f
i.
. . . . . . .
Ak f
k1
f
k2
. f
ki
. f
kr
f
k.
Total f.
1
f.
2
. f.
j
f
.r
n
0
se presentan en la siguiente tabla de frecuencias relativas bidimen-
sionales.
donde:
n
f
h
ij
ij
Asimismo, al dividir las frecuencias absolutas marginales
entre el nmero total de observaciones se obtienen las frecuen-
cias relativas marginales:
n
f
h
n
f
h
j
j
i
i
.
.
.
.
.
Ej empl o 4.12
Se toma una pequea muestra de docentes que participan en un
programa de capacitacin, para quienes registramos los valores
de las variables sexo y estado civil. Se tabular la informacin en
Tabla de frecuencias relativas conjuntas
X Y
B
1
B
2
. B
j
B
r
Total
A1 h11 h12 . h1j . h1r h1.
A2 h21 h22 . h2j . h2r h2.
.. . .. . . .
Ai hi1 hi2 . hij . hir hi.
. . . . . . .
Ak hk1 hk2 . hki . hkr hk.
Total h.1 h.2 . h.j h.r n
0
una tabla de doble entrada donde la variable sexo est representa-
da en las filas y el estado civil en las columnas.
Solucin
Slo con fines didcticos no hacemos uso del SPSS y contamos el
nmero de veces que se repite la categora A
i
de la variable sexo
y el nmero de veces que se repite la categora B
j
de la variable
estado civil. As, para A
1
= femenino, A
2
= masculino, B
1
= soltero,
B
2
= casado se tiene: f
22
= 2, es decir, son 2 los estudiantes del sexo
masculino y casados; f
12
= 6, es decir, son 6 estudiantes del sexo
Sexo Civil Sexo Civil Sexo civil sexo civil
Femenino Soltero Femenino Soltero Femenino soltero femenino soltero
Femenino soltero Masculino Soltero Masculino casado masculino casado
Masculino soltero Masculino soltero femenino casado femenino casado
Femenino casado Femenino casado Masculino soltero masculino soltero
Masculino soltero Femenino soltero femenino casado masculino soltero
Masculino soltero Femenino soltero femenino casado masculino soltero
Cuadro N 4.1 Distribucin de los docentes segn sexo y estado civil,
participantes en el Programa de Capacitacin de la FCM-UNMSM
Lima - 2004
SEXO ESTADO CI VI L Total
Soltero Casado
Femenino 7 6 13
Masculino 9 2 11
Total 16 8 24
femenino y casados. En el siguiente cuadro se presentan las fre-
cuencias conjuntas.
03
Son 7 docentes solteras y 6 casadas del sexo femenino. Los
estudiantes del sexo masculino 9 son solteros y 2 casados.
En tablas de doble entrada para dos variables cualitativas se
calcula el coeficiente de contingencia que mide la relacin entre las
dos variables. Como se ver, ste ndice est en funcin de la esta-
dstica ji-cuadrado,
2
, ampliamente usada por los investigadores
de las ciencias sociales, pero que su interpretacin a veces reviste
dificultades porque no existe un valor de comparacin y puede
tomar cualquier valor positivo. El valor del coeficiente de contin-
gencia oscila entre 0 y 1.
Coefi ci ente de conti ngenci a en l a muestra
Para la presentacin general de una tabla de contingencia para
dos variables cualitativas se tiene:
n: tamao de la muestra,
f
ij
: frecuencia absoluta conjunta que corresponde al i-simo nivel
de la variable fila y al j-simo nivel de la variable columna,
eij
: la frecuencia esperada conjunta que corresponde al i-simo
nivel de la variable fila y al j-simo nivel de la variable co-
lumna, que se calcula con la siguiente frmula:
n
f f
e
j i
ij
. .
r
j
k
i
ij e
e
f
ij
ij
1 1
2
2
.
Finalmente se define el coeficiente de contingencia como:
04
n
C
+
2
2
cuyos valores oscilan entre 0 y 1.
Pruebas de hiptesis para el parmetro poblacional
Paso 1: Se plantea independencia entre la variable fila y la va-
riable columna de la tabla de contingencia. En el ejemplo, el sexo
y el estado civil de los participantes son independientes. Simbo-
lizaremos con:
0
H : Las variables fila y columna son independientes.
1
H : Las variables fila y columna no son independientes.
Paso 2: Bajo la hiptesis nula, el estadstico de prueba
( )
r
j
k
i
ij e
e
f
ij
ij
1 1
2
2
.
Paso 3: Con un nivel de significacin , se compara el valor cal-
culado en el paso 2, con el percentil ( ) % 100 1 de la distribu-
cin chi-cuadrado con (k-1)(r-1) grados de libertad, percentil que
se denota por .
2
) 1 )( 1 ( ) 1 ( r k
x
3
1
2
1
2
2
j i
ij e
e
f
ij
ij
( )
29 . 29
29 . 29 21
2
+
( )
34 . 34
34 . 34 33
2
+
( )
37 . 37
37 . 37 47
2
+
( )
71 . 28
71 . 28 37
2
+
( )
66 . 33
66 . 33 35
2
+
( )
63 . 36
63 . 36 27
2
=9.859.
d) Finalmente, el valor del coeficiente de contingencia es:
217 . 0 047 . 0
859 . 209
859 . 9
C
.
Para 0.05, es estadsticamente significativo el valor en-
contrado?.
Pasamos a aplicar la metodologa de pruebas de hiptesis.
Prueba de hi ptesi s para i ndependenci a en tabl as de
conti ngenci a
Paso 1: Se plantean las hiptesis nula y alternativa:
0
H : El sexo y la escuela acadmico profesional son inde-
pendientes.
1
H : El sexo y la escuela acadmico profesional no son
independientes.
Paso 2: Bajo la hiptesis nula, el valor de la estadstica de
prueba es:
07
( )
r
j
k
i
ij
e
e
f
ij
ij
1 1
2
2
=
2
) 2 ( ) 95 . 0 (
x = 5.99. La regin de rechazo
es el intervalo (5.99, ).
Paso 4: El valor de la estadstica de prueba es 9.859 y es mayor que
2
) 2 ( ) 95 . 0 (
x = 5.99, por lo que se rechaza la hiptesis nula de indepen-
dencia, con un nivel de significacin 0.05.
Observe la importancia del tamao de la muestra.
Ej empl o 4.14
Los datos que dieron origen a la tabla de contingencia usada en
el ejemplo 4.13 se encuentran en la base de DATOS8-chi-cuadra-
do. Resolveremos el ejemplo anterior usando comandos del SPSS.
Sol uci n
sexo de los estudiantes- FACULTAD DE MATEMTI CAS
* escuelas acadmico profesionales- FACULTAD DE
MATEMTI CAS Crosstabulation
Count
escuelas acadmico profesionales-
FACULTAD DE MATEMTICAS
matematicas estadstica investigacin Total
operativa
sexo de los FEMENINO 21 33 47 101
estudiantes-
FACULTAD DE MASCULINO 37 35 27 99
MATEMTICAS
Total 58 68 74 200
08
Abrir la base de DATOS8-chi-cuadrado y ejecutar los comandos:
ANALYZE/ DESCRIPTIVE STATISTICS/ STATISTIC / elegir en
ROW la variable SEXO y como COLUMNS la variable ESCUELA
ACADMICO PROFESIONAL/ STATISTICS/ activar CHI-
CUADRADO CONTINGENCY/ PEARSON/ CONTINUE/ OK.
El output del SP=SS es el siguiente:
Se observa que el valor del coeficiente de contingencia es 0.217
y el valor de la estadstica de prueba es 9.859, valores que coinciden
con los obtenidos en el paso anterior.
Para la prueba de hiptesis procedemos de la siguiente
manera:
Paso 1: Se plantean las hiptesis nula y alternativa:
0
H : El sexo y la escuela acadmico profesional son inde-
pendientes.
1
H
: El sexo y la escuela acadmico profesional no son
independientes.
Paso 2: Bajo la hiptesis nula, el valor de la estadstica de prue-
ba es:
859 . 9
2
.
Value df Asymp.
Sig. (2-sided)
Pearson
Chi-Square 9.859 2 .007
Value Approx. Sig.
Nominal by Contingency .217 .007
Nominal Coefficient
09
Paso 3: Con un nivel de significacin = 0.05, si
value p_
<
se rechaza la hiptesis nula.
Paso 4: Como
value p_
= 0.007 < 0.05, la decisin es recha-
zar la hiptesis nula de independencia entre sexo y la elec-
cin de la Escuela Acadmico Profesional, para el nivel de sig-
nificacin 0.05
Ejercicios
Seleccione la base de DATOS10-maestra y:
a) Construya las tablas de doble entrada con las frecuencias
absolutas y relativas para las variables condicin laboral de
los estudiantes y el mtodo con el que estudiaron el curso de
estadstica.
b) Interprete algunas frecuencias absolutas y relativas con-
juntas.
c) Encuentre el coeficiente de contingencia e interpretar su
valor.
d) Con = 0.10, es estadsticamente significativa la asocia-
cin encontrada entre la condicin laboral de los estudian-
tes y el mtodo con el que estudiaron?. Resuelva detallada-
mente considerando todos los pasos desde el planteamiento
de las hiptesis hasta la decisin.
Seleccione la base de DATOS8-chi-cuadrado y:
a) Construya las tablas de doble entrada con las frecuencias
absolutas y relativas para las variables expectativas respec-
to a su futuro y escuela profesional.
b) Interprete algunas frecuencias absolutas y relativas con-
juntas.
c) Encontrar el coeficiente de contingencia.
d) Con = 0.10, es estadsticamente significativa la asocia-
cin encontrada entre las expectativas respecto a su futuro
y la escuela profesional escogida?. Resuelva detalladamente
considerando todos los pasos desde el planteamiento de las
0
hiptesis hasta la decisin.
Seleccione la base de DATOS8-chi-cuadrado y:
a) Construya las tablas de doble entrada con las frecuencias
absolutas y relativas para el medio de transporte que usan
para dirigirse a la universidad y el sexo de los estudiantes.
b) Interprete algunas frecuencias absolutas y relativas con-
juntas.
c) Encuentre el coeficiente de contingencia e interpretar su valor.
d) Con = 0.10, es estadsticamente significativa la asociacin
encontrada entre el medio de transporte utilizado para dirigir-
se a la universidad y el sexo de los estudiantes?. Resuelva deta-
lladamente considerando todos los pasos desde el planteamien-
to de las hiptesis hasta la decisin.
Para el ejercicio 4.1 encuentre el coeficiente de asociacin phi
entre la variable fila condicin laboral y la variable columna
mtodo con el que estudiaron el curso de estadstica. Interprete.
Al nivel de significacin = 0.10, es estadsticamente significati-
vo el valor encontrado?.
En la base de DATOS10-maestra seleccione las variables mto-
do de enseanza y notas en el curso de estadstica.
a) Defina una nueva variable ficticia X
0
y guarde en ella las
notas de estadstica para los que estudiaron con el mtodo
tradicional.
b) Defina una nueva variable ficticia X
1
y guarde en ella las
notas de estadstica para los que estudiaron con el mtodo
no tradicional.
c) Encuentre la media aritmtica de las dos variables ante-
riores.
d) Encuentre la desviacin estndar de las notas de estadstica.
e) Encuentre el coeficiente de correlacin biseral-puntual e in-
terprete su valor.
f) Es estadsticamente significativo el valor encontrado, cuan-
do = 0.10?.