Documentos de Académico
Documentos de Profesional
Documentos de Cultura
VII
136
Estadstica no paramtrica
Captulo
VII
.................................
Objetivo del
Captulo
............................
Desarrollar la metodologa de
prueba de hiptesis para variables
de distribucin libre. Analizar las
aplicaciones
para
variables
ordinales y nominales.
Cap. VII
Estadstica no paramtrica
137
7.1 Introduccin
Consideramos a los mtodos estadsticos no paramtricos como aquellos que no requieren
conocimientos de ningn parmetro de la poblacin, tambin denominados de distribucin libre.
As tambin existen situaciones en algunos problemas cuando las variables que intervienen no
necesariamente son variables intervalares; en algunos casos pueden ser variables nominales o
variables ordinales. Y en el caso de que exista asociacin lineal entre las variables dependientes e
independientes, pero del tipo mencionado con anterioridad, no resulta conveniente aplicar el
coeficiente de correlacin de Pearson, si no cumplen las condiciones y requisitos de uso que
requiere en este caso el citado coeficiente. Entonces se podr usar el coeficiente de Spearman (r s),
el cual es un caso particular del coeficiente de Pearson (r xy).
La expresin datos categricos se refiere al tipo de datos obtenidos al medir variables utilizando
una escala de medida nominal o de escala ordinal con pocos niveles, estos tipos de variables
abundan en las investigaciones sociales y/o psicolgicas. En una investigacin clnica se pueden
encontrar variables como el tipo de trastorno psicolgico (neurosis, esquizofrenia, ansiedad,
depresin, etc), o se puede clasificar a los pacientes como tratados y no tratados, recuperados y no
recuperados. En una investigacin social se puede clasificar a los sujetos de acuerdo con las
actitudes u opiniones que manifiestan hacia un objeto en particular (desde muy de acuerdo, hasta
muy en desacuerdo)
Estudiaremos el anlisis para:
1. Dos variables que pueden ser intervalares pero que no cumplen los supuestos bsicos de
pruebas paramtricas vistas en el captulo anterior, o tambin es el caso que las dos
variables sean ordinales (r de Spearman)
2. Una variable: proporciones y bondad de ajuste (prueba Binomial y Chi cuadrado
respectivamente)
3. Dos variables: tablas de contingencia bidimensionales (Chi cuadrado de Pearson, medidas
de asociacin para datos ordinales y nominales).
4. Mltiples variables: MODELOS LOGLINEALES JERRQUICOS, Modelos LOGIT
7.2 Anlisis de datos categricos con dos variables relacionadas o tambin dos variables
intervalares que no cumplen los requisitos que exigen las pruebas paramtricas
Coeficiente de correlacin por rangos de Spearman
Este coeficiente de correlacin se utiliza cuando una o ambas escalas de medidas son ordinales,
ejemplo: una variable es el orden de llegada en una carrera y la otra la estatura de los corredores.
Es especialmente til en el caso donde el tamao de muestra es pequeo (menor de 30), es decir el
nmero de pares de puntajes n que se desea asociar. Cuando el nmero de dichos pares es muy
grande, por el teorema del lmite central, la condicin de normalidad se minimiza, y el modelo
que se emplea es uno paramtrico; tambin, cuando los puntajes se jerarquizan (o se ponen en
correspondencia biunvoca con el conjunto de nmeros ordinales) se prevean muchos empates,
esto es que en el ordenamiento varios puntajes tendrn el mismo nmero ordinal. Si ests dos
situaciones ocurrieran, lo ms conveniente es utilizar el coeficiente de correlacin de Pearson.
Pero si el nmero de puntajes que se desean correlacionar fuera n < 30, y los empates son pocos
entonces se puede trabajar con el coeficiente de Spearman.
El coeficiente de correlacin por rangos (r s) se calcula aplicando la siguiente frmula:
rs = 1
d2
n(n2 1)
Cap. VII
Estadstica no paramtrica
138
Para el clculo de (rs) es necesario obtener la diferencia d entre los rangos, y si una de las escalas
no es ordinal, entonces se asigna rango a las puntuaciones.
Adems de obtener el grado de asociacin entre dos variables con r s, se puede saber acerca de la
dependencia o independencia de dos variables aleatorias, como sigue:
Prueba bilateral:
H0 : La variable x y la variable y son mutuamente independientes.
Ha : i) Cundo existe la tendencia de que los valores altos de x sean pareados con los valores
altos de y.
ii) Cuando existe la tendencia de que los valores bajos (o pequeos) de x sean pareados con
los valores altos (o grandes) de y.
Ejemplo de aplicacin:
A un grupo de 10 estudiantes de la UPeU se les aplic una prueba de matemticas (x) y una prueba
de lgica (y), se obtuvieron los siguientes puntajes (escala de 0 100):
Estudiante
x
y
A
84
52*
B
75
39
C
98*
48
D
70** 32**
E
75
40
F
80
36
G
83
38
H
75
37
I
84
50
J
90
46
Sumatoria
* Calificacin ms alta
** Calificacin ms baja
a) Se desea saber el grado de semejanza entre las calificaciones obtenidas por los estudiantes en
las pruebas x e y
b) H0: Las calificaciones obtenidas en matemticas son mutuamente independientes de las
calificaciones obtenidas en lgica por los 10 estudiantes, contra la alternativa bilateral, al 0.05
de nivel de significancia.
Ha: Existe una correlacin positiva o negativa entre las calificaciones obtenidas en ambas
pruebas (dependencia).
Solucin
Dar rango a los datos de las variables x e y de menor a mayor o viceversa, luego realizar las
diferencias de estos rangos (x-y), elevar al cuadrado estas diferencias, finalmente sumar estas
diferencias y usar este total en la formula.
Cap. VII
Estudiante
139
Estadstica no paramtrica
A
84
B
75
C
98*
D
70**
E
75
F
80
G
83
H
75
I
84
J
90
Sumatoria
* Calificacin ms alta
** Calificacin ms baja
y
52*
39
48
32**
40
36
38
37
50
46
a) Aplicando la formula de rs
Rango de x Rango de
y
3.5
1
8
6
1
3
10
10
8
5
6
9
5
7
8
8
3.5
2
2
4
rs = 1
d2
n(n2 1)
rs
Rx-Ry=d
2.5
2
-2
0
3
-3
-2
0
1.5
-2
6(4 2.5)
1 0(1 0 0 1)
d2
6.25
4
4
0
9
9
4
0
2.25
4
42.5
1 0.2 5 7 6 0.7 4 2
Salida en el SPSS
Correlaciones
Matemticas
Rho de Spearman
Matemticas
Lgica
Coeficiente de
correlacin
Sig. (bilateral)
N
Coeficiente de
correlacin
Sig. (bilateral)
N
Lgica
1.000
.739(*)
.
10
.015
10
.739(*)
1.000
.015
10
.
10
Cap. VII
Estadstica no paramtrica
140
b. Sig 0.015 < 0.05, por lo tanto concluimos que existe una correlacin significativa entre los
cursos
Coeficiente TAU ( ) de Kendall
Esta medida de correlacin est basada en intervalos jerarquizados de las observaciones, ms que
en los nmeros mismos, con la ventaja de que la distribucin de dicho coeficiente no depende de la
distribucin de x e y; siempre y cuando las observaciones representadas por x e y sean
independientes y continuas. Este coeficiente desarrollado por Kendall (1938), es preferido por
algunos investigadores sobre el coeficiente de Spearman, no obstante que ( ) es ms difcil de
calcular que (rs), la ventaja principal de Kendall es que su distribucin tiende a la distribucin
normal ms rpidamente que la de Spearman.
La formula est definida por:
P Q
n (n 1)
2
Ejemplo de aplicacin
Considerando una situacin de indisciplina en un grupo de nios de 5 aos de edad en una
guardera, a nueve nios (que aparentemente eran los catalogados ms agresivos tanto por sus
padres como por la persona encargada de ellos en la guardera), se les aplic una prueba para
confirmar el grado de agresividad. Por una semana se hicieron registros observacionales, da a da
y bajo ciertas condiciones, por lo que los registros obtenidos en promedio fueron los siguientes:
(ROy), registros observacionales en la guardera; (ROx), registros observacionales en sus hogares,
Ry, rangos o intervalos en la guardera Rx, rangos o intervalos en sus hogares.
Nios
A
B
C
D
E
F
G
H
I
ROx
84
80
78
76
70
64
62
50
47
ROy
60
64
71
61
58
57
54
55
52
Rx
1
2
3
4
5
6
7
8
9
Ry,
4
2
1
3
5
6
8
7
9
Paso 1.
Cada distribucin de puntajes que representa a cada variable x o y, se jerarquiza de
la misma manera que cuando se calcula el coeficiente de Spearman para obtener Rx y Ry, Pero
con la modificacin de que un conjunto de rangos (x o y) debe estar ordenado en una secuencia
natural y creciente. El objetivo de este paso es tener una referencia que se utilizar ms adelante.
Paso 2.
Se obtiene la columna (P) de rangos ms altos y la columna (Q) de rangos ms
bajos que tengan como referencia la columna Ry. Esto se obtiene de la siguiente manera: se
considera el valor numrico del primer nio (en la columna Ry., 4, en nuestro ejemplo) y se
cuenta hacia abajo cuntos valores numricos son menores que l (en este caso 2,1 y 3 son los tres
valores menores que l); tambin se cuentan cuntos valores son mayores que l (5, 6, 8, 7, y 9
son los cinco valores mayores que l).
Cap. VII
Estadstica no paramtrica
Rx
1
2
3
4
5
6
7
8
9
141
Ry
Primer sujeto
4
2
Tres rangos ms
1
bajos que el
3
primer sujeto
5
Cinco rangos
6
ms altos que
8
el primer
7
sujeto
9
Cantidad P de rangos ms Cantidad Q de rangos ms
altos
bajos
5
3
Para obtener el segundo sujeto (2 en nuestro ejemplo), hay uno ms bajo que l (el 1 es ms bajo
que el segundo sujeto) y seis ms altos que el segundo sujeto (3, 5, 6, 8,7 y 9).
Rx
1
2
3
4
5
6
7
8
9
Ry
4
2
1
3
5
6
8
7
9
Segundo sujeto
Un rango
ms bajo que
el segundo
sujeto
Seis rangos
ms altos que
el segundo
sujeto
Cantidad de rangos ms
altos (P)
5
6
Cantidad de rangos ms
bajos (Q)
3
1
En el caso de nuestro tercer sujeto (1) se excluyen los sujetos anteriores a l y se sigue contando
haca abajo cuntos hay menores que l y cuntos mayores en su valor numrico.
Para nuestro tercer sujeto (1) no hay un valor numrico menor que l (0) pero hay 6 ms altos 3, 5,
6, 8,7 y 9).
Rx
1
2
3
4
5
6
7
8
9
Ry
4
2
1
3
5
6
8
7
9
Tercer sujeto
(Cero rangos
ms bajos que
l)
Seis rangos
ms altos que
el tercer
sujeto
Cap. VII
142
Estadstica no paramtrica
Se seguir sucesivamente este mtodo hasta el ltimo sujeto, que siempre va a ser cero rangos ms
altos y cero rangos ms bajos.
Paso 3. Una vez que se tienen todas las columnas anteriores se obtiene la sumatoria de la columna
de rangos ms altos, la cual la denotaremos como P.
A la sumatoria de la columna de rangos ms bajos, la denotaremos con Q.
Sujetos
ROx
ROy
Rx
Ry,
A
B
C
D
E
F
G
H
I
84
80
78
76
70
64
62
50
47
60
64
71
61
58
57
54
55
52
1
2
3
4
5
6
7
8
9
4
2
1
3
5
6
8
7
9
Rangos
Rangos
ms altos ms altos
P
Q
5
3
6
1
6
0
5
0
4
0
3
0
1
1
1
0
0
0
31
31 5
9(9 1)
2
26
36
) Tau de Kendall
Donde:
n=9
P = 31
Q=5
0.72
Interpretacin: Existe una correlacin significativa entre lo detectado por los padres y lo
detectado por la guardera con respecto al nivel de agresividad de los nios menores de 5 aos.
Reporte en el SPSS
Correlaciones
Registro_guardera
Tau_b de Kendall
Registro_guardera
Registro_hogar
Coeficiente de
correlacin
Registro_hogar
1.000
.722(**)
Sig. (bilateral)
N
.007
Coeficiente de
correlacin
.722(**)
1.000
Sig. (bilateral)
N
.007
9
.
9
Cap. VII
143
Estadstica no paramtrica
Resultados
El SPSS toma como categora de referencia la correspondiente al primer caso del archivo de datos.
En nuestro ejemplo el primer caso le corresponde el cdigo 0, la categora de referencia es la
categora minora = no es decir raza blanca. Las hiptesis a contrastar son:
Ho: m i orn i a0 0.7
Ha: m i orn i a0 0.7
Prueba binomial
Categora
Clasificacin
de minoras
Grupo 1
Grupo 2
Total
Proporcin
observada
No (raza blanca)
370
.8 (0.78)
S (raza de color)
104
474
.2
1.0
Prop. de
prueba
.7
Sig. asintt.
(unilateral)
.000(a)
a Basado en la aproximacin Z.
La proporcin de casos en la categora de referencia es 0.78 (370/474) y la proporcin de prueba
es 0.70
Mtodos estadsticos aplicados a la investigacin - Mg. Rosa Padilla Castro
Cap. VII
Estadstica no paramtrica
144
G ner o
G ner o
1
2
M asculino
Fem enino
M asculino
1
2
M asculino
Fem enino
Asymp. Sig.
( 2- t ailed)
Segur idad
G r oup
G r oup
Tot al
G r oup
Tot al
G r oup
G r oup
Tot al
Test Pr op.
G ner o
O bser ved
Pr op.
C at egor y
Bi nom i al Test
157
206
363
27
27
74
10
84
. 43
. 57
1. 00
1. 00
1. 00
. 88
. 12
1. 00
. 50
. 012a
. 50
. 000a
. 50
. 000a
Cap. VII
Estadstica no paramtrica
145
Conclusin:
Dado que el Sig para todos las categoras es menor del 5%, entonces decimos al nivel de
significancia del 5% que la categora laboral si difiere en todos los casos con respecto al gnero,
siendo al nivel administrativo la proporcin de mujeres es ms alta (57%) con respecto a los
hombres, sin embargo sucede lo contrario a nivel directivo la proporcin de hombres es ms alta
(88%) con respecto a las mujeres y es ms notable en el personal de seguridad donde el 100% son
hombres.
Prueba de Rachas
Rachas para probar la aleatoriedad (secuencia de casos que se est repitiendo)
Ejemplo
Los artculos que salen de un proceso se clasifican como defectuosos o no defectuosos. Se tuvo la
siguiente sucesin n de artculos observados en el tiempo.
DNNNNNNDDNNNNNNDDDNNNNNDNNNDDNNNDD
Sugieren estos datos una falta de aleatoriedad de defectuosos o no defectuosos?
Ho: existe aleatoriedad
Ha: No existe aleatoriedad
Cap. VII
Estadstica no paramtrica
146
Prueba de rachas
ARTI CULO S.
RECO DI F
Valor de pr ueba a
Casos < Valor de pr ueba
Casos >= Valor de
pr ueba
Casos en t ot al
Nm er o de r achas
Z
Sig. asint t . ( bilat er al)
2
11
23
34
11
- 1. 751
. 080
a. Mediana
Como el nivel de significancia es 0.08, no podemos rechazar Ho, concluimos que si existe
aleatoriedad.
Prueba de Kolmogorov
Sirve para contrastar la hiptesis nula de que la distribucin de una variable se ajusta a una
determinada distribucin terica de probabilidad. A diferencia de las anteriores pruebas esta ha
sido diseada para evaluar el ajuste de variable categrica. La prueba de Kolmogorov tambin se
adapta a situaciones en la que interesa evaluar a situaciones de ajuste cuantitativo.
Ejemplo: Con la misma data datos de empleados.sav usar la variable Salario inicial
Ho: Las puntaciones de salario inicial se ajustan a una distribucin normal
Ha: Las puntaciones de salario inicial no se ajustan a una distribucin normal
Prueba de Kol mogorov- Smi rnov par a una muest ra
N
Par met r os nor m ales a, b
Dif er encias ms
ext r emas
Media
Desviacin t pica
Absolut a
Posit iva
Negat iva
Salar io inicial
474
$17, 016. 09
$7, 870. 638
. 252
. 252
- . 170
5. 484
. 000
Sig 0.000 < 0.05 por lo tanto rechazamos la Ho, es decir al nivel de significancia del 5%
concluimos que los datos no siguen una distribucin normal.
Ejemplo: (archivo autoaccidentes accidents.sav) base de datos sobre el n de accidentes
automovilsticos por conductor, as tambin como su edad y gnero. Cada caso representa un
Mtodos estadsticos aplicados a la investigacin - Mg. Rosa Padilla Castro
Cap. VII
Estadstica no paramtrica
147
conductor o chofer y que adems registra el n de accidentes en los 5 aos. Se desea probar que el
n de accidentes sigue una distribucin de Poisson (Alpha = 1%)
Ho: la variable sigue una distribucin de Poisson
(Poisson son para ocurrencias raras)
O ne- Sampl e Kol mogorov- Smi r nov Test
N
Poisson Par am et er
Most Ext r em e
Dif f er ences
a, b
Mean
Absolut e
Posit iv e
Negat ive
nmer o de
accident es
ms all de
5 aos
500
1. 72
. 065
. 065
- . 041
1. 460
. 028
Cap. VII
148
Estadstica no paramtrica
nmero de
accidentes
ms all de 5
aos
250
1.98
N
Parmetro de Poisson(a,b)
Diferencias ms extremas
Media
Absoluta
.047
.047
Positiva
Negativa
-.033
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
N
Femenino
Parmetro de Poisson(a,b)
Diferencias ms extremas
.750
.627
250
1.47
.074
Media
Absoluta
Positiva
.074
Negativa
-.042
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
1.164
.133
Para los dos casos el nivel de significancia es mayor del 0.05 por lo tanto no podemos rechazar la
Ho, por lo tanto demostramos que la variable sigue una distribucin de Poisson
Valor observado
Valor esperado =
, como:
e) 2
(o
e
; donde
to ta lfila x to ta lco lu mn a
to ta lg en era l
Supngase que en una determinada muestra se observan una serie de posibles sucesos E 1, E2, E3, . .
. , EK, que ocurren con frecuencias O1, O2, O3, . . ., OK, llamadas frecuencias observadas y que,
segn las reglas de probabilidad, se espera que ocurran con frecuencias e 1, e2, e3, . . . ,eK llamadas
frecuencias tericas o esperadas. Se desea saber si las frecuencias observadas difieren
significativamente de las frecuencias esperadas.
2
Cap. VII
Estadstica no paramtrica
149
.
Las aplicaciones ms importantes de la distribucin Chi cuadrado, son:
Con una sola variable: Prueba de bondad de ajuste, ejemplo: prueba de normalidad
Con dos variables:
Prueba de independencia
Prueba de homogeneidad de poblaciones.
Cuando consideramos que los valores de una tabla han sido extrados de una poblacin, entonces
nos interesara probar las siguientes dos hiptesis:
La prueba de la Independencia, que se efecta para probar si hay asociacin entre las variables
categricas A y B
La prueba de Homogeneidad, que es una generalizacin de la prueba de igualdad de dos
proporciones. En este caso se trata de probar si para cada nivel de la variable B, la proporcin con
respecto a cada nivel de la variable A es la misma.
7.4.1 La prueba de la independencia
Permite determinar si dos variables categricas son independientes (no estn asociadas o no
estn relacionadas) cuando ambas se han medido en la misma unidad de anlisis.
Las n unidades de anlisis se clasifican en categoras mutuamente excluyentes de modo que las
frecuencias se presentan en una tabla de contingencia bivariada o de doble entrada o tabla de f
filas x c columnas.
Los totales marginales no estn controlados por el investigador.
Si designamos las columnas por r y las filas o renglones por k, se tendr una tabla de r x k.
Los grados de libertad sern iguales a n = (r-1)(k-1), as que en una tabla de "2 x 2", los grados
de libertad son: (2-1)(2-1)= 1 G.L.; en la tabla "3 x 4" ser (3-1)(4-1) = 6 G.L.
Si se tuviera los niveles de un solo criterio, tambin se utiliza la Chi- cuadrado, y los grados de
libertad es igual al nmero de niveles menos uno (n-1); el valor esperado para cada frecuencia es
el correspondiente al promedio.
Pasos para la prueba de hiptesis:
1. Hiptesis estadsticas:
Ho: Las dos variables categricas son independientes
(Es decir, no hay asociacin entre ellas)
Ha: Las dos variables categricas estn relacionadas
(Es decir, son dependientes)
2. Nivel de significancia:
Cap. VII
150
Estadstica no paramtrica
3. Funcin Pivotal:
(o
e)
4. Regiones:
Delincuente
10
41
No
delincuente
29
20
Total
39
61
Ho: El grado de delincuencia es independiente del tiempo libre que comparten los padres con
sus hijos
Ha: El grado de delincuencia depende del tiempo libre que comparten los padres con sus hijos
Nivel de significancia:
= 0.5
Cap. VII
151
Estadstica no paramtrica
Funcin Pivotal:
(o e)
e
Valor observado
Valor esperado =
to ta lfilax to ta co
l lu mn a
to ta l
Regiones:
3 9* 5 1
1 9.9
100
(1 0 1 9.9) 2
1 9.9
e12
( 2 9 1 9.1) 2
1 9.1
3 9* 4 9
1 9.1
100
( 4 1 3 1.1) 2
3 1.1
2
exp
e21
6 1* 5 1
3 1.1
100
( 2 0 2 9.9) 2
2 9.9
e22
6 1* 4 9
2 9.9
100
1 6.4 5 2
Base de datos
2
Ponderar casos: Datos< Ponderar casos <ponderar casos mediante<pasar la variable
frecuencia< aceptar
Cap. VII
Estadstica no paramtrica
152
Cap. VII
153
Estadstica no paramtrica
Reporte
Tabla de contingencia Tiempo libre compartido *
DELINCUENCIA
Recuento
DELINCUENCIA
NO
DELINCUENTE DELINCUENTE
10
29
41
20
51
49
Total
39
61
100
Prueba de hiptesis
Decisin: Como el valor Sig = 0.000 < 0.05, la prueba es significativa; esto es el grado de
delincuencia depende del tiempo invertido por los padres en sus hijos. Nota: no se puede hacer una
inferencia pues los datos pertenecen a una muestra no probabilstica.
Ejemplo 2.
Con la data que se encuentra
en el SPSS encuesta general USA 1991.sav encontrar si existe
alguna relacin entre el nivel de felicidad y la variable sexo
Cap. VII
154
Estadstica no paramtrica
Solucin:
Abrir el archivo del SPSS encuesta general USA 1991.sav
Analizar<estadsticos descriptivos<tablas de contingencia
Hom br e
Mujer
Tot al
Recuent o
% de Sexo del
encuest ado
Recuent o
% de Sexo del
encuest ado
Recuent o
% de Sexo del
encuest ado
Muy f eliz
206
No
dem asiado
f eliz
53
32. 5%
59. 1%
8. 4%
100. 0%
261
498
112
871
30. 0%
57. 2%
12. 9%
100. 0%
467
872
165
1504
31. 1%
58. 0%
11. 0%
100. 0%
Tot al
633
Cap. VII
155
Estadstica no paramtrica
Nivel de felicidad
100,0%
Muy feliz
Bastante feliz
No demasiado feliz
0,30%
0,33%
Recuento
80,0%
60,0%
0,57%
40,0%
0,59%
20,0%
0,13%
0,08%
0,0%
Hombre
Mujer
Valor
7. 739a
7. 936
4. 812
2
2
. 028
gl
1504
Decisin: Al nivel de significancia del 5% concluimos que existe alguna relacin significativa
(sig=0.021) entre las variables, a favor de los varones, esto quiere decir que en mayor porcentaje
los varones presentan ms altos niveles de felicidad.
Nota: Existen tres factores que pueden alterar el resultado de las pruebas de asociacin e
independencia como lo son el tamao de la muestra, la fidelidad de los datos y el sesgo muestral;
antes de sacar alguna conclusin es necesario revisar estos factores ya que cualquiera de ellos
puede distorsionar severamente el resultado.
7.4.2 Prueba de la Homogeneidad
Supngase que en una determinada muestra se observan una serie de posibles sucesos E 1, E2, E3, . .
. , EK, que ocurren con frecuencias o 1, o2, o3, . . ., oK, llamadas frecuencias observadas y que,
segn las reglas de probabilidad, se espera que ocurran con frecuencias e1, e2, e3, . . . ,eK llamadas
frecuencias tericas o esperadas. Se desea saber si las frecuencias observadas difieren
significativamente de las frecuencias esperadas.
Ejemplo: Se presupone que la prevalencia de cncer se incrementa en el intervalo de edad 51 a 65
aos, mientras que entre los intervalos de edad de 36 a 50 y de 20 a 35 la proporcin no es tan alta;
se obtuvo una muestra observacional sobre un registro de pacientes que arrojan la siguiente tabla:
N de casos
20 - 35
19
EDAD
36 - 50
25
51 - 65
76
Cap. VII
Estadstica no paramtrica
156
Reporte:
Cap. VII
Estadstica no paramtrica
157
Cap. VII
158
Estadstica no paramtrica
2
Donde:
C = Coeficiente de contingencia
2
= Valor calculado de Chi Cuadrada.
n
nmero total de casos (tamao muestral)
El valor de C vara entre 0 y 1
C 0, significa que no hay asociacin entre las variables
C>.20, indica una buena asociacin entre las variables; sin embargo hay que tomar tambin en
consideracin el tamao de la tabla o de los datos.
Ejemplo de aplicacin (Pagano, 2009. Pg. 485)
Un investigador de la sexualidad humana quiere determinar si existe una relacin entre el gnero y
la hora del da preferida para tener relaciones sexuales. Se realiza una encuesta cuyos resultados
aparecen en la siguiente tabla; los datos de las entradas son la cantidad de individuos que prefieren
la maana, la tarde o la noche:
Gnero
Maana Tarde
Masculino
46
24
Femenino
28
21
Total
74
45
Noche
20
42
62
Total
90
91
181
= 12.380
1 2.3 8
0.2 5 3
1 8 1 1 2.3 8
Nominal por
Coeficiente de
nominal
contingencia
N de casos vlidos
Sig.
Valor
aproximada
,253
,002
181
Prueba de significancia
La significancia estadstica del coeficiente de contingencia se puede obtener a partir del Sig.
Aproximada ,002 <,05; por lo tanto el Coeficiente C es significativo, es decir existe relacin entre
el gnero y la hora del da preferida para tener relaciones sexuales, siendo el sexo masculino su
preferencia por las maanas mientras que el sexo femenino prefiere por las noches.
Cap. VII
159
Estadstica no paramtrica
Datos nominales.
Muestreo aleatorio. Con la finalidad de comprobar la significancia estadstica del
coeficiente de contingencia, la muestra se debe obtener en forma aleatoria.
Ejemplo de aplicacin
Se desea investigar la posible relacin entre la categora laboral que ocupa el trabajador y si
considera su vida excitante o aburrida. Emplear la data del SPSS encuesta general USA
1991.sav
Paso 1
Los datos obtenidos al realizar este estudio se concentran en una tabla de contingencia,
de la siguiente forma:
Tabla de contingencia Categora ocupacional * Su vida es excitante o aburrida?
Su vida es excitante o aburrida?
Categora
ocupacional
Directivo o profesional
liberal
Empleado tcnico,
administrativo o comercial
Servicios
Agricultura, forestal y
pesca
Produccin de precisin,
manufactura o reparacin
Operario, fabricacin y
mano de obra en general
Total
Recuento
% de Categora
ocupacional
Recuento
% de Categora
ocupacional
Excitante
129
Rutinaria
78
Aburrida
3
Total
210
61.4%
37.1%
1.4%
100.0%
125
156
13
294
42.5%
53.1%
4.4%
100.0%
56
73
135
41.5%
54.1%
4.4%
100.0%
16
25
64.0%
36.0%
.0%
100.0%
38
65
109
34.9%
59.6%
5.5%
100.0%
45
83
135
33.3%
61.5%
5.2%
100.0%
409
464
35
908
45.0%
51.1%
3.9%
100.0%
Recuento
% de Categora
ocupacional
Recuento
% de Categora
ocupacional
Recuento
% de Categora
ocupacional
Recuento
% de Categora
ocupacional
Recuento
% de Categora
ocupacional
Paso 2
41.829
Paso 3
4 1.8 2 9
0.2 1 0
9 0 8 4 1.8 2 9
Cap. VII
160
Estadstica no paramtrica
Salida en el SPSS
Medi das si mt ri cas
Valor
Nom inal por
nom inal
N de casos vlidos
Coef icient e de
cont ingencia
Sig.
apr oxim ada
. 210
. 000
908
Prueba de significancia
La significancia estadstica del coeficiente de contingencia se puede obtener a partir de la
magnitud de la 2 obtenida con la siguiente regla de decisin:
Si
2
cr i t
, en to n cesC es significativo
Para nuestro ejemplo la 2 tabular o crtica con 10 gl. y al nivel de significancia de 5% es 18.31,
entonces dado que el valor calculado es de 41.829, esto es: 41.829 18.31, podemos concluir que
el coeficiente de contingencia calculado es estadsticamente significativo, por lo que se rechaza la
hiptesis nula; por lo que podemos concluir que se considera si la vida es excitante o aburrida esta
relacionada a la categora laboral que ocupa el trabajador, es decir se puede observar que la vida es
ms excitante para los profesionales que ocupan cargos directivos o profesionales liberales de
igual manera para aquellos que trabajan en agricultura forestal y pesca.
Llegamos a la misma conclusin observando el Sig=,000<0.05 que se obtiene al pedir el anlisis
del coeficiente de contingencia
Coeficiente de correlacion
Coeficiente
ad bc
(a b)(a c)(b d )(c d )
Ejemplo de aplicacin
Se desea establecer una escala de medicin de cierto rasgo de agresin en adultos. Pero existe una
interrogante, que consiste en saber si hay relacin entre el sexo de la persona y la respuesta
(dicotmica) ante una situacin que afecte su actitud hacia la agresin. Por lo que a 400 personas,
Mtodos estadsticos aplicados a la investigacin - Mg. Rosa Padilla Castro
Cap. VII
161
Estadstica no paramtrica
200 del sexo masculino y 200 del sexo femenino, se les emplea para establecer dicha escala y se
analizan las respuestas, obtenindose lo siguiente: de las personas del sexo masculino 160 estn de
acuerdo y 40 en desacuerdo; de las del sexo femenino 40 estn de acuerdo y y 160 no lo estn.
Calcule el coeficiente ( ) de correlacin y concluya, considerando los resultados obtenidos.
Solucin:
Paso 1 Se acomodan los datos obtenidos en una tabla de doble entrada, de dos reglones y dos
columnas (tabla de contingencia 2x2)
Masculino
Femenino
Total
Acuerdo
160 (a)
40 (c)
200
Desacuerdo
40 (b)
160 (d)
200
Total
200
200
400
ad bc
(1 6 0
)(1 6 0
) (4 0)(4 0)
(2 0 0
)(2 0 0
)(2 0 0
)(2 0 0
)
0.6 0
= 0.60
Salida en el SPSS
Medidas simtricas
Valor Sig. aproximada
Nominal por
nominal
Phi
,600
,000
V de Cramer
,600
,000
N de casos
vlidos
400
Prueba de significancia de
Para poder comprobar la significancia de dicho coeficiente se utilizar la siguiente definicin:
2
Donde:
n
=
=
2
=
(4 0 0
)(0.6 0) 2
144
144
Este resultado se contrasta al valor crtico de ji cuadrada, calculado mediante la siguiente regla de
decisin R.D:
2
Si 2
c r i ,t en to n ces significativa
El valor crtico de la 2 est en funcin de los grados de libertad y el nivel de significancia
establecido con anterioridad.
Mtodos estadsticos aplicados a la investigacin - Mg. Rosa Padilla Castro
Cap. VII
162
Estadstica no paramtrica
2
(5%)
2
e xpe r i me nt al
=0.46 es significativo!
Requisitos de uso de
A fin de utilizar adecuadamente el coeficiente
como medida de asociacin entre las variables x
e y, dicotomizadas, se deben tomar en cuenta las siguientes condiciones:
1. Datos nominales. Las variables x e y, deben ser nominales y dicotomizables, ya que
nicamente se requeriran las frecuencias observadas (el nmero de veces que ocurren en
cierta nominacin).
2. Tabla de contingencia 2x2. Los datos deben poder colocarse en un diseo 2x2 (dos renglones dos columnas). Es inadecuado aplicar el coeficiente donde se comparan varias grupos o
categoras.
3. Muestreo aleatorio. Para poder comprobar la significancia y validez de
, la muestra en
estudio debe haber sido extrada en forma aleatoria (todos los elementos de la poblacin deben
tener la misma posibilidad de ser escogidos).
4. Cuando la muestra en estudio es pequea (un criterio es que la frecuencia observada, en dos
o ms casillas, sea menor que 10). Se utilizar la definicin de 2 , pero con la correccin de
Yates, tambin llamada de Pirie-Handem, que consiste en lo siguiente:
2
n a d b c 0.5
Cap. VII
163
Estadstica no paramtrica
Coeficiente Gamma
Medida de asociacin simtrica entre dos variables ordinales cuyo valor siempre est comprendido
entre menos -1 y 1. Los valores prximos a 1, en valor absoluto, indican una fuerte relacin entre
las dos variables. Los valores prximos a cero indican que hay poca o ninguna relacin entre las
dos variables.
d de Somers
La d de Somers es importante pues se puede pronosticar las categoras de columna a partir de las
categoras de fila; se usa para variables ordinales (filas y columnas). La d de Somers es una
extensin asimtrica de gamma.
Ejemplo:
Se quiere establecer la relacin entre las variables ingesta de agua segn el nmero de vasos por
da y si la persona tiene un horario establecido para beber este lquido tan importante para la salud.
La data se recogi haciendo uso de la metodologa de la encuesta y se muestra en la siguiente
tabla.
Tabla de contingencia AGUA * HORARIO
0
3
2
HORARIO
Casi siempre
1
6
16
3
8
Siempre
AGUA
Total
Ninguno
1 - 2 vasos
3 - 5 vasos
6 a ms
vasos
A veces
Total
2
2
5
3
11
23
10
28
11
47
Cap. VII
164
Estadstica no paramtrica
Medidas direccionales
Valor
Ordinal
d de Somer
por ordinal
Simtrica
AGUA dependiente
HORARIO dependiente
Error tp.
asint.(a)
T
aproximada(b)
Sig.
Aproximada
-.100
.148
-.669
.503
-.108
-.092
.161
.137
-.669
-.669
.503
.503
Cap. VII
165
Estadstica no paramtrica
Para realizar este anlisis usamos el coeficiente Eta, pues se trata de relacionar una variable
dependiente numrica asociada a una independiente categrica nominal.
Pasos en el SPSS: analizar<estadsticos descriptivos<tablas de contingencia<pasar las variables
como se observa en la figura anterior<pedir el coeficiente Eta<continuar<aceptar
Salida del SPSS
Tabla de contingencia SALON * PROMEDIO
Recuento
PROMEDIO
14,00
15,00
16,00
17,00
18,00
19,00
Total
SALN A
11
SALN B
12
23
Total
Medidas direccionales
Valor
Nominal por intervalo
Eta
SALON dependiente
,846
PROMEDIO dependiente
,787
El coeficiente Eta, que se obtiene en el cuadro de salida presenta dos sentidos: Un primer caso
considerando al saln como variable dependiente, para este caso se obtiene un Eta igual a 0.846.
Un segundo caso, considerando al promedio, como la variable dependiente, para lo cual se obtiene
un Eta igual a 0.787. En nuestro caso la variable promedio se considera como dependiente, por lo
tanto Eta= 0.78, lo que indica que el promedio depende del saln donde provienen los alumnos, en
otras palabras alguno de los profesores (A o B) utilizan una mejor didctica lo cual hace obtener
un mejor promedio en sus estudiantes (saln B).
El cuadrado de Eta, se interpreta como la proporcin de la variabilidad de la variable dependiente
Y, explicada por los valores de la independiente, X. En nuestro ejemplo el cuadrado del
coeficiente explica
Mtodos estadsticos aplicados a la investigacin - Mg. Rosa Padilla Castro
Cap. VII
Estadstica no paramtrica
166
Eta2 = (,787)2 = 0.619 explica la variacin del promedio de los estudiantes en funcin al saln al
que pertenecen, la varianza de los datos que dependen del saln y que hacen predecir el promedio.
El grfico bivariado que ofrece el SPSS es:
Cap. VII
167
Estadstica no paramtrica
Aceptar
Kappa
N de casos vlidos
,538
,046
T aproximada
aproximada
12,921
,000
200
El valor del estadstico Kappa (,538) y su nivel crtico (Sig aproximada 0.000) por lo tanto se
rechaza la hiptesis nula y concluimos que existe un grado de acuerdo mayor que el esperado por
el azar.
McNemar
Prueba no paramtrica para dos variables dicotmicas relacionadas. Contrasta los cambios en las
respuestas utilizando la distribucin de Chi-cuadrado. Es til para detectar cambios en las
respuestas debidas a la intervencin experimental en los diseos del tipo "antes-despus". Para las
tablas cuadradas de mayor orden se informa de la prueba de simetra de McNemar-Bowker.
Ejemplo
Se quiere estudiar si la aplicacin de un programa ha resultado efectivo en cuanto al mejoramiento
del dficit asertivo, se tom una muestra de agentes comunitarios (ACES) y se les capacit durante
4 meses. Al inicio se tomo un pretest y un postest despus de concluida la capacitacin; los
resultados se muestran en la siguiente tabla:
Cap. VII
Estadstica no paramtrica
168
Prueba de McNemar-Bowker
N de casos vlidos
Valor
Gl
p-value
12.571
,014
26
Cap. VII
7.9
Estadstica no paramtrica
169
Compara dos grupos de casos en una variable. Se puede trabajar con la prueba U de MannWhitney, la prueba de Kolmogorov Smirnov para dos muestras, la prueba de Moses de reacciones
extremas y la prueba de rachas de Wald-Wolfowitz.
Ejemplo: Se han desarrollado nuevos correctores dentales diseados para que sean ms comodos y
estticos, as como para facilitar un progreso ms rpido en la realineacin de la dentadura. Para
averiguar si el nuevo corrector debe llevarse tanto tiempo como el modelo antiguo, se eligen 10
nios al azar para que lleven este ltimo y otros 10 para que usen el nuevo. Mediante la prueba de
U de Mann-Whitney podra descubrir que de media, los nios que llevan el nuevo corrector tenan
que llevarlo puesto menos tiempo que los que llevaban el antiguo.
Datos: utilice variables numricas que puedan ordenarse.
Supuestos: utilice muestras independientes aleatorias. La prueba U de Mann-Whitney requiere que
las dos muestras probadas sean similares en la forma.
Se utiliza como alternativa a la prueba paramtrica de comparacin de medias de dos muestras
independientes; por lo tanto la escala de medida de la variable dependiente es cuando menos
ordinal. (para pruebas paramtricas no se debe usar las escalas de Likert).
En el SPSS:
U de Mann-Whitney: mezclados los datos de ambas muestras, se procede a ordenarlos de
menor a mayor; el estadstico de contraste es la suma de los rangos de cada grupo.
Reacciones extremas de Moses: se prueba si el rango de una variable ordinal es el mismo del
grupo control y en de comparacin, por lo que los valores son ordenados de forma ascendente.
Z de Kolmogorov-Smirnov: se prueba si la distribucin de una variable, la dependiente, es la
misma en dos grupos.
Rachas de Wald-Wolfowitz: Se ordenan los casos de ambos grupos conjuntamente de menor a
mayor para a continuacin, realizar una prueba de rachas usando como criterio el conjunto de
valores que pertenecen al mismo grupo.
7.10
Cap. VII
Estadstica no paramtrica
170
Ho: los grupos definidos por la variable minora proceden de poblaciones similares, por lo tanto
con igual promedio de salario inicial
Ha: los grupos definidos por la variable minora proceden de poblaciones distintas, por lo tanto
con diferente promedio de salario inicial
Ranks
Salar io inicial
N
370
104
474
Mean Rank
249. 14
196. 10
Sum of Ranks
92180. 50
20394. 50
Test St at i st i csa
Mann- Whit ney U
Wilcoxon W
Z
Asym p. Sig. ( 2- t ailed)
Salar io inicial
14934. 500
20394. 500
- 3. 495
. 000
Los grupos definidos por la variable minara proceden de poblaciones con distintos promedios
Pruebas de reacciones extremas de Moses Test
Sirve para estudiar si existen diferencias en el grado de dispersin o de variabilidad
Frequenci es
Salar io inicial
N
370
104
474
Cap. VII
Estadstica no paramtrica
171
Moses Test
Test St at i st i csa, b
O bser ved Cont r ol
G r oup Span
Sig. ( 1- t ailed)
Tr im med Cont r ol
G r oup Span
Sig. ( 1- t ailed)
O ut ie
l r s Tr im med f r om each End
Salar io inicial
467
. 000
434
. 990
18
a. Moses Test
b. G r ouping Var iable: Clasif icacin de minor as
N
370
104
474
Salar io inicial
. 237
. 000
- . 237
2. 134
. 000
Absolut a
Posit iva
Negat iva
N
370
104
474
Salar io inicial
M nim o posible
Mxim o posibe
l
Nm er o
de r achas
40a
200a
Z
- 16. 576
4. 923
Sig. asint t .
( unilat er al)
. 000
1. 000
Cap. VII
Estadstica no paramtrica
172
Prueba de H de Kruskal_Wallis
Este procedimiento contiene varias pruebas, todas ellas diseadas para analizar datos provenientes
con una variable independiente categrica (con mas de dos niveles que definen mas de dos grupos
o muestras) y una variable dependiente cuantitativa al menos ordinal, en la cual interesa comparar
las muestras
Ejemplo: Archivo Empleados
Directivos y administrativos
Ranks
Salar io inicial
N
363
27
84
474
Mean Rank
192. 29
252. 59
428. 04
Test St at i st i csa, b
Chi- Squar e
df
Asymp. Sig.
Salar io inicial
203. 112
2
. 000
Wilcoxon y Signo, sirven para contrastar hiptesis sobre igualdad de mediana, Mac Nemar para
contrastar hipo sobre igualdad de proporciones (antes y despus).
Cap. VII
Estadstica no paramtrica
173
Ranks
N
Salar io inicial Salar io act ual
474a
0b
0c
474
Mean Rank
237. 50
. 00
Sum of Ranks
112575. 00
. 00
Z
Asymp. Sig. ( 2- t ailed)
Salar io inicial
- Salar io
act ual
- 18. 865a
. 000
Rechazamos la hipo de igualdad de promedios son iguales, las variables comparadas difieren
significativamente
Sign Test
Frequenci es
N
Negat ive Dif f er ences a
Posit ive Dif f er ences b
Ties c
Tot al
474
0
0
474
Test St at i st i csa
Z
Asymp. Sig. ( 2- t ailed)
a. Sign Test
Concluimos igual
Mac Nemar para variable de tipo (Arch. Fumar y no)
Una muestra aleatoria de 150 estudiantes se someti a un cuestionario de opinin acerca de si
fumar produce cncer al pulmonar. Obtenida la informacin se les dio una conferencia y se les
presento una exposicin llevada a cabo por un equipo de sanidad explicando los peligros de fumar
y se les explico la relacin sobre el efecto de fumar sobre el cncer pulmonar
(se les hizo una encuesta y luego recibieron una charla y se quiere ver que tan fructfera fue esa
charla)
Despus
de
la
conferencia
Antes de la
conferencia NO
SI
Total
NO
43
67 110
SI
10
30 40
150
A partir de estos datos se puede concluir que hay suficiente evidencia de que la conferencia y
exposicin realizada tiene efecto sobre la opinin de la gente acerca de fumar y el cncer pulmonar
Mtodos estadsticos aplicados a la investigacin - Mg. Rosa Padilla Castro
Cap. VII
Estadstica no paramtrica
174
despues de la
conf er encia
1
2
43
67
10
30
1=no
2=si
Test St at i st i csb
N
Chi- Squar e a
Asym p. Sig.
ant es de la
conf er encia &
despues de la
conf er encia
150
40. 727
. 000
Ho: la probabilidad de que la conferencia no tenga efecto sobre la opinin de los estudiantes es
igual a que la probabilidad de que la conferencia si tenga efecto sobre la opinin de los estudiantes
Ha: la probabilidad de que la conferencia es mayor sobre la opinin de los estudiantes
El sig<0.05, rechazamos la Ho por lo tanto concluimos que si existe un efecto estadsticamente
significativo de que la conferencia cambie la opinin de los estudiantes a favor de que el fumar si
produce cncer
NPar Tests
Detecta diferencia en la distribucin de casos a travs de dos variables categricas relacionadas,
los valores distintos se enumeran (es si o es no)
Mar gi nal Homogenei t y Test
ant es de la
conf er encia &
despues de la
conf er encia
2
77
57. 000
. 000
8. 775
6. 496
. 000
Indican que se diferencian las distribuciones para las dos variables o tambin que la distribucin de
casos a travs de las categoras de la variables antes es diferente que la distribucin de casos a
travs de las categoras despus
Por que se les llama marginal por que la suma de las columnas filas y columnas son diferentes
La prueba de MH es una extensin de la prueba de Mc Nemar de la respuesta binaria a la respuesta
multinomial
La media o valor esperados de la estadstica de la homogeneidad es 0.000
Conclusin: quiere decir que se diferencian las distribuciones para las dos variables (se basa en las
sumas marginales)
Cap. VII
175
Estadstica no paramtrica
2
r
Si se desean comparar varias muestras o grupos de puntajes pareados (a cada puntaje de un grupo
le corresponde otro puntaje del otro grupo o grupos; tambin se suelen llamar grupos o muestras
dependientes o correlacionas), y en las cuales los requisitos bsicos para los mtodos paramtricos
no se cumplen (los puntajes de dichos grupos no se distribuyen normalmente y no hay
homogeneidad de las varianzas), el pareamiento puede ser obtenido relacionando conjuntos de
sujetos en una o ms variables previas y aleatoriamente asignando a cada elemento del conjunto
pareado varias condiciones diferentes, o, si los mismos sujetos son elementos de cada grupo a
comprobar, entonces los conjuntos pareados resultan adecuados.
Esta prueba es una variacin de la prueba t (Student), que se utiliza para comprobar una misma
muestra medida dos veces. Por ejemplo, en el diseo antes-despus, se utiliza la siguiente frmula:
2
r
12
n k(k 1)
( Ri ) 2 3n(k 1)
Donde:
Ri )2
= Nmero de grupos
12 y 3
= Constantes
Ejemplo:
Suponga que se desea comprobar la hiptesis nula de que un grupo de 10 sujetos reaccionan de la
misma manera ante tres situaciones diferentes; Se obtienen los siguientes resultados, que se ubican
en cada uno de los tres grupos I, II, III
Puntajes
Sujeto
A
B
C
D
E
F
G
H
I
J
Grupo 1
25
30
21
28
19
22
31
17
25
33
Grupo 2
28
33
19
31
22
21
33
14
21
35
Grupo 3
29
32
16
32
23
25
34
21
24
37
Cap. VII
176
Estadstica no paramtrica
Sujeto
Grupo 1
Grupo 2
Grupo 3
R1 16
R2 18
R3 26
Paso 2 Despus de sumar los rangos por cada grupo se comparan entre s; si la hiptesis nula es
verdadera estas sumas sern iguales.
Paso 3. Se sustituyen los valores en forma de
12
n k( k 1)
2
r
2
r
12
(1 62
1 0(3)(3 1)
2
r
5.6
Ri ) 2
1 82
2
r
3n ( k 1)
2 62 )
3(1 0)(3 1)
<
(gl,
(gl.
), entonces se rechaza la
Requisitos de uso del anlisis de varianza en dos direcciones por rangos de Friedman ( r2 )
1. Comparacin de una sola muestra medida dos o ms veces en diferentes condiciones, o una
comparacin entre dos o ms grupos pareados. (no se puede aplicar para contrastar diferencias
entre muestras independientes.
2. Datos ordinales: solo se requieren puntajes que puedan ser jerarquizados (ubicados en
intervalos ordenados).
3. Existe una relacin entre el tamao n de la muestra y el nmero de condiciones (variables) k.
Si K = 3, n debe ser igual o mayor que 10
Si K = 4, n debe ser igual o mayor que 5
Cap. VII
Estadstica no paramtrica
177
Primer
semestre
44
39
36
35
33
29
22
Segundo
semestre
58
42
18
22
31
38
38
De acuerdo con la data del ejemplo 1, determine qu tipo de anlisis se puede aplicar.
Respuesta: rs = 0.306
Cap. VII
178
Estadstica no paramtrica
Rangos
X
67
67
70
70
72
79
80
81
87
95
Rx
1.5
1.5
3.5
3.5
5
6
7
8
9
10
Y
67
68
70
71
72
74
77
80
83
90
Diferencias
Ry
2
2
3
4
5
6
7
8
9
10
D
0.5
-0.5
0.5
0
0
0
0
0
0
0
D2
0.25
0.25
0.25
0.25
-
D2 1.00
Respuesta: rs = 0.994
7. En un estudio realizado a 200 mujeres casadas, sobre relaciones humanas, haba dos preguntas
que consistan en lo siguiente:
a) Considera exitoso su matrimonio?
b) Tuvo una niez feliz?
Se obtuvieron las siguientes respuestas:
Niez
Matrimonio
No exitoso Exitoso
40
70
60
30
100
100
Feliz
No feliz
Total
Total
110
90
200
(si)
Entrevistado
A
B
C
D
E
mayor participacin
menor participacin
6
4
6
2
2
Cap. VII
Estadstica no paramtrica
179
Rango de aptitud
de mando
4
2
9
1
7
10
8
13
5
3
11
6
12
15
14
Cap. VII
180
Estadstica no paramtrica
No contesta
20
Total
encuestados
100
20
150
A partir de la tabla anterior, se puede decir que la opinin de los ciudadanos respecto a la
constitucin Europea es homognea en los dos pases o bien cabe hablar de diferencias
significativas?
13. Con el fin de conocer si un cierto tipo de bacterias se distribuyen al azar en un determinado
cultivo o si, por el contrario, lo hacen con algn tipo de preferencia (el centro, los extremos,
etc...), se divide un cultivo en 576 reas iguales y se cuenta el nmero de bacterias en cada
rea. Los resultados son los siguientes:
no
de
0
bacterias
no
de
229 211 93 35 7 1
reas
Obedecen los datos a una distribucin de Poisson?
14. Ante la sospecha de que el hbito de fumar de una embarazada puede influir en el peso de su
hijo al nacer, se tomaron dos muestras, una de fumadoras y otra de no fumadoras, y se clasific
a sus hijos en tres categoras en funcin de su peso en relacin con los percentiles P 10 y P90 de
la poblacin. El resultado se expresa en la tabla siguiente:
Peso del nio
Madre fumadora? Menor de P10 Entre P10 y P90 Mayor de P90
Si
117
529
19
Cap. VII
181
Estadstica no paramtrica
No
124
1147
117
20 - 30
11
30 - 40
15
40 - 50
24
50 - 60
18
60 - 70
12
70 - 80
80 - 90
Contrastar la hiptesis de que el nivel de triglicridos en nios de 6 aos sigue una distribucin
Normal.
16. En un estudio diseado para determinar la aceptacin por una parte de los pacientes de un
nuevo analgsico, 100 mdicos seleccionaron cada uno de ellos una muestra de 25 pacientes
para participar en el estudio. Cada paciente despus de haber tomado el nuevo analgsico
durante un periodo de tiempo determinado, fue interrogado para saber si prefera ste o el que
haba tomado anteriormente con regularidad, obteniendo los siguientes resultados:
no de pacientes que no de mdicos que no total de pacientes
prefieren el nuevo
obtienen estos
que prefieren el
analgsico
resultados
nuevo analgsico
16
10
30
10
40
15
75
17
102
10
70
10
80
81
10 o ms
Cap. VII
182
Estadstica no paramtrica
Total
100
500
no de mujeres
30 - 40
16
40 - 50
18
50 - 60
22
60 - 70
51
70 - 80
62
80 - 90
55
90 - 100
22
100 - 110 4
Cap. VII
Estadstica no paramtrica
183
Cap. VII
184
Estadstica no paramtrica
H1: Si hay diferencias significativas en la percepcin del tiempo de una pelcula entre tres
grados escolares.
ACCIN
15
10
15
15
15
10
10
15
15
10
CARITATURAS
18
15
10
10
15
15
15
20
25
15
HISTORIA
30
35
20
30
40
40
20
35
30
15
C. NATURAL
40
30
25
25
40
35
25
45
35
15
Cap. VII
Estadstica no paramtrica
185