Está en la página 1de 5

Tema 12. Contrastes No Paramtricos.

Problemas resueltos. Tema 12

1.- En una partida de Rol se lanza 200 veces un dado de cuatro caras obtenindose 60
veces el nmero 1, 45 veces el nmero 2, 38 veces el nmero 3 y 57 veces el nmero 4.
Se puede aceptar, a un nivel de confianza del 95%, que estos resultados corresponden a
un dado homogneo.
Solucin:
1 La hiptesis nula ser que el dado es homogneo, esto implica que la distribucin de
los nmeros es uniforme, es decir que los cuatro nmeros tienen una probabilidad de
aparecer de 0,25.
2 La hiptesis alternativa ser que la distribucin no es uniforme.
3 Como la variable es discreta utilizaremos el test Ji-cuadrado de bondad de ajuste a
una distribucin.
4 En la tabla siguiente se han realizado todos los clculos necesarios, obtenindose el
valor 4,36 para el estadstico de contraste.
xi
1
2
3
4

ni
60
45
38
57
200

pi
0,25
0,25
0,25
0,25

Npi
50
50
50
50

ni-np i
10
-5
-12
7

(ni-np i)2
100
25
144
49

(ni-np i)2 /np i


2
0,5
2,88
0,98
4,36

5 Como el estadstico tena 4 sumandos, buscamos en las tablas de la Ji-cuadrado con 3


grados de libertad el valor que deja por debajo una probabilidad de 0,95 y obtenemos
que el valor crtico es 7,81.
6 Como el valor del estadstico es inferior al valor crtico, aceptamos la hiptesis nula.
7 Estos resultados son compatibles con el hecho de que el dado sea homogneo.
2.- En una encuesta preelectoral realizada a 500 personas se obtuvo la siguiente
distribucin en funcin de sus edades y de su intencin de voto:

Partido
A
B
C
D

Edad
18 35
10
15
45
30

35 50
40
70
60
30

50 o ms
60
90
35
15

A un nivel de confianza del 90% Puede afirmarse que la intencin de voto es


independiente de la edad?

2 Problemas de Anlisis de datos. Jos M. Salinas

Solucin:
1 La hiptesis nula es que las dos variables son independientes.
2 La hiptesis alternativa es que hay relacin entre ambas variables.
3 Se trata de un contraste de independencia entre dos variables, por consiguiente el
estadstico de contraste a utilizar es el estadstico Ji-cuadrado para tablas de
contingencia.
4 Las tablas siguientes presentan los clculos del estadstico:

Partido
A
B
C
D

Edad
18 35
10
15
45
30
100

35 50
40
70
60
30
200

50 o ms
60
90
35
15
200

110
175
140
75
500

A partir de las frecuencias marginales de la tabla anterior, se obtienen las frecuencias


esperadas que aparecen a continuacin:

Partido
A
B
C
D

Edad
18 35
22
35
28
15

35 50
44
70
56
30

50 o ms
44
70
56
30

Por consiguiente las discrepancias entre frecuencias empricas y frecuencias esperadas


son:

Partido
A
B
C
D

Edad
18 35
-12
-20
17
15

35 50
-4
0
4
0

50 o ms
16
20
-21
-15

35 50
16
0
16
0

50 o ms
256
400
441
225

Los cuadrados de las discrepancias son:

Partido
A
B
C
D

Edad
18 35
144
400
289
225

Dividiendo por las frecuencias esperadas se obtiene:

Tema 12. Contrastes No Paramtricos. 3

Partido
A
B
C
D

Edad
18 35
6,55
11,43
10,32
15
43,30

35 50
0,36
0
0,29
0
0,65

50 o ms
5,82
5,71
7,88
7,5
26,91

70,86

Sumando, se obtiene el valor del estadstico 70,86.


5 Como la edad presenta tres intervalos y los partidos son cuatro, el estadstico tendr
(3 - 1)(4 -1 ) = 6. Buscamos en las tablas de la distribucin Ji-cuadrado con 6 grados
de libertad el valor de la variable que deja por debajo una probabilidad de 0,9
encontramos que el valor crtico es 10,64.
6 Como el valor del estadstico es mayor que el valor crtico rechazamos la hiptesis
nula de que ambas variables son independientes.
7 La edad cambia la intencin de voto.
3.- Los tiempos de respuesta de 9 sujetos en una tarea de reconocimiento de palabras,
previamente presentadas, han sido los siguientes:
115, 98, 123, 109, 112, 87, 118, 104, 116
A un nivel de confianza del 95% Son compatibles estos resultados con la hiptesis de
que el tiempo de reaccin en esta tarea sigue una distribucin Normal de media 110 y
desviacin tpica 10?
Solucin:
1 La hiptesis nula es que los datos proceden de una Normal (110, 10).
2 La hiptesis alternativa es que no siguen esa distribucin Normal.
3 Como la variable es continua, y la hiptesis nula especifica totalmente la distribucin
utilizaremos el test de Kolmogoroff-Smirnoff, cuyo estadstico de contraste es:
max | Fn (xi ) - Mn (xi) |
4 los clculos del estadstico se especifican en la siguiente tabla:
xi
87
98
104
109
112
115
116
118
123
zi
-2,3
-1,2
-0,6
-0,1
0,2
0,5
0,6
0,8
1,3
Fn
0,0107 0,1151 0,2743 0,4602 0,5793 0,6915 0,7257 0,7881 0,9032
Mn
0,1111 0,2222 0,3333 0,4444 0,5556 0,6667 0,7778 0,8889
1
|Fn -Mn | 0,1004 0,1071 0,059 0,0158 0,0237 0,0248 0,0521 0,1008 0,0968
5 Buscando en las tablas del test Kolmogoroff-Smirnoff para n = 9 el valor crtico para
un nivel de confianza del 95% se obtiene 0,43001.

4 Problemas de Anlisis de datos. Jos M. Salinas

6 Como el valor del estadstico 0,1071 es menor que el valor crtico se acepta la
hiptesis nula.
7 A un nivel de confianza del 95% no hay evidencia en contra de que el tiempo de
reaccin siga una distribucin N(110, 10).
4.- En la encuesta telefnica realizada el pasado curso por los alumnos los resultados
fueron muy dispares, mientras algunos realizaron las cuatro entrevistas programadas
otros no consiguieron cumplimentar ninguna de ellas. La distribucin del nmero de
entrevistas conseguidas por los 57 alumnos que participaron en el proyecto fue la
siguiente:
N entrevistas
0
1
2
3
4
Total

N alumnos
6
16
24
9
2
57

A un nivel de confianza del 90% Puede afirmarse que estas diferencias han sido
debidas al azar? O por el contrario estn motivadas por alguna otra causa.
1 La hiptesis nula de que los resultados obtenidos son debidos al azar implica que en
todas las llamadas hay la misma probabilidad de conseguir respuesta y que el resultado
de cada llamada es independiente de las restantes. Entonces el nmero de entrevistas
conseguidas por cada alumno es la suma de cuatro variables de Bernouilli y por
consiguiente, la distribucin sera una Binomial con n = 4 y P desconocida.
2 La hiptesis alternativa es que no siguen esa distribucin Binomial.
3 Como la variable es discreta y adems la hiptesis nula no especifica totalmente la
distribucin utilizaremos el test Ji-cuadrado de bondad de ajuste.
4 Para calcular el valor del estadstico necesitamos las probabilidades de los valores,
para ello es preciso estimar previamente el valor de P a partir de los datos de la muestra.
El total de llamadas ha sido 574 = 228.
Las llamadas con xito han sido 116 + 224 + 39 + 42 = 99.
La proporcin es 99/228 = 0,4342.
Las probabilidades aplicando la funcin de probabilidad de la distribucin Binomial
sern:
4
Pr( x = 0) = 0,4342 0 0,56584
0

= 0,1025

4
Pr( x = 1) = 0,43421 0,56583
1

= 0,3146

Tema 12. Contrastes No Paramtricos. 5

4
Pr( x = 2) = 0,4342 2 0,5658 2
2

= 0,3621

4
Pr( x = 3) = 0,4342 3 0,56581
3

= 0,1853

4
Pr( x = 4) = 0,4342 4 0,56580 = 0,0355
4
El resto de los clculos necesarios para obtener el valor del estadstico aparecen
ordenados en la tabla siguiente:
xi
0
1
2
3
4

ni
6
16
24
9
2
57

pi
0,1025
0,3146
0,3621
0,1853
0,0355

npi
5,84
17,93
20,64
10,56
2,02

ni-np i
0,16
-1,93
3,36
-1,56
-0,02

(ni-np i)2
0,03
3,72
11,29
2,43
0

(ni-np i)2 /np i


0,005
0,207
0,547
0,230
0
0,989

5 El estadstico tiene 5 sumandos, pero como hemos estimado un parmetro, debemos


buscar en las tablas de la Ji-cuadrado con 3 grados de libertad. El valor de la variable
que deja por debajo una probabilidad de 0,9 es 6,25.
6 Como el valor del estadstico 0,989 es menor que el valor crtico, 6,25 se acepta la
hiptesis nula.
7 Los resultados obtenidos por los alumnos pueden ser fruto del azar.

También podría gustarte