Está en la página 1de 11

Tenemos información sobre el número de errores contables que se producen de

1500 documentos inspeccionados . Nos preguntamos si el número de errores


seguirá un modelo de Poisson..Trabajando para ello con un nivel de significación
de 0,01
test de chi2 bondad de ajuste

Nº errores Nº documentos
0 543
1 560
2 280
3 90
4 23
5 2
6 2
1500

dado que presumiblemente se trata de un modelo de Poisson hemos de crear como


serían los valores de X (número de errores) si realmente se tratara de un modelo de
Poisson .
Primero estimamos el único parámetro de una Poisson 𝜆

lambda es la media y su estimador M.V es la media muestral así:

∑𝑛
𝑖=1 𝑥𝑖 ·𝑛𝑖 1504
𝜆̂ = = 1500 = 1,00266667
𝑁
luego el modelo teórico sería una Poisson de lambda =1,0026667

Creamos las frecuencias teóricas en base a ese modelo . Primero la probabilidad de cada
valor en base a la función de cuantía de dicha Poisson.

así:
𝑒 −𝜆 · 𝜆𝑥 𝑒 −1,0026667 · 1,0026667𝑥
𝑃(𝑥) = =
𝑥! 𝑥!
así : para x=0
𝑒 −1,0026667 · 1,00266670
𝑃(𝑥 = 0) = = 0,366899
0!
y así el resto de valores ....

para obtener las Frecuencias Teóricas para cada valor sólo tendremos que multiplicar su
probabilidad por N, en este caso 1500
x n obsr x*no p(x) nteor redondeo
0 543 0 0,366899736 550,3496043 550,3
1 560 560 0,367878135 551,8172032 551,8
2 280 560 0,184429572 276,6443579 276,6
3 90 270 0,061640461 92,46069206 92,5
4 23 92 0,015451209 23,17681348 23,2
5 2 10 0,003098482 4,647723662 4,6
6 2 12 0,000517791 0,776686265 0,8
1500 1504 1499,873081 1499,8

media 1,00266667

si observamos las frecuencias teóricas vemos que hay una muy pequeña ( menor que 5)
esto aconseja hacer CORRECCIÓN de CONTINUIDAD, uniendo dicho valor afectado
de la variable a uno de sus contiguos así y arreglando la diferencia de dos décimas en la
suma de frecuencias

x nobsr n teo
0 543 550,3
1 560 551,8
2 280 276,6
3 90 92,5
4 23 23,2
5 2 4,6
6 2 0,8
1500 1499,8

arreglada por corrección de continuidad calculamos el estadístico a aplicar

x nobsr n teo n obs- n teo (nobs-nteo)2 (nobs-nteo)2/nteo


0 543 550,3 -7,3 53,29 0,096838088
1 560 551,8 8,2 67,24 0,121855745
2 280 276,6 3,4 11,56 0,041793203
3 90 92,5 -2,5 6,25 0,067567568
4 23 23,2 -0,2 0,04 0,001724138
5 4 5,6 -1,6 2,56 0,457142857
eliminada
1500 1500 T= 0,786921599

Los grados de libertad serán n-k-1


siendo n=6 (hemos eliminado el valor 6 de x)
siendo K=1 pues hemos necesitado estimar un parámetro (𝜆̂) para conseguir la
frecuencias teóricas
luego grados de libertad n-k-1 =6-1-1=4

dado que el nivel de significación es 0,01 y los g.l. son 4 las zonas de aceptación
rechazo quedarán viendo en la tabla de la CHI2

por tanto no rechazamos que siga una Poisson de lammda = 1,0026667


PROBLEMA 7.2.El número de tormentas, registrado en cierta provincia, a lo largo
de tres años ha sido el siguiente:
Meses nº de tormentas
12 0
8 1
7 2
4 3
5 4
0 5 ó más
Contrastar, con un nivel de significación del 5% la hipótesis de que el número de
tormentas mensuales se distribuye según una Poisson, utilizando el método de
Kolmogorov-Smirnov

La variable es X=número de tormentas siendo los meses la frecuencia con la que se dan
ese número de tormentas .
Ni es la frecuencia acumulada Fi la frecuencia relativa acumulada observada que
lógicamente coincide con la probabilidad acumulada F(xi) .Función de distribución .
Construimos el modelo teórico en este caso Poisson con lambda estimada 1,5

∑𝑛𝑖=1 𝑥𝑖 · 𝑛𝑖 54
𝜆̂ = = = 1,5
𝑁 36

calculamos las probabilidades de X ,P(x) en base al modelo de Poisson con lambda=1,5

así : para x=0


𝑒 −1,5 · 1,50
𝑃(𝑥 = 0) = = 0,22313
0!
y así para 1,2,3,4,5

calculamos F(x) ( probabilidad acumulada) teórica en base a dichas probabilidades

así
comparamos, restando D , F(x) observada con F(x) teórica
después en valor absoluto

la mayor diferencia es 0,11

x n F(x) Poisson
n F(x) F(x)
tormentas meses N obs/prob x.n P(x) teo/prob D D (Abs)
0 12 12 0,33333333 0 0,22313016 0,22313016 0,11020317 0,11020317
-
1 8 20 0,55555556 8 0,33469524 0,5578254 0,00226984 0,00226984
-
2 7 27 0,75 14 0,25102143 0,80884683 0,05884683 0,05884683
-
3 4 31 0,86111111 12 0,12551072 0,93435755 0,07324643 0,07324643
4 5 36 1 20 0,04706652 0,98142406 0,01857594 0,01857594
5 o más 0 36 1 0 0,01857593 1 0 0
54

media 1,5

el número de observaciones es N=36 luego g.l. =36

en tabla de K-S para alpha igual 0,05 será

luego valor crítico


𝟏, 𝟑𝟔
𝑫𝜶=𝟎,𝟎𝟓 = = 𝟎, 𝟐𝟐𝟔𝟔
√𝟑𝟔

mayor que 0,1102 luego no se rechaza

https://www.uv.es/ceaces/scrips/tablas/taKS.htm
PROBLEMA 7.4. De una muestra de 250 profesionales (Economistas y Médicos) se
ha obtenido la siguiente clasificación atendiendo al número de semanas que
dedican a vacaciones en el año.
Nº semanas Economistas Médicos
2 20 40
3 30 50
4 50 60

a) Se desea saber si el ser Economista ó Médico es independiente del número


de semanas que dedican a vacaciones en el año, al 1% de significación.
b) Comprobar el ajuste a una polinomial considerando únicamente al colectivo
de los economistas, de manera que se contraste que: el 25% dedican 2
semanas o menos a vacaciones, el 35% dedican 3 y el resto dedican 4.
a)

Independencia/homogeneidad

Se trata de comprobar si el hecho de ser economista o médico no influye en el número


de semanas de vacaciones que se toman, es decir, que ser médico/economista es
INDEPENDIENTE del número de semanas de vacaciones. Y viceversa, claro.
De otra manera : que médicos y economistas tienen un comportamiento HOMOGÉNEO
respecto a sus semanas de vacaciones.
Por tanto comprobar independencia es lo mismo que comprobar homogeneidad
La hipótesis sería
Ho : son independientes/homogeneidad de comportamiento
Ha: NO son independientes/ no hay comportamiento homogéneo.

El test se llevará a cabo con la metodología de comparar situación observada con la


situación teórica si se cumpliese la hipótesis . Contrastando si las diferencias entre una y
la otra son debidas al azar o a que realmente es porque son distintas por no cumplir la
hipótesis lo observado.

En este caso la hipótesis es Independencia . Tenemos que crear una tabla de las mismas
características , pero.. en la que las observaciones conjuntas cumplieran con la hipótesis
de independencia.

Conocemos que dos variables son estadísticamente independientes cuando para todos
los valores : la frecuencia relativa conjunta es igual al producto de las frecuencias
relativas de las marginales.

es decir

∀𝒊,𝒋
𝒏𝒊,𝒋 𝒏𝒊,. 𝒏.,𝒋
= ·
𝑵 𝑵 𝑵
así tendríamos

Y=profesión
economistas médicos n.j
X=semanas

<2 n 1,1 ? n 1,2 ? 60

3 ? ? 80

4 ? ? 110

ni. 100 150 N=250

será

𝑛1,1 𝑛1,. 𝑛.,1 60 100 𝑛1,1


= · = · =
𝑁 𝑁 𝑁 250 250 250

60 · 100
= 𝑛1,1 = 24
250
los cinco restantes:

60 · 150
= 𝑛1,2 = 36
250
80 · 100
= 𝑛2,1 = 32
250
80 · 150
= 𝑛2,2 = 48
250
110 · 100
= 𝑛3,1 = 44
250
110 · 150
= 𝑛3,2 = 66
250
la tabla teórica si fueran independientes sería así

Y=profesión
economistas médicos n.j
X=semanas

<2 24 36 60

3 32 48 80

4 44 36 110

ni. 100 150 N=250

tabla observada

Nº semanas Economistas Médicos


2 20 40
3 30 50
4 50 60

¿se parecen? ?
hemos de comparar observada con teórica en base a

2
(𝑛𝑖.𝑗,𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑛𝑖.𝑗,𝑡𝑒ó𝑟𝑖𝑐𝑎 )
𝑛𝑖.𝑗,𝑡𝑒ó𝑟𝑖𝑐𝑎

así: para 1,1


(20 − 24)2 16
= = 0,66666
24 36
y así para los cinco restantes

0,4444 0,125 0,08333 0,8181 0,5454


el estadístico T será

2 3
2
(𝑛𝑖.𝑗,𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑛𝑖.𝑗,𝑡𝑒ó𝑟𝑖𝑐𝑎 )
𝑇 = ∑∑
𝑖=1 𝑗=1
𝑛𝑖.𝑗,𝑡𝑒ó𝑟𝑖𝑐𝑎

= 0,666 + 0,4444 + 0,125 + 0,08333 + 0,8181 + 0,5454 = 2,683

debemos ver si el estadístico cae o no en zona de NO rechazo

grados de libertad

g.l =(m-1)·(n-1)= (3-1)(2-1)=2 gl

veamos la chi2 para gl=2 con alpha=0,01

No rechazaríamos

si lo hiciéramos la probabilidad de equivocarnos sería al menos del 26%


https://www.uv.es/ceaces/scrips/tablas/chomoge.htm

apartado b)

Comprobar el ajuste a una polinomial considerando únicamente al colectivo de


los economistas, de manera que se contraste que: el 25% dedican 2 semanas o
menos a vacaciones, el 35% dedican 3 y el resto dedican 4. Con un nivel de
significación del 1%

Se trata de un contraste de Bondad de Ajuste de manera que:

H0: las semanas de vacaciones de los economistas se ajustan a una polinomial


especíca
Ha : No se ajustan a dicha polinomial específica

Nº semanas Economistas Teórica polinomial

2 20 25%
3 30 35%
4 50 40%

Nº semanas Economistas Teórica polinomial

2 20 25%
3 30 35%
4 50 40%

2
(𝑛0,𝑖 −𝑛𝑡,𝑖 )
Estadístico: 𝑇 = ∑3𝑖=1 𝑛𝑡,𝑖
Así :

Grados de libertad : n-k-1 =3-0-1=2


Estadístico T=4,2142

Como trabajamos con alpha =0,01


Tendremos una CHI2 con 2 g.l ( no procede Yates)

Luego no rechazamos hipótesis nula

https://www.uv.es/ceaces/scrips/tablas/teschi2.htm

También podría gustarte