Está en la página 1de 10

Estadstica II

Tema 1. Estadstica no Paramtrica o Libre de Distribucin



1. Introduccin.

Bajo el nombre de mtodos no parmetros (pruebas no paramtricas) se recogen
aquellas pruebas que no estn sujetas a determinadas condiciones de aplicacin, a
diferencia de la pruebas paramtricas que s lo estn. La condicin principal que marca
estas diferencias es que, en la pruebas paramtricas, se exige la normalidad de la variables
(cuantitativas) que intervienen en el anlisis. En otras ocasiones, para la correcta aplicacin
se exige la homogeneidad de varianzas, etc. En determinadas pruebas estadsticas las
condiciones de aplicacin pueden ser muy fuertes, y, por consiguiente a veces es difcil que
se cumplan todas. A veces, pequeas desviaciones en las condiciones de aplicacin no
invalidan su aplicacin (pruebas robustas).

Cuando el requisito de normalidad es difcil de cumplir, hay que recurrir a pruebas
no paramtricas. Para tamaos de muestra pequeos, inferiores a 10, las violaciones de las
hiptesis paramtricas se muestran ms apropiadas.

Cuando se seleccionan ciertas hiptesis que parecen importantes en una teora
determinada, se recogen los datos empricos que dan informacin directa cerca de la
aceptabilidad de esa hiptesis. La decisin acerca del significado de los datos pueden
conducir a la confirmacin, revisin o rechazo de la hiptesis y, con ella, la teora que la
origino.

Para tomar decisiones con objetividad acerca de una hiptesis particular,
necesitamos procedimientos que nos conduzcan a un criterio objetivo para aceptar o
rechazar esa hiptesis. Todo esto se ha de hacer de acuerdo con el mtodo cientfico que
requiere la posibilidad de repetir el experimento.

Se exige menor conocimiento estadstico para las pruebas no paramtricas que para
las paramtricas.

2. Intervalos de confianza para el cuantil
p
de orden p de una distribucin.

El cuantil se refiere a una medida de posicin relativa de una distribucin de
probabilidad.
p
se lee csi de p y es el cuantil de orden p de F(X).

Definicin del cuantil de orden p de una distribucin.

Sea X una variable aleatoria de tipo continuo con funcin de densidad de
probabilidad f(X) y funcin de distribucin F(X).
p
es el cuantil de F(X) de orden p, con
una fraccin positiva, entonces
p
es un valor tal que P(X
p
) =F
X
(
p
)=F(
p
)=p.

El cuantil de orden p=0.5, Pr(X
0.5
)=F(
0.5
)=0.5 es la mediana de la distribucin
y divide en dos partes iguales a los datos.

Estadstica II
Los cuartiles dividen en 4 partes a los datos:

El primer cuartil o cuantil inferior o de orden p=0.25, Pr(X
0.25
)=F(
0.25
)=0.25
El segundo cuartil o cuantil medio o de orden p=0.5, Pr(X
0.5
)=F(
0.5
)=0.5
El tercer cuartil cuantil superior o de orden p=0.75, Pr(X
0.75
)=F(
0.75
)=0.75

Los percentiles de una distribucin dividen en 100 partes iguales a los datos.

Tarea 1. Determinar el cuantil de orden 0.95 para las siguientes distribuciones:

- T de Student
-
2
Ji cuadrada de Pearson
- F de Fisher

Especifique los valores para los grados de libertad. Realizarlo en SPSS.

En el enfoque de la estadstica paramtrica o clsica se obtuvieron intervalos de
confianza para diferentes parmetros:

- Medidas de localizacin: ,
1
-
2

- Medidas de variabilidad:

Ahora los parmetros sern los cuantiles, quienes son medidas de posicin relativa.

Para obtener los Intervalos de Confianza para los cuantiles se considera a las
estadsticas de orden. Estos mtodos de inferencia estadstica son aplicables a todas las
distribuciones de tipo continuo. Se llaman a estos Mtodos libres de distribucin o Mtodos
de inferencia no paramtrica.

Para el uso del enfoque no paramtrico se procede de la siguiente manera:

Sea una muestra aleatoria (observaciones independientes e idnticamente
distribuidas) X
1
, X
2
,X
n
de una variable aleatoria de tipo continuo, donde las estadsticas
de orden son las siguientes.

Bajo el supuesto que los valores de la muestra son distintos se tiene que:

Y
1
< Y
2
<< Y
i-1
<Y
i
< Y
i+1
<< Y
j-1
<Y
j
< Y
j+1
<< Y
n-1
<Y
n

Min{X
i
} Y
i
<Y
j
Max{X
i
}

Considere que es de inters la probabilidad del siguiente evento o intervalo
aleatorio:

Y
i
<
p
<Y
j


Entonces para dicho clculo, utilizando un enfoque intuitivo, se procede como sigue:
Estadstica II

Se consideran los siguientes eventos Y
i
<
p
y
p
<Y
j
y nos preguntamos en ambos
casos por el nmero de Xs que se encuentran por debajo de
p
:

Para Y
i
<
p
el #X
s
<
p
son i al menos pero pueden ser ms de i dependiendo de la
posicin de
p
.

(1)

Para
p
<Y
j
el #X
s
<
p
son a los mucho j-1.

Si se considera que
1 ( )
0 ( )
i p
i
i p
si x xito
W
si x fracaso

<
=

>

W
i
~Bernoulli(p)con p= P(x
i

p
) = F(
p
)=P(w
i
=1)

Sean W
1
, W
2
,,W
n
n ensayos independientes entonces
1
n
i
i
W W
=
=

con W =
#X
s
<
p
al realizar n ensayos. Entonces W ~ Binomial(n, p) con W=0, 1, 2,, n.

Por lo tanto para el evento de inters Y
i
<
p
<Y
j
con i <j el nmero de xitos que hay
en dicho intervalo de acuerdo a (1) son al menos i y a lo mucho j-1, por ello

P(Y
i
<
p
<Y
j
) = P(i W j-1)

Sea F
W
la distribucin acumulativa de la variable aleatoria Binomial, entonces

P(i W j-1) = F
W
(j-1) - F
W
(i-1) = ( )
1
1
j n w
w
w i
n
p p
w

=
| |

|
\ .



Es importante hacer notar que P(i W j-1) = P(i-1 < W <j)

Si al calcular la probabilidad de un intervalo aleatorio suponga que esta es 1-, es
decir,

P(Y
i
<
p
<Y
j
) = 1- = P(i W j-1); 0 << 1

Esto significa que (1-) es la probabilidad que el intervalo aleatorio (Y
i
, Y
j
) incluya
el cuantil de orden p,
p
.

Si los valores observados de las estadsticas de orden de Y
i
y Y
j
son respectivamente
y
i
y y
j
, entonces el intervalo (y
i
, y
j
) sirve como un intervalo de confianza al (1-)x100%
para el cuantil de orden p,
p
.

As entonces el intervalo de confianza para
p

es:
p
e (y
i
, y
j
) con (1-)x100% de confianza

Estadstica II
El procedimiento explicado es el exacto, sin embargo en muchas ocasiones aparece
el clculo aproximado utilizando la distribucin de probabilidad normal [Hogg Graig.pdf].


Tarea 2.Realizar los ejercicios del artculo Hogg Graig.pdf.

3. Determinacin del intervalo de confianza para el cuantilp, de acuerdo a las
propiedades de las estadsticas de orden.

Antecedentes:

Propiedades de las estadsticas de orden.

Sea X una variable aleatoria de tipo continuo con una f.d.p f(x) en a x b < < que es
positiva y vale cero en otro lado. La funcin de distribucin ( ) F x es:
( ) ( ) , si
x
a
F x f w dw a x b = < <
}

( ) ( ) 0, si
a
a
f w dw F a x a = = s
}

( ) ( ) 1, si
b
a
f w dw F b x b = = >
}


Distribuciones marginales de las estadsticas de orden.

La distribucin conjunta es:
( )
( ) ( ) ( )
1 2 3 1 2 3
1 2 3
6 ,
, ,
0 ,
f y f y f y a y y y b
g y y y
eoc
< < < <
=


En particular se obtiene haciendo una transformacin uno a uno de los valores de la
terna X
1
, X
2
, X
3
a las estadsticas de orden Y
1
<Y
2
<Y
3
, es decir se hace un mapeo de las Xs
a las Ys. Para ello se requiere determinar para cada posible punto del mapeo el jacobiano
de la transformacin (funcin inversa de probabilidad).

Estadstica de orden marginal para la mediana
1 2 3
a y y y b < < < <
( ) ( ) ( ) ( ) ( ) ( ) ( )
2 2
2 2
2 1 2 3 1 3 2 3 3 1 1
6 6
b y b y
y a y a
g y f y f y f y dy dy f y f y dy f y dy
( (
= =
( (

} } } }
;
2
2
2
2
1 1
2 3 1 3
2 3 2 3
2 2 3 3
como ( ) ( ) :
6 ( ) ( )[ ( )]
6 ( ) ( )[ ( ) ( )]
6 ( ) ( ) ( )
6
b
y
a
y
b
y
b
y
F y f y
f y f y F y dy
f y f y F y F a dy
f y F y f y dy
=
=
=
=
=
}
}
}
2
2 2 3
2 2 2
( ) ( )[ ( )]
6 ( ) ( )[ ( ) ( )]
b
y
f y F y F y
f y F y F b F y =

Estadstica II
2 2 2 2
2 2 2
( ) 6 ( ) ( )[1 ( )]
6 ( )[1 ( )] ( )
g y f y F y F y
F y F y f y
=
=

2
2 2 2 2
2
6[ ( ) ( )] ( ),
( )
0 , eoc

F y F y f y a y b
g y
< <
=


Como se pudo comprobar la marginal de Y
2
puede expresarse como la f.d.p. f(y
2
) y
la F.D. F(y
2
)
Al considerar la f.d.p de Y
2
se puede calcular por ejemplo G(M):
2
2 2 2 2 2
2 3 2 3 2 3
2 2
2 3
( ) Pr[ ] 6 [ ( ) ( )] ( )
( ) ( ) ( ) ( ) ( ) ( )
6[ ] 6[ ]
2 3 2 3 2 3
( ) ( ) 1 1 3 1 2 1
6[ ] 6[ ] 6[ ] 6
2 3 4 2 8 3 24 24 2
M
a
M
a
G M y M F y F y f y dy
F y F y F M F M F a F a
F M F M
x x
= s =
= =

= = = = =
}

2 3
2 2
2
2
2 2 2
2
2
( ) ( )
Sea ( ) [ ]
2 3
( ) 2 ( ) 3 ( )
[ ] ( )
( ) 2 3
F y F y
H y
dH y F y F y
f y
d y
=
/ /
=
/ /


Es importante destacar que:
F(x)=f(x), a<x<b;
( )
( )
dF x
f x
dx
=
1 ( ) ( ) ( ) ( ) ( ) ( ) .
b x b
a a x
F x F b F x f w dw f w dw f w dw = = =
} } }

Procediendo de manera similar se obtiene la marginal para Y
1
y para Y
3
: g(y
1
),g(y
3
);
respectivamente.

Tarea 3: Para n=3, determine las marginales para Y
1
y para Y
3
.

A partir de lo visto se puede hacer la generalizacin para la distribucin conjunta de
nestadsticas de orden como sigue:

Conjunta de n estadsticas de orden:
1 2 1 2
1 2
! ( ) ( )... ( ), ...
( , ,..., )
0 , eoc
n n
n
n f y f y f y a y y y b
g y y y
< < < < <
=



Marginal de la mxima estadstica de orden (Y
n
).

Estadstica II
4 3 2
4 3 2
4 3
1 2 1 2 3 1
1 1 2 2 3 1
2 2 2 3 1
( ) ... ! ( ) ( )... ( ) ...
... [ ! ( ) ] ( )... ( ) ...
... [ ! ( ) ( )] ( )... ( ) ...

n
n
n
y y y y
n n n
a a a a
y y y y
n n
a a a a
y y y
n n
a a a
g y n f y f y f y dy dy dy dy
n f y dy f y f y dy dy dy
n F y F a f y f y dy dy dy

=
=
=
} } } }
} } } }
} } }
4 3
4
4
2 2 2 3 3 1
2 2
3
3 3 1
2
3
3 3 1
3
... [ ! ( ) ( ) ] ( )... ( ) ...
( ) ( )
... [ ![ ] ( )... ( ) ...
2 2
( )
...[ ! ( ) ]... ( )...
2
(
... ![
n
n
n
y y y
n n
a a a
y y
n n
a a
y y
n n
a a
n F y f y dy f y f y dy dy
F y F a
n f y f y dy dy
F y
n f y dy f y dy
F y
n

=
=
=
=
} } }
} }
} }
5
5
3
4
4 4 1
3
4
4 4 1
) ( )
] ( ) ]... ( )...
2 3 2 3
( )
... [ ! ( ) ]... ( )...
2 3
n
n
y y
n n
a a
y y
n n
a a
F a
f y dy f y dy
x x
F y
n f y dy f y dy
x

=
} }
} }

Si integramos sucesivamente sobre y
5,
,y
n
se obtiene:
1 1
1
( ) ( 1)! ( )
! ( ) ( ) ( ),
( ) ( 1)! ( 1)!
0 , eoc
n n
n n n
n n n n
n n
F y n n F y
n f y nF y f y a y b
g y n n


= = < <


Marginal de la mnima estadstica de orden (Y
1
).

1 2 3 4 2 1
...
n n n
a y y y y y y y b

< < < < < < < < <
1 3 2 1
1 3 2 1
2
1 1 1 2 1 2
1 2 1 1 2
1 2 1 1
( ) ... ! ( ) ( )... ( ) ...
... ! ( ) ( )... ( )[ ( ) ] ...
... ! ( ) ( )... ( )[1 ( )]
n n n
n n n
n n
b b b b
n n n
y y y y
b b b b
n n n n
y y y y
b
n n
y y
g y n f y f y f y dy dy dy
n f y f y f y f y dy dy dy
n f y f y f y F y



=
=
=
} } } }
} } } }
}
1 3
1 3 2
2
1 3
1 2
1 2 1 1 1 1 2 2
2
1
1 2 3 2 2
...
... ! ( ) ( )... ( )[ ( )[1 ( )] ] ...
[1 ( )]
... ! ( ) ( )... ( )[ ] ...
2
...
n n
n
n
b b
n
y
b b b
n n n n n
y y y
b b
b n
n y n
y y
dy dy
n f y f y f y f y F y dy dy dy
F y
n f y f y f y dy dy
n

=
=
} }
} } }
} }
1 3
2
2
1 2 2 2 2
[1 ( )]
! ( ) ( )... ( )[ ] ...
2
n
b b
n
n n
y y
F y
f y f y f y dy dy

} }

Al completar la integracin se encuentra que:
1
1 1 1
1 1
[1 ( )] ( ),
( )
0 , eoc
n
n F y f y a y b
g y

< <
=


Un procedimiento general para calcular la distribucin marginal de cualquier
estadstica de orden (Y
k
) se comenta a continuacin.


Estadstica II
Distribucin Marginal para cualquier estadstica de orden.

Con base en lo anterior puede observarse que es fcil expresar la marginal de
cualquier estadstica de orden, digamos Y
k
, en trminos de F(y
k
) y f(y
k
), esto se obtiene,
calculando la integral:

2
1
1 2 1 1 1
( ) ... ... ! ( ) ( )... ( ) ... ...
k
k k
y y b b
k k n n k k k
a a y y
g y n f y f y f y dy dy dy dy

+
=
} } } }

1
!
[ ( )] [1 ( )] ( ),
( 1)!( )! ( )
0 , eoc
k n k
k k k k
k k
n
F y F y f y a y b
k n k g y

< <



Tarea 4. Para n=3, obtenga la funcin de distribucin de las estadsticas de orden
Y1 y Y3. Considere la expresin para la k-sima estadstica de orden.

Es importante destacar que con las marginales de las estadsticas de orden es posible
determinar la probabilidad de un particular intervalo aleatorio para
p
. Una forma de cmo
realizarlo se encuentra en el Apndice 1, utilizando MATHEMATICA V.5.

Tarea 5. Calcule la probabilidad del Intervalo Aleatorio
1 0.25 3
( ) Y Y < < , en
MATHEMATICA V.5, considerando las distribuciones marginales de las estadsticas de
orden
1
Y y la de
3
Y .
Estadstica II
4. Intervalo de confianza para el cuantil poblacional
p
obtenido a partir de las
distribuciones marginales de las estadsticas de orden.

Sabamos intuitivamente que:
1
p
1
Pr( ) Pr[ 1] ( 1) ( 1) (1 ) Pr[ 1 ]
j
w n w
i j
w
n
Y Y i w j F j F i P P i w j
w

=
| |
< < = s s = = = < <
|
\ .

Para validar o fundamentar estadsticamente dicho resultado, se utilizan las propiedades de


las estadsticas de orden, en particular las distribuciones marginales. Para obtener la
expresin para el clculo de dicha probabilidad, considere los siguientes eventos:

El evento
p
( )
i
Y < ocurre ocurren los eventos
p p
( ) o ( )
i j j
Y Y Y < < <
Los dos eventos a la derecha son excluyentes para toda i < j. En trminos
probabilsticas se tiene entonces que:
p p p
Pr( ) Pr( ) Pr( )
i i j j
Y Y Y Y < = < < + <
O equivalentemente
p p p
Pr( ) Pr( ) Pr( )
i j i j
Y Y Y Y < < = < <
Como F
x
es estrictamente una funcin creciente
p p
( ) ( )
i x i x
Y F Y F < <
Pero la distribucin de probabilidad de la variable aleatoria F
x
(Y
i
) es conocida, es la
i-sima estadstica de orden de una distribucin U(0,1); esto de acuerdo al teorema de la
transformacin de probabilidad integral. Entonces:
1, si 0 1
( )
0, eoc
x
f x
< <
=


, si 0 1
( ) 0, si 0
1, si 1
x x
F x x
x
< <

= s

>


F
x
(y
i
) es la distribucin de la estadstica de orden Y
i
considerando que la ley que
gobierna a X es la uniforme. Al considerar la expresin para la estadstica de orden Y
i
y la
uniformidad de X se tiene que:
p p
1 1
0 0
Pr( ) Pr( ( ) ( )) Pr( ( ) )
!
(1 ) (1 )
( 1)!( )!
i x i x x i
P P
i n i n i i
Y F Y F F Y p
n
x x dx cte x x dx
i n i


< = < = <
= =

} }

Donde
1
! ( 1)!
1 ( 1)!( )! ( 1)!( )!
n
n n n
n cte
i i n i i n i
| |
= = =
|

\ .

Aplicando el mtodo de integracin por partes se tiene que:
udv uv vdu =
} }

donde
1 1
(1 ) ; ; ; ( )(1 )
i
n i i n i
x
i
u x dv x dx v du n i x dx

= = = =
( )
1
0
0
[(1 ) ] ( )(1 )
i i
P
n i P n i
x x
i i
cte x n i x dx

= +
}

Ahora manejando convenientemente los trminos constantes de las dos expresiones
respectivamente se obtiene:
Estadstica II
! !
;
( 1)!( )! ( )!( )!
n
cte n n
i i i i n i i n i
| |
= = =
|

\ .

! ( )
( ) !( )
( 1)!( )!
n n i
cte n i n n i
i i i n i


= =
! ( ) i n i
1
( 1)!
1
!( 1)! ( 1)!
n
n n
n cte
i i n i n i
| |
= = =
|

\ .

( )
1 1
0 0
(1 ) 1 (1 ) (1 ) 1 (1 )
P P
i n i n i i i n i n i i
n n
p p cte x x dx p p cte x x dx
i i

| | | |
= + = +
| |
\ . \ .
} }

donde ,

Nuevamente por el mtodo de integracin por partes se obtiene que:
1
1 2
1
(1 ) ; ; ; ( 1)(1 )
i
n i i n i
x
i
u x dv x dx v du n i x dx
+

+
= = = =
( )
1 1
1 2
0 1 1
0
(1 ) 1 [(1 ) ] ( 1)(1 )
i i
P
i n i n i P n i
x x
i i
n
p p cte x n i x dx
i
+ +

+ +
| |
= + +
|
\ .
}

Manejando los trminos constantes convenientemente se tiene que
( 1)!
1 !
1 ( 1) !( 1)! ( 1)!( 1)!
( 1)! ( 1)
1( 1) ( 1)( 1)!
1 ( 1) !( 1)!
1
1 1
1
( 1)
1
n n
cte n
i i i n i i n i
n n n i
cte n i n n i n
i i i n i
n n
n
i i i
n
n n i
i i

+ + +


+ +
| | | |
= = =
| |
+ +
\ . \ .
| |
= = =
|
+
\ .
( 1)! ( 1) i n i +
( )!
( 1)!( 2)!
( 2)!
1 1 2 1
0
1 ( 1) ( 2) 1
0
1
1
1
(1 ) (1 ) (1 )
1 1
1
(1 ) (1 ) (1 )
1 1
n n i
i n i
n i
P
i n i i n i n i i
i n i i n i n i i
n
n
i
n n n
p p p p n x x dx
i i i
n n n
p p p p n x x dx
i i i

+

+ +
+ + + +
| |
= =
|
+
\ .
| | | | | |
= + +
| | |
+ +
\ . \ . \ .
| | | | | |
= + +
| | |
+ +
\ . \ . \ .
}
P
}

Continuando la integracin hasta repetir la integracin por partes n-i veces, el
resultado que se obtiene es:
1 ( 1) 1
1 0
0
1 ( 1) 1 0
(1 ) (1 ) ... (1 )
1 1
1
(1 )
1
(1 ) (1 ) ... (1 ) (1 )
1 1
i n i i n i n
P
n
i n i i n i n n
n n n
p p p p n p p
i i n
n
n x x dx
n
n n n
p p p p n p p p p
i i n
+ +

+ +
| | | | | |
= + + +
| | |
+
\ . \ . \ .
| |
+
|

\ .
| | | | | |
= + + + +
| | |
+
\ . \ . \ .
}


p
Pr( ) (1 ) Pr( )
n
w n w
i
w i
n
Y p p i w n
w


=
| |
< = = s s
|
\ .


Que se refiere a n-i+1=n-(i-1) trminos de probabilidad en la suma.
Procediendo de igual manera para el evento
p
( )
j
Y < , se tiene:
p p
Pr( ) Pr( ( ) ( )) Pr( ( ) ) (1 )
n
w n w
j x j x x j
w j
n
Y F Y F F Y p p p
w


=
| |
< = < = < =
|
\ .


Por lo tanto
Estadstica II
p
Pr( ) Pr( ); con
j
Y j w n i j < = s s <
En este caso se realiza la integracin por partes n-j veces, la cantidad de trminos
que tiene la suma de probabilidades es n-j+1=n-(j-1).
Por lo tanto la probabilidad del intervalo aleatorio para el cuantil es:
p p p
1
1
Pr( ) Pr( ) Pr( )
(1 ) (1 )
Pr( ) Pr( ) (1 )
Pr(
i j i j
n n
w n w w n w
w i w j
j
w n w
w
Y Y Y Y
n n
p p p p
w w
n
i w n j w n p p
w
i


= =

=
< < = < <
| | | |
=
| |
\ . \ .
| |
= s s s s =
|
\ .
=

1) ( 1) ( 1) Pr( 1 )
w w
w j F j F i i w j s s = = < <

Las expresiones anteriores se refieren a las obtenidas inicialmente cuando se
procedi intuitivamente, donde W como se haba comentado era una variable
binomial(n,p), donde p es el orden del cuantil con
n
i
w i
W W
=
=

y
i
W es una variable aleatoria
Bernoulli(p).

Tarea 6. Determine para n=5, i=2 y j=4, como se calcula la probabilidad del
intervalo aleatorio
2 p 4
( ) Y Y < < , utilizando el enfoque formal con las marginales para la
estadsticas de orden, verificando para cada una de las probabilidades de los eventos
p p
( ) ( )
i j
Y y Y < < aleatorios cuantas veces se aplica el mtodo de integracin por partes y
cuantos trminos hay en la suma de probabilidades para cada evento aleatorio?
Se cumple lo que establecen las frmulas generales?

También podría gustarte