Guion Tema5

ESTADISTICA I I
Departamento de Fundamentos del Análisis Económico

Universidad de Alicante. Curso 2018/19
GUIÓN TEMA 5: CONTRASTES DE

ESPECIFICACIÓN
1. Contraste de bondad de ajuste chi-cuadrado

Bibliografía: Newbold, Sección 14.1.
Este contraste se utiliza para contrastar si una variable aleatoria (v.a.) disc-
reta tiene una determinada función de probabilidad, a partir de una muestra
aleatoria simple (m.a.s.) de dicha v.a.
Este contraste recibe el nombre de “contraste de bondad de ajuste”,
porque analiza si la distribución muestral se ajusta bien o no a la distribución
de probabilidad teórica que se desea contrastar.
Suponemos que la v.a. X puede tomar k posibles valores x1 ; :::; xk .
Nuestra hipótesis nula es que la función de probabilidad de X es f (xj ) =
p0j , para j = 1; :::; k, siendo los valores p0j (y también los xj ) totalmente
conocidos.
Suponemos que X1 ; :::; Xn es una m.a.s. de la v.a. X.
Ejemplo 1:
Supongamos que queremos contrastar si un dado está o no trucado.
La v.a. X es aquí el resultado obtenido al lanzar el dado.
El hecho de que el dado no está trucado es equivalente a que la función de
probabilidad de la v.a. X es P (X = j) = 1=6 para j = 1; :::; 6, que sería la
hipótesis nula del contraste.
La hipótesis alternativa es que la variable X sigue cualquier otra distribución
de probabilidad.
Para hacer el contraste lanzamos el dado n = 300 veces.
La tabla siguiente muestra los resultados obtenidos; en esta tabla represen-
tamos como Oj a la frecuencia absoluta de xj (es decir, número observado
de valores xj en la muestra):
xj 1 2 3 4 5 6
Oj 44 62 52 45 50 47
El estadístico de contraste compara las frecuencias observadas en la muestra

para cada posible valor, que llamaremos Oj , con las frecuencias que cabría
esperar obtener si la distribución que postulamos bajo la hipótesis nula es
la verdadera; a estas frecuencias esperadas las representaremos por Ej .
Puesto que bajo H0 la probabilidad del valor xj es p0j , y el tamaño muestral
es n, la frecuencia esperada del valor xj será Ej = np0j .
Cuanto más alejadas de 0 estén las divergencias Oj Ej ; menos verosímil
será la hipótesis nula.
Para poder llevar a cabo el contraste de hipótesis, partiendo de estas diver-
gencias Oj Ej , es necesario obtener un estadístico de contraste que tenga
distribución conocida bajo la hipótesis nula.
El estadístico de contraste que se utiliza es:
X
k
(Oj Ej )2
T ;
j=1
Ej
que siempre toma valores no negativos.

Si la hipótesis nula del contraste es cierta, la distribución aproximada de T
es una distribución 2k 1 , siendo k el número de resultados posibles de X.
Obsérvese que valores pequeños de T indican que no hay discrepancias
grandes entre las frecuencias observadas y las frecuencias que cabría es-
perar si la H0 fuera cierta, mientras que valores grandes de T indican que
las discrepancias (al menos una de ellas) son grandes en valor absoluto, lo
que sería evidencia en contra de la hipótesis nula.
Por lo tanto, para realizar un contraste aproximado de nivel de signi…cación
utilizaremos la siguiente regla de decisión: Rechazar H0 a nivel de signi…-
cación si T 2 ( 2k 1; ; +1).
2
Ejemplo 1 (continuación):
En el caso del dado, k = 6, y todas las frecuencias esperadas son iguales a
50.
El valor muestral del estadístico de contraste es t = 4:36.
2
Puesto que 5;0:05 = 11:1, no rechazamos H0 con nivel de signi…cación =
0:05:
El p-valor del contaste es:
2
p-valor P 5 > 4:36 = 0:4988
Comentarios adicionales sobre este contraste:

Para que la aproximación chi-cuadrado sea buena, todos los valores Ej “frecuencia
esperada del valor j-ésimo” deben ser mayores o iguales a 5. Si alguno de
estos valores es inferior a 5 se deben agrupar varios de los valores posibles
para conseguir que todas las frecuencias esperadas Ej sean mayores que 5.
En el siguiente ejemplo se ilustra cómo se puede hacer esta agrupación y que
el test de bondad de ajuste Chi-cuadrado también es aplicable a variables
cualitativas.
Ejemplo 2:
Una compañía automovilista a…rma que el 50% de sus clientes se declaran
muy satisfechos con su servicio de asistencia post-venta, el 40% se declaran
bastante satisfechos, el 8% se declaran poco satisfechos y solo el 2% se
declaran nada satisfechos. Para analizar si es a…rmación es verdadera, un
analista independiente ha encuestado a 150 clientes de la compañía; 66 de
esos clientes se han declarado muy satisfechos con el servicio post-venta, 54
se han declarado bastante satisfechos, 24 se han declarado poco satisfechos
y 6 se han declarado nada satisfechos. Con estos datos, ¿hay evidencia
su…ciente para rechazar lo que a…rma la compañía?
Si la a…rmación de la compañía es cierta, entonces el número de clientes

de la muestra que cabría esperar que se hubieran declarado muy satisfechos
es E1 = 150 0:50 = 75; analógamente podemos obtener el número de
clientes de la muestra que cabría esperar que se hubieran declarado bastante
satisfechos, poco satisfechos y nada satisfechos, que son, respectivamente,
3
E2 = 150 0:40 = 60; E3 = 150 0:08 = 12 y E4 = 150 0:02 = 3: Por
tanto, la tabla de frecuencias observadas Oj y esperadas Ej es:
Respuesta Oj Ej
Muy satisfecho 66 75
Bastante satisfecho 54 60
Poco satisfecho 24 12
Nada satisfecho 6 3
En esta tabla observamos que una de las frecuencias esperadas es inferior

a 5; por tanto, realizaremos el contraste agrupando las categorías “Poco
satisfecho”y “Nada satisfecho”. Tras esta agrupación, la tabla de frecuencias
observadas Oj y esperadas Ej que se obtiene es:
Respuesta Oj Ej
Muy satisfecho 66 75
Bastante satisfecho 54 60
Poco o nada satisfecho 30 15
El valor que toma el estadístico de contraste con esta muestra es:
(66 75)2 (54 60)2 (30 15)2

T = + + = 1:08 + 0:6 + 15 = 16:68
75 60 15
Debemos rechazar H0 si este valor queda en la región ( 22; ; +1): Si tomamos
como nivel de signi…cación = 0:05; entonces el valor crítico es 22;0:05 =
5:99; por tanto, como T = 16:68 2 (5:99; +1); se rechaza la hipótesis nula,
es decir, hay evidencia su…ciente para decir que rechazamos que sea cierto
lo que la compañía a…rma. El p-valor del contaste es:
2
p-valor P( 2 > 16:68) = 0:0002
Observando los tres sumandos del estadístico T; podemos ver que la razón
principal por la que se rechaza la hipótesis nula es porque el número de
clientes de la muestra que se han declarado poco o nada satisfechos está
muy por encima de lo que cabría esperar si lo que a…rma la compañía fuera
cierto.
4
2. Contraste de normalidad Jarque-Bera
En el apartado anterior hemos visto cómo contrastar si una v.a. discreta

tiene una especi…cada función de probabilidad (o de distribución).
En este apartado veremos cómo contrastar si una v.a. continua tiene una
distribución normal.
Cuando no haya evidencia para rechazar esta hipótesis, podremos con…ar en
los resultados de los procedimientos vistos en los temas anteriores.
Cuando se rechace la hipótesis de normalidad, si el tamaño muestral es
grande, generalmente puede recurrirse al teorema central del límite y los
procedimientos vistos en los temas anteriores siguen siendo aproximada-
mente válidos (habitualmente n 100 es más que su…ciente para la validez
de los resultados aproximados); si el tamaño muestral es pequeño, deben
utilizarse procedimientos alternativos, que no estudiaremos en este curso.
El primer paso para estudiar normalidad debe ser la obtención del his-
tograma.
En el histograma podrá apreciarse si la forma en que se distribuyen las
observaciones es similar a la de una campana de Gauss o no (con mayor
densidad de probabilidad en el centro y decrecimiento simétrico a derecha e
izquierda).
Para analizar de modo riguroso la hipótesis de normalidad se han propuesto
muchos procedimientos de contraste.
Aquí estudiaremos uno de los más sencillos, que recibe el nombre de con-
traste de normalidad de Jarque-Bera, y que se centra en comparar la
asimetría y el grosor de las colas (llamado curtosis en Estadística) de la dis-
tribución muestral con las respectivas medidas de una distribución normal
tipi…cada.
El coe…ciente de asimetría de una v.a. X se de…ne como E[(X

)3 ]=( 2 )3=2 ; donde y 2 denotan la esperanza de X y la varianza de
X, respectivamente. Si la distribución de una v.a. X es simétrica, su coe-
…ciente de asimetría es cero. Por tanto, si la v.a. X tiene una distribución
normal su coe…ciente de asimetría es cero. Por otra parte,
5
– si una v.a. tiene un coe…ciente de asimetría positivo, su distribución es
asimétrica a la derecha (hay más dispersión a la derecha de la media
que a su izquierda).
– si una v.a. tiene un coe…ciente de asimetría negativo, su distribución
es asimétrica a la izquierda (hay más dispersión a la izquierda de la
media que a su derecha).
Dada una muestra X1 ; :::; Xn de una v.a. X, se puede estimar el coe…ciente

de asimetría de X mediante el coe…ciente de asimetría muestral:
Pn
(Xi X)3 =n
Asi(X1 ; :::; Xn ) = P i=1 3=2
n
i=1 (Xi X)2 =n
El numerador del coe…ciente de asimetría muestral será:
– igual a 0 si la distribución muestral es simétrica

– positivo si la distribución muestral es asimétrica a la derecha (hay más
dispersión a la derecha de la media muestral que a su izquierda)
– negativo si la distribución muestral es asimétrica a la izquierda (hay
más dispersión a la izquierda de la media muestral que a su derecha).
El denominador del coe…ciente de asimetría muestral se introduce para com-

parar la dispersión a derecha e izquierda con la dispersión global, y gracias
a él se consigue también que este coe…ciente no se vea afectado por cambios
en la unidad de medida.
Si X1 ; :::; Xn es una m.a.s. de una v.a. X con distribución normal, en-
tonces cabe esperar que Asi(X1 ; :::; Xn ) tome un valor próximo a 0, porque
la distribución normal es simétrica.
El coe…ciente de curtosis de una v.a. X se de…ne como E[(X )4 ]=( 2 )2 ;
donde y 2 denotan la esperanza de X y la varianza de X, respectivamente.
Si la v.a. X tiene una distribución normal, entonces su coe…ciente de curtosis
es 3. De modo que
– si el coe…ciente de curtosis de una v.a. es menor que 3, entonces los

valores extremos de la v.a. tienen una importancia relativa menor que
en una distribución normal (esto ocurre, por ejemplo, con las distribu-
ciones uniformes).
6
– si el coe…ciente de curtosis de una v.a. es mayor que 3, entonces los
valores extremos de la v.a. tienen una importancia relativa mayor que
en una distribución normal (esto ocurre, por ejemplo, con las distribu-
ciones t de Student).
Dada una muestra X1 ; :::; Xn de una v.a. X, se puede estimar el coe…ciente

de curtosis de X mediante el coe…ciente de curtosis muestral:
Pn
(Xi X)4 =n
Cur(X1 ; :::; Xn ) = Pni=1 2
i=1 (Xi X)2 =n
El numerador siempre es positivo; y cuanto mayor sea, más peso tienen en

la muestra las observaciones muy alejadas de la media.
El denominador se introduce para comparar esta medida de discrepancia con
respecto a una medida de discrepancia tradicional, y gracias a él se consigue
también que esta medida no se vea afectada por cambios en la unidad de
medida.
Si X1 ; :::; Xn es una m.a.s. de una v.a. X con distribución normal, entonces

cabe esperar que Cur(X1 ; :::; Xn ) tome un valor próximo a 3:
El coe…ciente de exceso de curtosis muestral se de…ne como:
Ex.Cur(X1 ; :::; Xn ) = Cur(X1 ; :::; Xn ) 3
Por tanto, en una m.a.s. de una v.a. con distribución normal cabe esperar
que el coe…ciente de exceso de curtosis sea aproximadamente 0.
Teorema: Si X1 ; :::; Xn es una m.a.s. de v.a. con distribución normal;

entonces, para n su…cientemente grande, el estadístico
0 12 0 12
Asi(X1 ; :::; Xn ) A Cur(X1 ; :::; Xn ) 3 A
JB = @ q +@ q
6 24
n n
tiene distribución aproximada chi-cuadrado con dos grados de libertad.
Teniendo en cuenta el resultado anterior, una regla de decisión para con-

trastar la hipótesis nula H0 de que la distribución de X es nomal frente a
la hipótesis alternativa de que la distribución de X no es normal, con nivel
7
de signi…cación aproximado ; es: "Rechazar H0 si JB toma un valor en la
región ( 22; ; +1)":
Obsérvese que la región crítica sólo tiene valores grandes: si la distribución
de X no es normal porque es asimétrica, entonces Asi(X1 ; :::; Xn ) no será
0; y al elevar al cuadrado siempre obtendremos un valor positivo (cuanto
más grande sea, más evidencia en contra de H0 ); análogamente, si la dis-
tribución de X no es normal porque su curtosis es distinta de 3, entonces
Cur(X1 ; :::; Xn ) 3 no será 0; y al elevar al cuadrado siempre obtendremos
un valor positivo (cuanto más grande sea, más evidencia en contra de H0 ).
Ejemplo 3:
A una muestra de 1000 estudiantes se les pidió que indicaran el dinero que
gastaban en libros en un año.
El coe…ciente de asimetría muestral fue 0:15 y el coe…ciente de curtosis
muestral 3:35.
Se desea contrastar la hipótesis nula de que la cantidad de dinero gastado en
libros cada año en la población de estudiantes sigue una distribución normal
mediante el contraste de normalidad Jarque-Bera.
0 12 0 12
Asi(X1 ; :::; Xn ) A Cur(X1 ; :::; Xn ) 3 A
JB = @ q +@ q
6 24
n n
El valor que toma el estadístico de contraste es:

0 12 0 12
0:15 A 3:35 3 A
jb = @ q +@ q = 8:85
6 24
1000 1000
La regla de decisión es rechazar la hipótesis nula si el estadístico queda

dentro del intervalo ( 22; ; +1):
Si tomamos como nivel de signi…cación = 0:05; entonces 22;0:05 = 5:99;
luego el estadístico de contraste queda en la región crítica, por lo que rec-
hazamos la hipótesis nula, es decir, existe evidencia muestral para rechazar
la hipótesis de que la distribución de X es normal.
8
La aproximación chi-cuadrado en este caso solo funciona razonablemente
bien si n 1000:
Como el contraste es muy utilizado, se ha estudiado con detalle cómo es
la distribución de este estadístico para valores de n inferiores a 1000; como
resultado de estos estudios se han elaborado tablas que indican cuál es el
valor crítico que debe utilizarse en lugar 22; , una de las cuales se presenta
en un anexo.
Los coe…cientes de asimetría y de exceso de curtosis para un conjunto de
datos se pueden calcular con ayuda de Gretl utilizando la opción Ver )estadísticos
principales.
3. Contraste de independencia de dos variables cualitativas

Consideremos una población donde cada elemento se categoriza de acuerdo
a dos variables cualitativas A y B (por ejemplo en una población de personas
podemos considerar las variables cualitativas nivel de educación y sexo, o
bien estado civil y ser fumador o no).
Sean A1 ; A2 ; :::; Ar todas las categorías posibles de la primera variable
cualitativa y B1 ; B2 ; :::; Bc todas las categorías posibles de la segunda
variable cualitativa.
Si llamamos pij a la probabilidad de que un elemento de la población esté a la
vez en la categoría Ai de la variable A y en la categoría Bj de la variable Bj ;
es decir pij P (Ai \ Bj ); entonces el modelo probabilístico que describe el
comportamiento conjunto de los dos atributos (A; B) será una tabla de doble
entrada de tamaño r c con las correspondientes probabilidades conjuntas:
A n B B1 B2 Bc
A1 p11 p12 ::: p1c
A2 p21 p22 ::: p2c
.. .. .. .. ..
. . . . .
Ar pr1 pr2 ::: prc
Como en esta P
tablaP
se recogen todas las situaciones posibles, necesariamente
se tiene que: ri=1 cj=1 pij = 1:
9
El objetivo de este apartado es estudiar si hay independencia entre las dos
variables cualitativas consideradas, es decir si P (Ai \ Bj ) = P (Ai ) P (Bj );
para todos los i; j posibles.
Si conociéramos las probabilidades pij ; ya estudiamos (en el curso pasado)
cómo tendría que hacerse este análisis: simplementeP habría que calcular por
una parte P (Ai ) = P (Ai \ B1 ) + + P (Ai \P Bc ) = ck=1 pik ; por otra parte
P (Bj ) = P (A1 \ Bj ) + + P (Ar \ Bj ) = rk=1 pkj ; y después comprobar
si el producto de estas probabilidades coincide con pij para todos los i; j
posibles.
Ahora bien, en este apartado no supondremos que estas probabilidades pij
sean conocidas; lo que supondremos es que disponemos de una muestra
aleatoria simple de tamaño n de la población, y que observamos a qué cat-
egoría de la variable A y a qué categoría de la variable B pertenece cada
elemento de la muestra.
Utilizando estas observaciones nuestro objetivo es analizar si hay indepe-
dencia entre las dos variables cualitativas.
Obsérvese que si conociéramos las verdaderas probabilidades pij ; podríamos

saber con seguridad si las variables cualitativas son independientes o no.
Puesto que no conocemos estas probabilidades, lo que haremos será un con-
traste de hipótesis, es decir, analizaremos si hay evidencia su…ciente para
rechazar o no la hipótesis nula de independencia, pero no podremos estar
completamente seguros de que nuestra conclusión sea la correcta.
A partir de la muestra, lógicamente es posible estimar todas las probabili-
dades pij P (Ai \ Bj ); P (Ai ) y P (Bj ); utilizando, en cada caso, la propor-
ción muestral de elementos que satisfacen la condición correspondiente.
Llamando pbij ; Pb(Ai ) y Pb(Bj ) a estas estimaciones, podríamos comprobar
si pbij coincide con Pb(Ai )Pb(Bj ) o no, para todos los i; j posibles; pero esto
no nos permitiría deducir con seguridad si hay independencia o no, porque
puede ocurrir que en realidad las variables sí sean independientes y que no
se cumpla siempre que pbij = Pb(Ai )Pb(Bj ) por la aleatoriedad que hay en
todo proceso de selección de muestras.
Veamos cómo obtener la regla de decisión para el contraste de la hipótesis

nula de indepedencia frente a la alternativa de no independencia:
10
Suponemos que observamos n elementos de la población, y llamamos Oij al
número observado de elementos que están a la vez en la categoría Ai y en la
categoría Bj :
Estos datos vendrán dados en una tabla de la forma siguiente:
A n B B1 B2 Bc
A1 O11 O12 ::: O1c
A2 O21 O22 ::: O2c
.. .. .. .. ..
. . . . .
Ar Or1 Or2 ::: Orc
Para obtener el estadístico de contraste conviene completar esta tabla aña-
diendo una …la más y una columna más, con los elementos que hay en total
en la correspondiente …la o columna:
A n B B1 B2 Bc Total …la
A1 O11 O12 ::: O1c R1
A2 O21 O22 ::: O2c R2
.. .. .. .. ..
. . . . .
Ar Or1 Or2 ::: Orc Rr
Total columna C1 C2 Cc n
Esta tabla recibe el nombre de “tabla de contingencia”.
Ejemplo 4:
Consideramos una población grande de personas, de la que se toma una
muestra formada por 600 personas, y cada una de ellas la clasi…camos según
A = Nivel de educación (sin estudios, estudios primarios, estudios medios y
estudios universitarios), y según B = Sexo (hombre o mujer).
Por tanto, en este caso hay r = 4 categorías posibles para A y c = 2
categorías posibles para B.
Supondremos que estas 600 personas están clasi…cadas de esta manera:
A n B Hombre Mujer
Sin Estudios 15 30
Est. Primarios 120 150
Est. Medios 95 85
Est. Superiores 60 45
11
La tabla de contingencia se obtiene añadiendo una …la y una columna, que
incluyan los totales por …la y columna.
A n B Hombre Mujer Total Fila

Sin Estudios 15 30 45
Est. Primarios 120 150 270
Est. Medios 95 85 180
Est. Superiores 60 45 105
Total Columna 290 310 600
Observando la última columna vemos cuántas personas de la muestra hay

en cada nivel de estudios (sin tener en cuenta su sexo); observando la última
…la vemos cuántos hombres y mujeres hay en la muestra (sin tener en cuenta
su nivel de estudios).
Para obtener el estadístico de contraste, lo que haremos será comparar las
frecuencias observadas Oij con las que cabría esperar si realmente las dos
variables fueran independientes, que llamaremos Eij :
Para obtener cuáles son estas frecuencias esperadas, basta tener en cuenta
que, si las variables son independientes, la probabilidad de que un elemento
esté a la vez en la categoría Ai y en la categoría Bj ha de coincidir con
P (Ai ) P (Bj ):
Como hemos comentado antes, un buen estimador de P (Ai ) es la proporción
muestral de elementos en la categoría Ai , es decir Ri =n, mientras que un buen
estimador de P (Bj ) es la proporción muestral de elementos en la categoría
Bj , es decir Cj =n:
Por tanto, bajo independencia, un buen estimador de la probabilidad de
que un elemento esté a la vez en la categoría Ai y en la categoría Bj es
Pb(Ai ) Pb(Bj ) = Ri Cj =n2 ; así pues, como la muestra tiene n elementos, el
número de elementos que cabe esperar que estén a la vez en la categoría Ai
y en la categoría Bj es:
Ri Cj Ri Cj
Eij = n 2
=
n n
El estadístico de contraste que se utiliza para contrastar la hipótesis nula
de independencia está basado en la comparación entre las frecuencias obser-
vadas Oij y las frecuencias que cabe esperar bajo independencia Eij ; más
12
concretamente, su expresión es:
X
r X
c
(Oij Eij )2
T =
i=1 j=1
Eij
Si la hipótesis nula es cierta, puede demostrarse (no lo haremos) que este

estadístico tiene aproximadamente distribucion chi-cuadrado con (r 1)(c
1) grados de libertad.
Si la hipótesis nula no es cierta, cabe esperar que alguna discrepancia Oij
Eij esté alejada de 0; luego el estadístico T tomará un valor grande.
Por tanto, la regla de decisión con nivel de signi…cación será “Rechazar
H0 si T 2 2(r 1)(c 1); ; +1 ”.
Ejemplo 4 (continuación):
Con los datos que antes hemos introducido antes, nos planteamos analizar
si en la población que estudiamos las variables nivel educativo y sexo son
independientes.
Para ello calculamos una tabla que contenga todas las frecuencias esperadas
Eij :
Estudios n Sexo Hombre Mujer Total Fila
45 290 45 310
Sin Estudios 600 600
45
270 290 270 310
Est. Primarios 600 600
270
180 290 180 310
Est. Medios 600 600
180
105 290 105 310
Est. Superiores 600 600
105
Operando se obtienen la siguiente tabla de frecuencias esperadas:
Estudios n Sexo Hombre Mujer Total Fila
Sin Estudios 21:75 23:25 45
Est. Primarios 130:5 139:5 270
Est. Medios 87 93 180
Est. Superiores 50:75 54:25 105
Comparando los valores de esta tabla con los de la tabla de contingencia de
valores observados obtenemos el estadístico de contraste:
(15 21:75)2 (120 130:5)2 (45 54:25)2
T = + + + = 10:38.
21:75 130:5 54:25
13
Si tomamos como nivel de signi…cación = 0:05; el valor que aparece en la
región crítica es 23;0:05 = 7:81; por tanto, la regla de decisión es rechazar H0
si T 2 (7:81; +1):
En este caso, por tanto, rechazamos H0 ; es decir hay evidencia su…ciente
para rechazar que las variables nivel de estudios y sexo son independientes
en la población de la que se ha extraído esta muestra.
El p-valor del contraste es p-valor= P ( 23 > 10:38) = 0:0156; por tanto,
si hubiéramos tomado como nivel de signi…cación = 0:01 no habríamos
rechazado la hipótesis nula.

Para que la aproximación a la distribución chi-cuadrado sea buena, al menos
el 80% de valores Eij deben ser mayores o iguales a 5. Si no se cumple esta
condición, es deseable agrupar algunas de las categorías consideradas.
Gretl permite realizar este contraste directamente.
14
JB
Valores críticos del estadístico de contraste Jarque-Bera

Guion Tema5

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Guion Tema5

Cargado por

Copyright:

Formatos disponibles

ESTADISTICA I I

Departamento de Fundamentos del Análisis Económico

GUIÓN TEMA 5: CONTRASTES DE

1. Contraste de bondad de ajuste chi-cuadrado

El estadístico de contraste compara las frecuencias observadas en la muestra

que siempre toma valores no negativos.

Comentarios adicionales sobre este contraste:

Si la a…rmación de la compañía es cierta, entonces el número de clientes

En esta tabla observamos que una de las frecuencias esperadas es inferior

El valor que toma el estadístico de contraste con esta muestra es:

(66 75)2 (54 60)2 (30 15)2

En el apartado anterior hemos visto cómo contrastar si una v.a. discreta

El coe…ciente de asimetría de una v.a. X se de…ne como E[(X

Dada una muestra X1 ; :::; Xn de una v.a. X, se puede estimar el coe…ciente

El numerador del coe…ciente de asimetría muestral será:

– igual a 0 si la distribución muestral es simétrica

El denominador del coe…ciente de asimetría muestral se introduce para com-

– si el coe…ciente de curtosis de una v.a. es menor que 3, entonces los

Dada una muestra X1 ; :::; Xn de una v.a. X, se puede estimar el coe…ciente

El numerador siempre es positivo; y cuanto mayor sea, más peso tienen en

Si X1 ; :::; Xn es una m.a.s. de una v.a. X con distribución normal, entonces

El coe…ciente de exceso de curtosis muestral se de…ne como:

Ex.Cur(X1 ; :::; Xn ) = Cur(X1 ; :::; Xn ) 3

Teorema: Si X1 ; :::; Xn es una m.a.s. de v.a. con distribución normal;

tiene distribución aproximada chi-cuadrado con dos grados de libertad.

Teniendo en cuenta el resultado anterior, una regla de decisión para con-

El valor que toma el estadístico de contraste es:

La regla de decisión es rechazar la hipótesis nula si el estadístico queda

3. Contraste de independencia de dos variables cualitativas

Obsérvese que si conociéramos las verdaderas probabilidades pij ; podríamos

Veamos cómo obtener la regla de decisión para el contraste de la hipótesis

A n B Hombre Mujer Total Fila

Observando la última columna vemos cuántas personas de la muestra hay

Si la hipótesis nula es cierta, puede demostrarse (no lo haremos) que este

Comentarios adicionales sobre este contraste:

Valores críticos del estadístico de contraste Jarque-Bera

También podría gustarte