Está en la página 1de 22

4

INFERENCIA, ESTIMACIN Y CONTRASTE DE


HIPTESIS

1.- INTRODUCCIN

La Estadstica descriptiva y la teora de la Probabilidad van a ser los pilares de


un nuevo procedimiento (Estadstica Inferencial) con los que se va a estudiar el
comportamiento global de un fenmeno. La probabilidad y los modelos de distribucin
junto con las tcnicas descriptivas, constituyen la base de una nueva forma de
interpretar la informacin suministrada por una parcela de la realidad que interesa
investigar.

En el siguiente esquema representa el tema a tratar y que ser desarrollado a


continuacin.

Puntual
Estimacin
Estadstica
Descriptiva Intervalos
INFERENCIA

Probabilidad y
Contraste
modelos

Los mtodos bsicos de la estadstica inferencial son la estimacin y el contraste


de hiptesis, que juegan un papel fundamental en la investigacin.

Por tanto, algunos de los objetivos que se persiguen en este tema son:
Inferencia, estimacin y contraste de hiptesis 46
Calcular los parmetros de la distribucin de medias o proporciones muestrales
de tamao n, extradas de una poblacin de media y varianza conocidas.
Estimar la media o la proporcin de una poblacin a partir de la media o
proporcin muestral.
Utilizar distintos tamaos muestrales para controlar la confianza y el error
admitido.
Contrastar los resultados obtenidos a partir de muestras.
Visualizar grficamente, mediante las respectivas curvas normales, las
estimaciones realizadas.

En la mayora de las investigaciones resulta imposible estudiar a todos y cada


uno de los individuos de la poblacin ya sea por el coste que supondra, o por la
imposibilidad de acceder a ello. Mediante la tcnica inferencial obtendremos
conclusiones para una poblacin no observada en su totalidad, a partir de estimaciones o
resmenes numricos efectuados sobre la base informativa extrada de una muestra de
dicha poblacin. Por tanto, el esquema que se sigue es,

En definitiva, la idea es, a partir de una poblacin se extrae una muestra por
algunos de los mtodos existentes, con la que se generan datos numricos que se van a
utilizar para generar estadsticos con los que realizar estimaciones o contrastes
poblacionales.

Existen dos formas de estimar parmetros: la estimacin puntual y la


estimacin por intervalo de confianza. En la primera se busca, con base en los datos
muestrales, un nico valor estimado para el parmetro. Para la segunda, se determina un
intervalo dentro del cual se encuentra el valor del parmetro, con una probabilidad
determinada.

Si el objetivo del tratamiento estadstico inferencial, es efectuar generalizaciones


acerca de la estructura, composicin o comportamiento de las poblaciones no
observadas, a partir de una parte de la poblacin, ser necesario que la parcela de
poblacin examinada sea representativa del total. Por ello, la seleccin de la muestra
requiere unos requisitos que lo garanticen, debe ser representativa y aleatoria.
Apuntes de Estadstica II 47

Adems, la cantidad de elementos que integran la muestra (el tamao de la


muestra) depende de mltiples factores, como el dinero y el tiempo disponibles para el
estudio, la importancia del tema analizado, la confiabilidad que se espera de los
resultados, las caractersticas propias del fenmeno analizado, etctera. As, a partir de
la muestra seleccionada se realizan algunos clculos y se estima el valor de los
parmetros de la poblacin tales como la media, la varianza, la desviacin estndar, o la
forma de la distribucin, etc.

El estudio muestral no es un tema que entre a formar parte de este tema, pero si
necesitaremos una serie de conceptos necesarios para el desarrollo del tema, y que se
detallan a continuacin.

1.1.- Conceptos bsicos

POBLACIN: Conjunto de elementos sobre los que se observa un carcter comn. Se


representa con la letra N.

MUESTRA: Conjunto de unidades de una poblacin. Cuanto ms significativa sea,


mejor ser la muestra. Se representa con la letra n.

UNIDAD DE MUESTREO: Est formada por uno o ms elementos de la poblacin.


El total de unidades de muestreo constituyen la poblacin. Estas unidades son disjuntas
entre s y cada elemento de la poblacin pertenece a una unidad de muestreo.

PARMETRO: Es un resumen numrico de alguna variable observada de la


poblacin. Los parmetros normales que se estudian son:

- La media poblacional: X
- Total poblacional: X
- Proporcin: P

ESTIMADOR: Un estimador * de un parmetro , es un estadstico que se emplea


para conocer el parmetro desconocido.

ESTADSTICO: Es una funcin de los valores de la muestra. Es una variable aleatoria,


cuyos valores dependen de la muestra seleccionada. Su distribucin de probabilidad, se
conoce como Distribucin muestral del estadstico.

ESTIMACIN: Este trmino indica que a partir de lo observado en una muestra (un
resumen estadstico con las medidas que conocemos de Descriptiva) se extrapola o
generaliza dicho resultado muestral a la poblacin total, de modo que lo estimado es el
valor generalizado a la poblacin. Consiste en la bsqueda del valor de los parmetros
poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:

- Puntual: cuando buscamos un valor concreto.


Inferencia, estimacin y contraste de hiptesis 48
- Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se
supone que va a estar el valor del parmetro que se busca con una cierta
probabilidad.

CONTRATE DE HIPTESIS: Consiste en determinar si es aceptable, partiendo de


datos muestrales, que la caracterstica o el parmetro poblacional estudiado tome un
determinado valor o est dentro de unos determinados valores.

NIVEL DE CONFIANZA: Indica la proporcin de veces que acertaramos al afirmar


que el parmetro est dentro del intervalo al seleccionar muchas muestras.

2.- EL CONCEPTO DE ESTADSTICO Y DISTRIBUCIN


MUESTRAL

El objetivo de la inferencia es efectuar una generalizacin de los resultados de la


muestra de la poblacin. La tarea que nos ocupa ahora es conocer las distribuciones de
la probabilidad de ciertas funciones de la muestra, es decir, variables aleatorias
asociadas al muestreo o estadsticos muestrales. stos sern tiles para hacer
inferencia respecto a los parmetros desconocidos de una poblacin. Por ello se habla de
distribuciones muestrales, ya que estn basados en el comportamiento de las
muestras.

El primer objetivo es conocer el concepto de distribucin muestral de un


estadstico; su comportamiento probabilstico depender del que tenga la variable X y
del tamao de las muestras.

Sea x1.......xn, una muestra 1 aleatoria simple (m.a.s) de la variable aleatoria X,


con funcin de distribucin F0 , se define el estadstico T como cualquier funcin de la
muestra que no contiene ninguna cantidad desconocida.

Sea una poblacin donde se observa la variable aleatoria X. Esta variable X,


tendr una distribucin de probabilidad, que puede ser conocida o desconocida, y ciertas
caractersticas o parmetros poblacionales. El problema ser encontrar una funcin que
proporcione el mejor estimador de . El estimador, T, del parmetro debe tener una
distribucin concentrada alrededor de y la varianza debe ser lo menor posible.

Los estadsticos ms usuales en inferencia y su distribucin asociada


considerando una poblacin P sobre la que se estudia un carcter cuantitativo son:
1 n
o Media muestral: x = x
n i =1 i
1 n
o Cuasivarianza: s 2 = ( xi x ) 2
n 1 i = 1

1
Todas las variables aleatorias que forman la muestra verifican que son independientes entre s, que
E[ X i ] = y que su V [ X i ] = 2 .
Apuntes de Estadstica II 49

o Total: t = n xi .
i =1

2.1.- Distribuciones muestrales

Consideremos todas las posibles muestras de tamao n en una poblacin,


entonces, como se deca anteriormente, para cada muestra podemos calcular un
estadstico (media, desviacin tpica, proporcin,...) que variar de una a otra. As
obtenemos una distribucin de ese estadstico que se llamar distribucin muestral.

Las medidas fundamentales de esta distribucin son la media, la desviacin


tpica, tambin denominada error tpico, y el total poblacional, y sus distribuciones
muestrales son las siguientes.

MEDIA MUESTRAL: Sea X1.....Xn, una m.a.s. con media o con E(x)= y con
2
varianza muestral V [ X ] = , entonces la media muestra se distribuye como una
n
normal de parmetros:

X N ( , ).
n
VARIANZA MUESTRAL: Sea X1.....Xn, una m.a.s. independientes e idnticamente
distribuidas, definimos el estadstico muestral para la varianza como la cuasivarianza
muestral s 2 =
1
n 1
( 2
)
1n=1 x1 x , entonces se verifica que:

(n 1)s 2 n21
2

TOTAL MUESTRAL: Sea X1......Xn, una m.a.s. con E(t)= n y con V(t)= n 2 ,
entonces se distribuye como una normal:

(
t N n ; n 2 . )

3.- ESTIMACIN PUNTUAL

Un estimador de un parmetro poblacional es una funcin de los datos


muestrales. En pocas palabras, es una frmula que depende de los valores obtenidos de
una muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto
de un parmetro. Por ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la
talla media de los individuos de la muestra.
Inferencia, estimacin y contraste de hiptesis 50
La media de la muestra puede ser un estimador de la media de la poblacin, la
cuasivarianza muestral es un buen estimador de la varianza poblacional y el total
muestral es un buen estimador del total poblacional.
Por tanto, una definicin ms matemtica de un estimador y las propiedades que
debe de cumplir un estimador para ser bueno.
Sea X1......Xn, una m.a.s. de tamao n, decimos que es un estimador * de un
parmetro si el estadstico que se emplea para conocer dicho parmetro desconocido
es este.

3.1.- Propiedades deseables de un estimador

Las propiedades o criterios para seleccionar un buen estimador son los


siguientes:
A) Insesgadez: Diremos que un estimador * de un parmetro es insesgado si su
esperanza coincide con el verdadero valor del parmetro.
E[*] = .
En el caso de que no coincidan, diremos que el estimador es sesgado.
B) Eficiencia: Dados dos estimadores 1* y 2* para un mismo parmetro , se dice que
1* es ms eficiente que 2* si:
V[1*] < V[2*].

C) Suficiencia: Se dice que un estimador de un parmetro es suficiente cuando para su


clculo utiliza toda la informacin de la muestra.
D) Consistencia: Decimos que un estimador * de un parmetro es consistente si la
distribucin del estimador tiende a concentrarse en un cierto punto cuando el tamao de
la muestra tiende a infinito.
Lim n = {P[ + ]}.

3.2.- Mtodos para obtener estimadores

El demostrar que un cierto estimador cumple estas propiedades puede ser


complicado en determinadas ocasiones. Existen varios mtodos que nos van a permitir
obtener los estimadores puntuales. Los ms importantes son:
MTODO DE LOS MOMENTOS: se basa en que los momentos poblacionales y se
estiman mediante los momentos muestrales. Suelen dar estimadores consistentes.
MTODO DE MNIMOS CUADRADOS: consiste en obtener un estimador que
hace mnima una determinada funcin.
MTODO DE MXIMA VEROSIMILITUD: consiste en tomar como parmetro
poblacional el valor de la muestra que sea ms probable, es decir, que tenga mayor
probabilidad. Se suelen obtener estimadores consistentes y eficientes. Es el ms
utilizado.
Apuntes de Estadstica II 51

La probabilidad de que la media muestral sea igual a la media poblacional es


cero, P[x = ] = 0 , es decir, que ser bastante complicado obtener un estimador
puntual, por ello se utiliza ms el Intervalo de Confianza y el Contraste de Hiptesis.

4.- ESTIMACIN POR INTERVALOS DE CONFIANZA

El intervalo de confianza est determinado por dos valores dentro de los cuales
afirmamos que est el verdadero parmetro con cierta probabilidad. Son unos lmites o
margen de variabilidad que damos al valor estimado, para poder afirmar, bajo un
criterio de probabilidad, que el verdadero valor no los rebasar. Es una expresin del
tipo [1, 2] 1 2, donde es el parmetro a estimar. Este intervalo contiene al
parmetro estimado con una determinada certeza o nivel de confianza.

En la estimacin por intervalos se usan los siguientes conceptos:

Variabilidad del parmetro: Si no se conoce, puede obtenerse una


aproximacin en los datos o en un estudio piloto. Tambin hay mtodos para
calcular el tamao de la muestra que prescinden de este aspecto. Habitualmente
se usa como medida de esta variabilidad la desviacin tpica poblacional y se
denota .
Error de la estimacin: Es una medida de su precisin que se corresponde con
la amplitud del intervalo de confianza. Cuanta ms precisin se desee en la
estimacin de un parmetro, ms estrecho deber ser el intervalo de confianza y,
por tanto, menor el error, y ms sujetos debern incluirse en la muestra
estudiada. Llamaremos a esta precisin E, segn la frmula E = 2 - 1.
Nivel de confianza: Es la probabilidad de que el verdadero valor del parmetro
estimado en la poblacin se site en el intervalo de confianza obtenido. El nivel
de confianza se denota por (1-), aunque habitualmente suele expresarse con un
porcentaje ((1-)100%). Es habitual tomar como nivel de confianza un 95% o
un 99%, que se corresponden con valores de 0,05 y 0,01, respectivamente.
Valor : Tambin llamado nivel de significacin. Es la probabilidad (en tanto
por uno) de fallar en nuestra estimacin, esto es, la diferencia entre la certeza (1)
y el nivel de confianza (1-). Por ejemplo, en una estimacin con un nivel de
confianza del 95%, el valor es (100-95)/100 = 0,05.
Valor crtico: Se representa por Z/2. Es el valor de la abscisa en una
determinada distribucin que deja a su derecha un rea igual a /2, siendo 1- el
nivel de confianza. Normalmente los valores crticos estn tabulados o pueden
calcularse en funcin de la distribucin de la poblacin. Por ejemplo, para una
distribucin normal, de media 0 y desviacin tpica 1, el valor crtico para =
0,05 se calculara del siguiente modo: se busca en la tabla de la distribucin ese
valor (o el ms aproximado), bajo la columna "rea"; se observa que se
corresponde con -0,64. Entonces Z/2 = 0,64. Si la media o desviacin tpica de
la distribucin normal no coinciden con las de la tabla, se puede realizar el
cambio de variable t=(X-)/ para su clculo.
Inferencia, estimacin y contraste de hiptesis 52
Con estas definiciones, si tras la extraccin de una muestra se dice que "3 es una
estimacin de la media con un margen de error de 0,6 y un nivel de confianza del 99%",
podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con
una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando,
respectivamente, la mitad del error, para obtener el intervalo de confianza segn las
definiciones dadas.

Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza


van relacionados. Si admitimos un error mayor, esto es, aumentamos el tamao del
intervalo de confianza, tenemos tambin una mayor probabilidad de xito en nuestra
estimacin, es decir, un mayor nivel de confianza.

Por tanto, un aspecto que debe de tenerse en cuenta es el tamao muestral, ya


que para disminuir el error que se comente habr que aumentar el tamao muestral. Esto
se resolver, para un intervalo de confianza cualquiera, despejando el tamao de la
muestra en cualquiera de las formulas de los intervalos de confianza que veremos a
continuacin, a partir del error mximo permitido.

Los intervalos de confianza pueden ser unilaterales o bilaterales:

UNILATERAL: P[ X < z ] = 1 P[ X > z ] = 1 .


BILATERAL: P z < X < z .
2 2

4.1.- Intervalo de confianza para la media con varianza conocida

Sea X una variable aleatoria que se distribuye como X N( , ), si utilizamos



la media muestral ( X ) como estimador, entonces X N ( , ).
n

Tipificando, centramos el estimador, cambiando de origen y de escala


obteniendo:
x
Z= N (0;1).
/ n
Entonces, el intervalo de confianza o la probabilidad para el estimador media
con la varianza conocida viene dado por los siguientes parmetros:

x
P z < < z = P z . < x < z =
2 / n
2
2 n 2 n
Apuntes de Estadstica II 53


P x z . < < x + z .
2 n 2 n

Cambiamos todos los signos, para conseguir la media () positiva:


P [ x + z /2 > > x - z /2 ] = (1- ).
n n

Ordenando la informacin:


P [ x - z /2 < < x + z /2 ] = (1- ).
n n

Por tanto, el intervalo es,



x z ; x + z .
2 n 2 n

4.2.- Intervalo de confianza para la media con varianza desconocida


y n>30

Sabemos que para cualquier distribucin, por el Teorema Central del Lmite, si
tiene un tamao de muestra grande, se puede aproximar o se distribuye como una
Normal de parmetros:
s
X N ( , ),
n
siendo s la cuasidesviacin tpica muestral. En consecuencia,
x
Z= N (0;1) ,
s/ n
y procediendo de forma anloga a la anterior llegamos a que el intervalo de confianza
que buscamos es
s s
x z ; x + z .
2 n 2 n

4.3.- Intervalo de confianza para la media con varianza


desconocida y n<30

Partiendo de una poblacin Normal, en estas condiciones la variable aleatoria se


distribuye como una t-Student con n-1 grados de libertad de la forma,
Inferencia, estimacin y contraste de hiptesis 54

x
t n 1 .
s/ n

Construimos entonces el intervalo de confianza a un nivel (1- )% de la forma:


x s s
P t < < t = P t . < x <t = 1 . ,
n 1; 2 s / n n 1;
2 n 1; 2 n n 1;
2 n

de manera que si continuamos despejando de forma anloga a los caso anteriores se


obtiene un intervalo de confianza:

s s
I .C . x t ;x + t .
n 1;
2 n n 1;
2 n

4.4.- Intervalo de confianza para la proporcin

Basndonos en una variable aleatoria que se distribuye como una Binomial,


X B (n; p ); y la aproximacin de una distribucin Binomial por una Normal cuando
el tamao de la muestra es muy grande, se ha visto que se puede expresar como
( )
X N n p; npq . Segn esto, la variable aleatoria definida como Y=X/n se
(
distribuye como Y N p; pq / n . )
Al tipificar, nos queda
pP
Z= N (0;1) .
pq
n

Entonces, el intervalo de confianza o la probabilidad para el estimador


proporcin viene dado por los siguientes parmetros:

pq pq
p z ; p + z ; .
2
n 2
n
Apuntes de Estadstica II 55

4.5.- Intervalo de confianza para la varianza

En poblaciones Normales ya hemos visto que la variables aleatoria


(n 1)s 2 2 . Para un nivel de confianza de (1- )% viene dado por,
n 1
2


P 2 <
(n 1)s 2 < 2 = 1 .

n 1;1 2 2 n 1;
2

Si invertimos y despejamos, nos queda,


1 2 1 (n 1)s 2 (n 1)s 2
P 2 > > 2 = P 2 > >
2
= 1 .

n 1;1
(n 1)s n 1;
2


n 1;1 2
n 1;

2 2 2 2

Y por tanto, el intervalo de confianza para la varianza es:


(n 1)s 2 (n 1)s 2
2 ; 2 .
n 1;
n 1;1
2 2

5.- CONTRASTE DE HIPTESIS

El problema central de la inferencia estadstica es un problema de toma de


decisiones, del cual la estimacin y el contraste de hiptesis son aspectos importantes,
diferenciados entre s, pero complementarios.

Un contraste de hiptesis o Test de hiptesis estadstico es una prueba de


significacin o una prueba estadstica, que indican el proceso mediante el cual
decidimos si una proposicin respecto de la poblacin, debe ser aceptada o no. Esta
proposicin es lo que se denomina hiptesis estadstica.

Es una regla de decisin que nos dice cuando aceptar y rechazar las hiptesis,
con esto vemos si los datos de una muestra son compatibles o no con los de la
poblacin.

Una hiptesis estadstica, por tanto, es una proposicin acerca de la funcin de


probabilidad o de la funcin de densidad de probabilidad de una variable aleatoria o de
varias variables aleatorias. Tal proposicin debe referirse bien a la forma de la
Inferencia, estimacin y contraste de hiptesis 56
distribucin de probabilidad, bien al valor o valores de los parmetros que lo definan o
bien a ambos. Hiptesis estadstica es, una afirmacin acerca de la distribucin de la
poblacin. Puede haber hiptesis estadsticas en contextos paramtricos y no
paramtricos.

El contraste de hiptesis estadstico se basar en la informacin proporcionada


por la muestra. De modo, que si rechazamos la hiptesis, queremos indicar que los datos
de la muestra ofrecen cierta evidencia sobre su falsedad. Si la aceptamos simplemente
queremos significar que no se rechaza.

Un contraste de hiptesis consiste, por tanto, en estudiar dos hiptesis: H0


(hiptesis nula), H1 (hiptesis alternativa), de manera que el investigador divide los
resultados muestrales en dos zonas; una zona de rechazo y otra de aceptacin, de
manera que segn como obtengamos el resultado, aceptaremos o rechazaremos la
hiptesis.

Al aplicar un contraste de hiptesis, clasificamos los puntos del espacio muestral


en dos regiones excluyentes y complementarias:

Regin de Rechazo o Regin Crtica: La formada por el conjunto de los


valores del estadstico de contraste que nos llevan a rechazar la hiptesis nula H0,
se llama regin crtica (los puntos que delimitan la regin crtica se llaman
puntos crticos).
Regin de Aceptacin o Regin de No Rechazo: Es la formada por el conjunto
de los valores del estadstico de contraste que nos lleva a aceptar la hiptesis
nula H0.

5.1.- Planteamiento de la hiptesis estadstica

Aquella hiptesis que se desea contrastar se llama hiptesis nula (Ho), por tanto,
la que se acepta o rechaza como conclusin del contraste. La hiptesis nula suele ser
una estrategia o medio del que se sirve el investigador para probar la alternativa. Suele
ir acompaada por la hiptesis alternativa o hiptesis experimental, simbolizada por H1.
Apuntes de Estadstica II 57

La hiptesis alternativa es la que se verifica cuando no se verifica la hiptesis


nula. El planteamiento de Ho permite elaborar un modelo Probabilstico a partir del cual
podemos llegar a la decisin final.

A su vez, al plantear una hiptesis, esta puede ser simple o compuesta. Una
hiptesis es simple si se especifica exactamente el valor del parmetro. Una hiptesis es
compuesta, si contiene dos ms valores del parmetro. La hiptesis nula (Ho) por ser
ms concreta suele ser simple y la alternativa, compuesta. Es frecuente plantearlas como
complementarias.

5.2.- Supuestos
Las suposiciones que podemos hacer dependiendo del tipo de contraste que
necesitemos son:
a) Supuestos acerca de las caractersticas de los datos que se van a manipular,
como puede ser la independencia de la observaciones, nivel de medida
utilizada, etc.
b) Supuestos acerca de la forma de distribucin de partida: Normal, Binomial,
etc.

La violacin de los supuestos podr invalidar ms o menos el modelo


probabilstico y llevarnos a decisiones errneas. Concierne al investigador conocer las
consecuencias que se derivan de la violacin de tales supuestos sobre el modelo. Por
este motivo, si se plantean los supuestos deben ser mnimos y no demasiado exigentes.

Por ejemplo, se puede plantear de partida:

Poblaciones de partida: normales.

Muestras independientes.

Observaciones de las muestras: independiente.

5.3.- Estadstico de Contraste


Estadstico de Contraste es, aquel estadstico (T) que utilizamos para tomar una
decisin en un contraste de hiptesis. Este estadstico es una variable aleatoria, con una
distribucin muestral determinada, que nos dar las probabilidades asociadas a un valor
o un determinado intervalo de valores del estadstico de contraste. Este deber cumplir
todas las caractersticas que se mencionaron anteriormente cuando se habl de los
estadsticos.

5.4.- Reglas de decisin


Una regla de decisin es el criterio utilizado para decidir si aceptamos o
rechazamos la hiptesis nula, a partir del espacio muestral de valores del estadstico de
contraste y probabilidades asociadas.
Inferencia, estimacin y contraste de hiptesis 58

Este criterio consiste en dividir tal espacio en dos zonas mutuamente excluyentes
y exhaustivas: la zona de rechazo o regin crtica y la zona de aceptacin. La zona de
rechazo est constituida por aquellos valores del estadstico de contraste que se alejan
mucho de Ho, por lo tanto es muy poco probable que ocurran si Ho es verdadera. Por
ejemplo, a continuacin se pueden ver dos ejemplos de contrastes, uno unilateral y otro
bilateral, aunque se pueden crear muchos ms.

Un contraste de hiptesis unilateral es de la forma (hay ms formas):


Ho: = o
H1: >o
Un contraste de hiptesis bilateral es de la forma:
Ho: = o
H1: o

Decidimos que un contraste es unilateral o direccional, si para tomar la decisin


de rechazar Ho nos servimos exclusivamente de los valores muy grandes o
exclusivamente de los valores muy pequeos del estadstico de contraste.

Decidimos que un contraste es bilateral o no direccional, si utilizamos los


valores muy grandes y muy pequeos de los posibles valores del estadstico de
contraste.

Si la distribucin, bajo la H1, slo puede estar a la derecha ser ms potente si


colocamos a la derecha toda la regin crtica.
Apuntes de Estadstica II 59

Si la distribucin, bajo la H1, puede estar a la derecha o la izquierda sera un test


ms potente el que pone parte de la regin crtica a la derecha y parte a la izquierda.

El valor se llama nivel de significacin o nivel de riesgo y representa a la


probabilidad de que un nivel concreto del estadstico de contraste, caiga en la zona de
rechazo o crtica, es decir, es el conjunto de valores del estadstico de contraste que nos
lleva a la decisin de rechazar la hiptesis nula.

El valor (1-) se llama nivel de confianza, es el conjunto de valores del


estadstico de contraste que nos lleva a la decisin de aceptar la hiptesis nula.

En los contrates unilaterales est concentrada en uno de los dos extremos de


la distribucin, en una nica cola. En los contrastes bilaterales se reparte entre los dos
extremos de la distribucin, en las dos colas.

Los contrastes unilaterales suelen ser mejores que los contrates bilaterales. La
eleccin de uno u otro, est condicionada al planteamiento de la hiptesis alternativa.

Ejemplo:
Si Ho 0.50 H1 > 0.50 Es unilateral.

Si Ho = 0.50 H1 0.50 Es bilateral.

5.5.- Clculo del estadstico y toma de decisin


Antes de poder tomar una decisin se debe recopilar los datos con los que se van
a trabajar, es decir, se obtienen los datos de una varias muestras y los estimadores del
parmetro (proporcin, media, etc.) correspondiente, calculamos el valor concreto del
estadstico de contraste y fijado el nivel de significacin con la zona crtica, si el valor
de tal estadstico cae en la zona crtica, rechazamos las hiptesis nula y por tanto,
aceptamos la hiptesis alternativa. En este caso debemos interpretar que no hay
evidencia suficiente para decidir que es falsa. En caso contrario se aceptar la hiptesis
nula.

5.6.- Errores en los contrates de hiptesis


Cuando se realiza un contraste de hiptesis, siempre debemos tener en cuenta
que cuando aceptamos o rechazamos una hiptesis puede que estemos cometiendo un
cierto error. Cuando Rechazamos Ho, significa que Ho es falsa y cuando aceptamos Ho,
significa que Ho es verdadera. Por tanto, se pueden considerar, dos tipos de errores que
se pueden cometer cuando se realiza un contraste:

- Error tipo I ( ): Es el error que se comete en la decisin del contraste cuando


se rechaza la hiptesis nula (Ho), siendo correcta (cierta).

- Error tipo II (): Es el error que se comete en la decisin del contraste cuando
se acepta la hiptesis nula (Ho), siendo falsa.
Inferencia, estimacin y contraste de hiptesis 60
En la siguiente tabla se puede ver de forma ms concreta:

Verdadera Falsa
(1- )
Acertar
Decisin correcta Error tipo II
(1-)
Rechazar
Error tipo I Decisin Correcta

De aqu se pueden obtener las siguientes conclusiones que deben de tenerse en


cuenta:

El ERROR II es el ms grave, al que tambin se le conoce como potencia del


contraste, y se representa con la letra .
es el valor de significacin, nos dice a partir de qu valor estamos
cometiendo un error tipo I.

As, las probabilidades asociadas a los tipos dos tipos de Error vienen dadas por
las siguientes expresiones:

1.- Nivel de significacin o tamao del contraste ( ):

=P(error tipo I}=P{rechazar Ho / Ho cierta}

2.- Potencia del contraste ( ):

= P{rechazar Ho / Ho falsa}=1-P{ Aceptar Ho / Ho falsa}= 1-P{error tipo II}

5.7.- Potencia de un contrate


Se llama potencia de un contraste a la probabilidad de rechazar Ho, cuando es
falsa. Su probabilidad es 1-. Ms estrictamente debera llamarse potencia de regin
crtica. No es ms que la probabilidad de que sta detecte una Ho falsa dado un valor para
H1.
Los valores de y no tienen la misma importancia psicolgica. Es el
investigador el que en cada caso deber saber que error tiene ms importancia para tratar
de disminuirlo. Para disminuir el valor de es necesario aumentar el tamao de la
muestra.

5.8.- Curvas de potencia de un contrate


Fijado un nivel de significacin ( ), una hiptesis nula y una hiptesis alternativa,
tendremos una potencia para cada valor que tome la hiptesis alternativa (H1). La curva
Apuntes de Estadstica II 61

que se obtiene al relacionar los posibles valores de H1 con los correspondientes (1-), se
llama curva de potencia o funcin de potencia.

Cuanto mayor es el nivel de significacin (probabilidad Error Tipo I) mayor es la


potencia.

5.9.- Efecto del tamao de la muestra en la potencia

Se trata de poner de manifiesto cmo, manteniendo constante , al aumentar el


tamao de la muestra decrece el valor de , y por tanto, se incrementa la potencia, la
capacidad del contraste para distinguir H0 y H1.

Al igual que ocurra en los intervalos de confianza, el tamao de la muestra ser


importante para determinar el error que se comete o cual es el tamao de la muestra
necesario para mantener un determinado error mnimo.

5.10.- Nivel de significacin y nivel critico

Se puede definir el nivel de significacin () como la mxima probabilidad de


rechazar la Ho cuando es cierta. El nivel de significacin lo elige el investigador antes de
realizar el contrate, para que no influya en su decisin. Por lo tanto el nivel de significacin
representa el riesgo mximo admisible al rechazar Ho.

El nivel crtico se calcula despus de obtener el valor del estadstico de contraste y


representa el riesgo mnimo con el que se rechaza Ho.

5.11.- Violacin de los supuestos en los contrastes de hiptesis


A continuacin, se detalla de forma esquemtica en que situaciones se deben
utilizar otras distribuciones asociadas a la normal.

5.11.1.- Utilizacin de la distribucin T-Student, en el contraste de

a) Independencia: m.a.s. y poblacin pequea


b) Normalidad: Si la muestra es grande no presenta serios problemas. Si la
muestra es pequea los contrastes unilaterales aumentan el error. Por lo
tanto, si la muestra es grande haremos un contraste unilateral, si
utilizamos la distribucin t-student y no se puede asumir que la
poblacin es normal.

5.11.2.- Utilizacin de la distribucin T-Student, en el contraste de 1 - 2

a) Independencia: Muy importante.


b) Normalidad.
Inferencia, estimacin y contraste de hiptesis 62
c) Igualdad de varianzas.

5.11.3.- Utilizacin de la distribucin Chi-Cuadrado ( 2 ), en el contraste 2

El supuesto de normalidad lleva consigo un error, que no podemos


corregir aumentando el tamao muestral.

5.11.4.- Utilizacin de la distribucin F-Snedecor en el contraste de 2 1/ 22

No se puede usar si las poblaciones no son normales o los tamaos de las


muestras no son grandes. Tampoco debe utilizarse si la independencia no es
segura.

5.12.- Propiedades deseables en los contrastes de hiptesis


El investigador debe seleccionar aquella prueba que le sirve para contrastar su
hiptesis y procurar que se cumplan los supuestos que la sustentan, adems deben de
reunir estas propiedades:

Carencia de Sesgo:

Un Contraste de Hiptesis es una prueba insesgada de Ho, si la probabilidad de


rechazar Ho cuando es falsa, es igual o mayor que la probabilidad de rechazar Ho
cuando es cierta. Es decir, si su potencia es mayor igual que su nivel de significacin.

Consistencia:

Una secuencia de contrastes es consistente frente a todas las alternativas Hi, si su


funcin de potencia se aproxima a 1, a medida que n tiende al infinito. Se supone >0 y
constante.

5.13.- El concepto de p-valor


Cuando se realiza un contraste de hiptesis sabemos que a partir del nivel de
significacin delimitamos la zona de aceptacin y de rechazo. En ocasiones es muy
interesante calcular el nivel de significacin a partir del cual la hiptesis nula, H0, se va
a rechazar. Esta es la idea o concepto del p-valor, es decir,

[ ]
p = P Z > z exp .

El p-valor puede considerarse como el valor lmite para que un contraste sea
significativo, es decir, elegido un nivel de significacin , se rechazar H0 si p .
Apuntes de Estadstica II 63

5.14.- Contraste de hiptesis para la media con varianza conocida

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


mejor conocido es la media muestral,

X N ( , ).
n
Como ya se conoce su distribucin, el estadstico de contraste ser:
x
N (0;1) .
/ n

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es


cierta, y se rechaza cuando:
H 0 : = 0 x 0
A) RECHAZO H0 si > z
H1 : 0 / n 2
Inferencia, estimacin y contraste de hiptesis 64
H 0 : 0 x 0
B) RECHAZO H0 si > z
H1 : > 0 / n
H 0 : 0 x 0
C) RECHAZO H0 si < z
H1 : < 0 / n

En caso contrario se acepta la hiptesis nula.

5.15.- Contraste de hiptesis para la media con varianza


desconocida y n>30

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


s
mejor conocido es la media muestral, X N ( , ).
n
Como ya se conoce su distribucin, el estadstico de contraste ser:
x
N (0;1) .
s/ n
Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es
cierta, y se rechaza cuando:
H 0 : = 0 x 0
A) RECHAZO H0 si > z
H1 : 0 s/ n 2

H 0 : 0 x 0
B) RECHAZO H0 si > z
H1 : > 0 s/ n

H 0 : 0 x 0
C) RECHAZO H0 si < z
H1 : < 0 s/ n
En caso contrario se acepta la hiptesis nula.

5.16.- Contraste de hiptesis para la media con varianza


desconocida y n<30

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


mejor conocido es la media muestral, X t .
n 1
Como ya se conoce su distribucin, el estadstico de contraste ser:
Apuntes de Estadstica II 65

x
t
s/ n n 1

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es


cierta, y se rechaza cuando:

H 0 : = 0 x 0
A) RECHAZO H0 si >t
H1 : 0 s/ n n 1;
2

H 0 : 0 x 0
B) RECHAZO H0 si > t n 1;
H1 : > 0 s/ n

H 0 : 0 x 0
C) RECHAZO H0 si < t n1;
H1 : < 0 s/ n

En caso contrario se acepta la hiptesis nula.

5.17.- Contraste de hiptesis para la proporcin

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


pq
mejor conocido es la proporcin muestral, P N p; .
n

Como ya se conoce su distribucin, el estadstico de contraste ser:

p P0
N (0;1) .
p0 q0
n

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es


cierta, y se rechaza cuando:

H 0 : P = P0 p P0
A) RECHAZO H0 si > z
H 1 : P P0 p0 q0 2

n
Inferencia, estimacin y contraste de hiptesis 66
H 0 : P P0 p P0
B) RECHAZO H0 si > z
H 1 : P > P0 p0 q0
n

H 0 : P P0 p P0
C) RECHAZO H0 si < z
H 1 : P < P0 p0 q0
n
En caso contrario se acepta la hiptesis nula.

5.18.- Contraste de hiptesis para la varianza

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


mejor conocido es la varianza muestral. Como ya se conoce su distribucin, el
estadstico de contraste ser:
(n 1)s 2 n21 .
2

Como en este caso, la distribucin del estadstico no es simtrica, podremos


hacer tres mismos tipos de contraste, pero en este caso habr que tener en cuenta esa
no simetra. Se presupone que la hiptesis nula es cierta, y se rechaza cuando:

H 0 : 2 = 02 (n 1)s 2 2 ; 2
A) RECHAZO H0 si

H 1 : 2 02
2 1
0 2 2

H 0 : 2 02 (n 1)s 2
B) RECHAZO H0 si > 2
H1 : >
2 2
0
2
0

H 0 : 2 02 (n 1)s 2 < 2
C) RECHAZO H0 si 1
H 1 : 2 < 02 02

En caso contrario se acepta la hiptesis nula.

También podría gustarte