Está en la página 1de 10

La estadstica inferencial 1: unidad 2 Estimacin.

La estadstica inferencial Se dedica a la generacin de los modelos, inferencias y


predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la
aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y
extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas si/no (prueba de hiptesis),
estimaciones de unas caractersticas numricas (estimacin), pronsticos de
futuras observaciones, descripciones de asociacin (correlacin) o modelamiento
de relaciones entre variables (anlisis de regresin).
El primer problema del cual se ocupa la estadstica inferencial es la estimacin,
que puede ser a travs de un nmero simple, generalmente el estadstico
correspondiente llamado estimulador puntual, o por medio de dos valores
numricos que definen un intervalo llamado intervalo de confianza, el cual
contiene al parmetro estimado con cierto grado de confiabilidad
2.2 Caractersticas de un estimador.
Un estimador es un estadstico (esto es, una funcin de la muestra) usado para
estimar un parmetro desconocido de la poblacin
1) sesgo: se dice que un estimulador es insesgado si la media de la distribucin
del estimulador es igual al parmetro, son la medida maestral (estimador de la
media de la poblacin) y la varianza (estimador de la varianza de la poblacin).
2) consistencia: un estimador es consistente si aproxima el valor del parmetro
cuanto mayor es n (tamao de muestra).
3) eficiencia: diremos que un estimador es ms eficiente que otro si la varianza de
la distribucin muestral del estimador es menor a la del otro estimador. Cuando
menor es la eficiencia, menor es la confianza de que el estadstico obtenido en la
muestra aproxime al parmetro poblacional.
4) robustez El estimador ser un estimador robusto del parmetro si la
violacin de los supuestos de partida en los que se basa la estimacin, no altera
de manera significativa los resultados que ste proporciona.
5) Suficiencia: Se dice que un estimador es suficiente cuando resume toda la
informacin relevante contenida en la muestra, de forma que ningn otro
estimador pueda proporcionar informacin adicional sobre el parmetro
desconocido de la poblacin.

2.3 estimacin puntual.

La estimacin de parmetros tiene por finalidad asignar valores a los parmetros


poblacionales a partir de los estadsticos obtenidos en la muestra, la finalidad de
la estimacin de parmetros es caracterizar las poblaciones a partir de la
informacin de las muestras (un ejemplo es inferir el valor de la media de la
poblacin a partir de los datos de la muestra).

Esencialmente son tres los parmetros de inters:


- En el caso de que investiguemos una variable cuantitativa:
a) Para la media de la poblacin tomaremos como aproximacin la
media de la muestra.

b) Para la varianza de la poblacin 2 tomaremos la cuasivarianza de la


muestra.

- Si el estudio se centra en el estudio de un carcter cualitativo el


parmetro de inters ser la proporcin de elementos de la poblacin
que pertenecen a cierta categora C que lo aproximaremos con la
correspondiente proporcin en la muestra.

2.4 Estimacin por intervalos:

La estimacin por intervalos consiste en establecer el intervalo de valores donde


es ms probable que se encuentre el parmetro. La obtencin del intervalo se
basa en las siguientes consideraciones:
a) Si conocemos la distribucin muestral del estimador podemos obtener las
probabilidades de ocurrencia de los estadsticos mustrales.
b) Si conociramos el valor del parmetro poblacional, podramos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la distribucin
maestral.
c) El problema es que el parmetro poblacional es desconocido, y por ello el
intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran
nmero de veces y definimos un intervalo alrededor de cada valor del estadstico
muestral, el parmetro se sita dentro de cada intervalo en un porcentaje conocido
de ocasiones. Este intervalo es denominado "intervalo de confianza".
2.4.1 intervalo de confianza para la media
Se llama valor crtico al valor de Z necesario para construir un intervalo de
confianza para la distribucin.

2.4.2 intervalos de confianza para la diferencia de medias:


De una poblacin de media y desviacin tpica se pueden
tomar muestras de elementos. Cada una de estas muestras tiene a su vez una
media ( ). Se puede demostrar que la media de todas las medias muestrales
coincide con la media poblacional:3
Pero adems, si el tamao de las muestras es lo suficientemente grande, 4 la
distribucin de medias muestrales es, prcticamente, una distribucin
normal (ogaussiana) con media y una desviacin tpica dada por la siguiente
expresin:

. Esto se representa como sigue:

Siestandarizamos, se sigue que:


En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del
cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo
hallar z1 y z2 tales que P[z1 z z2] = 1 - , donde (1 - )100 es el porcentaje
deseado (vase el uso de las tablas en una distribucin normal).

Se desea obtener una expresin tal que


En esta distribucin normal de medias se puede calcular el intervalo de confianza
donde se encontrar la media poblacional si slo se conoce una media muestral (
), con una confianza determinada. Habitualmente se manejan valores de
confianza del 95 y del 99 por ciento. A este valor se le llamar
(debido a
que es el error que se cometer, un trmino opuesto).
Para ello se necesita calcular el punto
o, mejor dicho, su versin
estandarizada
o valor crtico junto con su "opuesto en la
distribucin"
. Estos puntos delimitan la probabilidad para el intervalo

2.4.3 intervalo de confianza para la proporcin.

En este caso, interesa construir un intervalo de confianza para una proporcin o


un porcentaje poblacional. Si el tamao muestral n es grande, el Teorema Central
del Lmite nos asegura que:

O bien:

Donde p es el porcentaje de personas con la caracterstica de inters en la


poblacin (o sea, es el parmetro de inters) y p es su estimador muestral.
Luego, procediendo en forma anloga al caso de la media, podemos construir un
intervalo de 95% de confianza para la proporcin poblacional p.

2.4.4 intervalos de confianza para diferencia de proporciones.


Supngase que se tiene dos poblaciones independientes con proporciones
desconocidas

, y varianzas conocidas

, respectivamente. Se

desea encontrar un intervalo de confianza del

para la diferencia de

las proporciones
Sean

una muestra aleatoria de

primera poblacin y

una muestra aleatoria de

tomadas de la segunda poblacin. Si


estadstica

observaciones tomadas de la

observaciones

son las proporciones muestrales, la

es un estimador puntual de

. La variable aleatoria

tiene una distribucin normal estndar si las dos poblaciones son normales, o es
aproximadamente normal estndar si se cumplen las condiciones del teorema del
lmite central, respectiva mente; Esto implica que:

La anterior expresin se puede expresar como:

Por lo tanto, un intervalo de confianza para la diferencia entre

se obtiene:

Con

el

anterior

intervalo

nula

se

puede

tambin

versus la alternativa

rechaza la hiptesis nula si el valor

probar

la

hiptesis

, donde se

cae fuera de este intervalo de confianza.

Adems, para probar esta hiptesis se puede hacer uso del estadstico:

el cual rechaza

si

2.4.5 intervalos de confianza para la varianza.

Dada una variable aleatoria con distribucin Normal N( , el objetivo es la


construccin de un intervalo de confianza para el parmetro , basado en una
muestra de tamao n de la variable.
A partir del estadstico

la frmula para el intervalo de confianza, con nivel de confianza 1 es la


siguiente

Donde 2/2 es el valor de una distribucin ji-cuadrado con n 1 grados de


libertad que deja a su derecha una probabilidad de/2

2.4.6 intervalos de confianza para la relacin de varianza.

La necesidad de disponer de mtodos estadsticos para comparar las


varianzas de dos poblaciones es evidente a partir del anlisis de una sola
poblacin. Frecuentemente se desea comparar la precisin de un
instrumento de medicin con la de otro, la estabilidad de un proceso de
manufactura con la de otro o hasta la forma en que vara el
procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podramos comparar las varianzas de dos
poblaciones,
y
, utilizando la razn de las varianzas muestrales
2
2
2
2
s 1/s 2. Si s 1/s 2 es casi igual a 1, se tendr poca evidencia para indicar
que
y
no son iguales. Por otra parte, un valor muy grande o
muy pequeo para s21/s22, proporcionar evidencia de una diferencia en
las varianzas de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables
aleatorias ji-cuadrada independientes, cada una dividida entre sus
respectivos grados de libertad. Esto es,

donde U y V son variables aleatorias ji-cuadrada independientes con


grados de libertad

respectivamente.

Sean U y V dos variables aleatorias independientes que tienen


distribucin ji cuadradas con

grados de libertad, respectivamente.

Entonces la distribucin de la variable aleatoria

est dada por:

y se dice que sigue la distribucin F con


numerador y

grados de libertad en el

grados de libertad en el denominador.

La media y la varianza de la distribucin F son:

para

para

La variable aleatoria F es no negativa, y la distribucin tiene un sesgo


hacia la derecha. La distribucin F tiene una apariencia muy similar a la
distribucin ji-cuadrada; sin embargo, se encuentra centrada respecto a
1, y los dos parmetros
proporcionan una flexibilidad adicional con
respecto a la forma de la distribucin.
Si s12 y s22 son las varianzas muestrales independientes de tamao n1 y
n2 tomadas de poblaciones normales con varianzas y ,
respectivamente, entonces:

Para manejar las tablas de Fisher del libro de Introduccin a la Inferencia


Estadstica del autor Genther, se tendr que buscar primero los grados
de libertad dos para luego localizar el rea correspondiente,
relacionndola con los grados de libertad uno, para calcular el valor de F.

2.5 determinacin del tamao de la muestra.


Cuando deseamos estimar el tamao de la muestra se debe tener en cuenta que los objetivos de
la encuesta suelen requerir varias estadsticas y que al considerar cada una de ellas pueden
llevar a un diseo diferente, por lo tanto, para determinar el tamao de la muestra se debe
elegir el principal objetivo y calcular el tamao de muestra necesario para cumplir dicho objetivo.
El tamao de la muestra depende bsicamente del tamao de la poblacin, del nivel de
confianza o confiabilidad de las estimaciones, del grado de variacin o dispersin de la variable a
estudiar y del error de estimacin.
El nivel de confianza o confiabilidad lo fija arbitrariamente quien est calculando el tamao de la
muestra, teniendo en cuenta que dicha confiabilidad debe estar entre el noventa y el noventa y
nueve por ciento. A mayor confiabilidad mayor tamao de muestra.
Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una frmula diferente
para calcular el tamao de la muestra.

Unidad 3 pruebas de hiptesis.