Documentos de Académico
Documentos de Profesional
Documentos de Cultura
estimación e inferencia,
estadística inductiva
Aplicaciones estadísticas: estimación e inferencia, estadística inductiva
Índice de Contenidos
En estos casos, tal como se ilustra en la Figura 1, lo que haremos será aproximar o,
como llamaremos más adelante, estimar el valor de aquellos parámetros, como la
media aritmética o la desviación tipo, que nos permitirán ajustar un modelo,
escogido entre los conocidos, que nos describa las observaciones.
Observación:
Fijémonos que las observaciones Xi son variables aleatorias que siguen la misma
distribución que la variable X y que estamos pidiendo que la realización de una de
las observaciones no condicione a las otras.
o análogamente,
Antes que nada, parece claro que el tamaño de la muestra jugará un papel
importante en el instante de realizar la inferencia; intuitivamente podemos decir
que cuanto más grande sea el tamaño de la muestra más significativa será la
estimación.
partir de y s.
La Tabla 1 muestra los resultados obtenidos después de una simulación hecha con
el ordenador con diferentes valores para el tamaño de la muestra.
Más adelante veremos que tanto los valores más cercanos a como los que no lo
están tanto nos resultan útiles para el análisis estadístico y la estimación de con
los respectivos márgenes de error que controlaremos en cada momento.
Cada muestra nos da, por tanto, una primera estimación, que denominamos
estimación puntual, del parámetro de la población; pero observemos,
Por otro lado, qué ocurre si queremos rehacer la Tabla 1 repitiendo la elección de
las muestras para los mismos valores de n? Naturalmente, obtendríamos en
general valores diferentes que no podemos determinar a priori, porqué están en
función de las muestras escogidas, lo que nos determina que "fijada una n, la
Cada una de las filas de la Tabla anterior son observaciones de las respectivas
N=4
Los respectivos resultados para n=16 y n=64 quedan ilustrados en la Taula 2b y los
resultados de todos los estadísticos en la Tabla 3b:
media 207.216 207.694 13.305 210.563 172.384 12.961 209.780 239.958 15.448
varianza 30.692 30032.9 30.669 14.946 3197.90 4.384 4.190 1272.42 1.327
desv. tipo 5.240 173.300 5.538 3.866 56.550 2.095 2.047 35.671 1.152
Como hemos hecho observar antes, y para cada una de los tamaños de la muestra,
las observaciones de la Tabla 2 se distribuyen aleatoriamente (obsérvese los
valores extremos indicados en negrita) alrededor de su media (Tabla 3). La
desviación tipo de estos estadísticos nos da una medida de la variabilidad del
estimador, que observemos que mejora con el tamaño de la muestra, lo que nos
dice que la distribución de los estadísticos se concentra cada vez más alrededor de
su media. En nuestro caso podemos intuir que esta media estima el parámetro
poblacional.
Una simulación de más réplicas nos permitiría comprobar que la variable aleatoria
Los elementos de teoría que desarrollaremos en este módulo nos demostraran que
este ejemplo es un caso particular de resultados más generales.
Estimador
Sea X una variable aleatoria y un parámetro asociado a la distribución de X.
El hecho que sea desconocido y que queramos estimarlo a partir de los valores
Sesgo de un estimador
Por otro lado, y para garantizar la proximidad a , conviene que a medida que
Consistencia de un estimador
Eficiencia de un estimador
que si
Observación:
es consistente
Entonces
Demostración
Calculemos directamente la esperanza de la media muestral utilizando la linealidad
Proposición 2
más lejos del parámetro . La Figura 4 también nos ilustra que la observación
Observación:
Comentario:
Proposición 3
Demostración
Por el nivel de esta documentación probaremos solamente la parte relativa a la
esperanza.
Queremos calcular:
y sabemos que .
En efecto,
y por tanto
Observemos que tiene un sesgo negativo que es más pequeño cuando más
grande es la n.
Proposición 4
Proposición 5
Demostración
y que
Observación:
de n desviaciones independientes .
tiene n-1 grados de libertad ya que del hecho que , por ser la
Comentario:
Fijémonos que, aunque se puede demostrar que este estimador tiene una eficiencia
Estimación puntual
Denominamos estimación puntual del parámetro de una población a cualquier
Ahora bien, ¿para qué nos sirve una estimación puntual? ¿De qué nos
informa?
De hecho la estimación puntual por ella misma nos informa realmente de poca
cosa. Nos será de utilidad en la medida que conozcamos la distribución del
estimador para poder avaluar la proximidad del parámetro que estimamos y de
este moda la bondad del estimador.
Observemos pues que es una medida por exceso del error estadístico que
estamos cometiendo si afirmamos que el parámetro no se aleja de la estimación
Pues que
n k
De las expresiones anteriores y con los datos de la Tabla 6 para verificarlo podemos
deducir:
es la medida del error probabilístico o riesgo que cometemos al decir que . Por
Fijado ,
Observemos que cuanto más pequeño sea , más grande será el error por tal
de mantener la igualdad.
y por tanto
y entonces
como expresión del intervalo de confianza con nivel de significación para la , con
Si recuperamos los datos de la Tabla 2 para n=64 y trabajando con una confianza
núm. observ.
y podemos escribir
verifica
Este resultado nos informa que, para valores suficientemente grandes de n (n > 30),
la variable aleatoria media muestral se puede considerar "aproximadamente
normal" como demuestra el siguiente corolario.
Demostración
Solamente hay que tener en cuenta el Teorema 1 en este caso en el que todas las
variables Xi son una réplica de la variable poblacional X y por tanto tienen la misma
función de distribución.
Tenemos pues,
o equivalentemente .
Observación:
El Teorema Central del Límite, tal como se ha presentado, hace referencia a una
función simétrica, Y, de los valores de la muestra (o sea que el valor de la función es
independiente del orden de las observaciones) como es la suma de las observaciones.
El Teorema admite una generalización a otros tipos de funciones simétricas como la
suma de las potencias k- ésimas de las variables o de su diferencia respecto a un
valor, expresiones racionales de las anteriores potencias k-ésimas,...
Observemos que esta generalización nos permitirá aplicar el Teorema Central del
Límite al caso de variables aleatorias como la varianza muestral de expresión
parámetro de la población
o equivalentemente
Población
Población X no Normal
de parámetros y ,n grande
El enunciado nos dice que la muestra de n=60 vigas nos da una desviación tipo
sn=0.73 Tm y por tanto una sn-1=0.7362 que es una estimación no sesgada de la
desviación tipo .
que sabemos que tiene una distribución con n-1 grados de libertad.
Tenemos que
y para la estimación de
Población X no Normal
de parámetros y , n grande
10 Estimación de proporciones
verifica:
Disponemos de una población de 250 individuos de los cuales 200 tienen una
determinada característica A (es decir que la proporción poblacional es p=0.8). Si
tomamos muestras de diferentes tamaños y calculamos los intervalos de confianza
para la proporción p, con un mismo nivel de significación =0.05, obtenemos los
resultados que presentamos en la siguiente tabla:
n p0 Intervalo de confianza
20 0.7 0.102
30 0.767 0.077
40 0.85 0.056
50 0.86 0.049
Una de las maneras que tenemos de saber a priori el tamaño de la muestra, n, para
una precisión, e, y un nivel de significación, , determinados, es considerar el caso
más desfavorable que será cuando el producto pq = p(1-p) = -p2+p sea máximo. Esto
es así cuando p=q=0.5. A partir de aquí deducimos que el tamaño de la muestra ha
de ser
Observación:
Comentario:
De manera análoga a como hemos visto al principio de este apartado, para variables
aleatorias normales o asinptóticamente normales, para conocida, tendríamos:
y por tanto:
Supongamos que queremos estimar, con un error máximo del 4% y con un riesgo , el porcentaje
de viviendas con bigas aluminosas de la población de viviendas construidas en Catalunya durante la
década del 60 y que se calcula que es aproximadamente de 800.000 viviendas.
Así pues si, en las 601 viviendas visitadas, observamos una proporción, por ejemplo, de p0=0.09, esto
Es fácil comprobar que si hubiéramos sabido que la proporción era del orden del 10%, entonces
utilizando la expresión
habría sido suficiente, para hacer esta misma estimación, visitar 217 viviendas.
12 Contraste de hipótesis
12.1 Introducción
Supongamos que nos informan que el peso de un cierto producto alimentario sigue
b) ¿Hay motivos para pensar que el producto sigue una media más baja que la que
se nos propone?
En este punto del tema es obvio que la respuesta a las preguntas anteriores
dependerá de la “confianza” que depositemos en la hipótesis del fabricante.
Para poder tratar adecuadamente este tema vamos a establecer las siguientes
definiciones:
Hipótesis nula:
Hipótesis alternativa:
en los apartados a) y b) y:
en el apartado c).
Fijémonos que, en este sentido, podemos aceptar (es decir, no tener motivos para
rechazar) diferentes hipótesis nulas para un mismo problema.
sucesos poco probables, es muy difícil que el suceso suceda. Por tanto si, en
una única prueba, este suceso aparece esta ha de ser debido a que H0 es falsa y
hemos de rechazarla.
Su complementario, , que contiene los valores del test para los cuales, si la
característica estudiada a partir de la muestra que tenemos es uno de estos
valores, la hipótesis H0 se rechaza. Este subconjunto lo denominamos región
crítica o de rechazo de H0.
Fijémonos que puede darse el caso de que la hipótesis H 0 sea cierta (cosa que no
podemos saber) y, porque el valor que ha tomado nuestro test está en la región de
rechazo (que de hecho solo depende de los valores de la muestra observada), la
Pero, por otro lado, también puede ocurrir que no siendo cierta la hipótesis H 0, no
encontramos motivos para rechazarla y no la rechazamos cuando de hecho
tendríamos que hacerlo. Este error lo denominamos error de tipo II.
Errores de Tipo I y II
Dado un contraste de hipótesis, H0, H1, denominaremos
Error de tipo I = = P(rechazar H0 | H0 es cierta) = P(X I)
En nuestro ejemplo, fijémonos que H0 falsa quiere decir diferente de 50, esto es
Puntos críticos
Denominamos puntos críticos a los puntos que separan la región crítica de la
región de aceptación.
Si entonces y tenemos una región crítica bilateral y
calcularemos k1 y k2 a partir de la distribución de referencia G, de manera que
Si y a la región crítica la denominamos
Acabemos esta parte con la resolución completa del ejemplo propuesto como
motivación para este apartado.
a)
El test estadístico que utilizaremos es que tiene una distribución de referencia
o su valor tipificado.
b) El test estadístico es el mismo que el del apartado a), solo que, en este caso el
región de aceptación de
región de aceptación de .
es
Hay que observar que el mismo valor de la media observada (47.75), para un tamaño
de muestra más grande, nos marca un valor del test más alejado del esperado en la
hipótesis nula.
Apartado a)
0.045 -2 2 Rechazamos H0
Apartado b)
Debido al aumento del tamaño de la muestra, observemos que en todos los casos,
para los dos niveles de significación, rechazamos la H0.
13.1 Introducción
Para disponer de una medida del grado de desviación, empezamos realizando una
partición en r intervalos o categorías (este valor es un dato del problema o hay que
fijarlo de entrada) del conjunto de valores que puede tomar la variable X. Sea pi la
probabilidad, según la función de densidad hipotética f(x), que la variable tome un
valor del i-ésimo intervalo de la partición, mientras que ni representa el número de
valores de la muestra que pertenecen al mismo intervalo. Entonces, se verifica:
p1 + p2 + ... + pr = 1
n1 + n2 + ...+ nr = n.
desviación tipo .
y es de esperar, además, que las diferencias ni - npi para i=1,...,r sean pequeñas.
Observación:
Los valores npi los podemos entender como las frecuencias esperadas o teóricas
ei, de la misma manera ni las podemos entender como las frecuencias
observadas oi, entonces, la variable aleatoria la podemos escribir de una
manera más útil en la práctica de la forma:
Hay que tener en cuenta de que manera se han de establecer los grados de libertad
de la distribución Chi-cuadrado que utilizaremos, porque este es un punto delicado
para estos tipos de problemas.
2. Por otro lado, si las frecuencias teóricas tan solo se pueden calcular haciendo
una estimación de m parámetros de la población a partir de estadísticos
cara 1 2 3 4 5 6
Frecuencia observada 25 17 15 23 24 16
Frecuencia esperada 20 20 20 20 20 20
queremos realizar el ensayo de la hipótesis de que el dado está bien hecho con un
nivel de significación del 0.05.
Aplicaremos la expresión:
teniendo en cuenta que r = 6 y los grados de libertad son =r-1=6-1=5. Por otro
Aplicaremos la expresión:
Como que r=6 y los grados de libertad los calculamos teniendo en cuenta que
hemos estimado el parámetro p a partir de los datos observados, tenemos que
m=1, y entonces .