Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estimacin confidencial
8.2 Introduccin
La estimacin confidencial consiste en determinar un posible rango de valores o
intervalo, en los que pueda precisarse --con una determinada probabilidad-- que el valor
de un parmetro se encuentra dentro de esos lmites. Este parmetro ser habitualmente
una proporcin en el caso de variables dicotmicas, y la media o la varianza para
distribuciones gaussianas.
La tcnica de la estimacin confidencial consiste en asociar a cada muestra un
intervalo que se sospecha que debe contener al parmetro. A ste se le denomina
intervalo de confianza
Evidentemente esta tcnica no tiene porqu dar siempre un resultado correcto. A la
probabilidad de que hayamos acertado al decir que el parmetro estaba contenido en
dicho intervalo se la denomina nivel de confianza. Tambin se denomina nivel de
significacin a la probabilidad de equivocarnos.
, nos interesamos
, consideramos la v.a.
y tomamos un
Figura: La distribucin
es
Sea
el percentil
de si la cantidad
Sea
el percentil
, es decir,
de que al
y que adems estas dos ltimas distribuciones son independientes. A partir de estas
relaciones podemos construir una distribucin de Student con n-1 grados de libertad
(cf. figura 8.3):
Figura: La distribucin
es algo diferente a
cuando n es
pequeo, pero conforme ste aumenta, ambas distribuciones se
aproximan.
el percentil
,
, el cual deja por encima de si la cantidad
de la masa
de probabilidad (figura 8.4). Por simetra de la distribucin de Student se tiene que
, luego
normal tipificada.
cuando
Al igual que en el caso del clculo del intervalo de confianza para cuando
es
conocido, podemos en el caso
desconocido, utilizar la funcin de verosimilitud
(figura8.5) para representarlo geomtricamente. En este caso se usa la notacin:
8.4.4.1 Ejemplo
Se quiere estimar un intervalo de confianza al nivel de significacin
para la
altura media de los individuos de una ciudad. En principio slo sabemos que la
distribucin de las alturas es una v.a. X de distribucin normal. Para ello se toma una
muestra de n=25 personas y se obtiene
Solucin:
En primer lugar, en estadstica inferencial, los estadsticos para medir la dispersin ms
convenientes son los insesgados. Por ello vamos a dejar de lado la desviacin tpica
muestral, para utilizar la cuasidesviacin tpica:
, es conveniente utilizar el
es decir,
Figura: Clculo del intervalo de confianza para la media usando para ello la
distribucin de Student y la funcin de verosimilitud asociada, la cual est tiene su
mximo en
es la mximo verosmil.
Consideremos dos cuantiles de esta distribucin que nos dejen una probabilidad
en la ``zona central'' de la distribucin (cf. figura 8.7):
de que:
8.4.6.1 Ejemplo
En un ejemplo anterior se estudiaba la altura de los individuos de una ciudad,
obtenindose en una muestra de tamao 25 los siguientes valores:
para la varianza
de la altura de los
Solucin:
Para estimar un intervalo de confianza para
nos resulta til es:
Entonces el intervalo de confianza que buscamos lo obtenemos mediante (cf. figura 8.8)
con una confianza del 95%, que por supuesto contiene a las estimaciones puntuales
y
Donde
es una estimacin puntual a priori de la varianza de la muestra. Para
obtenerla nos podemos basar en una cota superior conocida por nuestra experiencia
previa, o simplemente, tomando una muestra piloto que sirve para dar una idea previa
de los parmetros que describen una poblacin.
8.4.8.1 Ejemplo
En los ltimos ejemplos se ha estudiado la variable altura de los individuos de una
poblacin, considerando que sta es una variable que se distribuye de modo gaussiana.
Para ello se tom una muestra de 25 individuos (que podemos considerar piloto), que
ofreci los siguientes resultados:
Calcular el tamao que debera tener una muestra para que se obtuviese un intervalo de
confianza para la media poblacional con un nivel de significacin
con una precisin de d=1 cm.
(al
)y
Solucin:
Obsrvese que sobre la muestra piloto, el error cometido al estimar el intervalo al
fue aproximadamente de 4'2 cm por lo que si buscamos un intervalo de confianza tan
preciso, el tamao de la muestra, N, deber ser bastante mayor. En este caso se obtiene:
Podemos plantearnos a partir de las muestras el saber qu diferencias existen entre las
medias de ambas poblaciones, o por ejemplo estudiar las relacin existente entre sus
dispersiones respectivas. A ello vamos a dedicar los siguientes puntos.
Por razones anlogas a las expuestas en el caso de una poblacin una poblacin, se tiene
que
El siguiente cociente se distribuye entonces como una de Student con n1+n2-2 grados
de libertad
donde se ha definido a
Si
8.4.10.2 Ejemplo
Queremos estudiar la influencia que puede tener el tabaco con el peso de los nios al
nacer. Para ello se consideran dos grupos de mujeres embarazadas (unas que fuman un
paquete al da y otras que no) y se obtienen los siguientes datos sobre el peso X, de sus
hijos:
En ambos grupos los pesos de los recin nacidos provienen de sendas distribuciones
normales de medias desconocidas, y con varianzas que si bien son desconocidas,
podemos suponer que son las mismas. Calcular en cuanto influye el que la madre sea
fumadora en el peso de su hijo.
Solucin:
Si X1 es la v.a. que describe el peso de un nio que nace de madre no fumadora, y X2 el
de un hijo de madre fumadora, se tiene por hiptesis que
donde
con lo cual se puede decir que un intervalo de confianza para el peso esperado en que
supera un hijo de madre no fumadora al de otro de madre fumadora est comprendido
con un nivel de confianza del
El estimador
Esta expresin presenta dificultades para el clculo, siendo ms cmodo sustituirla por
la siguiente aproximacin:
para p se considera
deje la probabilidad
que:
fuera del
y
8.6.2.1 Ejemplo
Se quiere estimar el resultado de un referndum mediante un sondeo. Para ello se
realiza un muestreo aleatorio simple con n=100 personas y se obtienen 35% que votarn
a favor y 65% que votarn en contra (suponemos que no hay indecisos para simplificar
el problema a una variable dicotmica). Con un nivel de significacin del 5%, calcule
un intervalo de confianza para el verdadero resultado de las elecciones.
Solucin: Dada una persona cualquiera (i) de la poblacin, el resultado de su voto es
una variable dicotmica:
Sabemos que
Por tanto, tenemos con esa muestra un error aproximado de 9,3 puntos al nivel de
confianza del 95%.
En un ejemplo previo con una muestra de 100 individuos se realiz una estimacin
confidencial, con un 95% de confianza, del porcentaje de votantes a una cuestin en un
referndum, obtenindose un margen de error de 9,3 puntos.
Si pretendemos reducir el error a 1 punto y queremos aumentar el nivel de confianza
hasta el 97% (
) hemos de tomar una muestra lgicamente de mayor tamao,
N. La tcnica para aproximar dicha cantidad consiste en observar que el error cometido
en una estimacin es de la forma:
Si en un principio no tenemos una idea sobre que valores puede tomar p, debemos
considerar el peor caso posible, que es en el que se ha de estimar el tamao muestral
cuando p=q=1/2. As:
8.6.4.1 Ejemplo
Continuemos el ltimo ejemplo. Se quiere estimar el resultado de un referndum
mediante un sondeo, y sin tener una idea sobre el posible resultado del mismo, se desea
conocer el tamao de muestra que se ha de tomar para obtener un intervalo al 97% de
confianza, con un error del 1
Solucin:
Como no se tiene una idea previa del posible resultado del referndum, hay que tomar
un tamao de muestra, N, que se calcula mediante:
As para tener un resultado tan fiable, el nmero de personas a entrevistar debe ser muy
elevado --lo que puede volver excesivamente costoso el sondeo.
Entonces
Esta ltima relacin se puede aproximar por otra que simplifica bastante los clculos:
Por el mismo razonamiento que en el caso de una poblacin llegamos a que una
aproximacin para un intervalo de confianza al nivel
proporciones de dos poblaciones es:
para la diferencia de
8.8 Problemas
Ejercicio 8..1. Se ha medido el volumen diario de bilis, expresado en litros, en 10
individuos sanos, obtenindose
0,98; 0,85; 0,77; 0,92; 1,12; 1,06; 0,89; 1,01; 1,21; 0,77.
Cuanto vale la produccin diaria media de bilis en individuos sanos suponiendo que la
muestra ha sido obtenida por muestreo aleatorio simple sobre una poblacin normal?
Ejercicio 8..2. La cantidad mnima requerida para que un anestsico surta efecto en una
intervencin quirrgica fue por trmino medio de 50 mg, con una desviacin tpica de
10,2 mg, en una muestra de 60 pacientes. Obtener un intervalo de confianza para la
media al 99%, suponiendo que la muestra fue extrada mediante muestreo aleatorio
simple sobre una poblacin normal.
Ejercicio 8..3. Un investigador est interesado en estimar la proporcin de muertes
debidas a cncer de estmago en relacin con el nmero de defunciones por cualquier
tipo de neoplasia. Su experiencia le indica que sera sorprendente que tal proporcin
supere el valor de 1/3. Qu tamao de muestra debe tomar para estimar la anterior
proporcin, con una confianza del 99%, para que el valor estimado no difiera del valor
real en ms de 0,03?.