Está en la página 1de 55

Estimación puntual y por

Intervalos de Confianza

!1
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Estimación puntual
PARAMETROS ESTIMADORES
PARAMETROS: POBLACIONALES PUNTUALES
VALORES FIJOS
POBLACIONALES µ
GENERALMENTE
DESCONOCIDOS
σ S
ESTIMADORES σ2 S2
PUNTUALES:
VALORES QUE p
VARÍAN DE UNA
MUESTRA A OTRA
θ

!2
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Por ejemplo utilicemos X̄
! (media muestral), para aproximar la media
poblacional µ
El problema consiste en que es posible que para cada muestra se obtengan
medias muestrales distintas, lo cual añade incertidumbre acerca del verdadero
valor de la media poblacional.

Una estimación puntual por ser un solo número no da información sobre la


precisión y confiabilidad de la estimación ni sobre la variabilidad del estimador.

En consecuencia se opta por un segundo método de estimación denominado


estimación por intervalos.

La técnica ofrece un intervalo de valores razonables dentro del cual se pretende


esté el parámetro de interés (en este caso la media poblacional µ) con cierto
grado de confianza. Este intervalo de valores se conoce con el nombre de
intervalo de confianza.
!3
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
En un tambo de gran producción se registran problemas de grietas en los
recolectores de leche fabricados por un proveedor. En dicho tambo se selecciona
una muestra aleatoria de 20 recipientes recolectores de leche. Sea X: número de
recolectores agrietados entre los 20 seleccionados. Sea p= probabilidad de que
este agrietado. De la observación de los 20 recolectores se registran 3
agrietados.

¿Cuál es la estimación de la proporción de recolectores agrietados?


El estimador que calculó, es insesgado?

X: número de recolectores agrietados entre los 20 seleccionados.


a) X tiene distribución Bi(20, p)

!4
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
b) El estimador que calculo, es insesgado?

!5
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Considere las siguientes 20 observaciones del voltaje de ruptura dielectrica de
piezas de resina epoxica. [xmp06.02]
24.46 25.61 26.25 26.42 26.26 27.15 27.31 27.54 27.74 27.94 27.98 28.04 28.28
28.49 28.50 28.87 29.11 29.13 29.50 30.88

a)Estimar µ

b)Estimar σ2

n
2
∑ (X i −X)
σˆ 2 = S 2 = i =1
= 2.193
n −1
mean sd IQR 0% 25% 50% 75% 100% n
27.793 1.461856 1.565 24.46 27.0275 27.96 28.5925 30.88 20

!6
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Intervalos de Confianza
Cuando utilizamos un estimador puntual es conveniente
acompañar la estimación con una medida de cuan próxima
esta la estimación del parámetro poblacional.

DEFINICIÓN: Dado un parámetro desconocido θ, un intervalo


de confianza de nivel (1-α )*100% para θ es un intervalo
cuyos extremos L1 y L2 son estadísticos tales que:

P(L1 ≤ θ ≤ L2 ) = 1 − α
!7
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Ejercicio 4 TP5: Una máquina dosificadora está programada
para que la cantidad de alimento balanceado que arroja en
cada bolsa sea una variable aleatoria que tiene distribución
normal con σ=150 g. Se seleccionó una muestra de 30 bolsas
y se calculó el promedio muestral del contenido de las bolsas,
siendo este igual a 2000g. Estime el promedio poblacional de
alimento balanceado que dosifica, o sea µ, con un Intervalo de
95% de confianza.

0.95
α = 0.05
!8
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Como herramienta para calcular el Intervalo de confianza
utilizaremos el estimador puntual de µ, o sea .

X: cantidad de alimento balanceado que arroja la maquina


en cada bolsa.

0.95

!9
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Estandarizando,

En forma equivalente, busco que la variable aleatoria Z este


entre dos valores con probabilidad alta, del 95% para este
ejemplo. Esto es,

α=0.95
α1=0.025 α2=0.025

!10
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Reemplazando por los datos:

!11
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Buscamos los valores de z para α1 y α2

α=0.95
α1=0.025 α2=0.025

Reemplazando por los valores de z y despejando µ, resulta:

!12
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
INTERPRETACION DE ESTE INTERVALO DE
CONFIANZA PARA µ

Es tentador concluir que µ esta dentro de este intervalo con un 95% de


probabilidad. Pero NO ES CORRECTA ESA INTERPRETACION!

Al reemplazar la
variable aleatoria
por su valor
muestral SE PIERDE
TODA LA
ALEATORIEDAD!!

!13
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
¿Cuál es la interpretación correcta?

Supongamos 11 muestras y sus 11 IC


del 95%:
Los IC 3 y 11 no contienen a µ!!
La interpretación correcta es frecuentista:

De cada 100 IC construidos en base a


100 muestras, en 95 de ellos estará el
verdadero valor de la media
poblacional.
!14
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
DEFINICIÓN DE UN INTERVALO DE CONFIANZA
PARA LA MEDIA DE UNA VARIABLE ALEATORIA
NORMAL CON σ CONOCIDO

!15
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Ejercicio 1 Trabajo Práctico 6:
La duración de una pieza de un equipo es una variable aleatoria normal con
desvío estándar de 4 horas y una media que se desea estimar. Una muestra
aleatoria de 100 piezas que fueron probadas produjo una media muestral
de 501.2 horas. Obtener un intervalo de confianza para la media con un
nivel de confianza del:
a) IC del 95% para µ. X: duración de una pieza ~ N(µ,
95 % b) 99 %.
σ = 4 hs)

!16
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
!17
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
b) IC del 99% para µ. X: duración de una pieza ~ N(µ, σ = 4 hs)

!18
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Comparemos los dos resultados

Long = 1.56

Menos confiable, mas chico, mas preciso!

Long = 2.064

Mas confiable, mas grande, menos preciso!

!19
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Mayor confianza = > IC mas grande => menor precisión
Mayor dispersión => IC mas grande => menor precisión

¿De qué manera puedo ganar en precisión sin perder


confianza?
¿Cómo obtengo un IC mas pequeño con el mismo nivel
de confianza?

¿¿??

!20
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Ejercicio 6 Trabajo Practico 6: Las ventas de una revista semanal
han sido las siguientes (en miles de ejemplares) en las últimas 4
semanas: 15.4, 18.5, 16.3, y 19.2. Calcular los límites de confianza del
95% para el promedio semanal de las ventas (se supone que el volumen
semanal de ventas es una variable aleatoria con distribución normal).

X: volumen de venta semanal de una revista ~ N(µ, σ)


IC 95% para µ.
Pero desconozco σ !! TENGO
SOLAMENTE LA MUESTRA!
Recordemos una propiedad:

!21
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Desconocido

Curva t

0.95

!22
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
DEFINICION DE UN INTERVALO DE CONFIANZA
PARA LA MEDIA DE UNA VARIABLE ALEATORIA
NORMAL CON σ DESCONOCIDO

Curva t

- tn-1,α/2 tn-1,α/2

!23
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Volviendo al problema:
X: volumen de venta semanal de una revista ~ N(µ, σ)
IC 95% para µ.

Como σ es desconocido, calculo S2 a partir de la muestra


15.4 18.5 16.3 19.2

En la tabla de t – Student: t (3,0.025) = 3.182

!24
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Ejercicio 5 - Trabajo Práctico 6: Los contenidos de 7 recipientes similares
para ácido sulfúrico son: 9.8, 10.2 , 10.4, 9.8 , 10 , 10.2 y 9.6 litros.
Determinar un intervalo de confianza del 95% para la media del contenido de
los recipientes de esa clase asumiendo que la capacidad es una variable
aleatoria normal.
Hallar un intervalo de confianza del 95% para la varianza poblacional del
contenido de los recipientes.

!25
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Hallar un IC 95% para la varianza poblacional σ2:
Recordemos una propiedad: Si X ~ N(µ,σ) y no conocemos µ ni σ
y sea S2 el estimador puntual de σ2 sabemos que:

Entonces utilizaremos este estadistico y


su distribucion para hallar el IC 95%
para σ2

0.95 = 1- α

!26
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Despejamos σ2

!27
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
DEFINICION DE UN INTERVALO DE CONFIANZA
PARA LA VARIANZA DE UNA VARIABLE ALEATORIA
NORMAL CON µ DESCONOCIDO

0.95 = 1- α

!28
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Volviendo al problema: Hallar un IC 95% para σ2

En la tabla de Chi cuadrado:

!29
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Si necesitamos el IC del 95% para σ:

!30
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Ejercicio 1:Un grupo de estudiantes determina experimentalmente la
aceleración de la gravedad. En 10 mediciones independientes obtienen los
siguientes valores en m/s2

Se asume que dichos valores corresponden a una variable con distribución


normal, cuya varianza poblacional es de 0,0005 (m/s2)2.
a)Estimar puntualmente la media poblacional de la variable.
b)Estimar mediante un intervalo de confianza del 95% la media poblacional
de la variable.
c)Si se quiere trabajar un una confianza de 99% ¿cómo sería la amplitud del
intervalo de confianza nuevo con respecto la anterior?
e) ¿Cuál debe ser el tamaño de muestra para que la longitud del IC del 95%
sea menor que 0.01?

!31
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Ejercicio 2: Los resultados de una prueba de turbiedad de Wagner realizada en 15
muestras de arena fueron: 26.7 25.8 24.0 24.9 26.4 25.9 24.4 21.7 24.1 25.9 27.3
26.9 27.3 24.8 23.6. Calcule un IC del 95% para la desviación estándar de turbiedad
de la población. ¿Debe hacer algún supuesto?

!32
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Es importante tener en cuenta lo que deben comprender acerca del intervalo
de confianza:

1. Un intervalo de confianza para la media poblacional es la estimación de un


intervalo de un parámetro poblacional desconocido (la media), basado en
una muestra aleatoria de la población.
2. Un intervalo de confianza para la media poblacional es un conjunto de
valores plausibles del parámetro (µ) que pudiera haber generado el dato
observado como un posible resultado.
3. El nivel de confianza nos dice la probabilidad de que el método usado
construya un intervalo que incluya el parámetro desconocido. La
probabilidad usada se relaciona la método (datos, intervalo), no al
parámetro.
4. Un incremento en el tamaño de la muestra conduce a decrecer el ancho
del intervalo: grandes muestras tienen anchos de intervalos mas estrechos
que muestras pequeñas (todos los otros elementos permaneciendo
constantes)
5. Intervalos estrechos y altos niveles de confianza son deseables, pero esas
dos cosas se afectan una a la otra.
33
6. Si muchas muestras aleatorias del mismo tamaño, son recolectadas
independientemente de una población, y los intervalos de confianza son
construidos para cada muestra, con un nivel de confianza del 95%, podemos
esperar que alrededor del 5% de los intervalos no incluyan la media poblacional
(el parámetro poblacional). Este 95% refiere al proceso de tomar muestras
repetidas y construir intervalos de confianza para cada muestra.
7. Un intervalo de confianza sugiere que valores del parámetro son razonables
dados los datos, y todos los valores en el intervalo son igualmente plausibles
como valores del parámetro (µ) que pudieran haber producido la media
muestral observada.
8. Después de que usted calcula el intervalo de confianza, el parámetro puede
estar incluido o no, pero eso usted no lo sabe.
9. Es deseable tener un ancho de intervalo angosto (para una estimación mas
precisa) con un alto nivel de confianza. Un ancho de intervalo angosto no es
suficiente, si eso requiere un bajo nivel de confianza.

34
JERZY NEYMAN
16 /04/1894 Maldovia - Polonia – 5 /08/1981 Oakland - California

Existía un problema sobre las estimaciones. ¿Cuán


buena es una estimación? Se puede afirmar que los
estimadores que se utilizaban eran consistentes, de
máxima eficiencia e insesgados, pero no existía forma
de afirmar que eran correctos.

En 1943 J. Neyman se presentó en una charla en la Royal Statistical Society con el


título “Sobre los 2 diferentes aspectos del método representativo” el trabajo trataba
sobre el análisis de las muestras de encuestas. La parte más importante de este
trabajo estaba en un Apéndice, donde Neyman propone una forma de obtener un
intervalo de estimación y poder determinar cuan precisa es la estimación. Neyman
llamó a este procedimiento “Intervalos de Confianza” y al final los llamo “bandas de
confianza”. Los colegas no llegaban a entender a que se refería el nivel de confianza.
Si el 95% de confianza correspondía a una probabilidad del 95%, de qué?

35
Ejercicio 3: Se registraron 17 observaciones de grado de polimerización de papel,
que se sabe esta normalmente distribuido:
418 421 421 422 425 427 431 434 437 439 446 447 448 453 454 463 465
Calcule un IC del 95% para el grado de polimerización promedio verdadero o
poblacional.

!36
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Ejercicio 4: Se determinó la expansión lateral de soldaduras con una muestra n=9.
La desviación estándar muestral resultó 2.81. Suponiendo normalidad obtenga un IC
del 95% para la varianza y dispersión poblacional.

!37
Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera
Intervalos de Confianza
Asintóticos

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !38


INTERVALO DE CONFIANZA
PARA LA MEDIA POBLACIONAL DE UNA VARIABLE ALEATORIA
NORMAL CON σ CONOCIDO

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !39


INTERVALO DE CONFIANZA
PARA LA MEDIA POBLACIONAL DE UNA VARIABLE ALEATORIA
NORMAL CON σ DESCONOCIDO

Curva t

- tn-1,α/2 tn-1,α/2

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !40


INTERVALO DE CONFIANZA
PARA LA VARIANZA POBLACIONAL DE UNA VARIABLE ALEATORIA
NORMAL CON µ DESCONOCIDO

1- α

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !41


Ejemplo: ¿Cuál sería el tamaño de muestra necesario para que
la amplitud de un intervalo de confianza del 95% para la media
poblacional de una variable, medida en mm, con distribución
normal sea igual a 2 mm, si la varianza es conocida e igual a 4
mm2 ?
Calculemos la amplitud del intervalo para la media poblacional
de una distribución Normal. Siendo el IC para µ de un nivel de
confianza del (1-α)100%

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !42


Amplitud del IC:

Los datos del problema:


IC de 95% de confianza, Ampl IC= 2 y σ2=4

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !43


Cuando desconozco la distribución de X,
Teorema Central del Límite: Sean X1 X2 . . . Xn v.a. i. i. d
con E(Xi)=µ y V(Xi)=σ2 < ∞, entonces si n es
suficientemente grande,

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !44


Entonces, esta función

puede servir de pivote para obtener un INTERVALO DE


CONFIANZA PARA LA MEDIA DE UNA POBLACION
DESCONOCIDA, con σ conocido, con n > 30

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !45


INTERVALO DE CONFIANZA ASINTOTICO
PARA LA MEDIA DE UNA POBLACION DESCONOCIDA, CON σ CONOCIDO,
n > 30

Con nivel de
confianza
aproximado
(1-α)

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !46


En general si no conocemos µ tampoco conocemos σ!!

Pero como S es un estimador consistente de σ, eso


significa que:

puede servir de pivote para obtener un INTERVALO DE


CONFIANZA PARA LA MEDIA DE UNA POBLACION
DESCONOCIDA, con σ desconocido, n > 30

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !47


INTERVALO DE CONFIANZA ASINTOTICO
PARA LA MEDIA DE UNA POBLACION DESCONOCIDA, CON σ
DESCONOCIDO, n > 30

Con nivel de
confianza
aproximado
(1-α)

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !48


Aproximación de la distribución binomial por la normal. Sea X ~ Bi(n,p),
entonces, X: número de éxitos en n repeticiones de un experimento binomial
con probabilidad de éxito igual a p y X/n es la proporción muestral de éxitos.
Definamos las siguientes variables aleatorias:

Para i= 1, … , n. Estas v.a. son independientes, Xi ~ Bi(1,p) para todo i y

Aplicando el Teorema Central del Limite, si n es suficientemente grande.


Se considera buena
aproximación si:
np≥5 y nq ≥5

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !49


puede servir de pivote para obtener un INTERVALO DE
CONFIANZA PARA LA PROPORCION DE UNA
POBLACION DESCONOCIDA, n > 30

1-α

ASINTOTICO!!

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !50


Estandarizando,

Como por la Ley de los grandes números,

Entonces,

1-α
α/2 α/2

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !51


Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !52
INTERVALO DE CONFIANZA ASINTOTICO
PARA LA PROPORCION DE UNA POBLACION DESCONOCIDA, n > 30

Con nivel de
confianza
aproximado
(1-α)

Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !53


Bioestadística, I Cuatrimestre 2020 Dr. Osmar Vera !54
Una aplicación interesante: Uso de IC para verificar hipótesis.

Los IC permiten verificar hipótesis respecto de parámetros poblacionales.


Ejemplo: Supongamos que se plantee la hipótesis de que el promedio de peso
de nacimiento en cierta población es igual a la media nacional de 3250 gramos.

Al tomar una muestra de 30 recién nacidos de la población en estudio, se obtuvo:


n = 30, x = 2930, s = 450
Construyendo un IC(µ) del 95% se obtiene:

2930 − (1.96)(450) / 30 ≤ µ ≤ 2930 + (1.96)(450) / 30


Luego resulta que el peso de nacimiento varia entre 2769 y 3091 gramos, con
una confianza del 95%. Como el intervalo no incluye al valor µ=3250 gramos,
planteado en la hipótesis, entonces esta es rechazada con confianza 95% (ó un
valor p menor a 0.05).
Esto nos motiva para el próximo e importantísimo tema de estudio dentro de
55
la inferencia estadística, cuyo nombre es Pruebas de Hipótesis.
55

También podría gustarte