Está en la página 1de 29

Estimación puntual y por

intervalos
Estimación
• Procedimiento que se realiza para conocer el
valor de una característica poblacional en base
a los datos de una muestra.

Población Muestra
X X
XX X
X XX
X X X X
X X X X
X X X X
X X X
X X X X
X X
X X XX X
X
X X X X
X Estimación
Estimación de medias poblacionales
• Conocer la media de la población a partir de datos de
una muestra.
• Requisitos:
– La muestra debe ser representativa de la población,
– La variable de interés sigue una distribución normal,
– La variable de interés poblacional es desconocida.
Muestra representativa
• Muestra representativa es aquella que:
– Refleja las similitudes y diferencias encontradas en
la población.
¡Uso de técnicas de muestreo!
Elegir los elementos de la muestra a través de un muestreo
probabilístico.
Muestreo probabilístico, todos los elementos de la población
tienen la misma probabilidad de ser elegidos.
Muestreo aleatorio simple, muestreo sistemático, muestreo
estratificado, muestreo por etapas.
Estimación de medias poblacionales
• Conocer la media de la población a partir de datos de
una muestra.
• Requisitos:
– La muestra debe ser representativa de la población,
– La variable de interés sigue una distribución normal,
– La variable de interés poblacional es desconocida.
Teorema de límite central
• Si el tamaño de una muestra es suficientemente
grande, la distribución de la media de la muestra de
una población no normal, se distribuye normal.

Figura 1: Teorema
de límite central

http://www.gaussianwaves.com/2010/01/central-limit-theorem-2/
Teorema de límite central
• Las distribuciones de las medias de las
muestras, con tamaño de 30 elementos o más
se consideran normalmente distribuidas.
Estimación de medias poblacionales

• Puntual
• Por intervalos
Estimación Puntual
• Un valor numérico que se usa para estimar el
valor poblacional a partir de una muestra
representativa.
• Ejemplo, se selecciona una muestra aleatoria
x

de 50 pacientes en un hospital, el peso


promedio fue de 60 kilogramos. Esta es la
estimación puntual!.
Estimación por intervalo
• Consta de dos valores numéricos que determinan un
intervalo, y este considera un nivel de confianza que
contiene el verdadero valor poblacional.

Valor poblacional
Valor 1 Valor 2

amplitud del intervalo


Estimación por intervalo
• La amplitud del intervalo:
– el tamaño de la muestra,
– la variabilidad de la población y
– el nivel de confianza deseado (1-α)%.
• Nivel de confianza, es la probabilidad que el
x

intervalo contenga el verdadero valor de la media


poblacional.
• 95% , el 99%, 99.9% más usados
Estimación por intervalo
• Intervalos de confianza más precisos
= Intervalo estrecho
– Aumentar el tamaño de muestra.
– Reducir la variabilidad.
x

– Reduciendo el nivel de confianza.


Intervalo de confianza para una
media poblacional
• Intervalo de confianza para una media poblacional:

• Nivel de confianza al 95%

• Nivel de confianza al 90% Valor Z=1.645


• Nivel de confianza al 99% Valor Z=2.575
*Valores Z, son valores obtenidos de una distribución normal .
Ejemplo
• Ejemplo: de la muestra aleatoria de 50 pacientes.
• Estimar la peso promedio por intervalo con un nivel de
confianza del 95%, entonces:
  desviación _ estándar 
media  1.96 

  tamaño _ muestra 

  8.5 
60  1.96 50   [60  1.96(1.20)]  [60  2.36]  [57.6  62.4]
  

• Interpretación: Con un nivel de confianza del 95%, el intervalo
que varía entre 57.6 hasta 62.4 kilogramos contiene el valor
verdadero del peso promedio en el hospital.
Intervalo de confianza (IC)
• ¿Por qué realizamos estimaciones por intervalo?
• Supongamos que seleccionamos una muestra
aleatoria, para peso de pacientes: IC=[55.3, 65.7]
• Seleccionamos otra muestra: IC=[56.6, 62.9]
• Por tercera vez seleccionamos otra muestra:
• IC=[56.1, 63.4]
• Si repetimos 100 veces, tendremos 100 intervalos
diferentes, muchos contendrán la media
poblacional, pero algunos no.
Intervalo de confianza
• ¿Por qué realizamos estimaciones por intervalo?
• Si fijamos un nivel de confianza del 95%, y
repitiéramos el proceso 100 veces, 95 intervalos
contendrán la media poblacional y 5 intervalos no la
contendrán.

Media de la
población

Las líneas verticales representan 50 construcciones


diferentes de intervalos de confianza para la estimación de
la media poblacional.
http://es.wikipedia.org/wiki/Intervalo_de_confianza
Ejemplo
• Del ejemplo de pesos el cual se obtuvo un intervalo al 95% de
confianza = [57.6 , 62.4]
• Interpretación: Con un nivel de confianza del 95%, el peso
promedio de todos los pacientes en el hospital estará
contenida entre 57.6 hasta 62.4 kilogramos.
• Si seleccionamos muchas muestras diferentes de tamaño 50 y
construimos los intervalos de confianza, el 95% de ellos
contendrían realmente el valor del peso promedio
poblacional.
Más ejemplos
• En una población de recién nacidos con
complicaciones en un hospital, la distribución de la
edad gestacional al nacer es aproximadamente
normal. Una muestra aleatoria de 50 recién nacidos
de esta población tiene una edad gestacional
promedio = 29.6 semanas y una desviación estándar
= 3.6 semanas.
• Construya un intervalo de confianza de 95% para la
verdadera media de la población.
Más ejemplos
• Intervalo de confianza

Interpretación: Con un nivel de confianza del 95%, la


edad gestacional promedio en toda “población” estará
contenida en el intervalo que varía entre 28.6 hasta
30.6 semanas.
Estimación puntual de un porcentaje
poblacional
• La estimación para el porcentaje o proporción puede
ser de manera puntual o por intervalos.
• La estimación puntual de un porcentaje es la que
vimos en la sesión de análisis para datos categóricos.
Intervalo de confianza de una
proporción poblacional
• Intervalo de confianza para una proporción poblacional:

• Nivel de confianza al 95%

• Nivel de confianza al 90% Valor Z=1.645


• Nivel de confianza al 99% Valor Z=2.575
*Valores Z, son valores obtenidos de una distribución
normal.
Aproximación de la distribución binomial a
una normal

http://www.hiru.eus/matematicas/distribucion-normal
Ejemplo
• Se realiza una encuesta para conocer el grado de
satisfacción en la atención de un hospital, se
selecciona de manera aleatoria a 200 personas, se
encuentra que el 80% esta satisfecho, estimación
puntual!. Estimaremos por intervalo con un nivel de
confianza del 95%
 proporcion(1  proporcion) 
 proporcion  1.96 
 tamaño _ muestra 
 0.80(1  0.80) 
0.80  1.96   [0.80  1.96(0.028)]
 200 
Ejemplo

[0.80  0.055]  [0.745  0.855]


• Con un nivel de confianza del 95%, el porcentaje de
personas satisfechas en el hospital estará contenida
en el intervalo [74.5% , 85.5%].
Ejemplos
• Se pregunto a 100 personas elegidas de
manera aleatoria de una ciudad, si habían
tenido algún episodio de resfrío en el último
mes, 40 personas respondieron que si.
Encuentre el intervalo de confianza del
porcentaje de personas resfriadas en la
ciudad, con un nivel de confianza del 95%.
Ejemplo

Interpretación: Con un nivel de confianza del 95%, el porcentaje


de personas resfriadas en toda la ciudad estará contenida en el
intervalo [30.4% , 49.6%]
Ejemplos
• Un encargado del archivo de historias clínicas de un hospital
se planteo llevar a cabo un estudio sobre la calidad de la
información de las historias de los pacientes del hospital. Para
ello extrajo al azar una muestra de 100 expedientes de
pacientes y encontró que en el 8% de ellos la caratula tenia, al
menos, un detalle de información que contradecía el resto de
la información que aparecía en la historia. Construya un
intervalo de confianza al 99 % para el porcentaje de las
historias que contienen dichas discrepancias.
Ejemplos
• [0.0529 , 0.1071] = [5.29% , 10.71%]
• Con un nivel de confianza al 99%, el porcentaje de historias
clínicas con discrepancias en el hospital estará contenido en el
intervalo [5.29% , 10.71%] .
Resumen
• Las estimaciones puntuales = medidas resumen de
muestra representativa.
• Intervalos de confianza, para medias, para
proporciones, pero no son los únicos, también se
pueden construir intervalos para la varianza,
mediana, etc.
• Estos intervalos dependen de un nivel de confianza,
que es definida como una probabilidad de acierto,
usualmente se usa el 95%.