Está en la página 1de 27

Estimación puntual y por intervalo

Las medias o desviaciones estándar calculadas de una muestra se denominan ESTADÍSTICOS, podrían ser
consideradas como un punto estimado de la media y desviación estándar real de población o de los
PARAMETROS.
 
¿Qué pasa si no deseamos una estimación puntual como media basada en una muestra, qué otra cosa
podríamos obtener como margen, algún tipo de error?
“Un Intervalo de Confianza”

V. CUANTITATIVAS X --------- μ
V. CUALITATIVAS P --------- π
ESTIMADOR PUNTUAL: Utiliza un número único o valor para localizar una estimación del parámetro.

ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un rango dentro del cual se puede encontrar
el parámetro y el nivel de confianza que el intervalo contiene al parámetro.

LIMITES DE CONFIANZA: Son los límites del intervalo de confianza inferior (LIC) y superior (LSC), se
determinan sumando y restando a la media de la muestra un cierto número Z (dependiendo del nivel o
coeficiente de confianza) de errores estándar de la media .

Que debo tener en cuenta:

 Se conocen o no datos anteriores

 Tamaño de la muestra
INTERVALOS DE CONFIANZA
El objetivo de la estimación por intervalo es aportar información de qué tan cerca se encuentra la estimación
puntual, obtenida de la muestra, del valor del parámetro poblacional.
En esta clase se muestra cómo obtener una estimación por intervalo para la media poblacional μ y para la
proporción poblacional p. La fórmula general para obtener una estimación por intervalo para la media
poblacional es

De manera similar, la fórmula general para obtener una estimación por intervalo para la proporción
poblacional es

Las distribuciones muestrales de X y P de son clave para calcular estas estimaciones por intervalo.
Con el gráfico siguiente aclararemos mejor los conceptos relacionados con el intervalo de confianza.

NIVEL DE
CONFIAN
ZA
95% 2,5%
2,5%

0,975%
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado
en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina
nivel de confianza y generalmente se denota por 1 – α. La probabilidad de equivocarnos se llama nivel de
significancia y se simboliza por α. Generalmente se construyen intervalos con confianza ó significancia de α= 5%.
Para construir un intervalo de confianza, se puede comprobar que la distribución Normal estándar cumple:

Luego, si una variable aleatoria X tiene distribución , entonces el 95% de las veces se cumple:
Despejando μ de la ecuación se tiene:

El resultado es un intervalo que incluye al μ el 95% de las veces. Es decir en un intervalo de confianza al 95%
para la media μ cuando la variable X es normal y es conocido.

Un nivel de confianza de del 95% requiere un valor de Z de 1,96 (0,95/2= 0,4750). El área bajo la curva de
0,4750 corresponde a un valor de z= 1,96
Como en el ejemplo si , la media muestral es 82, σ 20 y el tamaño de la muestra es n 100, se obtiene

Por tanto, empleando la expresión, el margen de error es 3.92 y el intervalo de confianza de 95% va
de 82 - 3.92 = 78.08 a 82 + 3.92 = 85.92.
VALORES DE zα/2 PARA LOS NIVELES DE CONFIANZA MÁS USADOS

Aunque a menudo se usa un nivel de confianza de 95%, también suelen usarse otros niveles de
confianza como 90% y 99%.

En la tabla anterior se muestran los valores de zα/2 correspondientes a los niveles de confianza más
utilizados. A partir de estos valores y de la expresión , el intervalo de confianza de 90% en el ejemplo
es:
EJEMPLO

Si X ~ N (40,10) ¿En qué intervalo se obtendrán el 95% de los resultados?

Una muestra aleatoria extraída de una población normal de varianza 100, presenta una media muestral x
= 160 . Con una muestra de tamaño 144, se pide:

a) Calcular un intervalo de confianza del 95 por ciento para la media poblacional.


b) Calcular un intervalo de confianza del 90 por ciento para la media poblacional.
c) Comparar ambos intervalos, desde el punto de vista de la información que generan.
d) Si se quiere tener una confianza del 95 por ciento de que su estimación se encuentra a una distancia
de 1,2 cm más o menos de la verdadera media poblacional, ¿cuántas observaciones adicionales deben
tomarse?
El segundo intervalo de confianza es de longitud menor, y, por tanto, podría parecer más
preciso, pero no olvidemos que su nivel de confianza es también menor (el 90 por 100 frente al
95 por ciento del primer intervalo).

d) El error absoluto que se quiere cometer es de 1,2, aplicando la fórmula para la determinación
de la muestra a un nivel de confianza del 95 por 100, se tiene:
En consecuencia, se debería tomar una muestra adicional de 123 elementos ; (267 − 144 = 123).
El peso (en gramos) de las cajas de cereales de una determinada marca sigue una distribución N(μ, 5). Se
han tomado los pesos de 16 cajas seleccionadas aleatoriamente, y los resultados obtenidos han sido:

506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.

a) Obtener los intervalos de confianza del 90% para la media poblacional.


b) Determinar cuál sería el tamaño muestral necesario para conseguir, con un 95% de confianza, un intervalo
de longitud igual a 2 gramos.
c) Suponiendo ahora que σ es desconocida, calcular los intervalos de confianza para la media al 90%, 95% y
99%.
b) La amplitud o longitud vendrá dado por la fórmula

c) Debemos construir un intervalo de confianza para la media poblacional μ de varianza


poblacional desconocida, con muestras pequeñas (n ≤ 30).
El intervalo de confianza de nivel 1 − α , viene dado por:
ESTIMACIÓN DE LA MEDIA CUANDO LA MUESTRA ES PEQUEÑA
En probabilidad y estadística la distribución T (de Student) es una distribución de
probabilidades que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de la
media muestral y para la construcción del intervalo de confianza para la diferencia entre las
medias de dos poblaciones cuando se desconoce la desviación típica de una población y
ésta debe ser estimada a partir de los datos de una muestra.
Cuando se calcula un intervalo de confianza para la media poblacional, suele no contarse con una
buena estimación de la desviación estándar poblacional. En tales casos se usa la misma muestra
para estimar μ y σ. Esta situación es el caso que se conoce como σ desconocida. Cuando se usa s
para estimar σ, el margen de error y la estimación por intervalo de la media poblacional se basan en
una distribución de probabilidad conocida como distribución t. Aunque la elaboración matemática
de la distribución t parte de la suposición de que la población de la que se muestrea tiene una
distribución normal, las investigaciones han demostrado que la distribución t se aplica en muchas
situaciones en que la población se desvía significantemente de una población normal.
La distribución t es una familia de distribuciones de probabilidad similares; cada distribución t
depende de un parámetro conocido como grados de libertad
COMPARACIÓN DE LA DISTRIBUCIÓN NORMAL ESTÁNDAR CON
LAS DISTRIBUCIONES t PARA 10 Y 20 GRADOS DE LIBERTAD
La esperanza matemática es

La varianza es

Cuando el número de datos es pequeño y no se conoce la varianza tendríamos

Cuando el tamaño de muestra es pequeño el intervalo de confianza requiere utilizar la distribución T student (con
n – 1 grados de libertad) siendo n el tamaño de la muestra, en vez de la distribución normal, por ejemplo, para un
intervalo de confianza del 95%, los limites ya no estarían construidos usando el valor de 1.96 sino que habría que
buscarlo en la distribución T Student que varía de acuerdo con el numero de datos.
Con un nivel de confianza del 95%el promedio de los contenedores esta entre 9,47 y 10,26 litros
INTERVALO DE CONFIANZA PARA PROPORCIONES
En este caso interesa construir un intervalo de confianza para una proporción o un porcentaje poblacional.
Si el tamaño de muestra es grande, el Teorema del Limite Central nos asegura que:

Donde P es el porcentaje con la característica en la población y p es Su estimador muestral


Luego procediendo en forma análoga al caso de la media podemos construir un intervalo del 95% de
confianza para la proporción poblacional p.
Determinación del tamaño de la muestra

Despejando n de esta fórmula se obtiene la fórmula para calcular el tamaño de la muestra con el
que se tendrá el margen de error deseado, E.
Se ha hecho un estudio sobre la proporción de enfermos de cáncer de pulmón detectados en hospital que fuman,
obteniéndose que de 123 enfermos 41 de ellos eran fumadores. Obtener un intervalo de confianza para dicha
proporción. Estudiar si dicha proporción puede considerarse igual a la proporción de fumadores en la población si
ésta es de un 29%.

Entonces p= 0,333 y 1-P =0,667 es decir: (0.250; 0.416)

si consideramos la proporción de fumadores en la población global, p = 0.29, observamos que esta proporción se encuentra
dentro del intervalo de confianza obtenido para un nivel 0.05, es decir, como la proporción de fumadores en la población
pertenece al intervalo que contiene a la proporción de fumadores entre los enfermos de cáncer con una probabilidad de acierto
del 0,955, podemos considerar que esta proporción de fumadores en los enfermos de cáncer se corresponde con la de los
fumadores en la población global.
De sc rip c ió n Inte rv a lo d e c o nfia nza
Est im a c ió n d e  c o n sig m a c o n o c id a ,   X  Z  / 2 / n
m u e st ra g ra n d e n >30
Est im a c ió n d e  c o n sig m a d e sc o n o c id a ,   X  Z / 2 s / n
m u e st ra g ra n d e n >30 , se t o m a la d e sv .
Est . d e la m u e st ra S
Est im a c ió n d e  c o n m u e st ra s p e q u e ñ a s,   X  t / 2 s / n
n < 30 y sig m a d e sc o n o c id a
Est im a c ió n d e la  ( n  1) s 2 ( n  1) s 2
 2

  
, n 1 1 , n 1
2 2

Est im a c ió n d e la p ro p o rc ió n  p (1  p )
sp 
n
  p  Z / 2 s p

Ta m a ño d e m ue stra
Pa ra e st im a r n e n b a se a u n e rro r m á xim o n  Z / 2  /( X   ) 2
2 2

( X  )

Pa ra e st im a r n e n b a se a u n e rro r m á xim o n  Z  / 2  (1   ) /( p   ) 2
2

Si se e sp e c ific a u n in t e rv a lo t o t a l d e e rro r, Ut iliza r   0.5 q u e e s p e o r


e l e rro r ( p   ) m á xim o e s la m it a d d e l c a so
in t e rv a lo

También podría gustarte