Está en la página 1de 41

Estadística Inferencial

Estimación de parámetros
mediante Intervalos de Confianza
Introducción

• Uno de los objetivos de la Estadística es el de


realizar inferencia acerca de las característica de
una población.
• Estas inferencias se basan en la información
obtenida de una muestra aleatoria, de la población
en estudio, la cual debe ser representativa de la
población de interés.
Definiciones Básicas
Conceptos Previos
Para abordar el tema de Intervalos de Confianza, se debe tener claro
los siguientes conceptos:
➢ Población y Muestra
➢ Parámetro y Estadígrafo o Estimador
➢ Inferencia Estadística

Población
Es un conjunto total, finito o infinito, de personas, objetos o cosas,
que tienen al menos una característica en común, cuyo estudio nos
interesa o acerca de los cuales se desea información. Tenemos aquí, la
noción de población como un conjunto universo.

Ejemplos:
➢Todas las personas mayores de 30 años que residen en la ciudad
de Arequipa.
➢Los Colegios estatales de nivel primaria, ubicado en el cono norte de
la ciudad de Lima.
➢Las familias residentes en el distrito de Jesús María
Muestra
Subconjunto finito de unidades de análisis
(de tamaño “n”) seleccionados de la Ejemplos:
población en estudio. La muestra debe ser ➢ 50 personas
representativa, es decir debe tener, en lo seleccionadas, de entre
posible, caracteristicas similares a las de las personas que residen
su poblacion. en la Ciudad de Arequipa.

➢ Se seleccionan 35 colegios
de nivel primaria, de entre
los colegios ubicados en el
cono norte de Lima.

➢ 80 familias seleccionadas
de entre todas las familias
residents en el distrito de
Jesús María.
Parámetro (θ)
Es una medida de resumen de alguna característica de interés
(Variable), que representa a la población y cuyo valor numérico se
calcula en base al estudio de toda la población (Censo).
Como el realizar un censo generalmente no es factible por el tiempo
que requiere y por el costo que implica, estos valores son desconocidos
y por lo tanto deben de ser ESTIMADOS.

Los principales Parámetros son:

Media o Promedio Poblacional : 


Proporción Poblacional : π
Varianza Poblacional : 2

También estaremos interesados en comparar dos


parámetros de dos poblaciones diferentes

Comparar dos Medias : 1 , 2


Comparar dos Proporciones : π1 , π2

Cociente de Varianzas : σ12 , σ22



Estimador ( 
)
Es una medida de resumen que representa los datos de una muestra
aleatoria de tamaño n, digamos X1, X2,…,Xn ; la cual es seleccionada
aleatoriamente de una determinada población, es decir:

 = f(x1, x2,…,xn)
Esto nos indica que el estimador solo depende de los valores muestrales.
Los estimadores o estadígrafos correspondientes a los parámetros
definidos anteriormente son:

Los estimadores de interés en nuestro caso son:

Media Muestral: __
➢ Se denotado por x
➢ Es el estimador puntual de la media poblacional μ
➢ Se calcula de la siguiente manera:
si tenemos una muestra de tamaño “n”, x1, x2,…, xn entonces
n

__ x
i =1
i
x=
n
Proporción muestral:
➢ Se denotado por “p”
➢ Es el estimador puntual de la proporción poblacional π
➢ Se calcula de la siguiente manera:
si tenemos una muestra de tamaño “n” x1, x2,…, xn y en esta muestrase
obervan “a” caos favorable o éxitos, entonces:

a
p=
n
Varianza muestral:

➢ Denotado por S2
➢ Es un estimador de la Varianza poblacional σ2
➢ Se calcula de la siguiente forma:
si tenemos una muestra aleatoria de tamaño “n”, x1, x2,…, xn , entonces:
n __

 (x i − x ) 2
n __

o tambien x 2
i −nx 2

S2 = i =1
S2 = i =1
n −1 n −1
Parámetros y sus Estimadores Puntuales

Representación simbólica
Medida de resumen Parámetro Estimador
Media o Promedio µ x
Varianza σ2 S2
Desviación Estándar σ S
Proporción π p
ERROR DE ESTIMACIÓN

Definimos como error de estimación a la


diferencia entre el estimador y el parámetro.
este error se debe a que una muestra no da
la información completa acerca del parámetro.

Este error puede ser medido y controlado


utilizando técnicas estadísticas adecuadas.


E = θ− θ
Inferencia Estadística
Son los procedimientos y técnicas Estadística que
nos permiten sacar conclusiones acerca del valor
de un parámetros, en base en la información
obtenida en una muestra aleatoria seleccionada de
la población de interés.
Es decir es un proceso mediante el cual sacamos
conclusiones respecto a una población, pero en
base a los resultados obtenidos en una muestra
aleatoria.
En todo proceso de inferencia las conclusiones
están sujetas a un nivel de confianza y un
determinado margen de error de estimación
aleatorio.
POBLACIÓN MUESTRA

X 1 , X 2 ,..., X n
 Muestreo

 2 X
S2
 S
 p
Inferencia Estadística

Estimadores
Parámetros
Estimación de Parámetros mediante
Intervalos de Confianza
Intervalos de Confianza

Un método de estimación de Parámetros que se


utiliza con frecuencia es la estimación mediante
Intervalos de Confianza y cuya ventaja sobre la
estimación puntual es que en este caso es posible
determinar el error de estimación así como el nivel
de confianza con el que se dan los resultados.
Definición:
Un intervalos de confianza es un rango
de valores que se construye a partir de
datos muestrales de modo que el
parámetro, que se pretende estimar,
está contenido dentro de dicho rango con
una probabilidad especificada. A la
probabilidad especificada se le conoce
como Nivel de Confianza y se le denota
con la letra griega 
Es decir, dado un Parámetro de interés θ (que puede
ser la media , la Proporción π , la varianza 2 , etc)
basándonos en la información de una muestra
aleatoria y un nivel de confianza pre establecido,
podremos decir que el parámetro está contenido en
el intervalo:
IC(θ) = [ Li , Ls ]
donde:
Li : Límite inferior del intervalo
Ls : Límite superior del intervalo

Las fórmulas para estimar estos límites varían


dependiendo del Parámetro que deseamos estimar
Ejemplo:
Luego de realizar un estudio de investigación de mercados,
con la finalidad de determinar la preferencia en cuanto al
consumo de gaseosas en las personas mayores de 20 años, a
nivel de Lima Metropolitana, en una ficha técnica se tiene la
siguiente información, entre otros aspectos:

• Se seleccionó una muestra aleatoria de 822 personas


mayores de 20 años residentes en Lima Metropolitana
• A partir de esta muestra se encontró que 214 personas
manifestaron su preferencia por la marca Coca Cola.
• Se tiene un Error de estimación de 3%
• El Nivel de confianza es del 95%
En este caso podemos identificar:
Población: Todos las persona mayores de 20 años residentes en Lima
Metropolitana, que suelen consumir gaseosas.
Muestra: Las 822 personas seleccionadas para el estudio.
Unidad de análisis: Una persona mayor de 20 años residente en Lima
Metropolitana y que consume gaseosas.
Variable de estudio: Marca de gaseosa que consume preferentemente
Parámetro de Interés:
π: Proporción de jóvenes mayores de 20 años, residentes en Lima
Metropolitana, que prefieren consumir Coca Cola.
Estimador (Estadígrafo):
p: Proporción muestral de jóvenes mayores de 20 años que prefieren
consumir Coca Cola
En este caso p = 0.260 (estimador puntual del parámetro)
A partir de los resultados obtenidos podemos concluir la verdadera
proporción (π) está contenido en el intervalo [0.23, 0.29], es decir
IC(π) = [0.230; 0.290]
• En lo que sigue estableceremos los
intervalo de confianza que nos permitan
estimar los siguientes parámetros:
Media o Promedio 
Proporción π
Varianza 2
Estos intervalos se establecen a partir de
los datos de una muestra aleatoria y un
nivel de confianza establecido previamente.
Intervalos de Confianza
para estimar una Proporción
Intervalo de Confianza para estimar la
Proporción Poblacional π

Supongamos que se toma una m.a. de tamaño n, (n30)


de una población con distribución de Bernoulli con
probabilidad π, entonces el intervalo de confianza
para la Proporción es:

p(1 − p)
IC( ) = p  z o
n

p: es la proporción muestral
n : es el tamaño de muestra seleccionado
zo: Índice correspondiente el nivel de confianza
fijado
Ejemplo:
Al señor Juan Pérez le han propuesto participar en
una lista para el congreso, en representación de su
provincia. El Sr. Juan Pérez pretende aceptar la
propuesta si tiene evidencia que más del 23% de
personas votarían a su favor. Para realizar la
estimación respectiva se fija un nivel de confianza
del 95%, selecciona un muestra aleatoria de tamaño
n = 450 votantes, encontrando que 90 manifestaron
su intención de votar por él. En base a estos
resultados ¿Cúal será la decisión del Sr. Juan
Pérez?
Intervalos de confianza cuando el tamaño de la
población (N) es conocida
Cuando el tamaño de la población es conocida, la que denotaremos
como N, se debe utilizar un factor de corrección en el intervalo de
confianza, dicho factor de corrección es el siguiente:
N −n
f .c. =
N −1
Si ese fuese el caso los respectivos intervalos de confianza para la
media serán los siguientes:
p(1 − p) N −n
IC ( ) = p  z0
n N −1
A este caso se les denomina estimación de la proporción para
“poblaciones finitas”
Como calcular el tamaño de muestra
para estimar una proporción
Tamaño de muestra para estimar la Proporción Poblacional

z 2 p(1 − p )
Población “infinita”: n=
E2

z 2 p(1 − p) N
Población finita: n= 2
z p(1 − p) + (N − 1) E 2
Donde:
E: es el error máximo tolerable, el cual es fijado por el
investigador.
Z: es el índice asociado al nivel de confianza fijado por el
investigador
N : es el tamaño de la población
Para calcular el tamaño de muestra para estimar la

proporción poblacional ( ), se deben de tener las
siguientes consideraciones:


➢ Si se tiene información acerca del valor de , por
experiencia u otros estudios realizados, se utiliza
este como valor de “p”, en la fórmula.
➢ Si no se cuenta con dicha información, se toma una

muestra piloto y se estima el valor de , y este se
utiliza en la fórmula.
➢ Si ninguna de las situaciones anteriores se da,
entonces se utiliza un valor de p = 0,5
Ejemplo 1:
Se desea estimar la proporción de personas residentes en la
ciudad de Trujillo que están a favor de un proyecto de Ley,
recientemente propuesto en el congreso de la república, si se
fija un nivel de confianza del 95% y se está dispuesto a tolerar
un error de a lo más 4% ¿Qué tamaño de muestra se necesita?

Ejemplo 2:
Hallar el tamaño de muestra necesario si se desea estimar la
proporción de estudiantes, de un centro educativo, que suelen
hacer uso frecuente de la cafetería. En el periodo académico en
el que se realiza el estudio se matricularon 1650 alumnos. Se fija
un nivel de confianza del 90% y se desea un error máximo del
3%. En una muestra piloto previa al estudio, se encontró que el
62% de estudiantes solían hacer uso frecuente de la cafetería.
Intervalos de Confianza
para estimar un promedio
Intervalo de Confianza para la Media Poblacional IC()
cuando la varianza poblacional es conocida

Supongamos que se toma una m.a. de


tamaño n, de una población con
distribución normal con varianza σ
poblacional 2 conocida, entonces el IC(μ ) = x  z o
intervalo de confianza para la media n
de la población se calculará a partir
de la siguiente expresión:

x : Es la media muestral
σ : Es la desviación estándar poblacional
n : Es el tamaño de muestra utilizado
Zo: es un índice que se calcula en base al nivel de confianza
fijado (índice correspondiente al nivel de confianza fijado).
Este nivel de confianza es una probabilidad que debe estar
centrada de manera simétrica, en este caso, en la
distribución normal estándar
Intervalo de Confianza para la Media Poblacional IC()
cuando la varianza poblacional es desconocida

Supongamos que se toma una m.a. de


tamaño n, de una población con
distribución normal con varianza cuya
IC(μ ) = x  t o
S
varianza 2 es desconocida, entonces el
intervalo de confianza para la media de la n
población se calculará a partir de la
siguiente expresión:

x : Es la media muestral
S : Es la desviación estándar muestral
n : Es el tamaño de muestra utilizado
to: es un índice que se calcula en base al nivel de confianza fijado
(índice correspondiente al nivel de confianza fijado). Este
nivel de confianza es una probabilidad que debe estar
centrada de manera simétrica, en este caso, en la
distribución T de Student con n-1 grados de libertad
• Ejemplo:

El nivel de ventas por día de cierto establecimiento


tiene una distribución normal con media desconocida y
desviación estándar 145 soles.
Se desea tener una estimación del verdadero promedio
de ventas, para esto se tomó una muestra aleatoria de
36 días y se encontró una promedio de 485 soles.
Utilizando un nivel de confianza del 95% determine el
intervalo de confianza para estimar el verdadero
promedio de ventas por día. El Gerente de ventas
decidirá incrementar el stock de productos si tiene
evidencia que el nivel de ventas supera los 600 soles En
base a estos resultados ¿Cuál será se decisión del
gerente de ventas?
Ejemplo:
La empresa Cheese S.A. es una empresa exportadora de
quesos a los países europeos. El gerente de ventas, con la
finalidad de proyectar sus costos de envío, desea estimar el
promedio real de la cantidad de queso que vende por pedido.
Para esto selecciona una muestra aleatoria de 14 pedidos
recibidos durante los últimos meses y obtiene los siguientes
datos sobre la cantidad vendida en cada una de los pedidos
(en cientos de kilogramos)

18 19 16 14 15 19 18

17 12 16 17 11 16 17

Si la cantidad por pedido recibido y vendido es una variable


aleatoria con distribución normal, estime con un 90% de
confianza el promedio real de la cantidad de queso vendido
por pedido recibido.
En estos intervalos tendremos que:

• El máximo error de estimación, con el tamaño de


muestra y el nivel de confianza fijado es:
σ S
E =  z0 E = t0
n n

• La longitud del intervalo de confianza será


σ S
L = 2 z0 = 2E L = 2t0 = 2E
n n

• El punto medio
__
de este intervalo es el promedio de
la muestra x
Intervalos de confianza cuando el tamaño de la
población (N) es conocida
Cuando el tamaño de la población es conocida, la que
denotaremos como N, se debe utilizar un factor de
corrección en el intervalo de confianza, dicho factor de
corrección es el siguiente:
N −n
f .c. =
N −1

Si ese fuese el caso los respectivos intervalos de


confianza para la media serán los siguientes:

__
 N −n __
S N −n
IC (  ) = x  z0 IC (  ) = x  t0
n N −1 n N −1
A estos casos se les denomina estimación de la media para
“poblaciones finitas”
Como calcular el tamaño de muestra
para estimar un promedio
Determinación del tamaño de la muestra para
estima la media 
• Uno de los primeros problemas a resolver cuando
se pretende estimar algún Parámetro es el de
determinar cual es el tamaño de muestra adecuado.
• Fijado el nivel de confianza, se tienen dos factores
principales que influyen en el tamaño de la
muestra:
i) La variabilidad de la población ( 2 )
ii) El grado de error que se está dispuesto
a tolerar (E), y que es fijado por el
investigador
Tamaño de muestra para estimar la media de la población

z 2σ 2
Población “infinita”: n=
E2
z 2σ 2 N
Población finita: n= 2 2
z σ + (N− 1) E 2
Donde:
E: es el error máximo tolerable, el cual es fijado por el
investigador.
Z: es el índice asociado al nivel de confianza fijado por el
investigador
N : es el tamaño de la población

*Si no se conoce la varianza poblacional se toma una muestra


piloto y se estima su valor.
Ejemplo:

El dueño de un establecimiento de servicio de


fotocopias está interesado por conocer el
ingreso promedio diario obtenido por el
servicio de fotocopiado.
Suponga que el valor de la desviación estándar
es de S/.50. Si los ingresos se encuentran
distribuidos en forma normal, ¿cuál debe ser
el número de días que debe seleccionar para
que con un nivel del 95% de confianza el valor
del promedio muestral del establecimiento se
encuentre a no más de S/.15 del verdadero
valor del ingreso diario del establecimiento?
Intervalos de Confianza
para estimar una Varianza
Intervalo de Confianza para la Varianza Poblacional IC(2)

Supongamos que se toma una m.a.


de tamaño n, de una población
con distribución Normal con ( n − 1) S 2
( n − 1) S 2
media  y varianza 2, entonces IC ( 2 ) = , 2
el intervalo de confianza para la  
2

Varianza, con un nivel de ( n −1; 1+2 ) ( n −1; 1−2 )

confianza  es:
Donde:
 2
( n −1; 1+2 ) y
 2
( n −1; 1−2 ) denotan los índices asociados al nivel de

confianza fijado y son calculados con la distribución Chi-cuadrada


1+ 1−
con n -1 grados de libertad y probabilidades 2
y
2
respectivamente.

S2 : es la varianza muestral
Ejemplo:

Un empresario afirma que el riesgo de una cartera


de inversión es considerada baja si la desviación
estándar de la rentabilidad mensual es menor a
$500.
Para verificar esto, con respecto a una cartera de
inversión, un investigador decide tomar una muestra
aleatoria de tamaño n = 16 meses y encontró una
varianza de la rentabilidad mensual de 102400
dólares2.
Utilizando un 90% de confianza ¿se puede
considerar que realmente el riesgo de esta cartera
de inversión es bajo?. Justifique su respuesta.

También podría gustarte