Está en la página 1de 27

Propiedad reproductiva de la normal

Sean X e Y dos variables aleatorias normales e independientes,


tales que X ~ N(μX, σX2) e Y ~ N(μY, σY2)
Además: c1 y c2 constantes reales, entonces se cumple que:


S  c1 X  c2Y ~ N c1  X  c2 Y , 
2
c1 2
X 
 c2
2 2
Y 
La suma de
con otra es una
una
variable variable
variable
aleatoria aleatoria
aleatoria
normal normal
normal
Propiedad reproductiva de la normal
Si Xi ~ N(μ, σ2) (i = 1, 2,…, n) son variables aleatorias
independientes, entonces la variable

 X ~ Nn , n 
n
S i
2

i 1
Teorema central del límite
Si n variables aleatorias independientes X1, X2, X3,...Xn tienen la
misma distribución de probabilidad con media  y varianza 2.
Entonces para la variable aleatoria S = X1 + X2 + X3 +...+ Xn se tiene
que S tiende a seguir una distribución normal a medida que n
crece.
Se considera que S sigue aproximadamente una distribución
normal si n  30.
 
n
S   X i ~ N n , n 2

i 1

Media E S   n Varianza V S   n 2
Aplicación del Teorema central del límite - 1
Sea X1, X2,…, Xn una muestra aleatoria de tamaño n de la variable
aleatoria X tal que E(Xi) = μ, V(Xi) = 2 (i = 1, 2,…, n).
Se define la variable aleatoria media muestral como:
n

X i
X i 1
n

  
2
 X  N   ,  , siempre y cuando n  30
 n 
Aplicación del Teorema central del límite - 2
La distribución de una variable aleatoria X ~ B(n, p)
se puede aproximar por una distribución N(np, npq)
siempre y cuando n ≥ 30.
Además, la aproximación es buena si se verifica que:
 np es mayor a 5 y nq = n(1-p) es mayor a 5.
Aplicación del Teorema central del límite - 3
Sea X ~ B(n, p)
Se define la variable aleatoria proporción muestral como:
X
P
n

 p 1  p  
 P  N p ,  , siempre y cuando n  30
 n 
Estimación de parámetros
 Estimador puntual
Un estimador puntual es un estadístico para estimar un parámetro.
Ejemplos:
 La media muestral X es un estimador puntual de
la media poblacional µ.
 La proporción muestral P es un estimador puntual de la proporción
n
poblacional p.
 i
 x  x 2

 La varianza muestral S 2  i 1 es un estimador puntual de la


n 1
varianza poblacional σ2.
Un estimador puntual de un parámetro es una variable aleatoria y la
estimación puntual es un número real.
Programa del Curso

CAP. 6: ESTADÍSTICA INFERENCIAL


6.1 Introducción a la estadística inferencial. Muestra aleatoria.
Parámetros y estadísticas.
6.2 Distribución muestral de la media y de la proporción.
6.3 Estimación puntual de los principales parámetros poblacionales.
6.4 Estimación por intervalos de confianza para la media y la
proporción. Tamaño de muestra.
Estimación de parámetros por intervalo de confianza
Sean x1, x2,…, xn los valores experimentales de una muestra
aleatoria X1, X2,…, Xn de la variable aleatoria X cuya función de
distribución depende del parámetro .
Un intervalo de confianza proporciona información acerca de
qué tan cerca se encuentra la estimación puntual, calculada con
los datos de la muestra, del verdadero valor del parámetro de
interés.
 El intervalo [A, B] se denomina intervalo de confianza al
nivel (1-) para estimar el parámetro ,
 Un intervalo de confianza al nivel (1 - ) x 100% para el
parámetro , es un intervalo que con probabilidad (1 - )
contiene al parámetro.
Estimación de parámetros por intervalo de confianza
Un intervalo de confianza al nivel (1 - ) x 100% para el
parámetro , es un intervalo que con probabilidad (1 - )
contiene al parámetro.
La forma general de una estimación por intervalo es:

I(parámetro) = Estimación puntual del parámetro ± margen de error

El margen de error determina qué tan precisa es la estimación


realizada, y este valor depende de los siguientes factores:
tamaño de la muestra n, nivel de confianza (1-) y variabilidad
de la población .
Estimación de parámetros por intervalo de confianza
Interpretando el nivel de confianza
Por ejemplo, para un intervalo de confianza para la media µ a un
nivel de confianza del 95%
 Si se seleccionan repetidamente 1000 muestras de tamaño n,
y calculamos la media de cada una de ellas, podremos realizar
1000 estimaciones por intervalo de confianza para la media
poblacional .
 Se espera o confía que aproximadamente 950 de los intervalos
de confianza hallados contengan el parámetro  y los restantes
no lo contengan.
Ejemplo
Intervalos a 95% de confianza para µ generados con once
muestras de tamaño n.

Fuente: http://www.fisicanet.com.ar/matematica/estadisticas/ap08_inferencia_estadistica.php
Estimación de parámetros por intervalo de confianza
Sean x1, x2,…, xn los valores experimentales de una muestra
aleatoria X1, X2,…, Xn de la variable aleatoria X
con E(Xi) = , V(Xi) = 2.
Si la población es normal o el tamaño de muestra n es mayor
o igual a 30, entonces el intervalo de confianza para µ, a un
nivel de confianza de (1-α) x 100%, es:
   
I ( )   x  z  ; xz  
 1
2
n 1
2
n 
Donde x es la media calculada con los datos de la muestra de
tamaño n.
Estimación de parámetros por intervalo de confianza
Sean x1, x2,…, xn los valores experimentales de una muestra
aleatoria X1, X2,…, Xn de la variable aleatoria X
con E(Xi) = , V(Xi) = 2.
Si la población es normal o el tamaño de muestra n es mayor
o igual a 30, entonces el intervalo de confianza para µ, a un
nivel de confianza de (1-α) x 100%, es:
 s s 
I ( )   x  z  ; xz  
 1
2
n 1
2
n 

Donde x es la media calculada con los datos de la muestra de


n
tamaño n y  x  x 
i 1
i
2

S
n 1
Recordando: Z ~ N    0, 2  1 

 = 0.317
15.85% 15.85%
 P( -1 < Z < 1 ) = Ф(1) - Ф(-1) 68.3%
= 0.683
 = 0.045
 P( -2 < Z < 2 ) = Ф(2) - Ф(-2) 2.25% 2.25%
95.5%
= 0.955

 P( -3 < Z < 3 ) = Ф(3) - Ф(-3)  = 0.003


0.15% 99.7% 0.15%
= 0.997
Puntajes z de interés Z ~ N    0, 2  1 

 = 0.10  0.90 = P( -Z1-α/2 < Z < Z1-α/2 )

5% 5%
= P( -Z0.95 < Z < Z0.95 )
90%
α = 0.10  Z0.95 = 1.645
1.645
 0.95 = P( -Z1-α/2 < Z < Z1-α/2 )
 = 0.05
2.5% 2.5%
= P( -Z0.975 < Z < Z0.975 )
95%
α = 0.05  Z0.975 = 1.965
1.965
 0.99 = P( -Z1-α/2 < Z < Z1-α/2 )
 = 0.01
0.5%
99% 0.5% = P( -Z0.995 < Z < Z0.995 )
α = 0.01  Z0.995 = 2.565
2.565
Ejemplo
Para estimar el precio medio de las guías turísticas para visitar el Cusco se
elige una muestra aleatoria formada por 34 guías y se determina que la media
muestral es de S/.34.90. Por estudios realizados anteriormente se sabe que la
desviación estándar de los precios de estas guías es de S/.4.50. Construya un
intervalo de confianza para el precio medio de las guías turísticas para visitar
el Cusco, al nivel del 95%. Interprete.
 
El intervalo de confianza al 95% está dado por: x  z 0 ,975    x  z 0 ,975
n n
4 ,5 4 ,5
Reemplazando los datos tenemos: 34,9  1,96    34,9  1,96
34 34

33,39    36,41
El precio medio de las guías de turismo para visitar el Cusco, se estima entre
S/.33,39 y S/.36,41, con una confianza del 95%.
Ejercicio
Para estimar el puntaje medio en una prueba de pensamiento crítico se
aplica la prueba a una muestra aleatoria de estudiantes de EEGGLL. El
manual de instrucciones de la prueba reporta que la desviación estándar
de los puntajes es 8 puntos. El puntaje medio de los estudiantes evaluados
es 68 puntos (sobre un máximo de 80 puntos).
Como podemos afirmar, con una confianza del 90%, que el puntaje medio
en la prueba de pensamiento crítico para la población de estudiantes de
EEGGLL está entre 66.53 y 69.47? 66.53    69.47
 
x  z0.95    x  z0.95 69.47  68  1.64
8
n n n
 1.64  8 
2
8 8 n
68  1.64    68  1.64   79.658667  80
n n  69.47  68 
Tamaño de muestra para estimar la media poblacional
La forma general de una estimación por intervalo es:
I(µ) = Estimación puntual de la media ± margen de error
El margen de error determina qué tan precisa es la estimación realizada, y este
valor depende de los siguientes factores: tamaño de la muestra n, nivel de
confianza (1-) x 100% y variabilidad de la población .
Para tener una confianza de (1-) x 100% de que el margen de error o error de
estimación, al estimar la media poblacional con la media muestral, sea de a lo
más e unidades:
 z 
2

 1 2 
P| X   | e   1    ez    __ Población infinita o
muestreo con reposición
n 
1
2
X  e 
 
 El tamaño de muestra n debe ser un número entero.
 Si σ es desconocida, para encontrar el tamaño de muestra, σ se estima por Sx.
Ejemplo
El peso de cierto tipo de motores se modela con una variable con
desviación estándar de 7.04 kilos. Calcular el tamaño de muestra para que
con una confianza del 99% el error de estimación, al estimar la media
poblacional por la media muestral, sea de a lo más dos kilos.
X = peso del motor, en kilos, σ = 7.04 kilos,
Error máximo e = 2 kilos y nivel de confianza: 1- α es 0.99, luego
 z 
2

 1 2  
2
 2 . 575 7 . 04 
n      82.15
 e   2 
 
 El tamaño de muestra n debe ser un número entero  n=83.
 Basta tomar una muestra de 83 motores para que la estimación del peso
medio, al 99% de confianza, tenga un error máximo de dos kilos.
Ejercicio
Se pide al administrador de un supermercado que estime el
tiempo medio que invierte una cajera en atender a un cliente.
Le piden que las estimaciones tengan un nivel de una
confianza del 90% y un margen de error de 15 segundos. Si se
sabe que la desviación estándar poblacional es de 0,5
minutos, ¿cuál debe ser el tamaño de muestra?

 z 
2

 1 2   1.645  30 
2

n      10.75
 e   15 
 

 n=11
Intervalos de confianza para la proporción poblacional
Sean x1, x2,…, xn los valores experimentales de una muestra aleatoria
X1, X2,…, Xn de una población de Bernoulli
con E(Xi) = p, V(Xi) = p(1-p).
El intervalo de confianza para la proporción poblacional p, a un nivel
de confianza de (1-α) x 100%, es:
 p 1  p  p 1  p  
I(p)   p  z  ; pz  
 1
2
n 1
2
n 

Donde p es la proporción muestral calculada con los datos de la


muestra de tamaño n.
Tamaño de muestra para estimar proporción poblacional
Para tener una confianza de (1-) x 100% de que el margen de error o error
de estimación, al estimar la media poblacional con la media muestral, sea
de a lo más e unidades:
 
P P  p  e  1   e  z
1
   __
P
2

z 2  p 1  p 
Población infinita o 1
muestreo con reposición n 2
e2
 Como p es desconocida, para encontrar el tamaño de muestra, el valor p
se reemplaza por una estimación previa disponible o por 0,5.
 El tamaño de muestra n debe ser un número entero.
Ejercicio
A una muestra aleatoria de 650 personas mayores de 18 años de una
ciudad determinada se les preguntó si estaban a favor de un incremento
del 4% en el impuesto al precio de la gasolina para obtener fondos
necesarios que se destinarían a un programa de asistencia social. Si en la
muestra elegida se encontró que 312 están a favor del impuesto adicional,
calcule e interprete un intervalo de confianza del 90% para la verdadera
proporción de personas a favor del nuevo impuesto.
Ejercicio
Se quiere estimar la aprobación del presidente de la república para lo cual
se realizó una encuesta nacional, en la cual se entrevistó a 1116 personas,
encontrándose que 854 de ellas no estaban de acuerdo con la gestión
presidencial. Calcule un intervalo de confianza al 96% para proporción
poblacional de las personas que están de acuerdo con la gestión
presidencial. Además, determine el margen de error. Interprete.
Ejercicio
Una empresa encuestadora quiere realizar una investigación sobre
intención de voto a favor de cierto candidato en la segunda vuelta electoral
de las próximas elecciones presidenciales. Desea que los resultados tengan
un nivel de confianza del 95% y un margen de error del 3%. Calcule el
tamaño de muestra necesario para dicha encuesta.
Ejercicio
Una compañía de investigación de mercado desea estimar el porcentaje de
hogares que tienen Internet en casa, ¿cuántos hogares debe encuestarse si
desea tener un nivel de confianza del 99% y un margen de error del 2%? En
una investigación del año pasado se determinó que el porcentaje de
hogares con Internet era del 24%.

También podría gustarte