Está en la página 1de 65

PROF: Ing. Rosa Quispe Solórzano.

Inferencia Estadística
Uno de los propósitos de la estadística inferencial es estimar las características
poblacionales desconocidas, examinando la información obtenida de una
muestra, de una población.
El punto de interés es la muestra, la cual debe ser representativa de la
población objeto de estudio.

Se seguirán ciertos procedimientos de selección para asegurar de que las


muestras reflejen observaciones a la población de la que proceden, ya que
solo se pueden hacer observaciones probabilísticas sobre una población
cuando se usan muestras representativas de la misma.

Una población está formada por la totalidad de las observaciones en las


cuales se tiene cierto observa.

Una muestra es un subconjunto de observaciones seleccionadas de una


población.
Muestras aleatorias
Cuando nos interesa estudiar las características de poblaciones grandes,
se utilizan muestras por muchas razones; una enumeración completa de la
población, llamada censo, puede ser económicamente imposible, o no se
cuenta con el tiempo suficiente.

A continuación se verá algunos usos del muestreo en diversos campos:

1.Política. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinión pública y el apoyo en las elecciones.
2.Educación. Las muestras de las calificaciones de los exámenes de estudiantes se
usan para determinar la eficiencia de una técnica o programa de enseñanza.
3.Industria. Muestras de los productos de una línea de ensamble sirve para controlar
la calidad.
4.Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos
prueban la eficacia de una técnica o de un fármaco nuevo.
5.Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la
producción los efectos de un fertilizante nuevo.
6.Gobierno. Una muestra de opiniones de los votantes se usaría para determinar los
criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
Errores en el muestreo
Cuando se utilizan valores muestrales, o estadísticos para estimar
valores poblacionales, o parámetros, pueden ocurrir dos tipos
generales de errores: el error muestral y el error no muestral.
El error muestral se refiere a la variación natural existente entre
muestras tomadas de la misma población.
Cuando una muestra no es una copias exacta de la población;
aún si se ha tenido gran cuidado para asegurar que dos
muestras del mismo tamaño sean representativas de una cierta
población, no esperaríamos que las dos sean idénticas en
todos sus detalles. El error muestral es un concepto importante
que ayudará a entender mejor la naturaleza de la estadística
inferencial.
Errores en el muestreo
Los errores que surgen al tomar las muestras no pueden
clasificarse como errores muestrales y se denominan errores no
muestrales.
El sesgo de las muestras es un tipo de error no muestral.
El sesgo muestral se refiere a una tendencia sistemática inherente
a un método de muestreo que da estimaciones de un parámetro
que son, en promedio menores (sesgo negativo), o mayores (sesgo
positivo) que el parámetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la
aleatorización.
La aleatorización se refiere a cualquier proceso de selección de
una muestra de la población en el que la selección es imparcial o
no está sesgada; una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria.
Error Muestral
Cualquier medida con lleva algún error. Si se usa la media
para medir y estimar la media poblacional , entonces la
media muestral x , como medida, con lleva algún error.
Por ejemplo, supongamos que se ha obtenido una
muestra aleatoria de tamaño 25 de una población con
media µ = 15: si la media de la muestra es x =12,
entonces a la diferencia observada do= -3 se le denomina
el error muestral. Entonces: una media muestral
puede pensarse como la suma de dos cantidades, la
media poblacional y el error muestral; si e denota el
error muestral, entonces:
DISTRIBUCIONES
MUESTRALES
Introducción
 En la vida real es imposible calcular parámetros
poblacionales porque las poblaciones son muy
grandes.
 En lugar de analizar toda una población, se toma
una muestra, luego se calcula un estadístico
relacionado con el parámetro que interesa, y se
hace una inferencia.
 La distribución muestral de un estadístico es la
herramienta que nos dice cuán cerca está el
estadístico del parámetro.
9
DISTRIBUCIONES MUESTRALES
Uno de los objetivos de la estadística es saber acerca
del comportamiento de parámetros poblacionales
tales como: la media(  ), la varianza (  ) o la
2

proporción ( p ).
Se extrae una muestra aleatoria de la población y se
calcula el valor de un estadístico correspondiente, por
ejemplo, la media muestral (X ), la varianza muestral
( s 2 ) o la proporción muestral ( p̂). El valor del
estadístico es aleatorio porque depende de los
elementos elegidos en la muestra seleccionada. y, por
lo tanto, el estadístico tiene una distribución de
probabilidad la cual es llamada la Distribución
Muestral del Estadístico.
10
Distribución de la Media Muestral
 Un ejemplo
 Se arroja un dado una infinita cantidad de veces.
Llamamos X a la cantidad de puntos en la cara
superior en cada tirada.
 La distribución de probabilidad de X es:

E(X) = 1(1/6) +
x 1 2 3 4 5 6 2(1/6) + 3(1/6)+
p(x) 1/6 1/6 1/6 1/6 1/6 1/6 ………………….= 3,5

V(X) = (1-3,5)2(1/6) +
(2-3,5)2(1/6) +
…………. …= 2,92

11
Y como se hallaria la media
muestral , si se arroja dos dados a
la vez ?
 Si se se quiere estimar  a partir de la
media x de una muestra de tamaño
n = 2.

Cuál es la distribución de x ?

12
Si se arroja dos veces el dado ,La media
muestral
Muestra Media Muestra Media Muestra Media
1 1,1 1 13 3,1 2 25 5,1 3
2 1,2 1.5 14 3,2 2.5 26 5,2 3.5
3 1,3 2 15 3,3 3 27 5,3 4
4 1,4 2.5 16 3,4 3.5 28 5,4 4.5
5 1,5 3 17 3,5 4 29 5,5 5
6 1,6 3.5 18 3,6 4.5 30 5,6 5.5
7 2,1 1.5 19 4,1 2.5 31 6,1 3.5
8 2,2 2 20 4,2 3 32 6,2 4
9 2,3 2.5 21 4,3 3.5 33 6,3 4.5
10 2,4 3 22 4,4 4 34 6,4 5
11 2,5 3.5 23 4,5 4.5 35 6,5 5.5
12 2,6 4 24 4,6 5 36 6,6 6
13
Distribución de las Medias Muestrales para n = 2
ºSample  x2
Notar :  x   x y1  x 1,1 Mean
Muestra 2 Media Sample
Muestra Mean
Media Sample
Muestra Mean
Media
1 13 3,1 2 25 5,1 3
2 2
1,2 1.5 14 3,2 2.5 26 5,2 3.5
3 1,3 2 15 3,3 3 27 5,3 4
4 1,4 2.5 16 3,4 3.5 28 5,4 4.5
5 1,5 3 17 3,5 4 29 5,5 5
6 1,6 3.5 18 3,6 4.5 30 5,6 5.5
7 2,1 1.5 19 4,1 2.5 31 6,1 3.5
8 2,2 2 20 4,2 3 32 6,2 4
9 2,3 2.5 21 4,3 3.5 33 6,3 4.5
10 2,4 3 22 4,4 4 34 6,4 5
11 2,5 3.5 23 4,5 4.5 35 6,5 5.5
12 2,6 4 24 4,6 5 36 6,6 6

6/36

E( x) =1,0(1/36)+
5/36
4/36 1,5(2/36)+….=3,5
3/36
V(X) = (1.0-3,5)2(1/36)+
2/36 (1,5-3,5)2(2/36)... = 1,46
1/36
1 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 x 14
Distribución de la Media Muestral cuando la
población es normal
Se extraen muestras aleatorias de tamaño n de una población
infinita con media poblacional  y varianza :  2
 La media de las medias muestrales es igual a la media
poblacional. Es decir,  x  
 La varianza de las medias muestrales es igual a la varianza
poblacional dividida por n . En consecuencia la desviación
estándar de las medias muestrales (llamada también el error
estándar de la media muestral), es igual a la deviación estándar
poblacional dividida por la raíz cuadrada de n . Es decir  x   .
n

Si la población fuera finita de tamaño N, se aplica el factor


de correción: N  n al error estándar de la media muestral
N 1

15
La Distribución de la Media Muestral

Sea x la media de una muestra aleatoria de n observaciones extraída de una


población de media  y varianza  2 .
x x

a) La distribución muestral de x tiene media  x , es decir : E ( X )   x


x
b) La distribución muestral de x tiene un desvío estándar:  x 
n
Esta cantidad se llama el error estándar de la media.

c) Si n no es una proporción pequeña de N se tiene:    x N n


N 1
x
n
d) Si la población tiene distribución normal entonces z  X   x tiene una
distribución normal. x
e) Si la población no es normal pero el tamaño de muestra n es grande, es válido
el resultado anterior. (TLC)
16
Distribución de la Media Muestral
n5 n  10 n  25
 x  3,5  x  3,5  x  3,5
 x2  2  x2
  0,5833 (
2
x )  x2  0,2917 ( x
)   0,1167 (
2
x )
5 10 25

17
Distribución de la Media Muestral
n5 n  10 n  25
 x  3,5  x  3,5  x  3,5
 2  x2  x2
 x2  0,5833 ( x
)   0,2917 (
2
x )   0,1167 (
2
x )
5 10 25

Notar que  x es menor que x. Cuanto


2

mayor es el tamaño de muestra, va a ser


menor  2 .Entonces,
x x
tiende a ubicarse
cerca de  , a medida que el tamaño de la
muestra aumenta

18
Distribución de la Media Muestral
Demostración: La varianza de la media muestral es menor que la
varianza de la población.

Media = 1,5 Media = 2. Media = 2,5


Población 1 1.5 2 2.5 3
1.5 2 2.5
1.5 2 2.5
1.5 2 2.5
1.5
Compare1.5 2 de la 2.5
la variabilidad población
2.5
1.5
con la variabilidad de22 la media2.5
1.5 2.5muestral.
1.5 2 2.5
1.5 2.5
1.5 2 2.5
Tomando muestras 1.5 2 2.5
1,5 2 2,5
de dos observaciones

19
Distribución de la Media Muestral

También,
Valor Esperado de la población =
(1 + 2 + 3)/3 = 2

Valor Esperado de la media muestral =


(1,5 + 2 + 2,5)/3 = 2

20
Teorema del Límite Central
 Si se extrae una muestra aleatoria de cualquier
población, la distribución de la media muestral es
aproximadamente normal con tal que el tamaño de la
muestra (n) sea suficientemente grande.
 Cuanto mayor es el tamaño de n, más se aproximará la
distribución muestral de x a una distribución normal.

21
El Teorema del Límite Central
De una población infinita con media  y varianza  2 se
extraen muestras aleatorias de tamaño n , entonces la
media muestral se comporta aproximadamente como una
variable aleatoria normal con media igual a la media
poblacional y con varianza igual a la varianza poblacional
dividida por el tamaño de la muestra, siempre que n sea
grande. Esto es: X ~ N ( ,  2 )
n X 
Z ~ N (0,1)

, Estandarizando: n

22
Distribución de la Media Muestral

1.  x   x
 x2
2.  
2
x
n
3. Si x es normal, x es normal. Si x no es normal, x
se distribuyeaproximadamente como una normal
si el tamaño de muestra es suficientemente grande.

23
Distribución de la Media Muestral
 Ejemplo 1
 La cantidad de soda en cada botella de una gaseosa se
distribuye normalmente con una media de 32,2 gramos y un
desviacion estándar de 0,3 gramos.
 Hallar la probabilidad de que un cliente compre una botella
que contenga más de 32 gramos.
 Solución
 La variable aleatoria X es la
cantidad de soda en una botella. 0,7486

x 32  32,2
P( x  32)  P(  )
x 0,3 x = 32  = 32,2
 P( z  0,67)  0,7486
24
Distribución de la Media Muestral
 Hallar la probabilidad de que un paquete de cuatro
botellas tendrá una media de más de 32 gramos de soda
por botella.
 Solución
 Se define la variable aleatoria como la cantidad promedio de soda
por botella.
x 32  32,2
P( x  32)  P(  ) 0,9082
x 0,3 4
 P( z  1,33)  0,4082
0,7486
x = 32
x  32  = 32,2
 x  32,2 25
Distribución de la Media Muestral
 Ejemplo 2
 Segun el INEI : El salario básico inicial promedio de los
obreros no calificados (sin antigüedad), es de S/600
mensuales.
 Suponga que la distribución de los salarios tiene un
desvacion standard de S/100. Cuál es la probabilidad de
que 25 obreros elegidos al azar tengan un salario
promedio mensual de menos de S/550?
 Solución x   550  600
P ( x  550)  P (  )
x 100 25
 P ( z  2,5)  0,0062
26
Uso de la Distribuciones Muestrales para Inferencia
 Para hacer inferencia acerca de parámetros poblacionales se usan
las distribuciones muestrales .
 La simetría de la distribución normal junto con la distribución de la
media muestral lleva a:

x
P(1,96  z  1,96)  0,95, ó P(1,96   1,96)  0,95
- Z0,025 Z0,025  n
Esto se puedeescribir como :
 
P (1,96  x    1,96 )  0,95
n n
y ordenando:
 
P (   1,96  x    1,96 )  0,95
n n 27
Uso de la Distribuciones Muestrales
para Inferencia

Distribución normal estándar Z Distribución normal de x


100 100
P(600  1,96  x  600  1,96 )  0,95
25 25

0,95
0,95
0,025 0,025 0,025 0,025

Z x
-1,96 0 -1,96 
100 
600 P(600
100
 11.96
P(600 .96  1.96
1.96
n
25 n 25
29
Uso de las Distribuciones Muestrales para
Inferencia
100 100
P(600  1,96  x  600  1,96 )  0,95
25 25
Se simplifica a P(560,8  x  639,2)  0,95

 Conclusión
 Si la media poblacional es 600: Hay una probabilidad del
95% de que la media muestral caiga dentro del intervalo
[560,8; 639,2]
 Dado que la media muestral fue 550, no es probable que la
media poblacional sea 600.

30
Distribución Muestral de una Proporción

 El parámetro de interés para datos nominales es la


proporción de veces que se presenta un determinado
resultado(suceso).
 Para estimar la proporción poblacional ‘p’ se usa la
proporción muestral.
El número
de sucesos
X
^ =
El estimador de p = p n

31
Distribución Muestral de una Proporción

 Si X es binomial, las probabilidades ^p


se pueden calcular con la distribución binomial.

^ se prefiere usar la
 Pero, para inferencia acerca de p
normal como aproximación a la binomial.

32
Distribución de la Proporción Muestral
Si de una población distribuida Binomialmente con probabilidad de
éxito p, se extrae una muestra aleatoria de tamaño n, entonces se
puede mostrar que la media de X : número de éxitos en la muestra,
es   np y que su varianza es  2  npq
.
X
En consecuencia la proporción muestral pˆ  tiene media p, y
n
varianza pq . Entonces: por el Teorema del Limite Central, cuando n
n
es grande se tiene: X  np pˆ  p
z 
npq pq
n

33
Aproximación Normal a la Binomial

 La aproximación normal a la binomial es mejor


cuando la cantidad de experimentos (tamaño de
la muestra ) es grande, y la probabilidad del
suceso, p, es próxima a 0,5.

 Para que la aproximación dé buenos resultados se


deben cumplir dos condiciones:
np  5; n(1 - p)  5

34
Aproximación Normal a la distribución Binomial

Ejemplo:
Aproximar la probabilidad binomial P(x=10)
cuando n = 20 y p = 0,5

Los parámetros de la distribución normal


que usamos para aproximar la binomial son:

 = np; 2 = np(1 - p)

35
Aproximación Normal a la Distribución
Binomial
Se construye una distribución normal para  = np = 20(0,5) = 10;
aproximación de la binomial P(X = 10). 2 = np(1 - p) = 20(0,5)(1 – 0,5) = 5
 = 51/2 = 2,24
P(9,5<YNormal<10,5)
P(XBinomial = 10) = 0,176 La aproximación

~= P(9.5<Y<10.5)

9,5 10 10,5
9,5  10 10,5  10
 P( Z  )  0,1742
2,24 2,24
36
Aproximación Normal a la
Distribución Binomial

 Más ejemplos de la aproximación


normal a la binomial
P(X  4) @ P(Y< 4,5)

4
4,5
P(X 14) @ P(Y > 13,5)

13,5 14 37
Fórmulas de aproximación Normal a la Binomial.
Si X es una Binomial con parámetros n y p, entonces
k  .5  np k  .5  np
i) P X  k  @ P(k  .5  X  k  .5)  P( Z )
npq npq

a  .5  np b  .5  np
ii) Pa  X  b   P(a  .5  X  b  .5)  P( Z )
npq npq

a  .5  np b  .5  np
iii) Pa  X  b  P(a  .5  X  b  .5)  P( npq
Z
npq
)

38
Aproximación de la Distribución Muestral
de la Proporción Muestral
 EN RESUMEN:
 De las propiedades del valor esperado y la
varianza, se cumple E(p̂ ) = p y V ( p̂ ) =p(1-p)/n
 Si ambos np > 5 y np(1-p) > 5, entonces
p̂  p
z
p(1  p)
n
 Z se distribuye como una normal estándar.

39
 Ejemplo : Un representante estatal recibió el 52% de los
votos en la última elección. Un año después el
representante quiere estudiar su popularidad. Si su
popularidad no ha cambiado, cuál es la probabilidad de
que más de la mitad de un muestra de 300 electores lo
voten?
 Solución
 El número de electores que prefieren el representante es
binomial con n = 300 y p = 0,52. Se tiene np = 300(0,52) =
156 y n(1-p) = 300(1-0,52) = 144 (ambos mayores de 5)

 pˆ  p 0,50  0,52 
P( pˆ  0,50)  P    0,7549
 p (1  p ) n (0,52)(1  0,52) 300 

40
Distribución Muestral de la Diferencia Entre
Dos Medias
 Se extraen dos muestras independientes de
dos poblaciones con distribución normal.
 Interesa la distribución muestral de la
diferencia entre las dos medias muestrales.

x1  x 2

41
Distribución Muestral de la Diferencia Entre
Dos Medias

La distribución de x1  x 2 es normal si:


 Las dos muestras son independientes, y
 Las distribuciones poblacionales se distribuyen
normalmente.

 Si cada una de las poblaciones no tiene


distribución normal, pero los tamaños de
muestra son 30 o más, la distribucion de
x1  x 2 es aproximadamente normal.
42
Distribución Muestral de la Diferencia Entre Dos
Medias
 Aplicando las propiedades de valor esperado y
varianza se tiene:
E( x1  x 2 )  E( x1 )  E( x 2 )  1   2
  2 2

V( x 1  x 2 )  V( x 1 )  V( x 2 )   1 2

n n
 Se puede definir:
( x 1  x 2 )  ( 1   2 )
Z
12  22

n1 n2
43
Distribución Muestral de la Diferencia Entre
Dos Medias
Ejemplo
 Los ingresos promedios anuales de los funcionarios
de dos empresas, WONG y KAI LU son de $62.000
(d. estándar = $14.500), y $60.000 (d. estándar =
$18.300). (Valores anuales)
 Cuál es la probabilidad de que una media muestral
de la WONG sea mayor que la media muestral de
KAI LU (nWONG = 50; nkai lu = 60)

44
Distribución Muestral de la Diferencia Entre
Dos Medias
 Ejemplo : Solución
Hay que determinar : P( x1  x 2  0)

1 - 2 = 62.000 - 60.000 = $2.000

 12  22 14.5002 18.3002
    $3.128
n n 50 60
x1  x2  ( 1 -  2 ) 0  2000
P( x1  x2  0)  P(  )
 12  22 3128

n1 n2
 P( z  0,64)  0,5  0,2389  0,7389 45
Introducción a la Estimación
 La Inferencia Estadística es el proceso por el
cual se obtiene información sobre
poblaciones en base a muestras.
 Hay dos tipos de Inferencia:
 Estimación
 Pruebas de Hipótesis
Conceptos de Estimación
 El objetivo de la Estimación es determinar el
valor de un parámetro poblacional en base a
un estadístico muestral.
 Hay dos tipos de Estimaciones:

Estimación Puntual
Estimación por Intervalos
Estimador Puntual
 Un estimador puntual permite hacer una inferencia
acerca de una población, estimando el valor de un
parámetro desconocido de la misma usando
solamente un valor o un punto obtenido de una
muestra.
Estimación por Intervalos
 Una estimación por Intervalo permite hacer
inferences acerca de un población estimando el
valor de un parámetro desconocido usando un
intervalo.
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores
Propiedades de los Estimadores

También podría gustarte