Está en la página 1de 14

D ISTRIBUCIN N ORMAL

Si una variable aleatoria continua X tiene una distribucin normal con parmetros y 2, entonces:
se le denota X ~ N(,2)
y su funcin de densidad es:
f X ( x)

1
2 2

1
22

x 2

donde:
Valor esperado: X = .
Varianza: 2X = 2.
Propiedades:
1.

Propiedad Reproductiva: Si X1, X2, , Xn son n variables aleatorias independientes, donde


cada Xi ~ N( i , 2 i ), entonces:
n
n

2 2
Y c0 ci Xi ~ N c0 cii , ci i ,
i1
i1
i1

siendo: c0 , c1, , cn constantes arbitrarias.


2.

Teorema de Lmite Central (TLC): Si X1, X2, , Xn son n variables aleatorias independientes,
donde cada Xi tiene la misma distribucin de media y varianza 2, entonces para n
suficientemente grande (en la prctica n 30) se cumple que aproximadamente:

i1 X i n
n

Zn

3.

X
~ N (0,1)

Aproximacin de la Distribucin Binomial por la Normal:


Como caso particular del Teorema del Lmite Central, si X ~ B(n,p) y n es suficientemente
grande, entonces aproximadamente:
Z

X np
~ N(0,1)
n p (1 p)

Para el clculo de probabilidades se utiliza la llamada correccin por continuidad:


Si a b son dos nmeros naturales, entonces aproximadamente:
1
1
P ( a X b) P a X b
2
2

M UESTREO

POBLACIN ESTADSTICA
Poblacin
Fsica

E1 E2 ...
.
.. EN

(1)

Poblacin
Estadstica

(2)

X X .
X(N)...
.

Observacin de
valores de X
v.a.

Observaciones

MUESTRA.- Es un subconjunto de la Poblacin Estadstica. Se dice que una muestra es representativa


si se selecciona de forma aleatoria.
Poblacin
Estadstica

X(1) X(2)....
X(N)..
......................

Seleccin
aleatoria

X1 X2 .
Xn

Muestra de
tamao n

MUESTRA ALEATORIA (m.a.).- Una muestra aleatoria de tamao n de la v.a. X es un subconjunto de n


v.a.,: X1, X2, Xn que son:
(1)
(2)

independientes
idnticamente distribuidas con la distribucin de X

ESTADSTICO.- Es cualquier funcin de los elementos de una m.a. que no dependa de parmetros
desconocidos.
IDEA
Poblacin
Estadstica

X(1) X(2)
..X(N)

Muestra
aleatoria
X1 X2 .
Xn

Seleccin
aleatoria

Estadstico

Inferencia

DISTRIBUCIN MUESTRAL.- Es la distribucin de un estadstico, es decir la distribucin de


probabilidad de los valores que puede tomar el estadstico a lo largo de todas las posibles muestras,
con el mismo nmero de observaciones, que pueden ser extradas de la poblacin.

Por ejemplo.
Consideremos una poblacin de 6 nios cuyas edades (X) son:
Poblacin Estadstica
4
6
6
7

X:

= 5.5

Si tomamos una muestra aleatoria de tamao 4:

Por ej.:

Muestra
4
6

Xi X

Y calculamos el estadstico

Obtenemos

X = 4.5

Pero existen otras posibles muestras de tamao 4


Por ej.:
2

= 4.75

=5

= 5.5

=6

:
en total 15 posibles muestras
6

6!

2! 4!

y por lo tanto 15 valores para el estadstico

4.5

podemos hallar p( X = a) distribucin de probabilidades de

5.0
0
dado que todas las posibles muestras tienen igual probabilidad de ser seleccionadas la
probabilidad que tiene cada una de ser elegida es 1/15 podemos determinar la probabilidad de cada
uno de los valores de la media muestral.

Otro estadstico podra ser:

Xi X 2

n 1

varianza muestral

D ISTRIBUCIONES M UESTRALES
A SOCIADAS A LA N ORMAL

DISTRIBUCIN CHI-CUADRADO
Una variable aleatoria X tiene distribucin chi-cuadrado con n grados de libertad, y se le denota:

si:

X ~ 2(n),

X ~n ,1 .
2 2

Es decir, la distribucin chi-cuadrado es un caso particular de una distribucin gamma.


PROPIEDADES:
1.

Si Z ~ N(0,1), entonces Z2 ~ ~ 2(1).

2.

Propiedad Reproductiva: Si W1, W2, , Wk son k variables aleatorias independientes con


distribuciones chi-cuadrado de respectivamente n1, n2, , nk grados de libertad, entonces:
k

W Wi
i 1

n i 1 ni
k

es tambin una v.a. con distribucin chi-cuadrado de


3.

grados de libertad.

Si X1, X2,, , Xn es una muestra aleatoria de X ~ N(,2), entonces:


W

n 1 S2 ~ 2n 1
2

g.l. =9
g.l. =16
g.l. =20

10

15

20

25

30

35

40

45

DISTRIBUCIN TDE STUDENT


Una variable aleatoria tiene distribucin t de Student con n grados de libertad, y se le denota por X ~
t(n), si su funcin de densidad es:
n 1

f X ( x)

2
x
n
n 1
n
2

n 1
2

Valor esperado: X = 0.
Varianza: 2X

n
(n > 2)
n2

PROPIEDADES:
1.

Sea X ~ t(n). Si n es grande, entonces aproximadamente:


X ~ N(0,1)

g.l. =5
g.l. =1
g.l. =30

-3.0

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Si Z ~ N(0,1) y W ~ 2(n) son variables aleatorias independientes, entonces:


T

En
particular,
dada
2
X ~ N(, ), se cumple que:

una

muestra
T

Z
W

~ t ( n) .
n

aleatoria

X
~ t (n 1)
S
n

X1 ,

X2 ,

Xn

de

I NTERVALOS

DE

C ONFIANZA

Sea un parmetro desconocido de una variable aleatoria X. Supongamos que basndonos en una
muestra aleatoria X1, X2, , Xn determinamos dos estadsticos Li y Ls tales que:
P(Li Ls) = 1 -
Entonces el intervalo [Li, Ls] se denomina intervalo de confianza al 100 (1 - ) % para .

Ls

Li

La cantidad (1 - ) se denomina nivel de confianza del intervalo.


INTERVALO DE CONFIANZA PARA LA MEDIA:
Caso 1: Varianza (2) conocida
Si X es la media muestral de una muestra aleatoria de tamao n de una poblacin con varianza
conocida 2, hallaremos un intervalo de confianza para del 100 (1 ) por ciento.
1.

Si se tiene una m.a. de tamao n de la v.a. X


~ N(,2): X1, X2, ...Xn

N(0,1)

2.

Entonces X1, X2, ...Xn ~ N(, )

3.

X ~ N ( ,

4.

X ~ N ( 0 ,1)

2
n

)
1-

-z/2

p ( z
2

z ) 1

p( X z
2

donde:

p( Z z )
2

X z
2

X z
2

n = tamao muestral

z/2

Entonces un IC al 100(1-) para es:


X z

) 1

Por lo tanto:

Punto medio

Intervalo de
confianza:
Longitud

2 z X
2

Depende
de:

Ejemplo:
Se toma una muestra aleatoria de tamao 40 de una variable X que sigue una distribucin normal con
varianza conocida. Supongamos que la media muestral que se obtiene es igual a 100.
Calcularemos diferentes IC para la media poblacional:
n

40

100

1.96

Efecto de la desviacin estndar:

1.

Fijamos un nivel de confianza del 95%

0.05

Linf

Punto
medio

Lsup

Longitud

Semilongitud

0.79

98.45

100.00

101.55

3.10

1.55

15

2.37

95.35

100.00

104.65

9.30

4.65

25

3.95

92.25

100.00

107.75

15.50

7.75

aumenta

Linf

Lsup
X

Linf

Linf

Lsup
Lsup

Efecto del nivel de confianza:

2.

Fijamos una desviacin estndar

Nivel

15

2.37

Linf

Punto
medio

Lsup

Longitud

Semilongitud

0.10

1.6449

96.10

100.00

103.90

7.80

3.90

95%

0.05

1.9600

95.35

100.00

104.65

9.30

4.65

99%

0.01

2.5758

93.89

100.00

106.11

12.22

6.11

aumenta

90%

Linf

Lsup

Linf

Lsup

Linf

3.

Lsup

Efecto del tamao de muestra: n


Fijamos:

un nivel de confianza del 95%


una desviacin estndar

0.05

1.96

15

Linf

Punto
medio

Lsup

Longitud

Semilongitud

20

3.35

93.43

100.00

106.57

13.15

6.57

40

2.37

95.35

100.00

104.65

9.30

4.65

80

1.68

96.71

100.00

103.29

6.57

3.29

disminuye

Linf

Lsup

Linf

Lsup

Linf

Lsup
8

CASO 2: VARIANZA (2) DESCONOCIDA


Si X y S son la media y la desviacin estndar de una muestra aleatoria de tamao n, tomada de una
distribucin normal con varianza 2 desconocida, hallaremos un intervalo de confianza del 100 (1)% para :
X1, X2, ...Xn ~ N(,2)

X ~ N ( ,

X
~ t ( n 1)
S
n

donde:

p(t (n 1) t
t(n-1)

, n 1

n = tamao muestral

-t/2

1-

p(t
2

, n 1

t/2

X
t ) 1
, n 1
S
2
n

p ( X t
2

X t

S
n

, n 1

S
, n 1

) 1

Entonces un IC al 100(1-) para es:


X t
2

S
, n 1

X t
2

S
n

, n 1

NOTA: INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIN


Si se tiene:

X v.a. tal que:


E(X) =
Una m.a. de tamao n de la v.a. X:
X : la media muestral

Var(X) = 2
X1, X2, ...Xn

Entonces, si n es grande, un IC al 100 (1 - ) % para viene dado por:


X z / 2

X z / 2

Justificacin: Teorema del lmite central


Sea:

S: la desviacin estndar muestral

Entonces si n es grande, una buena aproximacin de un intervalo de confianza al 100 (1) % para
viene dado por:
X z / 2 S / n X z / 2 S / n

Adems:
Esta aproximacin seguir siendo adecuada an cuando la distribucin de la poblacin (v.a. X) no
sea normal (TLC).
9

INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIN NORMAL:


Si S2 es la varianza muestral de una muestra de tamao n de una variable aleatoria X normal con
varianza 2. Entonces se va hallar un intervalo de confianza del 100 (1 - ) % para 2 (varianza
poblacional):
1.

X1, X2, ...Xn ~ N(,2)


n

2.

S
2

(X
i 1

(n 1) S 2

X )2

~ 2 (n 1)

n 1

2(n-1)

p(

(n 1) S 2

2 2

2
2 1

2 )

Entonces un IC al 100(1) para es:


2

1 S

2
2

donde:

p( 2 (n 1) 2 )
2

, n 1

n = tamao muestral

10

1 S
2
1

, n 1

INTERVALO DE CONFIANZA PARA UNA PROPORCIN (MUESTRAS GRANDES)


Sea p la proporcin observada de xitos en una muestra aleatoria de n observaciones procedentes
de una poblacin con una proporcin p de xitos.
Sea X = Nro. de xitos en la muestra

X ~ B(n,p)

Si n es grande, aplicando el TLC: X ~ N(np,np(1-p))

p(1 p)
X
~ N ( p,
)
n
n

p p

p (1 p )
n

~ N (0,1)

donde:

p( Z z )

N(0,1)

1-

p( z
2

z/2

-z/2

p p
p (1 p )
n

z ) 1
2

Un intervalo de confianza para p al 100(1)% es:

p z
2

p (1 p )
p (1 p )
p p z
n
n
2

11

CORRECCIN POR FINITUD PARA LOS IC


Para poblaciones finitas la longitud de los intervalos de confianza hallados anteriormente se debe
modificar multiplicndola por el factor de correccin: f
f=

N n
N 1

al cual se denomina factor de correccin para poblaciones finitas.


Con lo cual se obtiene:
1)

IC para la Media poblacional


Si la poblacin es finita (N elementos), un IC aproximado al 100 (1 - ) % para
cuando n es grande es:

N n
N n

IC X z
, X z
N
1
N
1

n
n

2
2
2)

Para proporciones
El IC al 100 (1 - ) % para p M es:
N

p 1 p N n
p 1 p N n

IC p z
, p z

n
N
1
n
N
1

2
2

12

T AMAO

DE LA

M UESTRA

: estimacin puntual del parmetro poblacional

= | X | = error al estimar
Un IC para al 100 (1 - ) % implica:
una confianza del 100 (1 - ) % que el intervalo contiene a

I.C.:

Ls

Li

Si llamamos e al mximo error posible:

tenemos una confianza del 100 (1 - ) % que:

e z
2

N n
N 1

Se puede especificar un valor para e (margen de error) y hallar el valor de n que corresponda.

Dados e y , despejamos n y obtenemos:


Cuando N

z2 2

n n0

2
2

n0 N
n0 N 1

n0 N
n0 N 1

En el caso de las proporciones:


Cuando N
n n0

Para N finito:

Para N finito:

z2 p 1 p
2

e2

Problema:

desconocida

se conoce al tomar la muestra

Soluciones:
1)
Muestra piloto
2)
Alguna estimacin de la variable pero al final se calcula e
3)
En el caso de las proporciones:
mx n
p 1

13

Ejemplos
1.

Se va a adquirir un lote de 500 bolsas de un material de construccin, las cuales deben cumplir
ciertas especificaciones relacionadas al peso del material contenido.
Como no es posible pesar todas las bolsas, se va a tomar una m.a. del lote para estimar el peso
promedio de las bolsas.
Se sabe que el peso de una bolsa del material es una v.a. con distribucin normal y se supone que
la desviacin tpica del peso de una bolsa es de 0.2 kg.
Determine el tamao de muestra necesaria para estimar el peso promedio con una confianza del
95% y un margen de error mximo de 40 gr.

2.

Se han efectuado varios cambios a nivel curricular para las especialidades de una facultad y se
desea conocer el nivel de aprobacin de parte del alumnado (alumnos a favor de cada uno de los
cambios).
La facultad cuenta con 3,014 alumnos y se va a tomar una muestra para la medicin del objetivo
mencionado.
A cuntos alumnos se debe encuestar para tener una informacin adecuada con un margen de
error no mayor a un 5% y un nivel de confianza del 90 %

14