Está en la página 1de 42

Dr. Luis Paihua M.

1
Dr. Luis Paihua Montes
MUESTRA ALEATORIA: Una muestra aleatoria es
aquella que se obtiene de forma tal que cada
observación disponible en la población tenga la
misma posibilidad de ser seleccionada

DISEÑOS DE MUESTRA

Muestreo aleatorio simple (M.A.S.)


Muestreo sistemático (M.S.)


 Proporcional (M.E.P.)
Muestreo estratificado Desproporcionada (M.E.D)
 
Muestreo por conglomerado (M.C.)
M.A.S.: (Técnica de la urna) cada elemento de la
población es simbolizada por una ficha numerada de
1 a N, esta fichas se ponen en una urna se mezcla
bien y se extrae una a una (con reposición) cada
ficha que sale identifica un elemento de la población,
el proceso finaliza cuando tenemos el tamaño de la
muestra

M.S. : Los elementos de la población están en un


orden (numerados) enseguida se selecciona un
elemento digamos la número “p”, a partir de ella se
van tomando la “ j*k” ésima siguiente j=1,2,..n-1
siendo “n” el tamaño de la muestra y k la razón de
muestreo, observar que k=[N/n]
Muetreo Estratificado: Una población heterogénea
es conveniente clasificarlo en grupos más
homogéneos denominados ESTRATOS.
Si en cada estrato la razón de muestreo es
proporcional a los elementos del estrato tenemos
un M.E.P.
Si en cada estrato la razón de muestreo es
inversamente relacionado con la homogeneidad
tendremos un M.E.D.
M.C.: A partir de la población se selecciona
aleatoriamente grupos que se denominan
CONGLOMERADOS (población en miniatura,
unidades primarias de muestreo)
Si todo lo seleccionado es la muestra tenemos un
M.C. de una sola etapa (unietápico)
Si se toma una submuestra en cada conglomerado y
esta forma la muestra tenemos un M.C. de 2 etapas
(bietápico)
En general cuando la muestra a estudiar es
submuestra de etapas anteriores tenemos un M.C.
polietápico
La inferencia estadística se descompone
en dos áreas:
 La estimación de los parámetros de
una población.
 La prueba de hipótesis, que constituye
el proceso relacionado con aceptar o
rechazar declaraciones acerca de los
parámetros de la población.
REGLA DE LA NORMAL

Para una distribución de frecuencias


simétrica en forma de una campana,
aproximadamente 68% de los datos caerán
en el intervalo formado por una desviación
típica medida a partir de la media, 95% de
los datos caerán en el intervalo medido a
dos desviaciones típicas a partir de la
media y casi 100% de los datos caerán
dentro del intervalo medido a tres
desviaciones típicas a partir de la media.
Ley Débil de los Grandes Números

Sea X la v.a. con media μ y varianza finita σ2 ,


dados dos números pequeños ε y δ, si:

 2
n 2 Tenemos:
 

P| X n   |    1  

Xn Media de la muestra de tamaño n


Teorema Central del Límite

Sea X la v.a. con media μ y varianza finita σ2

Xn media de una muestra de tamaño n

Xn  
Yn  n   Z  N (0 ,1)
TIENDE


DISTRIBUCIONES MUESTRALES

Si x1,x2,…,xn es una m.a. de una N(µ,σ2)

X  N  ,  2
n Z 
X 

n
n 1
 2
n 1  s 2
E (s )  
2 2
 2

X 
Tn 1 
s
n
ESTIMACIÓN PUNTUAL

x i
Estimador de X  i 1
verific a E( X )  
µ: n

Estimador de
 (x  X ) i
2

s 
2 i 1
, E (s )  
2 2
σ2 n 1
Desviación estándar de la media muestral

Población N n    N tamaño de la población


X   
finita: N 1  n  n tamaño de la muestra

Población 
X 
infinita: n

La última expresión puede emplearse incluso para


población finita si (n/N)≤0.05 (n ≤ del 5% de N)
Distribución muestral de proporciones

x x n° de elementos de la
p característica de interés
n

Población N n  p(1  p)  N tamaño de la población


p   
finita: N 1  n  n tamaño de la muestra

Población p(1 p)
p 
infinita: n

La última expresión puede emplearse incluso para


población finita si (n/N)≤0.05 (n ≤ del 5% de N)
Distribución muestral de proporciones

Cuando np ≥ 5 y n(1-p)≥5 la distribución p


de
Es aproximadamente una normal con media p
y varianza p(1-p).
ESTIMACIÓN POR INTERVALOS para μ
Confianza del (1-α)100%
N(0 , 1)
Cuando se conoce σ2

 
X  z / 2    X  z / 2
n n

 z /2 z / 2


Margen de error: z / 2
n
ESTIMACIÓN POR INTERVALOS para μ
Confianza del (1-α)100%
Cuando no se conoce σ2 T-Student

s s
X  t / 2    X  t / 2
n n

t (n -1) gradosde libertad t /2 t / 2

s
Margen de error: t / 2
n
ESTIMACIÓN POR INTERVALOS para σ

(n  1) s 2
(n  1) s 2
 
2

b a
P (  n21  b)  1   / 2
donde
P (  n21  a)   / 2

Estimación por intervalo de una proporción

p (1  p ) p (1  p )
p  z / 2  p  p  z / 2
n n
Decisión mediante el intervalo confidencial

Una compañía fabricante de harina la empaca en


bolsas de papel. Se desea estimar el verdadero peso
medio de las bolsas. Una muestra de 25 bolsas da una
media de 24.5 libras, con una desviación estándar de
1.5 libras. Obténgase un intervalo confidencial de 99%
para μ. Con los resultados obtenidos, ¿podría afirmar
que el peso medio de las bolsas es 25 libras?

Con 24 grados de libertad tα/2 es: t0.005  2.797


Y con los datos se tiene

23.66    25.54
Con cierta incertidumbre se puede afirmar que μ es 25 libras
ESTIMACIÓN POR INTERVALOS para la
diferencia de medias μ1-μ2
Confianza del (1-α)100%
N(0 , 1)

Cuando se conoce σ1 y σ2

 2
 2
 1   2 : X 1  X 2  z / 2 1
 2
n1 n2

 z /2 z / 2

Margen de error: z / 2
n
ESTIMACIÓN POR INTERVALOS para la
diferencia de medias μ1-μ2
Confianza del (1-α)100%

Cuando no se conoce σ1 , σ2
T-Student

2 2
s s
 1   2 : X 1  X 2  t / 2 1
 2
n1 n 2
t con gl grados de libertad
2
 s12 s22 
   t /2 t / 2
 n1 n2 
gl= 2 2
1  2
s1  1  2
s2 
     gl redondeado por defecto
n1  1  n1  n2  1  n2 
Tamaño de una muestra n


σ conocido E  z / 2 el margen de error
n
( z / 2 ) 
2 2
Luego para un valor de E se tiene n 2
E

Tamaño de la muestra

p(1 p)
Resolviendo: E  z /2
n

( z / 2 ) 2 p * (1  p*) p* valor estimado


Se tiene: n
E2 de p
Cuando la muestra aleatoria proviene de una población
finita de tamaño N la estimación del error estándar es

N n  s 
sx   
N  n

Para el tamaño de la N n  s 
E2
muestra resolver N  n 

Ns 2
n
Obteniéndose:  E2 
N    s 2
 4 
Dr. Luis Paihua
Pasos básicos en pruebas de hipótesis

 Identificación del patrón de la distribución de


la población: Paramétrico: Distribución identificada.
No paramétrico: Distribución libre.

 Planteamiento de las hipótesis.


 Especificación del nivel de significación.
 Planteamiento de la regla de decisión.
 Toma de decisiones.
Ejemplo de aplicación

Una planta manufacturera produce cierto tipo de


fusibles. Se sabe que la duración media de éstos
se distribuye normalmente con media 1000 h y
desviación típica de 100 h. Se instala un nuevo
proceso de producción y se espera que los
fusibles producidos tengan una duración de
1100 h. Se selecciona aleatoriamente una
muestra de 25 fusibles obtenidos mediante el
nuevo proceso y se obtiene una media de 1050
h. ¿Qué puede comentar sobre el nuevo
proceso?
Identificación del patrón de la distribución de la
población:
Se sabe que la población es N(μ,σ2) siendo
μ=1000, σ=100

Planteamiento de las hipótesis:


Hipótesis nula: H0 es la declaración tentativa de
que el parámetro es igual a un valor específico, la
afirmación que queremos rechazar o aceptar.
Hipótesis alternativa: H1 es la declaración
tentativa de que el parámetro de la población tiene
un valor diferente del especificado en la hipótesis
nula.
 H 0 :   1000  0

 H1 :   1100
Especificación del nivel de significación.

Normalmente se fija una confianza del γ=(1-


α)100%, al valor α se le llama nivel de significación
En una prueba estadística hay dos tipos de error, el
error tipo I considerado el peor de los errores se fija
con el valor α

Situación en la población

H0 H1 verdadera
P[Re ch H 0 / H 0 es V ]  
verdadera
Se Decisión
acepta Correcta Error tipo II P[ No Re ch H 0 / H 0 es F ]  
Decisión

H0

Se
rechaza Error tipo I Decisión Potencia del test=1-β
H0 Correcta
x En la figura se muestran las áreas
representando α y β. Observar que si
α aumenta β disminuye en cambio si
α disminuye β aumenta


  1000 x


  1100
Planteamiento de la regla de decisión
Se basa en el estadístico de prueba, que es una v.a.
muestral, con ella se determina la región llamada
crítica (parte sombreada del gráfico) se emplea el
valor α que se fija, hagamos α=0.025

x  0
x  N (0 , / n)  Z 
2

/ n

Regla de decisión:
 Rechaza H0 si z ≥1.96
  1000
z  1.96
Toma de decisiones.
Con los datos se evalúa el valor de z
1050  1000
z  2.5
100 / 25
  
P[ Z  z ]    P  x    z  
 n

Es decir se rechaza si x  1039.2


El error tipo II es: P[ x  1039.2 /   1100]  0.0012

La potencia del test es:0.9988


Prueba de una cola

De la cola inferior De cola superior

H 0 :   0  H 0 :   0
 
 H1 :   0  H1 :    0

 

Valor crítico

Valor crítico
Prueba de dos colas

 H 0 :   0

 H1 :    0

 /2  /2

Valor crítico Valor crítico


El valor crítico se determina empleando el
estadístico adecuado, según se o no se
conozca la varianza población.

X  0 Si la varianza es conocida.
Z 

n

X  0
Tn 1  Si la varianza es desconocida.
s
n
En la prueba de hipótesis para la proporción
poblacional, se emplea el estadístico:

p  p0
Z
p0 (1  p0 )
n

En cualquiera de los casos de una cola ó dos colas.


Prueba para la varianza

(n  1) s 2
El estadístico que se emplea es:   2

2
Con (n-1) grados de libertad.

La región crítica es de tamaño α.


 H 0 :  2   02

 H1 :  2   02

P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  b ]  

Decisión: Se rechaza H0 si el valor del estadístico es


mayor a la lectura b es decir si χ2>b
 H 0 :  2   02

H
 1 :  2
  2
0

P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  a ]  

Decisión: Se rechaza H0 si el valor del estadístico es


menor a la lectura a es decir si χ2<a
 H 0 :  2   02

H
 1 :  2
  2
0

P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  b ]   / 2


P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  a ]   / 2

/2 /2

a b
Decisión: Se rechaza H0 si χ2>b ó χ2<a
PRUEBA PARA LA BONDAD DE AJUSTE

Consiste en que la hipótesis nula especifica un distribución


conocida y la alternativa afirma que la muestra no proviene
de la distribución indicada.
La prueba implica la clasificación en J clases los datos
muestrales en una distribución de frecuencias denominada
frecuencias observadas (Oj) , estas se comparan con las
frecuencias esperadas (Ej) que se determinan a partir de la
distribución teórica especificada. El estadístico a emplear
es:
(O j  E j )
 
2

jJ Ej El índice j indica la clase j.


 H 0 : x  Distribución f ( x)

 H1 : x no sigue la distribución f(x)

P[Re ch H 0 / H 0 es V ]  P[  (2J 1, )  b ]  

Decisión: Se rechaza H0 si el valor del estadístico es


mayor a la lectura b es decir si χ2>b

También podría gustarte