MuestrasEstadísticas

Dr. Luis Paihua M.
1
Dr. Luis Paihua Montes
MUESTRA ALEATORIA: Una muestra aleatoria es
aquella que se obtiene de forma tal que cada
observación disponible en la población tenga la
misma posibilidad de ser seleccionada
DISEÑOS DE MUESTRA
Muestreo aleatorio simple (M.A.S.)

Muestreo sistemático (M.S.)


 Proporcional (M.E.P.)
Muestreo estratificado Desproporcionada (M.E.D)
 
Muestreo por conglomerado (M.C.)
M.A.S.: (Técnica de la urna) cada elemento de la
población es simbolizada por una ficha numerada de
1 a N, esta fichas se ponen en una urna se mezcla
bien y se extrae una a una (con reposición) cada
ficha que sale identifica un elemento de la población,
el proceso finaliza cuando tenemos el tamaño de la
muestra
M.S. : Los elementos de la población están en un

orden (numerados) enseguida se selecciona un
elemento digamos la número “p”, a partir de ella se
van tomando la “ j*k” ésima siguiente j=1,2,..n-1
siendo “n” el tamaño de la muestra y k la razón de
muestreo, observar que k=[N/n]
Muetreo Estratificado: Una población heterogénea
es conveniente clasificarlo en grupos más
homogéneos denominados ESTRATOS.
Si en cada estrato la razón de muestreo es
proporcional a los elementos del estrato tenemos
un M.E.P.
Si en cada estrato la razón de muestreo es
inversamente relacionado con la homogeneidad
tendremos un M.E.D.
M.C.: A partir de la población se selecciona
aleatoriamente grupos que se denominan
CONGLOMERADOS (población en miniatura,
unidades primarias de muestreo)
Si todo lo seleccionado es la muestra tenemos un
M.C. de una sola etapa (unietápico)
Si se toma una submuestra en cada conglomerado y
esta forma la muestra tenemos un M.C. de 2 etapas
(bietápico)
En general cuando la muestra a estudiar es
submuestra de etapas anteriores tenemos un M.C.
polietápico
La inferencia estadística se descompone
en dos áreas:
 La estimación de los parámetros de
una población.
 La prueba de hipótesis, que constituye
el proceso relacionado con aceptar o
rechazar declaraciones acerca de los
parámetros de la población.
REGLA DE LA NORMAL
Para una distribución de frecuencias

simétrica en forma de una campana,
aproximadamente 68% de los datos caerán
en el intervalo formado por una desviación
típica medida a partir de la media, 95% de
los datos caerán en el intervalo medido a
dos desviaciones típicas a partir de la
media y casi 100% de los datos caerán
dentro del intervalo medido a tres
desviaciones típicas a partir de la media.
Ley Débil de los Grandes Números
Sea X la v.a. con media μ y varianza finita σ2 ,

dados dos números pequeños ε y δ, si:
 2
n 2 Tenemos:
 
P| X n   |    1  
Xn Media de la muestra de tamaño n

Teorema Central del Límite
Sea X la v.a. con media μ y varianza finita σ2
Xn media de una muestra de tamaño n
Xn  
Yn  n   Z  N (0 ,1)
TIENDE

DISTRIBUCIONES MUESTRALES
Si x1,x2,…,xn es una m.a. de una N(µ,σ2)
X  N  ,  2
n Z 
X 

n
n 1
 2
n 1  s 2
E (s )  
2 2
 2
X 
Tn 1 
s
n
ESTIMACIÓN PUNTUAL
x i
Estimador de X  i 1
verific a E( X )  
µ: n
Estimador de
 (x  X ) i
2
s 
2 i 1
, E (s )  
2 2
σ2 n 1
Desviación estándar de la media muestral
Población N n    N tamaño de la población

X   
finita: N 1  n  n tamaño de la muestra
Población 
X 
infinita: n
La última expresión puede emplearse incluso para

población finita si (n/N)≤0.05 (n ≤ del 5% de N)
Distribución muestral de proporciones
x x n° de elementos de la
p característica de interés
n
Población N n  p(1  p)  N tamaño de la población

p   
finita: N 1  n  n tamaño de la muestra
Población p(1 p)
p 
infinita: n
La última expresión puede emplearse incluso para

población finita si (n/N)≤0.05 (n ≤ del 5% de N)
Distribución muestral de proporciones
Cuando np ≥ 5 y n(1-p)≥5 la distribución p

de
Es aproximadamente una normal con media p
y varianza p(1-p).
ESTIMACIÓN POR INTERVALOS para μ
Confianza del (1-α)100%
N(0 , 1)
Cuando se conoce σ2
 
X  z / 2    X  z / 2
n n
 z /2 z / 2

Margen de error: z / 2
n
ESTIMACIÓN POR INTERVALOS para μ
Cuando no se conoce σ2 T-Student
s s
X  t / 2    X  t / 2
n n
t (n -1) gradosde libertad t /2 t / 2
s
Margen de error: t / 2
n
ESTIMACIÓN POR INTERVALOS para σ
(n  1) s 2
(n  1) s 2
 
2
b a
P (  n21  b)  1   / 2
donde
P (  n21  a)   / 2
Estimación por intervalo de una proporción
p (1  p ) p (1  p )
p  z / 2  p  p  z / 2
n n
Decisión mediante el intervalo confidencial
Una compañía fabricante de harina la empaca en

bolsas de papel. Se desea estimar el verdadero peso
medio de las bolsas. Una muestra de 25 bolsas da una
media de 24.5 libras, con una desviación estándar de
1.5 libras. Obténgase un intervalo confidencial de 99%
para μ. Con los resultados obtenidos, ¿podría afirmar
que el peso medio de las bolsas es 25 libras?
Con 24 grados de libertad tα/2 es: t0.005  2.797

Y con los datos se tiene
23.66    25.54
Con cierta incertidumbre se puede afirmar que μ es 25 libras
ESTIMACIÓN POR INTERVALOS para la
diferencia de medias μ1-μ2
N(0 , 1)
Cuando se conoce σ1 y σ2
 2
 2
 1   2 : X 1  X 2  z / 2 1
 2
n1 n2
 z /2 z / 2

Margen de error: z / 2
n
ESTIMACIÓN POR INTERVALOS para la
diferencia de medias μ1-μ2
Cuando no se conoce σ1 , σ2
T-Student
2 2
s s
 1   2 : X 1  X 2  t / 2 1
 2
n1 n 2
t con gl grados de libertad
2
 s12 s22 
   t /2 t / 2
 n1 n2 
gl= 2 2
1  2
s1  1  2
s2 
     gl redondeado por defecto
n1  1  n1  n2  1  n2 
Tamaño de una muestra n

σ conocido E  z / 2 el margen de error
n
( z / 2 ) 
2 2
Luego para un valor de E se tiene n 2
E
Tamaño de la muestra
p(1 p)
Resolviendo: E  z /2
n
( z / 2 ) 2 p * (1  p*) p* valor estimado

Se tiene: n
E2 de p
Cuando la muestra aleatoria proviene de una población
finita de tamaño N la estimación del error estándar es
N n  s 
sx   
N  n
Para el tamaño de la N n  s 
E2
muestra resolver N  n 
Ns 2
n
Obteniéndose:  E2 
N    s 2
 4 
Dr. Luis Paihua
Pasos básicos en pruebas de hipótesis
 Identificación del patrón de la distribución de

la población: Paramétrico: Distribución identificada.
No paramétrico: Distribución libre.
 Planteamiento de las hipótesis.

 Especificación del nivel de significación.
 Planteamiento de la regla de decisión.
 Toma de decisiones.
Ejemplo de aplicación
Una planta manufacturera produce cierto tipo de

fusibles. Se sabe que la duración media de éstos
se distribuye normalmente con media 1000 h y
desviación típica de 100 h. Se instala un nuevo
proceso de producción y se espera que los
fusibles producidos tengan una duración de
1100 h. Se selecciona aleatoriamente una
muestra de 25 fusibles obtenidos mediante el
nuevo proceso y se obtiene una media de 1050
h. ¿Qué puede comentar sobre el nuevo
proceso?
Identificación del patrón de la distribución de la
población:
Se sabe que la población es N(μ,σ2) siendo
μ=1000, σ=100
Planteamiento de las hipótesis:

Hipótesis nula: H0 es la declaración tentativa de
que el parámetro es igual a un valor específico, la
afirmación que queremos rechazar o aceptar.
Hipótesis alternativa: H1 es la declaración
tentativa de que el parámetro de la población tiene
un valor diferente del especificado en la hipótesis
nula.
 H 0 :   1000  0

 H1 :   1100
Especificación del nivel de significación.
Normalmente se fija una confianza del γ=(1-

α)100%, al valor α se le llama nivel de significación
En una prueba estadística hay dos tipos de error, el
error tipo I considerado el peor de los errores se fija
con el valor α
Situación en la población
H0 H1 verdadera
P[Re ch H 0 / H 0 es V ]  
verdadera
Se Decisión
acepta Correcta Error tipo II P[ No Re ch H 0 / H 0 es F ]  
Decisión
H0
Se
rechaza Error tipo I Decisión Potencia del test=1-β
H0 Correcta
x En la figura se muestran las áreas
representando α y β. Observar que si
α aumenta β disminuye en cambio si
α disminuye β aumenta

  1000 x

  1100
Planteamiento de la regla de decisión
Se basa en el estadístico de prueba, que es una v.a.
muestral, con ella se determina la región llamada
crítica (parte sombreada del gráfico) se emplea el
valor α que se fija, hagamos α=0.025
x  0
x  N (0 , / n)  Z 
2
/ n
Regla de decisión:
 Rechaza H0 si z ≥1.96
  1000
z  1.96
Toma de decisiones.
Con los datos se evalúa el valor de z
1050  1000
z  2.5
100 / 25
  
P[ Z  z ]    P  x    z  
 n
Es decir se rechaza si x  1039.2

El error tipo II es: P[ x  1039.2 /   1100]  0.0012
La potencia del test es:0.9988

Prueba de una cola
De la cola inferior De cola superior
H 0 :   0  H 0 :   0
 
 H1 :   0  H1 :    0
 
Valor crítico

Valor crítico
Prueba de dos colas
 H 0 :   0

 H1 :    0
 /2  /2
Valor crítico Valor crítico

El valor crítico se determina empleando el
estadístico adecuado, según se o no se
conozca la varianza población.
X  0 Si la varianza es conocida.
Z 

n
X  0
Tn 1  Si la varianza es desconocida.
s
n
En la prueba de hipótesis para la proporción
poblacional, se emplea el estadístico:
p  p0
Z
p0 (1  p0 )
n
En cualquiera de los casos de una cola ó dos colas.

Prueba para la varianza
(n  1) s 2
El estadístico que se emplea es:   2
2
Con (n-1) grados de libertad.
La región crítica es de tamaño α.

 H 0 :  2   02

 H1 :  2   02
P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  b ]  
Decisión: Se rechaza H0 si el valor del estadístico es

mayor a la lectura b es decir si χ2>b
 H 0 :  2   02

H
 1 :  2
  2
0
P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  a ]  

menor a la lectura a es decir si χ2<a
 H 0 :  2   02

H
 1 :  2
  2
0
P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  b ]   / 2

P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  a ]   / 2
/2 /2
a b
Decisión: Se rechaza H0 si χ2>b ó χ2<a
PRUEBA PARA LA BONDAD DE AJUSTE
Consiste en que la hipótesis nula especifica un distribución

conocida y la alternativa afirma que la muestra no proviene
de la distribución indicada.
La prueba implica la clasificación en J clases los datos
muestrales en una distribución de frecuencias denominada
frecuencias observadas (Oj) , estas se comparan con las
frecuencias esperadas (Ej) que se determinan a partir de la
distribución teórica especificada. El estadístico a emplear
es:
(O j  E j )
 
2
jJ Ej El índice j indica la clase j.

 H 0 : x  Distribución f ( x)

 H1 : x no sigue la distribución f(x)
P[Re ch H 0 / H 0 es V ]  P[  (2J 1, )  b ]  

mayor a la lectura b es decir si χ2>b

MuestrasEstadísticas

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

MuestrasEstadísticas

Cargado por

Copyright:

Formatos disponibles

Dr. Luis Paihua M.

Muestreo aleatorio simple (M.A.S.)

M.S. : Los elementos de la población están en un

Para una distribución de frecuencias

Sea X la v.a. con media μ y varianza finita σ2 ,

Xn Media de la muestra de tamaño n

Sea X la v.a. con media μ y varianza finita σ2

Xn media de una muestra de tamaño n

Si x1,x2,…,xn es una m.a. de una N(µ,σ2)

Población N n    N tamaño de la población

La última expresión puede emplearse incluso para

Población N n  p(1  p)  N tamaño de la población

La última expresión puede emplearse incluso para

Cuando np ≥ 5 y n(1-p)≥5 la distribución p

t (n -1) gradosde libertad t /2 t / 2

Estimación por intervalo de una proporción

Una compañía fabricante de harina la empaca en

Con 24 grados de libertad tα/2 es: t0.005  2.797

( z / 2 ) 2 p * (1  p*) p* valor estimado

 Identificación del patrón de la distribución de

 Planteamiento de las hipótesis.

Una planta manufacturera produce cierto tipo de

Planteamiento de las hipótesis:

Normalmente se fija una confianza del γ=(1-

Es decir se rechaza si x  1039.2

La potencia del test es:0.9988

De la cola inferior De cola superior

Valor crítico Valor crítico

En cualquiera de los casos de una cola ó dos colas.

La región crítica es de tamaño α.

P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  b ]  

Decisión: Se rechaza H0 si el valor del estadístico es

P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  a ]  

Decisión: Se rechaza H0 si el valor del estadístico es

P[Re ch H 0 / H 0 es V ]  P[  (2n 1, )  b ]   / 2

Consiste en que la hipótesis nula especifica un distribución

jJ Ej El índice j indica la clase j.

P[Re ch H 0 / H 0 es V ]  P[  (2J 1, )  b ]  

Decisión: Se rechaza H0 si el valor del estadístico es

También podría gustarte

( z / 2 ) 2 p * (1  p) p valor estimado