Está en la página 1de 106

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERIA ECONÓMICA

Curso:
Estadística Inferencial
MODULO I:
INTRODUCCION A LA TEORIA DEL MUESTREO,
Y DISTRIBUCION MUESTRALES
Docente del curso:

• Dr, Carlos Ramirez Cayro


Docente Principal de la F I E

Apuntes de clase 1
 POBLACIÓN .- Totalidad de las
observaciones, las cuales están en estudio.
 MUESTRA.- Parte representativa de la
población.
 Muestreo.- Es el procedimiento para
seleccionar una parte representativa de la
población, con el objeto de inferir
características de la población de la que
proviene la muestra

Apuntes de clase 2
ESTADISTICA
PROBABILIDAD
POBLACION (N)

MUESTREO INFERENCIA
ESTADÍSTICA
Ramón de la Cruz Yupanqui

MUESTRA
(n)
ESTADÍSTICA
DESCRIPTIVA
Apuntes de clase 3
Clasificación de los métodos de muestreo

Métodos de muestreo basados en probabilidades

1. Al azar simple 4. Al azar por conglomerados


 con reemplazamiento
. De igual tamaño
 sin reemplazamiento
. De desigual tamaño
2. Al azar sistemático
4. Al azar por etapas sucesivas
3. Al azar estratificado:
. Bietapico
 Si proporcional

 No proporcional
. Trietapico
4. Al azar por experimentación

Apuntes de clase 4
 Métodos de muestreo no basados en
probabilidades
 Basado en el criterio de los expertos

 Basado en el juzgamiento de unidades tipo

 Basado en cuotas

 Basado en el acaso

Apuntes de clase 5
Métodos de muestreo basados en probabilidades
 Al azar simple.- Se seleccionan la muestra
confiriendo a cada uno de las combinaciones
posibles de muestras, la misma probabilidad de ser
incluida en la muestra.
Ejem. Seleccionar muestra diferentes de 2
elementos a partir de una población de 5 elementos.

N = {A,B,C,D,E} c{5,2} = 4C2 = 10


n= 2 elementos ; P (muestra )= 2/5 ; P (A) = 2/5

Apuntes de clase 6
En este ejemplo cada unidad (letra) entra en 4
combinaciones luego la probabilidad de cada
muestra 4/10 = 2/5 = 0.4 luego la
probabilidad de que salga elegida cada
unidad de la muestra es 40%.
A B C D E

A AB AC AD AE

B BA BC BD BE

C CA CB CD CE

D DA DB DC DE

E EA EB EC ED

Apuntes de clase 7
Una muestra al azar simple puede obtenerse en
cualquiera de las siguientes formas:
 Mediante una ánfora: designamos por un
número o letra cada uno de las muestras,
anotamos en tarjetas y luego extremos sin mirar,
en esta forma obtenemos una muestra habiendo
evitado cualquier inclinación preferencial en la
elección de las unidades.
 Tabla de dígitos al azar: Se aplica por ejemplo
cuando n = 500 o mas por la dificultad de
utilizar el 1er método, para utilizar esta tabla
todas las unidades de la población son
numerados desde el 1 hasta N

Apuntes de clase 8
Por ejemplo:

 Suponiendo que se desea determinar una


muestra de la cantidad de ventas de las
tiendas mayoristas de una ciudad
 Empezaremos por conseguir la lista total
de las tiendas mayoristas, consideramos
que son 9000 las enumeramos del 1 al
9000; determinamos que el tamaño de
muestra n = 90, de acuerdo a los fondos
existentes, personal, precisión del
estudio;
Apuntes de clase 9
 Para determinar a quienes tendrán que encuestar
recurrimos a una tabla de dígitos al azar por lo que
tendremos que escoger por ejemplo de 5177,
2403, 45935, 3058, 358, 6493, 1563, 0944,
21639, 5053, etc
 Si son 2 cifras se consideran solo 2,si son 4 como
en el ejemplo se consideran 4 si se vuelve a
repetir un numero se pasa por alto

Apuntes de clase 10
 Ejemplos: Si n = 100 de un archivo de 200
paginas con 10 cuentas por pagina total 2000
cuentas se puede hacer que los 3 primeros
números indiquen el número de pagina y el 4°
al 6º el número de cuenta dentro de cada pagina.
 Si se cuenta con un terreno 200 metros de largo
y 100 metros de ancho, y deseamos seleccionar
una muestra.
 Seleccionamos 2 columnas en la tabla; los 3
primeros números de la 1ra columna para la
coordenada correspondiente al largo del campo
y los 2 primeros números de la segunda
columna para el ancho del campo, todos los
puntos de intersección son las parcelas
seleccionadas.

Apuntes de clase 11
 Algunas veces debe muestrearse un producto que
esta en sacos o que forma un montón en este caso
se debe homogenizar los sacos o el montón
después dividirlo en 2 partes a su vez en otras 2
y así sucesivamente, hasta obtener tantas partes
como se desea en el tamaño de muestra.
 En este caso si se trata de Sacos se puede extraer
varias unidades (2,3,4) unidades de muestra a
diferentes profundidades dadas de saco o de cada
2, 4 ó 6 sacos según sea el tamaño de muestra, la
tabla de dígitos al azar se puede dividir en
columnas que pueden significar el número de
saco, y la profundidad a la que se puede
seleccionar la muestra.
 Se debe notar que estas muestra puede ser con
reemplazamiento y sin reemplazamiento.
Apuntes de clase 12
Muestreo al azar sistemático
 En este muestro el azar juega su función solo al
elegirse el primer miembro de la muestra, las
elecciones posteriores se hacen en forma
sistemática.
 Si no se dispone de una lista de todas las
unidades de la población y si estos costos se
puede emplear este método.
 Lo primero que hay que hacer es determinar cada
cuantas unidades se va a seleccionar una unidad,
supongamos que se va a seleccionar 1 de cada
100 seleccionamos en la tabla de dígitos al azar el
primer número. Suponiendo que sea 35, tomando
como base este número seleccionamos las
unidades que resulten de sumas 100 al primer
número; estos serían 135, 235, 335, ..... etc.
Apuntes de clase 13
 La diferencia con el método al azar simple es
que con este método resulta un número
reducido de muestras diferentes posibles,
mientras que con el muestreo al azar simple el
N° puede llegar a millones.
 Ventajas
 Este método asegura que el muestreo se
extenderá a toda la población por igual.
 Es mas fácil se determinar el tamaño de
muestras puesto que solo requiere de un
número al azar.

Apuntes de clase 14
Desventajas
 Si la población presenta una variación periódica y
si el intervalo entre 2 unidades sucesivas en la
muestra sistemática llega a coincidir con la
longitud de onda o con un múltiplo de ella puede
ser que tengamos una muestra con marcado sesgo.
 Los resultados de un muestreo al azar sistemático
no dan confianza para estimar la desviación
estándar de la distribución de medios
Apuntes de clase 15
Muestreo Estratificado:
Razones principales para la estratificación
1. La estratificación se utiliza para disminuir
las varianzas de los estimadores
2. Se pueden formar estratos para aplicar
diferentes métodos y procedimientos de
muestreo dentro de ellos.
Ramón de la Cruz Yupanqui

3. Los estratos pueden establecerse por que se


pueden volver a sub-dividir en sub-
poblaciones definidas como “Dominios de
estudio”

Apuntes de clase 16
MUESTREO ALEATORIO ESTRATIFICADO ( MAE )

POBLACION ESTRATOS
ESTRATO 1
(hogares con
ingresos altos)
N1 n1

ESTRATO 2
(hogares con N2 n2
ingresos medios)

ESTRATO 3
(hogares con
ingresos bajos) N3 n3
Ramón de la Cruz Yupanqui

L
Tal que, N  N1  N 2  N 3  N  N
h 1
h

L
n  n1  n2  n3  n n
h 1
h

Apuntes de clase 17
NOTACION

L = número de estratos
N = número total de elementos en la población
Nh = número total de elementos en el estrato h
nh = número de elementos de la muestra en el
estrato h
X h i = i-ésima observación de la muestra en el
estrato h

Apuntes de clase 18
Muestreo al azar estratificado
 La estratificación es el proceso de dividir la
población en sub grupos (o estratos) a fin de
llevar a cabo procesos separados de muestreo
en cada uno de ellos.
 Uno de los objetivos de la estratificación es
disminuir el N° de casos en que la proporción
de las categorías de la muestra sea diferente a
las proporción de las categorías de la
población.
Apuntes de clase 19
 La estratificación es un medio de mejorar la
representatividad de la muestra. Para la
estratificación se requiere de una información
previa de la población. Así por ejemplo en el
estudio de la población estudiantil los criterios
para formar los estratos pueden ser edad, sexo,
nivel de estudio, especialización , etc.
 En este método el muestreo se divide a la
población en sub muestras esto pueden ser
proporcionales a no estratos o sub poblaciones.

Apuntes de clase 20
 Si es que no se conoce la variabilidad entre las
unidades dentro de los estratos entonces se
recomienda realizar el sub muestreo en forma
proporcional a los tamaños de los estratos. Pero
si se conoce que la variabilidad en unos estratos
es mayor que en otros entonces se recomienda
muestrear mas intensamente a los estratos con
mayor variabilidad.
 La información (suplementaria) que se adopte
debe ser de tal naturaleza que permita gran
uniformidad de las unidades dentro de cada
estrato y gran heterogeneidad entre estratos.
Apuntes de clase 21
 Cuando diferentes partes de la población
presentan diferentes problemas para hacer
listas, estas partes de la población pueden
servir de base para la estratificación, con la
ventaja de permitir manejar estos problemas
por separado.
 ejemplo: Si tenemos una población formado
por 2000 hombres y 8000, mujeres empleados
hemos sacado una muestra al azar simple n° =
100
 Población 10000 individuos, total de
remuneración de100 individuos de la muestra
441,084, promedio de la muestra 4,410.84

Apuntes de clase 22
 Saquemos una muestra dividida en dos sub
muestras de tamaño 20 hombres y 80 para
mujeres.
 En esta forma estamos haciendo una muestra
con estratificación de la población y en forma
proporcional al tamaño de los estratos los
resultados obtenidos serían:

Población Estratos Tamaño las Total Sueldos


muestras sueldos promedio
10000 2000 H 20 160,500 8,025
8,000 M 80 205120 2564
N= 10000 100 365620 3656.2

Apuntes de clase 23
 El promedio de la muestra X= 365, 620/100 =
3656.20
Observación:
 En el muestreo al azar simple puede haber en
la muestra una cantidad mayor de hombres
que de mujeres con la consiguiente elevación
en el promedio general de la población, lo que
no sucede con el muestreo estratificado con
sub muestras proporcionales a los estratos.
 Con este método se dominara totalmente la
población de obtener muestras totalmente no
representativas.

Apuntes de clase 24
 Con el muestreo no proporcional a los estratos
se toman muestras sub muestras de mayor
tamaño de aquellos estratos que tienen mayor
variabilidad que de aquellos que tienen menor
variabilidad. Esto se hace para que los
promedios de los estratos de mayor
variabilidad sean estimados con mayor
precisión.

Apuntes de clase 25
 Si en el ejemplo anterior la variabilidad de los
sueldos de los hombres oscila de 5000 a 18000
mientras que el de las mujeres de 1000 a 4000
considerando esto volvemos a muestrear pero
esta vez en forma desproporcional a los estratos
así el 4% de los hombres y el 0.25% de las
mujeres los resultados serían:

Población Estratos Tamaño Total Sueldos


las sueldos promedio
muestras
10000 2000 H 80 884004 11,061.30
8000 M 20 64816 3240.8

Apuntes de clase 26
 El promedio estimativo de la población es
X= (11,061.30) (2000) + 3240.8 (8000) = 4804.9
10000

siendo X los promedios y ni tamaño de los


estratos
 Conclusión.- Para el muestreo proporcional
y no proporcional se requiere conocer con
ciertas precisión el tamaño de los estratos, lo
cual constituye una seria limitación para el uso
del método; para el muestreo no proporcional
se necesita también conocer la variabilidad
dentro de cada estrato, lo cual resulta difícil.

Apuntes de clase 27
Muestreo al azar por conglomerados
 Es un método de seleccionar en el que las unidades
incluidas en la muestra son escogidas de la población
reunidas en grupos antes que individualmente. La
razón usual para la conglomeración es conseguir una
reducción en los costos de las entrevistas, escogiendo
para esto unidades que estén geográficamente cercanas
unas a otras.
 Primero hay que conglomerar las unidades del
universo y después seleccionar conglomerar en vez de
unidades individuales.
 En este método debe buscarse la menor homogeneidad
posible dentro de los conglomerados y la mayor
homogeneidad entre los conglomerados. Esto es lo
contrario de lo que debe hacerse en el muestreo por
estratificación.

Apuntes de clase 28
 Ejemplo.- Al seleccionar muestras para un estudio del
departamento de Puno.
 Se considera como grupos o conglomerados a los distrito
podemos considerar utilizando la tabla de dígitos al azar
n1 distritos y dentro de los distritos a n2 comunidades
entonces podría ser que n1 = 6 y n2 = 4 con lo que daría n
= 24 el tamaño de muestra, pero como lo que se desea es
reducir los costos si los estratos dentro de los
conglomerados, son homogéneos se puede encuestar a n1
= 4 distritos y dentro de cada distrito escoger 6
comunidades ya que estos se supone son elementos
heterogéneos entonces n1 = 4 n2 = 6 entonces n= 4 x 6=
24 habiéndose reducido los costos. Al elegir los
conglomerados puede ser de igual tamaño o de desigual
tamaño, usualmente los errores de muestreo son mayores
en los conglomerados mas grandes que en los mas
pequeños.
Apuntes de clase 29
Muestreo al azar en etapas sucesivas
 Es cuando intervienen 2 o mas métodos por
ejemplo el proceso de seleccionar una muestra
de conglomerados y luego hacer un muestreo
dentro de cada conglomerado para tener una
muestra de unidades, este muestreo involucra 2
ó tres tipos de muestreo, en este caso se
denominan bietapico, Trietapico y si son más de
tres Trietapico.

Apuntes de clase 30
Muestro al azar por experimentación o
muestreo con diseños experimentales
 Esta basado en diseños experimentales
basados en probabilidades sin embargo, c/u de
los diferentes tipos de diseño fija restricción a
la aplicación del Azar, restricciones que hace
que no diferencien uno de otros; diseño
simples “completamente randomizado y
otros complicados “latices”

Apuntes de clase 31
Métodos de muestreo no basados en
probabilidades

Métodos basados en el criterio de los


expertos
 Este método se basa en el criterio de los
expertos que deciden que una cierta
unidad, tal como una ciudad o área es
representativa de la sierra otra de la
costa, etc.

Apuntes de clase 32
Métodos basados en el juzgamiento de
unidades tipo
 Esta basado en el juzgamiento de las personas
que hacen la encuesta o muestreo.
 La elección de unidades tipo puede quedar al
libre criterio del encuestador o puede ser que
se fije ciertas restricciones tal como encuestar
individuos entre 35 a 45 años u otras
restricciones.
 Es poco costoso el inconveniente en que los
encuestadores deben tener un vasto
conocimiento de la estructura de la población
entera y buen juicio para el juzgamiento.

Apuntes de clase 33
Método de muestreo basado en cuotas
 En este método muy semejante al anterior

los entrevistados son instruidos en el sentido


de obtener cuotas mínimas y máximas de
unidades de cada tipo. Por ejemplo se puede
instruir al entrevistador para que obtenga
encuestas entre 50 a 60 personas varones de
30 a 50 años y que viven en cierta sección o
distrito de la ciudad.

Apuntes de clase 34
Método de muestreo basado en el acaso

 Este método requiere poco esfuerzo y dinero


y tiene el inconveniente de que quien lo
realiza desarrolla poco interés para que la
muestra represente a la población de este,
método hacer uso los periodistas de los
diarios cuando entrevistan a un grupo de
personas que generalmente son las que están
mas a su alcance en las calles y plazas de la
ciudad, generalmente sirve para muestras de
opiniones sobre tópicos especiales de
importancia con el fin de escribir un artículo
pero no debe utilizarse para estimar
poblaciones.

Apuntes de clase 35
DISTRIBUCIONES MUESTRALES

 De una población infinita o finita, es posible sacar


“n” muestras diferentes.
 Para cada muestra se puede calcular un estadístico
o estadística tal como la media, la desviación
típica, etc., de esta forma obtenemos una
distribución del estadístico que se conoce como
distribución muestral.

Apuntes de clase 36
 Si el estadístico que se halla es la media
muestral, la distribución se conoce como
distribución muestral de medias, así mismo
podríamos obtener las distribuciones muestrales
de las desviaciones típicas, varianzas medianas,
proporciones , etc.
 Para cada distribución muestral se puede
calcular la media, desviación típica, etc.

Apuntes de clase 37
DISTRIBUCION MUESTRAL DE MEDIAS

 Se denomina distribución muestral a la


distribución de probabilidad de un estadístico
calculado a partir de todas las posibles
muestras de tamaño “n”, elegidas al azar de
una población determinada.
 Esta distribución muestral del estadístico
desempeña un papel fundamental en la teoría
de la inferencia estadística.

Apuntes de clase 38
DISTRIBUCION MUESTRAL DE LA MEDIA
Esquemáticamente tenemos:
Muestras

X1

POBLA
CION X2
µx  µ
E( X ) = 
µ •.
•.

Xn

E(X) = x = 

Apuntes de clase 39
En general cuando estudiamos la distribución
muestral estamos interesados en conocer las
siguientes características:
 Su forma funcional (representación gráfica

de su función de densidad)
 Su media

 Su desviación estándar

Apuntes de clase 40
MEDIA Y VARIANZA DE UNA
DISTRIBUCIÓN MUESTRAL DE MEDIAS

 TEOREMA. Sea X1, X2, ... Xn, una muestra


aleatoria de tamaño “n” escogida. Si X es la
media muestral, entonces:
1. E(X) = ,
2. Var(X) = 2/n Población infinita
3. Para “n” suficientemente grande, la variable
X 
aleatoria: z   tiene distribución normal:
n
N(0,1)

Apuntes de clase 41
PRUEBA: Por la definición de muestra
aleatoria, las variables aleatorias X1, X2, ... Xn,
son independientes e idénticamente distribuidas
como f(x) con E(X)= , y con Var(X) = 2 .
Entonces:
1 n  1 n 1
E ( X )  E   X i   E ( X i )  n  
 n 1 i  n 1 i n

1 n  1 1
1  2
Var ( X )  V   X i   2 1i V ( X i )  n 2 n  2  n
 n 1 i  n
1

X  X
1 i
i  n
Z  
 
n n

Apuntes de clase 42
Teoremas:

1. La aproximación de X a la normal N(,2/n) es


buena si n  30, sin importar si la población es
discreta o continua.
2. Si la muestra aleatoria es escogida de una
población normal N(,2), entonces, la
distribución de X es exactamente normal N(,2),
para cualquier tamaño de muestra, n  2.

Apuntes de clase 43
3. La varianza de la media: Var (X)=2/n es
válida, si el muestreo es con o sin
reemplazo en una población infinita, (o es
con reemplazo en una población finita de
tamaño N).
Si el muestreo es sin reemplazo en una
población finita de tamaño N, entonces, la
varianza de la distribución de X es:

2  N  n 
 X2 
n  N  1 

Apuntes de clase 44
El coeficiente (N-n)/(N-1) se denomina
factor de corrección para población finita.
Cuando N  +  el factor de corrección
tiende a uno.
4. La desviación estándar de una estadística es
conocida como error estándar.

Apuntes de clase 45
Queda claro que:

 Para una población finita y si el muestreo es sin


reemplazamiento se tiene lo sgte (Np>n)

 Media µ x  µ
2 
 Np n
 Varianza  x 
2  
 
n  N p 1 
Donde:
Np= Tamaño de la población
n = Tamaño de la muestra.

Apuntes de clase 46
Para una población infinita y si el muestreo es
con reemplazamiento se tiene lo siguiente
(n≥30)
 Donde:
 Media µx 
 Varianza.  x2 
Donde:
Media de la distribución muestral de medias
µx  µ
Varianza de la distribución muestral de medias.
 2
 x2 
n
Apuntes de clase 47
Ejemplo

1. Una población se compone de 5 números


2,3,6,8,11, considerar todas las muestras
posibles de tamaño 2 que puedan extraerse con
remplazamiento de esta población. Hallar
a) La media de la población
b) La desviación típica de la población
c) La media de la distribución muestral de
medias
d) La desviación típica de la distribución
muestral de medias
Apuntes de clase 48
Solución
 a) Media de la población

x  x  x  x  ...  x  x 2  3  6  8  11 30
  6
 
i
1 2 3 4 5 i 1
5 5
N N

 b) Desviación típica de la población

Apuntes de clase 49
c) Media de la distribución muestral de Medias
Número de muestras con reemplazamiento (5)² = 25

Total de muestras Medias de las muestras


2 3 6 8 11

2 2,2 2,3 2,6 2,8 2,11 2.0 2.5 4.0 5.0 6.5
3 3,2 3,3 3,6 3,8 3,11 2.5 3.0 4.5 5.5 7.0
6 6,2 6,3 6,6 6,8 6,11 4.0 4.5 6.0 7.0 8.5
8 8,2 8,3 8,6 8,8 8,11 5.0 5.5 7.0 8.0 9.5
11 11,2 11,3 11,6 11,8 11,11 6.5 7.0 8.5 9.5 11.0

Media de la distribución muestral de medias

2  2,5  4  5  6,5  .......... ...9,5  11 150


   6
25 5
X

Apuntes de clase 50
 d) Desviación típica de la distribución
muestral de medias

n = número de muestras

 También se puede calcular a través de la


desviación estándar de la población

Apuntes de clase 51
Problema anterior en el caso de muestreo sin
reemplamiento
 a) Media de la población
n

x  x  x  x  ...  x  x 
2  3  6  8  11 30
 6
 
i
1 2 3 4 5 i 1

N N 5 5

 b) Desviación típica de la población

Apuntes de clase 52
c) Caso: muestreo sin reemplazamiento. 5C2 = 10

Total de muestras Medias de las muestras


2 3 6 8 11
2 2,3 2,6 2,8 2,11 2.5 4.0 5.0 6.5
3 3,6 3,8 3,11 4.5 5.5 7.0
6 6,8 6,11 7.0 8.5
8 8,11 9.5
11

Media de la distribución muestral de medias

2,5  4  5  6,5  .............9,5 60


   6
10 10
X

Apuntes de clase 53
 d) Desviación típica de la distribución muestral
de medias

n = número de muestras

 También se puede calcular a través de la


desviación estándar de la población

Apuntes de clase 54
Ejemplo2:

 Sea 1, 1, 1, 3, 4, 5, 6, 6, 6, 7 una población.


Se extrae una muestra de tamaño 36 con
reemplazamiento de una población.
Calcular:
1. La media µ y la desviación estándar σ de la
población.
2. La media µx y la desviación estándar σx de la
media muestral X.
3. P(3.6  X  4.4). (Rufino Moya. Página 576).

Apuntes de clase 55
Solución:
 La distribución de probabilidad de la
población es:
x= 1 3 4 5 6 7
.f(x)= 0.3 0.1 0.1 0.1 0.3 0.1
1. La media µ = 4; .σ = 2.2361
2. La media µx = 4; .σx = √5/36 = 0.372678
3. Como n = 36 > 30, tiene aproximadamente
una distribución normal con media µ = µx y σx
= σ√n luego:
 3.6  4 4.4  4 
P (3.6  X  4.4)  P  Z   P 1.07  Z  1.07   0.7154
 0 . 37268 0 . 37268 

Apuntes de clase 56
Ejemplo 3
 Una población esta formada por 4 números
3,7,11,15,considerar todas las posibles muestras de tamaño
2 que puedan extraerse de esta población con
reemplazamiento.
 Hallar
a) La media Poblacional
b) La desviación Típica Poblacional
c) La media de la Distribución muestral de Medias
d) La Desviación típica de la distribución muestral de medias

e) Calcular lo que se pide en el problema anterior pero sin


reemplazamiento

Apuntes de clase 57
n

x  x  x  x  ...  x  x
 
i
1 2 3 4 5 i 1

N N

Apuntes de clase 58
Ejemplo 4
 Supóngase que las alturas de 3000
estudiantes de una universidad se distribuyen
normalmente con media 68 pulgadas y
desviación típica 3 pulgadas, si se toma 80
muestras de 25 estudiantes cada una ¿Cuál
será la media y la desviación típica esperada
de la distribución muestral de medias
resultante si el muestreo se hizo:
 A) con reemplazamiento
 B) Sin reemplazamiento
Apuntes de clase 59
Ejemplo 5

A.- Los pesos de 1500 cojinetes de bolas se


distribuyen normalmente con una media de
22,40 onzas y desviación típica de 0,048
onzas. Si se extraen 300 muestras de tamaño
36 de esta población: determinar la media
esperada y la desviación típica de la
distribución muestral de medias si el
muestreo se hace
 a) con remplazamiento

 b) sin remplazamiento

Apuntes de clase 60
 Solución
a) con remplazamiento
µx = 22.40

b) Sin remplazamiento
µx = 22.40

Apuntes de clase 61
En el problema anterior ¿en cuantas de las
muestras al azar cabe esperar que las medias:
a) Estén entre 22,39 y 22,41 onzas

X
22,39 22,4 22,41

Z
-1.25 0 1.25

P(22.39 ≤ X ≤ 22.41) = P(-1.25 ≤ Z ≤ 1.25) = 0.7888

Nº de muestras = 0,7888 (300)= 236,64= 237

Apuntes de clase 62
b) Sea mayor de 22.42 onzas

 P(X ≥ 22.24) = P(Z ≥ 2.5) = 0.0062

 No de Muestras = 0.0062(300) = 2 muestras

22,4 22,42 x
Z
0 2,5

Apuntes de clase 63
c) Sea menor de 22.37 onzas

 P(X ≤ 22.37) = P(Z ≤ -3.75) = 0.0002

 No de Muestras = 0.00009(300) = 0.0027, o sea


ninguna muestra

x
22,37 22,4
z
-3,75 0

Apuntes de clase 64
Ejercicio 01:

El número de automóviles por familia es una


variable aleatoria X cuya distribución de
probabilidad es como sigue:
.x = 0 1 2 3 4
.f(x) =4/12 4/12 2/12 1/12 1/12
(M. Córdova Z. Página 12).
MEDIA 1.24
DESVIACION ESTANDAR
1.2332

Apuntes de clase 65
Sea X el número de automóviles por familia.
Determinar:

1. La media µ y la desviación estándar σ de la


población.1.25 1.2332
2. La media µx y la desviación estándar σx de la
media muestral X. 1.25 0.176
3. Si se escoge al azar una muestra de 49
familias, ¿Cuál es la probabilidad de que la
media muestral de autos por familia este entre
1 y 2?: P(1 X  2)
4. 0.92073

Apuntes de clase 66
Ejercicio 02:

 Una cadena de 250 tiendas a nivel nacional,


vende una marca muy conocida de calculadora
de bolsillo. Para poder lograr el máximo
descuento por volumen de compra, todas la
tiendas deben hacer un nuevo pedido de
calculadoras al mismo tiempo. La decisión
para el nuevo pedido, es hacer el pedido
cuando el inventario promedio de una muestra
de tiendas es menor de 25 calculadoras. (Rufino
Moya. Página 582).

Apuntes de clase 67
Con base a datos anteriores, se supone que
la desviación estándar es de 10
calculadoras. Si se selecciona una muestra
de 25 tiendas, ¿Cuál es la probabilidad que
se vuelva a ordenar el pedido de
calculadoras?.
1. Cuando el inventario promedio real de
todas las tiendas es de 30 calculadoras?
2. Cuando el inventario promedio real de
todas las tiendas es de 20 calculadoras?

Apuntes de clase 68
 EJERCICO 3
Una población esta formada por 4 números 3,7,11,15.
Considerar todas las muestras posibles de tamaño 2 que puedan
extraerse de estas población con reemplazamiento. Hallar:
a. La media poblacional
b. La desviación típica poblacional
c. La media de la distribución muestral de medias
d. La desviación típica de la distribución muestral de medias

 EJERCICIO 4
Resolver el problema si el muestreo es sin reemplazamiento
y hallar:
a. La media poblacional
b. La desviación típica poblacional
c. La media de la distribución muestral de medias
d. La desviación típica de la distribución muestral de medias

Apuntes de clase 69
DISTRIBUCIÓN MUESTRAL DE
PROPORCIONES

 Supongamos una población con distribución


binomial, donde:
P: probabilidad de éxito
q: probabilidad de fracaso y es igual a q = 1-p
 Por ejemplo la población puede ser todos los
posibles lanzamientos de una moneda en donde
p = 1/2.

Apuntes de clase 70
 Si se consideran todas las muestras posibles de
tamaño “n” extraídas de esta población, y para
cada muestra se determina la proporción p de
éxito, por ejemplo estamos interesados en que
aparezca cara entonces p es la probabilidad de
cara que aparece en n lanzamientos, esto se
obtiene una distribución muestral de
proporciones donde:

Apuntes de clase 71
 Para el caso de poblaciones infinitas, o para
valores grandes de N (N≥30), la distribución se
aproxima a la normal, la media y la desviación
estandar se calcula de acuerdo a las siguientes
formulas:

 Para poblaciones finitas y muestras sin


reemplazamiento

Apuntes de clase 72
Factor de corrección por continuidad

 Se debe usar por que las frecuencias


binomiales son funciones de variable discreta,
mientras que las frecuencias normales son
funciones de variables continuas: 1/(2n).
 Cuando se aplica el factor de corrección para
casos de proporción se debe restar 1/(2n) al
valor de la izquierda y sumar al valor de la
derecha.

Apuntes de clase 73
P
Z
pq
n
Veamos la aplicación:
 
 p  1 /( 2 * n)   
P Z  2 
 pq 
 n 
 
 P1  1 /(2 * n)   P 2  1 /(2 * n)     
P Z   p1  1 /(2 * n)   
 pq pq  P Z  
 pq 
 n n   n 
 
   
p  1 /( 2 * n )  
  P Z  2 
p  1 /( 2 * n )   p  1 /( 2 * n )    N n 
P 1 Z 2 

pq
 pq N n pq N n   n N  1 
 n n 
 N  1 N  1   
 
p  1 /( 2 * n )  
P Z  1 
 pq N n 
 n N  1 

Apuntes de clase 74
P
Z
pq
n

 
 p  1 /( 2 * n)   
P Z  2 
 pq 
 n 
 
 P1  1 /(2 * n)   P 2  1 /(2 * n)     
P Z   p1  1 /(2 * n)   
 pq pq  P Z  
 pq 
 n n   n 

 
 
p  1 /( 2 * n )  
  P Z  2 
   pq N n 
p  1 /( 2 * n )   p  1 /( 2 * n )    n N  1 
P 1 Z 2  
 pq N n pq N n 
 n N 1 n N  1   
  
p  1 /( 2 * n )  
P Z  1 
 pq N n 
 n N  1 

Apuntes de clase 75
 Otra forma de plantear la aproximación de la media y de
la varianza binomial a la distribución normal es de la
siguiente forma: µ = np y σ2 = npq.
 Para enteros cualesquiera a y b en intervalo cerrado, la
aproximación toma la forma:
 a  0.5  np b  0.5  np 
Pa  X  b P
 npq
Z
npq


 a  0.5  np b  0.5  np 
Pa  X  b P
npq
Z
npq

 

Pa  X  b  a  0.5  np
P Z
b  0.5  np 

 npq npq 
 a  0.5  np b  0.5  np 
Pa  X  b P Z 
 npq npq 
Apuntes de clase 76
 Lo importante que debe notarse es que se suma
o se resta 0.5 del límite, así como incluir o
excluir a ó b, la elección adecuada está indicada
por la naturaleza de la desigualdad. El 0.5 se
suma o se resta se conoce comúnmente como
“corrección por continuidad” cuando
trabajamos en términos de x

Apuntes de clase 77
Ejemplo 1
 Supongamos que tenemos un universo de 5

personas, que representamos por A, B, C, D y E;


cuyos resultados para lograr su voto por un
candidato X en proporciones se presenta en el
siguiente cuadro. Personas
A B C D E
1 0 0 1 1

 Como 3 de las 5 personas están a favor del


candidato, el promedio de la población es:
1 0  0 11
 p  0,6
5
Apuntes de clase 78
 Lo mismo la proporción de
voto favorable es: q  3  0.6; q  2  0.4
5 5
 La desviación estándar de la
población es:

 ( Xi   ) (0.4) 2  (0.6) 2  .....(0.4) 2


2
   0.489897948
N 5

Apuntes de clase 79
 Si determinamos una distribución de proporciones de
las muestras de tamaño 2, y si todas son diferentes, y
sin reemplazamiento, entonces tenemos:
 Número de muestras = 5C2 = 10

A B C D E Personas de la Valores de las Proporciones de


A 1,O 1,O 1,1 1,1 muestra muestras las muestras
B 0,0 0,1 0,1 A,B 1,0 0,5
C 0,1 0,1 A,C 1,0 0,5
D 1,1
A,D 1,1 1,0
E
A,E 1,1 1,0
Personas B,C 0,0 0,0
B,D 0,1 0,5
A B C D E

1 0 0 1 1
B,E 0,1 0,5
C,D 0,1 0,5
C,E 0,1 0,5
D,E 1,1 1,0

Apuntes de clase 80
 Media de la distribución de proporciones:
0,5  0,5  1  1  0  0,5  0,5  0,5  0,5  1
p   0,6  P
10

 Desviación estándar de la distribución muestral


de medias

 Que es igual a:
 Se puede inferir a partir de la desviación
estándar de la población.
 N  n 0,489897948 5  2
p    0,3
n N 1 2 5  1

Apuntes de clase 81
 Para el caso, con reemplazamiento nr = (5)² = 25
Total de muestras Medias de las muestras

A B C D E

A 1,1 1,0 1,0 1,1 1,1 1.0 0.5 0.5 1.0 1.0
B 0,1 0,0 0,0 0,1 0,1 0.5 0.0 0.0 0.5 0.5

C 0,1 0,0 0,0 0,1 0,1 0.5 0.0 0.0 0.5 0.5

D 1,1 1,0 1,0 1,1 1,1 1.0 0.5 0.5 1.0 1.0

E 1,1 1,0 1,0 1,1 1,1 1.0 0.5 0.5 1.0 1.0

A. Media de la distribución muestral de medias.


1  0,5  0,5  0,5  1.............1 15
p    0,6
25 25
B. Desviación típica de la distribución muestral
de proporciones

Apuntes de clase 82
También se puede calcular a través de la desviación
estándar de la población

P
El estadístico para una población finita Z
pq N n
sin reemplazo es: n N 1

P
El estadístico para una población Z
pq
finita con reemplazo es:
n

Apuntes de clase 83
 Ejemplo Hallar la probabilidad de que en los próximos
200 niños nacidos, (supóngase iguales la probabilidad
de niño o niña).
a) sean niños menos del 40% (MENOR IGUAL de 80)
Solución, en términos de X
 µ = Número de niños esperado = Np= 200(1/2) = 100

 P= probabilidad de niño = ½

 q= probabilidad de no niño = 1/2

 40% de 200= 80

80,5 100

-2,76 0
P (Z<-2,76)= 0,5-0,4971)= 0,0029

Apuntes de clase 84
Solución en términos de probabilidad:
µp = P= ½

P (Z<-2,76)= (0,5-0,4971)= 0,0029

Resolver:
b) Entre el 43 % y el 57 % sean niños
c) Mas del 54 % sean niños

Apuntes de clase 85
DISTRIBUCION MUESTRAL DE
SUMAS Y DIFERENCIAS

 Supongamos que se tienen dos poblaciones:


Para la población 1 se extraen muestras de
tamaño ni, se calcula la media, la proporción
u otra medida S1 para cada muestra, esto
proporciona una distribución muestral del
estadístico en referencia, cuya media y
desviación típica vienen dadas por :
µs1 y σs1.

Apuntes de clase 86
 Para la población 2 se extrae una muestra de
tamaño n2, se calcula la media, la proporción u
otra medida S2 para cada muestra , esto
proporciona una distribución muestral del
estadístico en referencia, cuya media y
desviación típica vienen dadas por:
µs2 y σs2.
 De todas las posibles combinaciones de estas
muestras de las dos poblaciones se puede
obtener una distribución de las sumas S1 + S2, o
diferencias S1 - S2, y el nombre toma del
estadístico del que se esta analizando.

Apuntes de clase 87
DISTRIBUCIÓN MUESTRAL DE LA
DIFERENCIA ENTRE DOS MEDIAS
MUESTRALES DE DOS POBLACIONES
NORMALES INDEPENDIENTES CON AMBAS
VARIANZAS CONOCIDAS

 Sean X1 y X2 , las medias de dos muestras


aleatorias independientes de tamaños n1 y n2
seleccionadas respectivamente de dos
poblaciones con medias 1 y 2 y variancias
21 y 22, supuestas conocidas.

Apuntes de clase 88
 Entonces, la variable aleatoria X1 – X2 tiene
las siguientes propiedades:
x  x  E ( X 1  X 2 )  E ( X 1 )  E ( X 2 )  1  2
1 2

 X2 1  X 2  V X 1  X 2   V X 1   V X 2    12 / n1   22 / n2

 Para n1 y n2 suficientemente grandes, la


distribución de la variable aleatoria:

Apuntes de clase 89
 Es aproximadamente normal estándar N(0,1).
La aproximación de Z a la normal es muy
buena si n1 y n2 sin importar si las poblaciones
son discretas o continuas:
Si: y P(-Z/2  Z  Z/2) = 1 - .
 Conforme n   es la distribución normal
estándar: N(0,1).
X 1  X 2  ( 1   2 )
P (  Z 1  / 2   Z 1  / 2 )  1  
 2
 2

n1 
1 2
n2

Apuntes de clase 90
Ejemplo 1
 Una muestra aleatoria de 50 casas de alquiler
de la ciudad de Puno produjeron una renta
mensual promedio de S/. 1’795,000. se
calculó una renta mensual promedio de I/.
1’800,000 con base en una muestra aleatoria
independiente para 45 casas de alquiler de la
ciudad de Juliaca.Supongamos que no hay
ninguna diferencia entre las ciudades respecto
a las rentas mensuales promedio de las casas.
 ¿Cuál es la probabilidad de observar una
diferencia entre medias muestrales tan grande
o más que la que se acaba de anotar si se
supone que σ = 15,000 para ambos distritos?.

Apuntes de clase 91
 Solución
 Sean X1 = 1´795,000 n1 = 50
 Sean X2 = 1´800,000 n2 = 45
 X2 - X1 = 1´800,000-1´795,000 = 5,000

 P[(X1-X2)> 5,000] = P[ > ]

1 - 2= 0 5,000
1 - 2
z
0 1,62
 P(Z > 1.62) = 0,5-0,44738 = 0,05262

Apuntes de clase 92
Ejemplo 2:

 Supongamos que la distribución de las notas de


2 cursos son normales con media µ1=60 y
σ21=25 para el primer curso y media µ2=55 y
σ22=16. Se tomó una muestra de tamaño n1=10
y del segundo curso n2=15.
 ¿Cuál será la probabilidad de que la diferencia
de las medias muestrales se encuentre entre 7 y
10 puntos?

Apuntes de clase 93
Solución:

P7  X 1  X 2   10  ¿?
 12  22 25 16
X 1X 2
     1.89
n1 n2 10 15

 75 10  5 
P  Z X1X 2    P1.06  Z  2.65  0.1406
 1.89 1.89 

La probabilidad es 14.1 %

Apuntes de clase 94
Ejercicios:

1. Los puntajes obtenidos en una prueba de


rendimiento motor hecha con estudiantes que
participaron en deportes universitarios (grupo 1)
están distribuidos normalmente y tienen una
media X1=60 y una varianza σ12=100.
Los puntajes de los jóvenes que no participaron
en deportes universitarios (grupo 2) están
también distribuidas normalmente y tienen una
media X2=50 y una varianza σ22=121.

Apuntes de clase 95
Se selecciona una muestra aleatoria de 10
jóvenes del grupo 1 y una muestra aleatoria
independiente de 11 del grupo 2.
¿Cuál es la probabilidad de que la diferencia
entre las medias muestrales estén
comprendidas entre 8 y 14?

Apuntes de clase 96
2. El consumo promedio diario de carne de
pollo en una población determinada es de 500
gramos y en otra de 400 gramos, supongamos
que los valores del consumo de carne de
pollo en las dos poblaciones están
distribuidos normalmente con una desviación
estándar de 100 gramos.
¿Cuál es la probabilidad de que dos muestras
aleatorias e independientes de tamaño 25
extraídas de cada población arrojen una
diferencia entre medias muestrales de 50
gramos o menos?.

Apuntes de clase 97
DISTRIBUCIÓN MUESTRAL DE LA
DIFERENCIA DE DOS PROPORCIONES

 Sean X1, X2, ... Xn1 y Y1, Y2, ... Yn2, dos
muestras aleatorias independientes de tamaños
n1 y n2 seleccionadas respectivamente de dos
poblaciones independientes de Benoulli B(1,p)
y B(1,p), donde p1 y p2 son las proporciones
poblacionales de éxito respectivos.
 Sean las proporciones muestrales de éxito: Si se
seleccionan X Y
p1  ; p2 
n1 n2

Apuntes de clase 98
 Donde las variables aleatorias X= Xi, Y = Yi
tienen distribuciones binomiales respectivas X
 B(n1, p1) e Y  B(n2, p2).
 Entonces, la variable aleatoria diferente de
proporciones muestrales: p1 – p2 tiene una
distribución de probabilidad cuyas propiedades
son las siguientes:
 p1  p 2  E ( p 1  p 2 )  E ( p 1 )  E ( p 2 )  p 1  p 2
p1 (1  p1 ) p 2 (1  p 2 )
 2
p1  p 2  V ( p1  p 2 )  V ( p1 )  V ( p 2 )  
n1 n2

Apuntes de clase 99
Para n1 y n2 suficientemente grandes, la
variable aleatoria estadarizada:
p 1  p 2  ( 1   2 )
z
p1q 1 p2 q 2
n1  n2

Conforme n   es la distribución normal


estándar: N(0,1) reemplazando en:
P(-Z/2  Z  Z/2) = 1 - .
p 1  p 2  ( 1  2 )
P (  Z/2   Z/2 )  1  
Tenemos: p1q 1 p2 q 2
n1  n2

Apuntes de clase 100


Ejemplo 1:

 Dos compañías A y B producen pilas. La


compañía A cree que el 10% de su producción
son defectuosos y B, el 5%. Se toma una
muestra al azar de 300 unidades de la línea de
producción de la compañía A y se encuentra
que 24 son defectuosas. Se toma una muestra
al azar de 400 unidades de la línea de
producción de la compañía B y se encuentra
que 20 son defectuosas.

Apuntes de clase 101


Solución:
 ¿Cuál es la probabilidad de obtener esta
diferencia a o una menor en proporción si la
creencia acerca de los parámetros de la
población es correcta?
 µp1-p2 = p1 – p2 = 0.10 – 0.05 = 0.05
 .p1 – p2 = 24/300 – 20/400 = 0.08 – 0.05 = 0.03

0.10.9  0.050.95  0.02046
300 400

 0.03  0.05 
p p1  p 2  0.03  p Z    pZ  098  0.1635
 0.0205 
 La probabilidad es 16.4%
Apuntes de clase 102
2. Un Psicólogo opina que el 15% de los
adolescentes de la comunidad A y el 10% de
la comunidad B sufren de un problema
emocional. En una m.a. de 150 adolescentes
de la comunidad A el Psicólogo encontró .
que 30 tenían ese problema. Una m.a.
independiente de 100 adolescentes de la
comunidad B reveló que 7 estaban sufriendo
de algún problema emocional. Supongamos
que la opinión que tiene el Psicólogo sobre los
adolescentes de estas dos comunidades es
correcta. ¿Cuál es la probabilidad de observar
una diferencia entre las proporciones
muestrales mayor o igual a la que realmente
se observa?

Apuntes de clase 103


3. Una empresa de estudios de mercado
quiere conocer las proporciones de
hombres y mujeres que conocen un
producto promocionado a escala
nacional. Supongamos que el 25% de
hombres y 30% de mujeres están
familiarizados con dicho artículo a escala
nacional. Se hace una encuesta a nivel
nacional sobre una m.a. de 200 hombres
y 200 mujeres. ¿Cuál es la probabilidad
de que los resultados muéstrales
muestren de que las mujeres están más
familiarizados que los hombres?

Apuntes de clase 104


1. Dos amigos A y B, juegan al
lanzamiento de un dado. Cada uno
lanza un dado 50' veces; uno gana el
juego si obtiene por lo menos 7 caras
superiores del dado con número 5
más que el otro. ¿Cuál es la
probabilidad de que A gane el juego?

Apuntes de clase 105


Bibliografía:

 CÓRDOVA ZAMORA, Manuel. 1999. “Estadística


Inferencial” Publicaciones Moshera. Lima Perú.
 MITAC MEZA Máximo (1990) Tópicos de Inferencia
estadística. Editorial san Marcos. Lima - Perú.
 MOYA Rufino y ZARAVIA Gregorio. “Probabilidad e
Inferencia Estadística”. Lima Perú
 Prof. RAMÓN DE LA CRUZ YUPANQUI. Curso:
Muestreo y Diseño Muestral INEI
 WALPOLE y MYRES. 1991 “Probabilidad y
Estadística”. Mc Graw Hill

Apuntes de clase 106

También podría gustarte