Está en la página 1de 44

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERIA ECONÓMICA

Estadística para economistas II

PARTE II: DISTRIBUCIONES MUESTRALES

M.Sc. Sabino Edgar Mamani Choque

1
DEFINICIÓN

• Se denomina distribución muestral a la


distribución de todas las muestras que pueden
ser escogidas conforme a un esquema de
muestreo especifico.

Medidas Población Muestra


Media aritmética  X
Varianza  2
S 2

Desviación estándar  S
Tamaño N n

2
X Media de todas las medias muestrales

X Desviación estándar de todas las medias muestrales

M Número de muestras posibles

N N!
M     Cuando la selección se hace sin reposición
 n  ( N  N )!n!

M N n Cuando la selección se hace con reposición

3
Al extraer todas las muestras posibles X1
de un mismo tamaño, las medias de la
distribución de todas las medias n S1
muestrales posibles, será igual a la
media poblacional.

X2
n
Población
X2
N

X1, X2, X3, … XN


X3
n
x S3
x
XM
n SM

4
Media: x 
 X i

X 1  X 2  X 3 ...  X M

M M

x  

Desviación
X 
(X i  )2

( X 1   ) 2  ( X 2   ) 2  ...  ( X M   ) 2


estándar: M M n

  x2
X   x2 
n n
DEFINICIÓN

• Se denomina distribución muestral de una


estadística a la distribución de probabilidad de
esa variable aleatoria. Las aplicaciones de las
distribuciones muestrales son aplicaciones del
Teorema Central del Límite. (M. Córdova Z.).
• Se denomina distribución muestral a la
distribución de probabilidad de una estadística
calculada a partir de todas las posibles
muestras de tamaño n, elegidas al azar de una
población determinada. (Mitacc, pág. 8)

6
DISTRIBUCIÓN MUESTRAL DE LA MEDIA

• TEOREMA. Sea X1, X2, ... Xn, una muestra


aleatoria de tamaño n escogida. Si es la
media muestral, entonces:
1. E(X) = ,
2. Var(X) = 2/n
3. Para n suficientemente grande, la variable
aleatoria: tiene distribución normal:
X 
N(0,1) z 
n

7
• PRUEBA: Por la definición de muestra aleatoria,
las variables aleatorias X1, X2, ... Xn, son
independientes e idénticamente distribuidas
como f(x) con E(X)= , y con Var(X) = 2 .
Entonces:

X 
Z

n

8
Teorema de limite central
Se cumple, cuando independientemente de la población origen, la
distribución de las medias aleatorias se aproximan a una distribución
normal a medida que el tamaño de la muestra crece.

Si las muestras provienen de una población que no es normal, es


importante tomar en cuenta el tamaño de la muestra.

Si el tamaño muestral es pequeño, la distribución obtenida de sus medias


muestrales tendrán un comportamiento similar al de la población de
donde se extrajeron.

Si el tamaño muestral es grande, el comportamiento de estas muestras


será igual al de una distribución normal independiente de la población de
donde fueron extraídas.

Entonces, si n variables aleatorias independientes tienen varianzas finitas,


la suma, expresado en medida estándar, tienden a estar normalmente
distribuidas cuando n tiende a infinito. 9
X  X X 
Entonces: Z 
X / n
Este cambio origina una distribución normal estándar de media μ = 0 y
desviación estándar σ = 1 cuya función de densidad es :

t2
1  x   2 1 
f ( x) 
1  
2  
 f (z)  e 2

 2
e 2

X
  Z
- 0 + 10
Considere que el peso de los niños varones en el momento del nacimiento se
distribuye normalmente.
Si el peso medio en el momento de nacer es de 3,25 kg y la desviación estándar
es de 0,82 kg, ¿cúal es la probabilidad de que el peso de un niño varón al nacer
sea superior a 4 kg?
Variable aleatoria X, peso de los niños al nacer.
En el proceso de estandarización, al valor de X=4, le corresponde el valor,
z=0,9146 :
X  4  3.25
z   0.9146
 0.82
En la tabla de la distribución normal, se busca el valor de α correspondiente al
valor de z=0,9146 ; la probabilidad de z > 0,9146 es,

p( X  4)  p( z  0,9146)  0,18

12
1. La altura media de 400 estudiantes es de 1.50 m y su desviación estándar
es de 0.25 m. Determine la probabilidad de que en una muestra de 36
estudiantes, la media sea superior a 1.60 m.

P ( X  1.60)  ?

1.60  1.50
Z  2.40
0.25
36

2. En un lote de 1000 pollos, con un peso promedio de 3.50 k, y una


desviación estándar de 0.18 k. ¿Cuál es la probabilidad de que en una
muestra aleatoria, 100 pollos de esta población, pesen entre 3.53 y 3.56?
3. Un fabricante de champú distribuye su producto en 100 salones de belleza.
El consumo promedio de su producto es de 2800 cojines mensuales, con
desviación estándar de 280 cojines. Si se toma una muestra probabilística
de 36 salones, ¿Cuál es la probabilidad de que el consumo promedio en un
mes sea inferior a 2700?
En poblaciones finitas (cuando el tamaño de la muestra es mayor al 5%
de la población, se puede aplicar el factor corrección, representado en
diferentes formas.

N n N n N n n n
    1  1 f f 
N 1 N N N N N
donde f es la fracción de muestreo

En consecuencia, la desviación estándar de la muestra se convierte en:


x N n
x 
n N 1

Entonces: X 
Z
   N n
 
 n  N 1

Caso, estatura de estudiantes


1. En una población normal, con media 72.1 y desviación estándar de 3.1, ¿Cuál
es la probabilidad de que en una muestra de 90 observaciones, la media sea
menor que 71.7?
2. En un banco de ahorros, la cuenta promedio es de S/159,320. con una
desviación estándar de S/ 18,000. ¿Cuál es la probabilidad de que un grupo
de 400 cuentas, elegidas al azar, tenga un depósito promedio de S/160,000 o
mas?.
3. El salario de los mineros, de cierta región, se distribuye en forma normal con
una media de S/165,000 y una desviación estándar de S/15,000. ¿Cuál es la
probabilidad de que una media representativa de 25 mineros tenga un
promedio inferior a S/ 157,500.
4. La estatura de un grupo de adultos tiene un promedio de 167.42 m y una
desviación estándar de 2.58 cm. Si las estaturas están normalmente
distribuidas y se eligen aleatoriamente 25 personas del grupo. (cual es la
probabilidad de que su media sea de 168.00 cm. o mas?
5. Los salarios diarios d cierta industria están distribuidos normalmente con una
media de S/ 13,200. Si el 9% de las medias de los salarios diarios en
muestras de 25 obreros, es inferior a S/ 12,500. ¿Cuál es la desviación
estándar de los salarios diarios en esta industria?
6. Si los pesos individuales de las personas que viajan en un avión se distribuye
normalmente con media de 68 k y desviación estándar de 3.5 k, ¿Cuál es la
probabilidad de que un Boeing 707 con 81 pasajeros pese más de 5,700 k?
7. Las estaturas de los estudiantes se distribuyen normalmente con media de 170 cm y
desviación estándar de 10 cm. Si se toma una muestra de 81 estudiantes, ¿Cuál es la
probabilidad de que tengan una estatura mayor a 175 cm?
8. Una siderúrgica produce cables para suspensión de puentes. La característica mas
importante de este producto es su resistencia, el peso que puede soportar antes de que
reviente. Por experiencias pasadas se sabe que el promedio de la resistencia es de 6 t
con desviación estándar de 3/4 de t. Para efectos de control, se selecciona una muestra
de 9 cables y se adopta la siguiente decisión:
Si la resistencia promedio está por encima de 6.5 t o por debajo de 5.5 t, se suspende el
proceso.
Si está entre 5.5 y 6.5 se continúa con la producción.
a) ¿Cuál es la probabilidad de detener el proceso si la media de producción es aún de 6
t?
b) ¿Cuál es la probabilidad de detener el proceso si la media de producción ya no es de
6 t sino de 6.18 t?
c) ¿Cuál es la probabilidad de continuar el proceso si el promedio es en realidad de 6.4
?
d) ¿y si es de 5.8 t?
9. Si se extrae una muestra aleatoria de 36 elementos de una población,
(cuantos elementos debe contener una segunda muestra de la misma
población, para que el error estándar de la media de la segunda
muestra sea 2/3 del error estándar de la media de la primera muestra.

10.Si se extrae dos muestras aleatorias de una misma población, y si el


error estándar de la media de una de ellas es K veces el error
estándar de la media de otra, ¿Cuál es la relación entre los tamaños
de ambas muestras?
Ejemplo:
Según un estudio, la altura de los varones de cierta ciudad es una v.a. X, que se
puede considerar que se distribuye según una ley gaussiana de valor esperado
=175 cm y desviación estándar =10 cm. En que intervalo, el 50% los
habitantes de la ciudad estarán dentro de este peso?.

En este caso se busca en la tabla de la N(0,1) el valor que deja el 25% de los
datos hacia la derecha y 25 % a la izquierda, de esta manera sumados sea igual
al 50% en los valores centrales.

Xa Xb
N(175, 10)

Se busca el valor estandarizado


cuya probabilidad sea 0,25 en la
N(0,1) que es aproximadamente
0,675

Por lo tanto si “destipificamos”


X  175
0,675   X  (0,675  10)  175  181,75
10
Como es simétrica la distribución,
el valor que deja el 25% por
debajo es -0,675
X  175
 0,675   X  (0,675  10)  175  168,25
10
El 50% de la población tiene
un peso comprendido en el
intervalo [168.25;181.75]
Distribución muestral de una proporción

Número _ de _ casos _ favorables _ o _ éxitos


Proporción de éxito: P
Total _ de _ casos _ posibles

Muestra:

Número de atributos en la muestra (a) entre el tamaño de la muestra n

p
 a i

Número _ de _ éxitos
n Tamaño _ de _ la _ muestra
Media de la proporción de éxitos:

X 1 1
 P  E    E ( X )  (np )  p
n n n

Varianza de la proporción de éxitos:

X 1 1 pq
 2
P  Var    2 Var ( X )  2 (npq ) 
n n n n

Por lo que:

pq
P 
n
A   Ai  NP Número de elementos que presentan la característica en
la población

p  P  P

P
A
 A i
Proporción de elementos que presentan la característica
N N en la población

NA Proporción de elementos que no presentan la


Q  1 P
N característica

P Q 1

 P2  PQ Varianza de la proporción en la población

 P  PQ Desviación estándar

p PQ
p   Error estándar de la proporción
2 n
p  P p  p
Z 
PQ p
n

a   ai Número total de elementos que presentan la característica en la


muestra

a
p  a i
Proporción de elementos que presentan la característica en la
n n población
na
q  1 p Proporción de elementos que no presentan la característica
n
p  q 1

S p2  pq Varianza de una proporción en la muestra

Sp  pq Varianza de una proporción en la muestra


1. El 4% de las piezas producidas por cierta máquina son defectuosas, ¿Cuál es
la probabilidad de que en un grupo de 200 piezas, el 3% o mas sean
defectuosas?

Para obtener una mejor aproximación a la distribución normal, se debe


hacer una corrección a la variable discreta (1/2n).
Si el área de interés es hacia la derecha, se resta este factor de
corrección; mientras que a la izquierda se suma este factor al valor de p.

 1   1 
 p    P  p    p
Z  2n 
  2n 
PQ p
n
2. Se ha determinado que el 65% de los estudiantes universitarios

prefieren cuadernos de marca Alpha. ¿Cuál es la probabilidad de que

en una muestra de 100 estudiantes se encuentre:

a) Como máximo el 68% sean usuarios de ese tipo de cuaderno?

b) Exactamente 66% sean usuarios?

3. Hallar la probabilidad de que en 200 lanzamientos de una moneda el

número de caras esté comprendido entre 40% y 60%.


Distribución de diferencias entre dos medias
muestrales

X1 Y1
n1 S1
n2
S1
Población Población
X n1 X2 Y2 n2 Y
N1 S2 N2
S2
X1, X2, X3, … XN X3 Y1, Y2, Y3, … YN
n1 Y3 n2
x x S3 S3 y y
XM
n1 SM
YM n2
SM
 X Y 
 (X i  Yi )

( X 1  Y1 )  ( X 2  Y2 )  ...  ( X M  YM )
M M

 X Y 
 X i

 Y i

M M

 X Y   X   Y

 X Y   X   Y
 ( X  Yi )  (  X   Y )
2

 X Y  i

 2
 2
Si  2
X  X
y   2
Y
Y
n1 n2

 2
 2
Entonces
 X Y     2 2 ó  X Y  X
 Y
X Y n1 n2
Suponiendo que la distribución de diferencias entre las medias muestrales
tenga un comportamiento similar a la distribución normal, la
estandarización tiene la siguiente forma:

( X  Y )  (  X  Y )
Z
 xy

( X  Y )  (  X  Y )
Z
 X2   Y2

( X  Y )  (  X  Y )
Z
 X2  Y2

n1 n2
Cuando no se conoce las varianzas poblacionales de X e Y se sustituye
por sus correspondientes estimadores, siempre que n1 y n2 sean
mayores a 30. En algunos casos cuando n1 + n2 > 30

( X  Y )  (  X  Y )
Z
S X2 SY2

n1 n2

1. De dos poblaciones normales e independientes, la media de la segunda


población es de 0.65 menor que la primera; si se obtienen muestras de tamaño
100 y 120 y si las respectivas desviaciones estándar poblacionales son de 12 y
8, determine la probabilidad de que, en un par de muestras, la diferencia entre
ambas medias muestrales sea superior a 1 en valor absoluto.
2. Se obtiene una muestra aleatoria de 100 elementos de una población
normal, que tiene media 50 y desviación estándar 8. Luego se saca otra
muestra aleatoria de 400 elementos de una población normal que tiene
media 40 y desviación estándar 12. Hallar la probabilidad de que:
a) La media de la primera muestra exceda a la de la segunda en 8 o mas
b) Ambas medias difieran, en valor absoluto, en 12 o más

3. En un restaurante, el consumo medio es de S/. 1980, con una desviación


estándar de S/ 150. En un segundo restaurante las cifras fueron S/ 1920 y
S/ 120. Si se eligen al azar 80 boletos de pago del primer restaurante y
una muestra aleatoria de 60 del segundo, ¿Cuál es la probabilidad de que
la diferencia entre consumos medios de ambas muestras sea mayor que S/
100 en valor absoluto?

4. De cada una de dos poblaciones normales e independientes con iguales


medias y desviaciones estándar de 6.40 y 7.20, se extraen muestras de 64
elementos. Hallar la probabilidad de que la diferencia entre las medias de
las muestras exceda de 0.60 en valor absoluto
Distribución de diferencias entre dos proporciones
muestrales
Suponiendo dos poblaciones independientes N1 y N2, distribuidas
binomialmente, con parámetros, medias proporcionales:
P1   p1 P2   p2

Desviación estándar:  p  P1Q1


1  p  P2Q2
2

El error estándar de las diferencias entre las dos medias proporcionales


estará dada por:

P1Q1 P2 Q2 p1q1 p2 q2
 p p   S p1  p2  
1 2
n1 n2 n1 n2

Poblacional Muestral
( p1  p 2 )  (  P1   P2 )
Entonces: Z
P1Q1 P2 Q2

n1 n2

( p1  p 2 )  ( P1  P2 )
Z
p1 q1 p 2 q 2

n1 n2

1. Dos fábricas A y B, producen artículos similares. La producción de A contiene


7% de defectuosos, y la de B contiene 5%. Si se extrae una muestra de 2000
de cada una de las producciones de las fábricas, ¿Cuál es la probabilidad de
que las dos muestras revelen una diferencia en el número de los defectuosos
del 1% ó mas?
2. Se sabe que cierta marca de crema para las manos satisface el 65% del
mercado. ¿Cuál es la probabilidad de que dos muestras aleatorias de 200
usuarios cada una, muestre una diferencia mayor del 10% en las
proporciones del uso de la crema?

3. Suponga que una máquina A produce, en promedio, un 12% de piezas


defectuosas, mientras que la máquina B, produce con 18% de
defectuosas. Hallar la probabilidad de que el promedio de una muestra de
600 unidades, tomada de la máquina A, no difiera en más de 8% de otra
muestra de 400 unidades de la máquina B.

4. Cierta encuesta revela que el 25% de los hombres y 33% de mujeres de


clase media, ven el noticiero 11.00 de la noche. ¿Cuál es la probabilidad
que en dos muestras aleatorias de 150 hombres y 100 mujeres
respectivamente, se encuentre que la proporción de hombres que ha visto
el programa sea igual o mayor que la proporción de mujeres?
Ejercicios
1. Según datos anteriores, se sabe que la efectividad de una vacuna es del 90%,
¿Cuál es la probabilidad de que al vacunar a 64 personas la proporción sea
mayor del 95%?
2. Un laboratorio lanza una nueva droga al mercado. Se asegura que en el 80%
de los casos la droga es eficaz. Si en una clínica se seleccionan 49 pacientes
que padecen de la misma enfermedad, ¿Cuál es la probabilidad de que se
presente una diferencia superior al 10% a lo asegurado por el laboratorio?
3. Se sabe que el 70% de la población económicamente activa del país tiene
ingreso mensual de S/3000. Si se toma una muestra de 1000 personas de
dicha población, calcular la probabilidad de que entre 680 y 750 tengan
ingresos menores a S/3000.
4. En cierto proceso de producción se utiliza el siguiente sistema de control de
calidad: se elige una muestra de 36 unidades; si el porcentaje de unidades de
la muestra no excede el valor de p, se continua el proceso. Si se sabe que el
proceso ocasiona un 10% de unidades defectuosas, en promedio, determine el
valor de p, para que exista un 45% de probabilidad de continuar el proceso,
cuando la proporción de piezas defectuosas es inferior a p.
5. Dos marcas de bombillas de alumbrado público, A y B tienen una duración
promedio de 1400 y 1200 horas, respectivamente, y sus varianzas de 40000
y 10000 horas. Se extrae una muestra aleatoria de 125 por cada marca.
Determine la probabilidad de que: a) la marca A tenga una vida media de por
lo menos 160 horas más que B; b) la marca A tenga una vida media de por
lo menos 250 horas más que B.
6. Cierto artefacto eléctrico tiene una vida promedio de 2600 horas, con
desviación estándar de 200 horas; mientras que el mismo artefacto e
fabricación extranjera tiene un promedio de duración de 2400 horas, con
desviación estándar de 180 horas. Si se toman dos muestras de 125 y 100
artefactos, respectivamente, ¿Cuál es la probabilidad de que la diferencia
registrada entre las dos muestras sea superior a 150 horas?.
7. Se sabe que los pesos de ciertas bolsitas aromáticas tienen una media de
25 gramos, con desviación estándar de 5 gramos. Si se toman dos muestras
de 100 bolsitas cada una, ¿Cuál es la probabilidad de que los resultados de
estas muestras difieran en más de 2 gramos?.
8. El promedio de los obreros, en una fábrica textil, es de 34 años con
desviación estándar de 6 años; además, el promedio de edad de las obreras
es de 30 años con desviación estándar de 4 años, ¿Cuál es la probabilidad,
que al tomar muestras de 20 obreros de cada sexo, de que el promedio de
edad de las mujeres resulte mayor que el de los hombres?.
9. El tiempo promedio requerido para ejecutar un trabajo de ensamblaje es de
2 horas con una desviación estándar de 40 minutos y el tiempo requerido
para ejecutar otro trabajo o etapa en el ensamblaje es de una hora con
cuarenta minutos, con una desviación estándar de 32 minutos.
Suponiendo que se distribuyen normalmente, ¿Qué porcentaje de veces
será mayor el promedio del primer trabajo con relación al segundo, si se
toman muestras de tamaño 28 y 30 respectivamente?
10. Por experiencia se sabe que el tiempo de trabajo promedio en un artículo
con los tornos existentes es de 38.6 minutos (desviación estándar de 13.8).
El tiempo de trabajo promedio con los nuevos tornos es de 33.5 minutos,
(desviación estándar de 14.1). Si se toman dos muestras de 18 tornos
cada una, ¿Cuál es la probabilidad que al producir 900 artículos, el
promedio de diferencia de B con respecto a A, sea superior en dos
minutos?.
11. En dos fábricas A y B, que producen determinados artículos para hombres;
se sabe que el 8 y 12% de la producción es defectuosa. Si se extrae una
muestra de 400 artículos de cada lote producido, en cada fábrica, ¿Cuál es
la probabilidad de que las dos muestras revelen una diferencia inferior al
3%?.
12. Los porcentajes de familias con ingreso superior a S/3500 en las ciudades A
y B es de 25% y 20%, respectivamente. Al seleccionar al azar dos muestras
de 100 familias en cada una de las dos ciudades y se comparan las
proporciones muestrales de las familias con ingreso superior a S/ 3500,
¿Cuál es la probabilidad de que la proporción muestral correspondiente a la
ciudad B sea: a) mayor que la de A en 3% o más; b) menor que la de A en
3% o más?

13. El 12% de la producción de una máquina es defectuosa, mientras que en otra


similar es del 15%. Si se extraen dos muestras de tamaños 80 y 100
respectivamente, ¿Cuál es la probabilidad, en cuanto al porcentaje de
defectuosos: a) que las dos muestras revelen una diferencia superior al 3%;
b) que el porcentaje en la muestra A, sea superior a la de B?
Ejemplo 1
• Supongamos que tenemos un universo de 5
personas, que representamos por A, B, C, D y E;
cuyos resultados para lograr su voto por un
candidato X en proporciones se presenta en el
siguiente cuadro. Personas
A B C D E
1 0 0 1 1

• Como 3 de las 5 personas están a favor del


candidato, el promedio de la población es:
1 0  0 11
 p  0,6
5
• Lo mismo la proporción de voto
favorable es: 3 2
q   0 .6; q   0 .4
5 5

• La desviación estándar de la
población es:

   ( Xi   ) 2


( 0 . 4 ) 2  (  0 . 6 ) 2  .....( 0 . 4 ) 2
 0 . 489897948
N 5

P  PQ
• Si determinamos una distribución de proporciones de las
muestras de tamaño 2, y si todas son diferentes, y sin
reemplazamiento, entonces tenemos:
• Número de muestras = 5C2 = 10
Personas de la Valores de las Proporciones de
A B C D E muestra muestras las muestras
A 1,O 1,O 1,1 1,1 A,B 1,0 0,5
B 0,0 0,1 0,1
A,C 1,0 0,5
C 0,1 0,1
A,D 1,1 1,0
D 1,1

E A,E 1,1 1,0


B,C 0,0 0,0
Personas
B,D 0,1 0,5
A B C D E
B,E 0,1 0,5
1 0 0 1 1
C,D 0,1 0,5
C,E 0,1 0,5
D,E 1,1 1,0
 Media de la distribución de proporciones:
0,5  0,5  1  1  0  0,5  0,5  0,5  0,5  1
p   0,6  P
10

 Desviación estándar de la distribución muestral de


medias  ( Pi   ) 2

p  p
 0 ,3
N
pq N n 0,6(1  0,6) 5  2
p    0,3
 Que es igual a: n n 1 2 5 1

 Se puede inferir a partir de la desviación estándar de


la población.
 N  n 0,489897948 5  2
p    0,3
n N 1 2 5 1
• Para el caso, con reemplazamiento nr = (5)² = 25
Total de muestras Medias de las muestras

A B C D E

A 1,1 1,0 1,0 1,1 1,1 1.0 0.5 0.5 1.0 1.0
B 0,1 0,0 0,0 0,1 0,1 0.5 0.0 0.0 0.5 0.5

C 0,1 0,0 0,0 0,1 0,1 0.5 0.0 0.0 0.5 0.5

D 1,1 1,0 1,0 1,1 1,1 1.0 0.5 0.5 1.0 1.0

E 1,1 1,0 1,0 1,1 1,1 1.0 0.5 0.5 1.0 1.0

A. Media de la distribución muestral de medias.


1  0 ,5  0 ,5  0 ,5  1 .......... ... 1 15
p    0 ,6
25 25
B. Desviación típica de la distribución muestral de
proporciones
(p   ) (1 - 0,6)  (0,5  0,6)  .......  (1  0,6)
n 2
 
2 2 2

 p
i 1 i p
  0,346410161
num.muestras 25

pq
p   0,3464101615
n
pq 0,6(0,4)
p    0,346410161
n 2

También se puede calcular a través de la desviación estándar


de la población

 
p  
0 , 489897948
 0 ,346410161
n p
2

El estadístico para una población finita sin


reemplazo es: P
Z
pq N n
n N 1
P
El estadístico para una población finita con Z
reemplazo es: pq
n

También podría gustarte