Está en la página 1de 14

UNIVERSIADAD DEL VALLE DE MÉXICO

Estadística Inferencial

ACTIVIDAD 1
“Ejercicios Sobre Distribuciones Muéstrales”

Individual

Profesora

Fecha

25 de julio del 2022


EJERCICIOS SOBRE DISTRIBUCIONES MUESTRALES

• Con base en el material consultado en la unidad resuelve los ejercicios que se plantean
acerca de los siguientes temas:
o Distribuciones muéstrales
o Teorema del Límite Central (TLC)

• Técnicas Básicas 1.

1. Una población consta de cinco números: 2, 3, 6, 8,11. Considere todas las muestras
posibles de tamaño dos que pueden extraerse con reemplazo de esta población.
Encontrar:
a) La media de la población
2 + 3 + 6 + 8 + 11 30
𝑋 ∑ = =𝟔
5 5

b) La desviación estándar de la población


√(2 − 6)2 + (3 − 6)2 + (6 − 6)2 + (8 − 6)2 + (11 − 6)2
𝜎=
5
√6 + 9 + 0 + 4 + 25
𝜎=
5
√54
𝜎=
5
𝜎 = √10.8
𝝈 = 𝟑. 𝟐𝟖𝟔𝟑
c) El valor esperado de la media muestral

Muestras Media Muestral

(2,3) 2.5

(2,6) 4

(2,8) 5

(2,11) 6.5

(3,6) 4.5

(3,8) 5.5

(3,11) 7

(6,8) 7

(6,11) 8.5

(8,11) 9.5

∑? 60

El valor esperado de la media de una distribución de probabilidad, y la media


de las medias muestrales es el valor esperado de las medias:
µ? = ∑?/?
µ? = 60/10
µ? = 6
d) La desviación estándar (error estándar) de la media muestral
𝜎
𝜎=
√𝑛
3.2863
𝜎 = √2
𝝈 = 𝟐. 𝟑𝟐𝟑𝟕

Datos 2 3 6 8 11
Media 6
Desv. Estandar 3.28
Valor Esperado de la Muestra
2.2 2.3 2.6 2.8 2.11
3.2 3.3 3.6 3.8 3.11
6.2 6.3 6.6 6.8 6.11
8.2 8.3 8.6 8.8 8.11
11.2 11.3 11.6 11.8 11.11

La media de Distribución Muestras es igual a la suma de todas las medias


muéstrales 150/25= 6.

La desviación Estándar de la distribución muestral de la medias, es decir el error


típico de medias.

La varianza de la distribución muestral de medias se obtiene restando el valor


de la media = 6 de cada número de (1), elevando al cuadrado cada diferencia,
sumando los 25 números obtenidos y dividiendo por 25 obtenemos el resultado
final.

2. Se seleccionaron muestras aleatorias de tamaño n de poblaciones con las medias y


varianzas dadas aquí. Encuentre la media y desviación estándar de la distribución de
muestreo de la media muestral X en cada caso:
a) n = 36, µ = 10, σ2 = 9
𝜇 = 𝜇?
𝝁 =10

𝜎
𝜎=
√𝑛
√9
𝜎=
√36
𝝈 = 𝟎. 𝟓
b) n = 100, µ= 5, σ2 = 4
𝜇 = 𝜇?
𝝁 =5

𝜎
𝜎=
√𝑛
√4
𝜎=
√100
𝝈 = 𝟎. 𝟐
c) n = 8, µ = 120, σ2 = 4
𝜇 = 𝜇?
𝝁? =120

𝜎
𝜎=
√𝑛
√1 1
𝜎= =
√8 2.82
𝝈 = 𝟎. 𝟑𝟓𝟒𝟔

Si las poblaciones muestreadas son normales, ¿cuál es la distribución de muestreo de X


para los incisos a, b y c?

Si la población muestreada es normal, entonces la distribución muestral de X también


será normal sin importar cuál sea el tamaño de la muestra que se escoja.

De acuerdo con el Teorema del Límite Central, si las poblaciones muestreadas no son
normales, ¿qué se puede decir acerca de la distribución muestral de X para los incisos a,
b y c?

Si las muestras aleatorias de “n” observaciones de obtienen de una población no normal


con media finita “m” y desviación estándar “s” entonces cuando “n” es grande, la
distribución de muestreo de la media “m” y desviación estándar, la aproximación se
hace más precisa cuando “n” se hace grande.

3. Una muestra aleatoria de n observaciones se selecciona de una población con


desviación estándar  = 1. Calcule el error estándar de la media (SE) para los siguientes
valores de n.
𝜎 1
a) n = 1 = =𝟏
√𝑁 √1
𝜎 1
b) n = 2 = = 𝟎. 𝟕𝟎𝟕𝟏
√𝑁 √2
𝜎 1
c) n = 4 = = 𝟎. 𝟓
√𝑁 √4
𝜎 1
d) n = 9 = = 𝟎. 𝟑𝟑𝟑
√𝑁 √9
𝜎 1
e) n = 16 = = 𝟎. 𝟐𝟓
√𝑁 √16
𝜎 1
f) n = 25 = = 𝟎. 𝟐
√𝑁 √25
𝜎 1
g) n = 100 = = 𝟎. 𝟏
√𝑁 √100

a b c d e f g
Datos n=1 n=2 n=4 n=9 n=16 n=25 n=100
Resultados 1 0.7 0.5 0.33 0.25 0.2 0.1
4. Se seleccionaron muestras aleatorias de tamaño n de poblaciones binomiales con
parámetros poblacionales p dados aquí. Encuentre la media y la desviación estándar de
la distribución de muestreo de la proporción muestral p ˆ en cada caso:
a) n = 100, p = 0.3

𝜌(1 − 𝜌)
𝑜𝜌 = √
𝑛

0.3(1 − 0.3)
𝑜𝜌 = √ = 𝟎. 𝟎𝟒𝟓𝟖𝟐
100

b) n = 400, p = 0.1

𝜌(1 − 𝜌)
𝑜𝜌 = √
𝑛

𝜌(1 − 0.1)
𝜌=√ = 𝟎. 𝟎𝟏𝟓
400
c) n = 250, p = 0.6

𝜌(1 − 𝜌)
𝑜𝜌 = √
𝑛

𝜌(1 − 0.6)
𝑜𝜌 = √ = 𝟎. 𝟎𝟑𝟎𝟗𝟖
250

5. ¿Es adecuado utilizar la distribución normal para aproximar la distribución de muestreo


de P ˆ en las siguientes circunstancias?
a) n = 50, p = 0.05
Si es adecuado, porque se cumple con la condición n ≥ 30

b) n = 75, p = 0.1
Si es adecuado, porque se cumple con la condición n ≥ 30

c) n = 250, p= 0.99
Si es adecuado, porque se cumple con la condición n ≥ 30
• Aplicaciones

1. Enfermedad de Alzheimer. La duración de la enfermedad de Alzheimer desde el principio


de los síntomas hasta el fallecimiento varía de 3 a 20 años; el promedio es 8 años con una
desviación estándar de 4 años. El administrador de un gran centro médico selecciona al azar,
de la base de datos del centro, los registros médicos de 30 pacientes de Alzheimer ya
fallecidos y anota la duración de la enfermedad para cada unidad en muestra. Encuentre las
probabilidades aproximadas para los siguientes eventos:
Si la duración de la enfermedad en años es una variable aleatoria con distribución normal,
la media aritmética también tiene distribución normal, así usando una estandarización y la
tabla de probabilidades acumuladas podemos responder los siguientes incisos.

La duración de la enfermedad Alzheimer desde el principio de los síntomas hasta el


fallecimiento tiene distribución normal con:

Media= m = 8 años y desviación estándar σ = 4 años

Para hallar posibilidades asociadas a esta distribución se usa una tabla de probabilidades
acumuladas calculadas como áreas bajo la curva normal estándar (z).

a) La duración promedio es menor a 7 años


Se desea hallar la probabilidad de que la media sea menor que 7 entonces tenemos
que hay una probabilidad de 0.0853 de que la enfermedad en promedio dure 7 años
o menos.

(?̅−?) ′(?−?)
?< ?⁄ 𝑃(𝑧) = 𝑃{? < ?⁄
√? √?

(7−8)
?< 4 𝑃(𝑧) = 𝑃(? < −1.3693)

√30

(−1)
?< 4 𝑃(𝑧) = 0.5 − 0.4147
⁄5.4772

(−1)
? < 0.7303 𝑷(𝒛) = 𝟎. 𝟎𝟖𝟓𝟑

? < −1.3693
b) La duración promedio excede de 7 años
La probabilidad de que la media sea mayor que 7 dado que la tabla arroja
probabilidades acumuladas es necesario trabajar con el evento complemento para
obtener el resultado de la distribución.

(¿̅−¿) ′(?−?)
¿< ?⁄ 𝑃(𝑧) = 𝑃{? < ?⁄
√? √?
(7̅−8)
?< 4⁄ 𝑃(𝑧) = 𝑃(? < −1.3693)
√30
(−1)
?< 4⁄ 𝑃(𝑧) = 0.4147 + 0.5
5.4772
(−1)
?< 0.7303
𝑷(𝒛) = 𝟎. 𝟗𝟏𝟒𝟕

? < −1.3693

c) La duración promedio está a no más de un año de la media poblacional  = 8


Cuando se trabaja con intervalos, las probabilidades se obtienen por diferencias de
las probabilidades acumuladas a la cola izquierda de los extremos de dicho
intervalo, entonces la probabilidad de que la duración promedio de la enfermedad
este entre 7 y 9 años es de 0.8294.

𝑃(7 < 𝑧 < 9)

𝑃(−1.3693 < 𝑧 < 1.3693

𝑃(𝑧) = 0.9147 − 0.0853

𝑷(𝒛) = 𝟎. 𝟖𝟐𝟗𝟒

Inicios Rango de Años n p σ Z Tabala Z P %


A 03 a 20 30 8 4 -1.37 ( <-1.37) 0.0853 8.53%
B -1.37 (x>7)=1-p(x<7)=1-0.0853 0.9147 91.47%
P(7<x<9)=p(-1.37<z<1.37)
C -1.37 0.8294 82.94%
=0.9147-0.0853

Grafique el error estándar de la media (SE) contra el tamaño muestral n y enlace los puntos
con una curva suave. ¿Cuál es el efecto de aumentar el tamaño de muestra sobre el error
estándar?
Desviación: 4

N Error Estándar
30 0.73029674
60 0.51639778
1000 0.12649111
50000 0.01788854
200000 0.00894427

2. Salarios de profesores. Suponga que los profesores de una universidad en E.U.A. -con rango
de profesor en instituciones públicas que imparten programas académicos de dos años-,
ganan un promedio de 71,802 dólares por año, con una desviación estándar de 4,000
dólares. En un ejercicio por verificar este nivel de salario se seleccionó una muestra aleatoria
de 60 profesores de una base de datos del personal académico de todas las instituciones
públicas que imparten programas de dos años en E.U.A.

a) Describa la distribución de muestreo de la media muestral X


Sería una Distribución Normal

b) ¿Dentro de qué límites se esperaría que esté el promedio muestral, con


probabilidad 0.95?
Alfa = 1-0.95 (nivel de Significancia)
Valor crítico alfa/2 = 0.025
Valor en tablas 1.96 (del centro a extremos)
Intervalo de confianza:
𝑎
𝑍( )
(𝜇)95% = 𝜇 ± 2 ∗𝜎
√𝑛
1.96 ∗ 4000
(𝜇)95% = 71.802 ±
√60
(𝜇)95% = 71.802 ± 1012.139648

c) Calcule la probabilidad de que la media muestral x sea mayor que 73,000 dólares.
𝑥 = 73,000
𝑋−𝑀
𝑍=
𝜎
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑇𝑎𝑏𝑙𝑎𝑠 = 0.6141 (𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑜𝑠 𝐸𝑥𝑡𝑟𝑒𝑚𝑜𝑠)
𝑃(𝑋 < 73000) = 0.6141
𝑃(𝑋 < 73000) = 1 − 0.6141=0.3859 (38.59%)

d) Si una muestra aleatoria en realidad produjo una media muestral de 73,000 dólares,
¿consideraría usted que esto es poco común? ¿Qué conclusión obtendría?
Los datos que se encuentran un poco alejados de la media dado que se encuentra
en los valores superiores máximos a 72814.

3. Requerimiento de Potasio. El requerimiento normal diario de Potasio en seres humanos


está en el intervalo de 2,000 a 6,000 miligramos (mg), con cantidades más grandes
necesarias durante los meses calurosos de verano. La cantidad de potasio en distintos
alimentos varía pero las mediciones indican que el plátano contiene un nivel alto de potasio,
con aproximadamente 422 mg en un plátano de tamaño mediano. Suponga que la
distribución de potasio en plátanos está distribuida normalmente, con media igual a 422 mg
y desviación estándar de 13 mg por plátano. Usted come n = 3 plátanos al día y T es el
número total de miligramos de potasio que recibe de ellos.

La cantidad de potasio en distintos alimentos varía, pero las mediciones indican que el
plátano contiene un nivel alto de potasio, con aproximadamente 422 mg y desviación
estándar de 13 mg por plátano.

Usted come n=3 plátano al día y “T” es el número total de miligramos de potasio recibe de
ellos.

a) Encuentre la media y la desviación estándar de T.


T= número total de miligramos de potasio.
M= 422mg
S= 13mg
b) Encuentre la probabilidad de que su ingesta diaria de potasio de los tres plátanos exceda
de 1,300 mg. (Sugerencia: Observe que T es la suma de tres variables aleatorias 1 2 3 X
X X , y donde X1 es la cantidad de potasio en el plátano 1, etc.)
Encuentre que la probabilidad de que su ingesta diaria de potasio de los tres plátanos
exceda de 1,300mg.

(𝑥̂−𝜇)
𝑃(𝑋 > 434) = 𝑃(𝑍 < 𝜎 )
√𝑛

4. Duración de baterías para automóvil. Un fabricante de baterías para automóvil afirma que
la distribución del tiempo de duración (tiempo de vida) de las baterías de su mejor marca
tiene una media  = 54 meses y una desviación estándar  = 6 meses. Suponga que un grupo
de consumidores decide verificar la afirmación y para ello compran una muestra de 50
baterías y las somete a prueba para medir su tiempo de vida.

a) Suponiendo que la afirmación del fabricante es verdadera, describa la distribución de


muestreo de la media muestral cuando n = 50 baterías.
La distribución sería una distribución de muestreo aleatoria, que tiende a ser una
distribución normal. (Agregar a ese una distribución de muestra aleatoria).

b) Suponiendo que la afirmación del fabricante es verdadera, ¿cuál es la probabilidad de


que la muestra de 50 baterías tenga un tiempo de vida de 52 meses o menos?
(𝑥̂ − 𝜇)
𝑃(𝑋 < 52) = 𝑃(𝑧 < )
𝜎
( )
√𝑛

(52 − 54)
𝑃(𝑋 < 52) = 𝑃 (𝑧 < ) = −2.3570
6
( )
√50

P(X<52) = 0.00939 = Se traduce como el 0.9% de probabilidad de obtener una batería


tengan tiempo de vida de

5. Temperatura corporal. Suponga que la temperatura corporal de personas sanas se


distribuye aproximadamente normal con media 37.0 C y desviación estándar de 0.4 C.

a) Si 130 personas sanas se seleccionan aleatoriamente, ¿cuál es la probabilidad de


que la temperatura promedio para estas personas sea de 36.80 o menor?
X= Temperatura corporal promedio
M= 37° C
S= 0.4 C
N= 130

(36.80 − 37)
𝑃(𝑋 < 36.80) = 𝑃 (𝑧 < ) = −5.70008 = 0%
0.4
√130

b) ¿Consideraría una temperatura promedio de 36.80 como poco probable de ocurrir,


si la verdadera temperatura promedio de las personas sanas es de 37 C?
Si es un poco probable

6. Costo de un apartamento. El costo promedio de un apartamento en el desarrollo Cedar


Lakes es de $62,000 usd con una desviación estándar de $4,200 usd.

a) ¿Cuál es la probabilidad de que un apartamento en este desarrollo cueste al menos


$65,000 usd?
65,000 − 62,000
𝑃 (𝑋 > ) = 0.7142
4,200
𝑃(𝑋 > 65,000) = 0.7142 = 0.23755

b) La probabilidad de que el costo promedio de una muestra de dos apartamentos sea


al menos de $65,000 usd es mayor o menor que la probabilidad de que un
apartamento cueste eso? ¿En qué cantidad difiere?
Las cantidades difieren tanto porque se alejan de la media.

7. Lanzamiento de una moneda. Una moneda justa se lanza n = 80 veces. Sea p ˆ la proporción
muestral de caras (soles). Encuentre P p (0.44 0.61)

̅ (1 − )
𝜎 ̅=√
𝑛

0.5(1 − 0.5)
𝜎 ̅=√ = 0.0559
80
P (0.44<p<0.61)
P (Z1<p<Z2)
𝑃̅ −
𝑍=
𝜎𝜌
0.44 − 0.5
𝑍1 = = 1.0733 𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑒𝑛 𝑇𝑎𝑏𝑙𝑎 = 0.1423
0.0559
0.61 − 0.5
𝑍2 = = 1.9677 = 0.02455
0.0559

Z1-Z2 = 0.11775
8. Herramientas defectuosas. Se ha encontrado que 2% de las herramientas que produce
cierta máquina tienen algún defecto. ¿Cuál es la probabilidad de que en 400 de dichas
herramientas,

a) ¿3% o más tengan algún defecto?


N>30 Si Cumple
Np = 0.02*400 = 8 Si Cumple
N (1-p) = 400 (1-0.02) = 392 Si Cumple

0.02(1 − 0.02)
𝜎 ̅=√ = 7𝑋10−3
400
0.03 − 0.02
𝑍= = 0.9222 (𝑆𝑒 𝑟𝑒𝑠𝑡𝑎 𝑎 1)𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑒𝑛 𝑇𝑎𝑏𝑙𝑎 = 0.0888
0.007

b) ¿2% o menos tengan algún defecto?


0.02 − 0.02
𝑍= = 0 𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑒𝑛 𝑇𝑎𝑏𝑙𝑎 = 0.500
0.007

Conclusión:

En estadística, un parámetro es un número que resume la gran cantidad de datos que


pueden derivarse del estudio de una variable estadística. El cálculo de este número está
bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de
la población; En estadística un estadístico es una medida cuantitativa, derivada de un
conjunto de datos de una muestra, con el objetivo de estimar o inferir características de una
población o modelo estadístico.

En estadística, la distribución muestral es lo que resulta de considerar todas las muestras


posibles que pueden ser tomadas de una población. Su estudio permite calcular la
probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la
población.

El error estándar es la desviación estándar de la distribución muestral de un estadístico


muestral. El término se refiere también a una estimación de la desviación estándar,
derivada de una muestra particular usada para computar la estimación.
Referencias

▪ Dennis D., W., Mendenhall, W. I., & Scheaffer, R. L. (2009). Estadística Matemática con
Aplicaciones (7 ed.). Mexico, México: Cengage Learning.
▪ Devore, J. L. (2016). Probabilidad y Estadistica para Ingenieria y Ciencias (9 ed.). Cengage
Learning. Retrieved from https://elibro.net/es/lc/uvm/titulos/93280
▪ McClave, J., & Sincich, T. (2014). Statistics (12 ed.). Harlow: Pearson.
▪ Mendenhall, W. I., Beaver, R. J., & Beaver, B. M. (2015). Introducción a la Probabilidad y
Estadística (14 ed.). México, D.F: CENGAGE Learning.
▪ Sweeney, D. J., Anderson, D. R., & Williams, T. (2011). Estadistica para Negocios y Economia
(11 ed.). Cengage Learning. Retrieved from https://elibro.net/es/lc/uvm/titulos/39949

* * *

También podría gustarte