Está en la página 1de 17

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO

FACULTAD DE INGENIERÍA ESTADÍSTICA 2


ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

UNIDAD 1: TEORÍA DEL MUESTREO

Glosario:

 Población (N): la totalidad de las observaciones en las que estamos


interesados.

 Población infinita: no se conoce la totalidad de elementos en la población


o la misma es demasiado grande en relación al tamaño de la muestra.

 Población finita: se conoce la totalidad de elementos en la población.

 Muestra (n): subconjunto de elementos extraídos de la población.

 Muestra con reemplazo: un elemento de la población puede estar en la


muestra al menos una vez.

 Muestra sin reemplazo: un elemento de la población puede estar en el


muestra solamente una vez.

 Distribución muestral: es una lista de todos los valores posibles para un


estadístico y la probabilidad relacionada con cada valor. Representa la
distribución de valores de una muestra.

 Error estándar o error de la distribución muestral de medias: medida de


la dispersión de las medias muestrales alrededor de µ.

 Proporción: es el cociente del número de veces que se presenta un valor o


característica (éxito), con respecto al total de observaciones de la variable en
estudio.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Distribuciones muestrales

Como primer paso antes de trabajar con distribuciones muestrales es importante


definir las variables de estudio y los indicadores a utilizar. A los indicadores de la
población se les llama parámetros poblacionales mientras que a los indicadores de
la muestra son llamados estadísticos muestrales. Se denotarán con los siguientes
símbolos.

Indicadores Parámetros poblacionales Estadísticos muestrales

Promedio  __
x
Varianza 𝜎2 𝑠̂ 2
Desviación 𝜎
estándar ŝ
 oP
Proporción p̂
Muestreo aleatorio

El muestreo aleatorio es aquel en el que todos los elementos de la población tienen


las mismas probabilidades de estar en la muestra. El muestreo es realizado con el
propósito de obtener información sobre parámetros desconocidos de la población
estudiada.

Si se consideran todas las muestras posibles de tamaño n que pueden


extraerse de una población, y para cada muestra se calcula el estadístico. De
esta manera obtenemos la distribución del estadístico, que es su distribución
muestra.
Para una distribución muestral podemos lógicamente calcular la media,
varianza, desviación estándar, etc. Algunas veces a la desviación estándar
también se le llama error estándar.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

 DISTRIBUCIÓN MUESTRAL DE MEDIAS CON VARIANZA CONOCIDA σ2

Una población de las producciones semanales de una fábrica en miles de toneladas


es 200, 250, 150, 200 y 300. Realice una distribución muestral y calcule la media de
las medias y el error estándar para las muestras de tamaño 2, utilice muestras con
reemplazo y sin reemplazo.

Como primer paso se procede a calcular la media y la desviación estándar de la


población.

200 + 250 + 150 + 200 + 300


𝜇= = 220 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠
5

∑(𝑥̅ − 𝜇)2
𝜎= √ = 50.19 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠
5

Se realizaran los cálculos para las distribuciones muestrales con muestras con
reemplazo y sin reemplazo.

 Con reemplazo

o Debe calcularse el número de muestras, se utiliza con la siguiente fórmula:


𝐾 = 𝑁 𝑛 = 52 = 25

o Una vez se tenga el número de muestras se procede a calcular la media


para cada una de las muestras utilizando la fórmula
∑ 𝑥𝑖
𝑥̅𝑖 =
𝑛

200 250 150 200 300


200 200 225 175 200 250
250 225 250 200 225 275
150 175 200 150 175 225
200 200 225 175 200 250
300 250 275 225 250 300
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Al tener las medias de todas las muestras se procede a calcular la media de la


distribución muestral, utilizando la siguiente fórmula:
∑ 𝑥̅𝑖 5500
𝜇𝑥̅ = = = 220 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠
𝐾 25
Se cumple que la media poblacional es igual a la media de la distribución muestral
de medias.
𝜇𝑥̅ = 220 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠 = 𝜇

 Sin reemplazo
o Debe calcularse el número de muestras, se utiliza con la siguiente fórmula:
K= NCn= 5C2=10

o Una vez se tenga el número de muestras se procede a calcular la media


para cada una de las muestras utilizando la fórmula
∑ 𝑥𝑖
𝑥̅𝑖 =
𝑛

Muestra Media
200 250 225
200 150 175
200 200 200
200 300 250
250 150 200
250 200 225
250 300 275
150 200 175
150 300 225
200 300 250

Al tener las medias de todas las muestras se procede a calcular la media de la


distribución muestral, utilizando la siguiente fórmula:
∑ 𝑥̅𝑖 2200
𝜇𝑥̅ = = = 220 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠
𝐾 10

Se cumple que la media poblacional es igual a la media de la distribución muestral


de medias.
𝜇𝑥̅ = 220 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑡𝑜𝑛𝑒𝑙𝑎𝑑𝑎𝑠 = 𝜇
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Ejemplo:
Las ventas en miles de dólares para East Coast Manufacturing (ECM) durante los
últimos 5 meses fueron de 68, 73, 65, 80, y 72. Asumiendo que estos cinco meses
constituyen la población, la media claramente es µ=71.6. Como director de
marketing de ECM, se desea estimar este µ “desconocido” tomando una muestra
sin reemplazo de tamaño n=3. Se espera que el error de muestreo que es probable
que ocurra sea relativamente pequeño. Realice una distribución muestral.

1. Calcular el número de muestas K= NCn= 5C3=10


68+73+65
2. Calcular la media para cada una de las muestras, Ej. 𝑥̅1 = =68.67
3
Muestra Media
68,73,65 68.67
68,73,80 73.67
68,73,72 71
68,65,80 71
68,65,72 68.33
68,80,72 73.33
73,65,80 72.67
73,65,72 70
73,80,72 75
65,80,72 72.33
3. Calcular la media de la distribución muestral
∑ 𝑥̅𝑖 716
𝜇𝑥̅ = = = 71.6 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝐾 10
4. Calcular la varianza y la desviación estándar muestral

Muestra Varianza
68,73,65 8.5849
68,73,80 4.2849
68,73,72 0.36
68,65,80 0.36
68,65,72 10.6929
68,80,72 2.9929
73,65,80 1.1449
73,65,72 2.56
73,80,72 11.56
65,80,72 0.5329
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

∑(𝑥̅ −𝜇)2 43.07


𝜎 2 𝑥̅ = = = 4.307 𝜎𝑥̅ = √4.307 = 2.08 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑑ó𝑙𝑎𝑟𝑒𝑠.
𝐾 10

Dado que para utilizar las fórmulas anteriores para la varianza de la


distribución muestral es necesario realizar muchos cálculos y puede tomar
tiempo una aproximación certera son las siguientes fórmulas. Estas
fórmulas podrán utilizarse siempre y cuando se conozca la varianza
poblacional.

 Población Infinita, muestra con reemplazo


σ
μX̅ = μ σX̅ =
√𝑛
 Población Finita, muestra sin reemplazo
σ (𝑁 − 𝑛)
μX̅ = μ σX̅ = √
√𝑛 (𝑁 − 1)

Existe la posibilidad de que aunque conozcamos el tamaño de la población,


la misma se considere infinita si la muestra es muy pequeña respecto a la
misma. Para determinar si este es el caso utilizaremos la siguiente
expresión.
𝒏 > 𝟎. 𝟎𝟓𝑵
Si se cumple con lo que establece la expresión consideraremos a nuestra
población finita, de lo contrario la consideraremos infinita. Cuando tengamos
una población finita utilizaremos un factor de corrección:

(𝑁−𝑛)
Factor de corrección de población finita √
(𝑁−1)

Como ejemplo utilizaremos los datos del problema Utilicemos el problema


anterior para realizar la demostración de la muestra, por medio de la fórmula
∑(𝑥−𝜇)2 129.2
𝜎2 = = = 25.84 𝜎 2 = √25.84 = 5.083
𝑁 5

Ahora utilizando la nueva fórmula para población finita dado que 3 es mayor
que 0.25 de acuerdo a la relación de comparación, procederemos a calcular
el valor de la desviación estándar de la distribución muestral.

σ(𝑁 − 𝑛) 5.083 (5 − 3)
σX̅ = √ = √ = 2.9348 ∗ 0.70716 = 2.075 ≅ 2.08
√𝑛 (𝑁 − 1) √3 (5 − 1)
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Con esto comprobamos que la nueva fórmula es más sencilla de aplicar y


genera los mismos resultados, solamente debemos conocer la desviación
estándar poblacional y el tamaño de la muestra.

 DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

Cuando queremos estudiar el porcentaje de cliente que compra un producto,


el porcentaje de artículos defectuosos en un lote, la cantidad de mujeres o
de hombres, haremos uso de proporciones. La distribución muestral de
proporciones es similar la distribución muestral de medias.

Se tomarán muchas muestras de tamaño n, y cada muestra tendrá su propia


cantidad de éxitos x, se espera que la media de las proporciones muestrales
sea igual a la proporción poblacional.
∑𝑝
𝐸(𝑝) = =𝜋
𝑘
El error estándar para la distribución muestral de proporciones se calculará
de la siguiente manera:
𝜋(1−𝜋)
o Población infinita 𝜎𝑝 = √
𝑛

𝜋(1−𝜋) 𝑁−𝑛
o Población finita 𝜎𝑝 = √ ∗ √ 𝑁−1
𝑛

 DISTRIBUCIÓN MUESTRAL DE VARIANZA


Cuando se extraen todas las muestras posibles de una población, y a dichas
muchas se les calcula la varianza se obtiene la distribución muestral de
varianzas. La misma también es conocida como la distribución Chi-cuadrado.
Para calcular el valor de chi cuadrado utilizaremos la siguiente expresión

2
(n − 1)s2 𝑛 (𝑥 − 𝑥̅ )2
𝑖
χ = = ∑
σ2 𝑖=1 𝜎2
Donde:
s2 es la varianza muestral n es el tamaño de muestra
2
σ es la varianza poblacional
La varianza muestral se puede calcular por medio de la siguiente expresión:
𝑛 (𝑥 − 𝑥̅ )2
2 𝑖
𝑆 =∑
𝑖=1 𝑛
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

TEOREMA DEL LÍMITE CENTRAL

El teorema del límite central dice que para una población cualquiera, a medida
que n aumenta la distribución de medias muestrales se aproxima a una
distribución normal.

En caso de que la población estudiada tenga una distribución normal, la distribución


de medias muestrales también tendrá una distribución normal.

Fuente: Estadística aplicada a los negocios, Allen Webster. 2,000

En el caso en el que la población no presente una distribución normal, si el tamaño


de la muestra es igual o mayor a treinta la distribución muestral de medias tendrá
una distribución muestral.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Fuente: Estadística aplicada a los negocios, Allen Webster. 2,000

El tamaño de la muestra afectará la dispersión de los datos muestrales respecto de


la media poblacional, mientras más grande sea la muestra más cercana es la
estimación.

En el teorema del límite central para medias se utilizarán valores de Z para analizar
las poblaciones dadas, el cálculo del mismo se realizará por medio de la siguiente
fórmula cuando se conozca la desviación estándar poblacional.
𝑥̅ − 𝜇
𝑍=𝜎
⁄ 𝑛

Donde:
𝑥̅ media muestral 𝜎 desviación estándar poblacional
𝜇̅ media poblacional 𝑛 tamaño de la muestra
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Se pueden tener tres casos para la aplicación del teorema del límite central.
̅ ≤ 𝒂, deben encontrarse solamente un valor de Z en base al valor de
1. 𝑿
comparación a, además del área bajo la curva para dicho Z.

̅ ≥ 𝒂, Deben encontrarse solamente un valor de Z en base al valor de


2. 𝑿
comparación a, el área bajo la curva de dicho valor debe de ser restado a 1
para encontrar el área que estamos buscando. P= 1 − 𝑃(𝑍)

̅ ≤ 𝒃, deben encontrarse dos valores de Z y dos áreas bajo la curva, uno


3. 𝒂 ≤ 𝑿
para cada límite.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Pudimos observar el caso cuando conocemos la desviación estándar de la


población y tengamos muestras de tamaño mayor a 30. Pero cuando tenemos
muestras de tamaño menor a 30 o no se nos proporciona la desviación
estándar poblacional, la distribución muestral de medias se aproxima a la
distribución t de student.

Por lo tanto tendremos lo siguiente para la distribución muestral de medias:



μX̅ = μ σX̅ =
√𝑛
Para calcular ŝ utilizaremos la siguiente expresión:
∑(𝑥𝑖 − 𝑥̅ )2 𝑛 ∑ 𝑥𝑖 2 − (∑ 𝑥𝑖 )2
𝑠̂ = √ =√
𝑛−1 𝑛(𝑛 − 1)

Para aplicar el teorema del límite central con muestras pequeñas utilizaremos la
distribución t de student, con la siguiente expresión. Se pueden aplicar los mismos
3 casos que para la normal.
𝑥̅ − 𝜇
𝑡=
ŝ⁄
√𝑛
Donde:
𝑥̅ media muestral 𝑠̂ desviación estándar muestral
𝜇̅ media poblacional 𝑛 tamaño de la muestra

Al utilizar la distribución debemos tener en cuenta los grados de libertad, los cuales
son el número de observaciones que podemos elegir libremente. De denota con g.l.
g.l. = n-1
Mientras el tamaño de la muestra se acerca a 30, la distribución tiende a la normal.

Fuente: Estadística aplicada a los negocios, Allen Webster. 2,000


UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Teorema del límite central para proporciones

Al estudiar las proporciones de una población nos topamos con que las mismas son
variables discretas no continuas. Las proporciones siguen una distribución binomial,
pero su estudio reveló que cuando se trata de muestras muy grandes se puede
aproximar los valores de la distribución binomial por medio de la distribución normal.
Para realizar dicha aproximación incluiremos se definirá lo siguiente:
𝜇 = 𝑛 ∗ 𝜋 y 𝜎 = √𝑛𝜋(1 − 𝜋)
Dado que utilizaremos la distribución normal para aproximar debemos calcular un
valor de Z, utilizando la media y la desviación en términos de las proporciones.
𝑥−𝜇 𝑥 − 𝑛𝜋
𝑍= =
𝜎𝑝̂ √𝑛𝜋(1 − 𝜋)
La expresión anterior se encuentra en términos de la proporción de la población y
del número de éxitos en la muestra. Debido al cambio de variable discreta a continua
es necesario hacer una corrección para el número de éxitos, para ella se le sumará
o restará 0.5 dependiendo de si los límites quieren incluirse o no. Por ejemplo si
nosotros queremos saber la probabilidad de que sea mayor que un valor
sumaremos 0.5 para quedar por encima del límite superior, pero si queremos que
sea mayor o igual a un valor, restaremos 0.5 para incluir el límite.
𝑥 ± 0.5 − 𝑛𝜋
𝑍=
√𝑛𝜋(1 − 𝜋)
La expresión anterior se encuentra en términos del número de éxitos pero si
queremos el valor en términos de la proporción muestral tendremos que dividir todo
dentro n, dado que 𝑝̂ = 𝑥⁄𝑛, el cambio se presenta a continuación

𝑥±0.5−𝑛𝜋
𝑛 𝑝̂±1⁄2𝑛−𝜋 𝑝̂±1⁄2𝑛−𝜋
𝑍= √𝑛𝜋(1−𝜋)
= =
𝑛𝜋(1−𝜋) 𝜋(1−𝜋)
√ √
𝑛 𝑛2 𝑛

𝑝̂ ± 1⁄2𝑛 − 𝜋
𝑍=
√𝜋(1 − 𝜋)
𝑛
El signo del factor de corrección dependerá de si queremos o no incluir el límite de
los valores a o b dentro de la probabilidad. Por ejemplo veamos el límite de a en la
imagen de abajo. Si queremos que la proporción sea menor que un valor,
utilizaremos -𝟏⁄𝟐𝒏 dado que no queremos incluirlo, pero si queremos que la
proporción sea menor o igual a a, entonces utilizaremos +𝟏⁄𝟐𝒏 para incluir el límite.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Los mismo puede aplicarse para el valor b, si queremos que la proporción sea
mayor que b, entonces utilizaremos +𝟏⁄𝟐𝒏 para no incluir el valor del límite, pero si
queremos que la proporción sea mayor o igual entonces debemos utilizar -𝟏⁄𝟐𝒏
para incluir el límite.

Ejemplos teorema del límite central:

1. Muestras grandes, σ conocido


Las latas vendidas por una empresa tienen un promedio de 16.1 onzas con
una desviación estándar de 1.2 onzas. Si se toma una muestra de 200 las
tas ¿cuál es la probabilidad de que el promedio sea?
a) Menor de 16.27
b) Por lo menos 15.93
c) Entre 15.9 y 16.3
a) 𝑷(𝒙̅ < 𝟏𝟔. 𝟐𝟕)
16.27 − 16.1
𝑍= = 2.003 ≅ 2.00
1.2⁄
√200
Se busca la probabilidad de z en la tabla de la normal
𝑃(𝑍 = 2.00) = 0.97725
Ra/La probabilidad de la media de llenado de las latas sea menor a 16.27
onzas es del 97.73%
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

̅ ≥ 𝟏𝟓. 𝟗𝟑)
b) 𝑷(𝒙
15.93 − 16.1
𝑍= = −2.003 ≅ −2.00
1.2⁄
√200
Se busca la probabilidad de z en la tabla de la normal, y la misma se resta a
1 pues queremos el lado derecho del límite.
𝑃(𝑍 = −2.00) = 0.02275
𝑷(𝒙̅ ≥ 𝟏𝟓. 𝟗𝟑) = 𝟏 − 𝟎. 𝟎𝟐𝟐𝟕𝟓 = 𝟎. 𝟗𝟕𝟕𝟐𝟓
Rb/La probabilidad de la media de llenado de las latas sea de por lo
menos 15.93 onzas es del 97.73%

̅ ≤ 𝟏𝟔. 𝟑)
c) 𝑷(𝟏𝟓. 𝟗 ≤ 𝒙

Dado que ahora queremos que la media se encuentre entre dos valores
dados, debemos calcular dos valores de z, utilizando ambos límites.
15.9−16.1 16.3−16.1
𝑍1 = 1.2⁄ = −2.36 𝑍2 = 1.2⁄ = 2.36
√200 √200
̅ ≤ 𝟏𝟔. 𝟑)= 0.99086- 0.00914 =0.98172
𝑷(𝟏𝟓. 𝟗 ≤ 𝒙
Rc/La probabilidad de la media de llenado de las latas este entre 15.9 y
16.3 onzas es de 98.172%

2. Muestras pequeñas, σ desconocido


Los valores de las matriculas de estudiantes en una universidad privada
tienen un comportamiento aproximadamente normal. El promedio es de
2,100,000 soles. Se seleccionan 8 pagos al azar, los mismos presentan una
media de 2, 098, 750 soles con una desviación estándar de 168,644.81.
Determine la probabilidad de que:
a) La media sea menor a 2, 000, 000 soles
b) La media sea mayor o igual a 2, 500, 000 soles.
a) 𝒙̅ < 𝟐, 𝟎𝟎𝟎, 𝟎𝟎𝟎
2000000 − 2100000
𝑡= = −1.67
168644.81⁄
√8
Ya con el valor de t, procedemos a buscarlo en la tabla de la distribución de
t student, con n-1, 7 grados de libertad.
La tabla proporcionada por el área de estadística nos provee de la
probabilidad de izquierda a derecha, por lo que es necesario restarle a uno
la probabilidad encontrada para obtener la probabilidad de que sea menor.
Dado que la distribución de t de student es simétrica si necesitamos
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

encontrar la probabilidad de un t negativo, se buscará el mismo valor


pero positivo y se realizará la corrección.

Probabilidad 0.1 X 0.05


Valor de t 1.4149 1.67 1.8946

La probabilidad x, la encontraremos promediando las otras dos


probabilidades encontradas, lo mismo nos da una probabilidad de 0.075.
Dado que las colas para -1.67 y 1.67 serían iguales, las probabilidades son
las mismas.
Ra/La probabilidad de que el pago promedio sea menor a 2, 000, 000 de
soles es 7.5%

̅ ≥ 𝟐, 𝟎𝟎𝟎, 𝟎𝟎𝟎
a) 𝒙
2500000 − 2100000
𝑡= = 6.70
168644.81⁄
√8
Se procede a buscar el valor de t en la tabla con 7 grados de libertad, se
puede observar que el valor calculado es mayor que el valor más alto de t por
lo que la probabilidad se acercará a 0. Rb/La probabilidad de que el pago
promedio sea mayor o igual a 2, 500, 000 de soles tiende a ser 0.

3. Proporciones
Encontrar la probabilidad de que de los 200 próximos niños que nazcan, a)
menos de 40% sean varones, b) por lo menos el 54% sean varones.
Supóngase que existe la misma probabilidad de nacimiento de un niño que
de una niña.

Como primer punto debemos calcular nuestros valores de π, en este caso


dado que se asume igualdad de proporciones π=0.5
a) Probabilidad de que 𝒑 < 𝟎. 𝟒
Primero calculamos la desviación de la proporción
0.5(1 − 0.5)
𝜎𝑝 = √ = 0.03535
200
Una vez tenemos dicho valor podemos calcular el valor de z, utilizando el
factor de corrección con signo negativo pues no queremos incluir el límite.
0.4 − 1⁄2(200) − 0.5
𝑍= = −2.758 ≅ −2.76
0.03535
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Luego buscamos el valor de z en la tabla de la normal para encontrar el


la probabilidad de ocurrencia.
𝑃(𝑝̂ ) = 0.00289

Ra/ la probabilidad de que menos del 40% de los bebés que nazcan sean
varones es del 0.289%.

b) Probabilidad de que 𝒑 ≥ 𝟎. 𝟓𝟒

Dado que los datos de la población no han cambiado tendremos la misma


desviación del inciso anterior. Para calcular el valor de z volvemos a utilizar
el factor de corrección negativo pero en este caso es porque queremos incluir
el límite.
0.54 − 1⁄2(200) − 0.5
𝑍= = 1.0608 ≅ 1.06
0.03535
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA MATERIAL DE APOYO
FACULTAD DE INGENIERÍA ESTADÍSTICA 2
ESCUELA DE CIENCIAS UNIDAD 1
ÁREA DE ESTADÍSTICA INGA. MAYRA CARVAJAL

Luego buscamos el valor de z en la tabla de la normal para encontrar el la


probabilidad de ocurrencia y lo restamos a 1, pues queremos la parte mayor
o igual al límite dado.
𝑃(𝑧) = 0.85543

𝑃(𝑝̂ ) = 1 − 0.85543 = 0.14457


Rb/ La probabilidad de que al menos el 54% de los bebés que nazcan
sean varones es del 14.457%

4. Varianzas

Un fabricante de baterías para automóvil garantiza que su producto durara,


en promedio, 3 años con una desviación estándar de 1 año. Si cinco de estas
baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, ¿el fabricante
continuara convencido de que sus baterías tienen una desviación estándar
de 1 año? Suponga que las duraciones de las baterías siguen una
distribución normal.

Primero debemos calcular el valor de la varianza muestral utilizando la


siguiente expresión:

2
𝑛 ∑ 𝑥𝑖 2 − (∑ 𝑥𝑖 )2 5 ∗ 48.28 + (15)2
𝑠̂ = = = 0.815
𝑛(𝑛 − 1) 5(4)
Luego se calculará el valor de Chi cuadrado

2
(n − 1)s2 (4)0.815
χ = = = 3.26
σ2 1
La teoría nos dice que el 95% de la distribución de chi cuadrado se encuentra
entre los valores de χ2 0.025 y χ2 0.975 , en nuestro caso deberemos buscar
dichos valores con n-1 grados de libertad en la tabla para determinar si el
valor que encontramos se encuentra entre dichos valores o no.

Los valores obtenidos son:


χ2 0.025 = 11.153 y χ2 0.975 = 0.484
Nuestro valor de chi cuadrado es de 3.26 por lo que está dentro de los
límites y podemos decir que la suposición del fabricante está en lo
correcto.

También podría gustarte