Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
INFERENCIAL
Etapa 2: profundización
2
Tabla de contenido
Introducción ................................................................................................................................3
1.2.5. Estimación por intervalos de confianza para las diferencias de medias. .......17
Glossary....................................................................................................................................20
3
Introducción
Sin embargo, estudiar un grupo poblacional en general, ya sea de personas o cosas, puede
ser un trabajo muy tedioso y casi imposible de costear. Aunque este es el trabajo de la
estadística descriptiva, es muy poco probable, por ejemplo, conocer una población tan grande
como la estatura de todos los habitantes de la ciudad de Ibagué.
Por este motivo, la estadística inferencial estudiar sólo una pequeña parte de grupos
enormes. Esto se conoce como muestra y tiene que ser representativa de toda la población.
Así, se ahorran gastos y tiempo, además de poder concluir sobre esta muestra, confiando en
que no esté muy lejos de la realidad.
En este sentido, para poder aplicarse correctamente este tipo de estadística, deben
conocerse sus partes, como lo son el muestreo y las distribuciones de muestreo, que abarcan
el tamaño de la muestra, el teorema del límite central, la distribución muestral de la media, etc.
También hay que conocer la estimación de intervalos de confianza, que permite desarrollar la
estimación puntual, las diferencias de medias, la media, las proporciones, entre otras.
Pregunta orientadora
Existen dos tipos de muestreo estadístico: el “probabilístico”, que es cuando cada elemento
de la población tiene la misma probabilidad de ser seleccionado para la muestra y el "no
probabilístico", que es cuando las probabilidades de que se seleccione cada elemento de la
población no son las mismas y se obtienen de forma subjetiva.
Es el número total de elementos que son extraídos de la población. Hay que tener en cuenta
que la muestra es más pequeña que la población.
5
“Se selecciona haciendo una estimación del parámetro con las características específicas”
(nivel de confianza y error de estimación) (Bustos, 2016). El tamaño de la muestra es denotado
como “n”.
Para poder hallar el tamaño de la muestra, es necesario tener presente los datos que se
ofrecen. Dependiendo de ellos, se relaciona con el tipo de ecuación a desarrollar, en especial si
se tiene la desviación estándar y la población o no.
𝑧2𝜎2
𝑛=
𝑑2
Ejemplo:
Un analista de producción está tratando de ajustar una máquina llenadora de néctar para que
este tenga el promedio a llenar esté dentro de cierto rango. Sabemos que la cantidad de néctar
proyectada por la llenadora la cual corresponde una distribución normal con una desviación
estándar de 0,12 decilitros.
Además, con un nivel de significancia del 95%, la estimación promedio no debe exceder los
0,12 decilitros. ¿Qué tamaño debe elegir el analista de producción para la muestra? ¿Cuántas
mediciones se deben realizar para que la muestra coincida con su plan?
Datos:
S=𝜎= 0.12 (desviación estándar)
E=d=0.02 (error)
𝛼= 95% (nivel de confianza)
Z=1.960
𝑧 2 𝜎 2 (1.960)2 (0.12)2
𝑛= 𝑑2
= (0.02)2
= 138,29 → 139
𝑁𝑍 2 σ2
𝑛=
(𝑁 − 1)𝑑2 + 𝑧 2 σ2
Datos:
𝜎2=1000 (desviación estándar)
E=d=4 (error)
N.C= 90% (nivel de confianza)
Z=1.645
N=10.000 (población)
Donde:
X= Media muestral
µ= Media poblacional
𝜎=Desviación estándar poblacional
n= Tamaño de la muestra
Cabe resaltar que, dependiendo de los datos que se tengan para desarrollar el teorema del
límite central, se procede a elegir entre dos ecuaciones: una que tenga desviación estándar sin
población y otra que tenga la desviación estándar y la población.
Ejemplo: Se conoce que el contenido de creatina de la marca Max Power tiene distribución
normal con un promedio de 25 gramos y desviación estándar de 4 gramos. Si el encargado de
analizar la producción de creatina toma una muestra aleatoria de 25 paquetes de creatina,
¿cuál es la probabilidad de que la media sea mayor o igual a 26 gramos?
Datos:
8
𝜇 =25 gramos
𝜎= gramos
𝑛= 25
√25(26 − 25)
𝑍= = 1.25
4
10 1 2
P( ≥ 26)= P (Z≥ 1.25)=0.1056*100=10.56%= 100
= 10 = 20
(X − µ)
𝑍=
𝜎 √N − n
( )
√n N − 1
Ejemplo: 500 bultos de arroz tienen un peso medio de 5.02 arrobas y una desviación de 0.30
arrobas. El encargado de calidad del molino tomó una muestra al azar de 100 bultos de arroz.
¿Cuál es la probabilidad para que este grupo tenga un peso mayor a las 5,1 arrobas?
0
P ( > 5.10) = P (Z > 2.98) =0.0014*100=0.14%=100 = 0
La probabilidad de que los bultos de arroz elegidos en esta muestra tengan un promedio de
5.10 arrobas es del 0.14%, es decir, ninguno cumple la condición.
9
Para entenderla, se debe partir de que, si se seleccionan todas las posibles muestras
aleatorias de una población, se puede concluir que al evaluar cada una de estas medias
aleatorias como valor que alteran una variable, se puede estudiar su distribución. Partiendo de
esto se procede al cálculo de las medias µ, para hallar la probabilidad.
Ejemplo: El promedio de las baterías de la marca Led Ligfht sigue una distribución normal N
(1500,160). Si se escoge una batería al azar, ¿cuál es la probabilidad de que la batería esté
funcionando por más de 1524 horas?
Datos:
X= bombillas
N (µ, 𝜎) = N (1500,160)
P(X>1524)
1524 − 1500
𝑍= = 0.15
160
Al tener 𝑧 = 0.15, podemos obtener de la tabla para la distribución normal el valor de 0.55. Y se
procede a hacer una resta 1-0.55=0.45*100=45%. La probabilidad es del 45%.
10
Ejemplo: Un analista de calidad posee 12 artículos, de los cuales 4 tienen defectos. El analista
selecciona 5 aleatoriamente del lote descrito, sin reemplazo. Cuando se obtiene la distribución
de la muestra de proporciones para el número de piezas defectuosas, resulta lo siguiente:
4 1
𝑃= = = 33%
12 3
Por lo que se puede deducir que, del lote de piezas, un 33% están defectuosas.
2021, de https://es.slideshare.net/eraperez/distribucion-muestral-de-proporciones
Esta distribución se emplea cuando se tienen dos poblaciones distintas con distribución
normal, en donde la primera población cuenta con una media µ1 y desviación estándar 𝜎1 , y la
segunda población, con media µ2 y desviación estándar 𝜎2 . Asimismo, las muestras aleatorias
de poblaciones son de tamaño “𝑛1 " y “𝑛2 " respectivamente. Se calcula la media muestral para
cada muestra y la diferencia entre ellas. La colección de la diferencia de todas esas medias se
conoce como Distribución muestral de diferencias de medias -
2021, de http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01c.html
𝜎2 𝜎 2
𝑋̅1 − 𝑋̅2 = 𝑁(µ1 − µ2 ; √𝑛1 + 𝑛2 )
1 2
Ejemplo: El jefe de una entidad bancaria en Ibagué afirma que las edades de las personas que
adquieren préstamos comprenden una distribución normal con un promedio de 41 años y una
desviación estándar de 5 años. Por otra parte, el jefe de la sede de Cali encontró que aquellos
de sus clientes que también toman préstamos tienen edades que comprenden una distribución
normal con una media de 39 años y una desviación estándar de 3 años. Con el fin de comparar
las dos sedes de la entidad bancaria, se seleccionan muestras aleatorias de 40 clientes de
cada una. Según lo descrito, ¿cuál es la diferencia de las dos medias muestrales?
52 32
𝑋̅1 − 𝑋̅2 = 𝑁(41 − 39; √ + ) = (2 ; 0,92)
40 40
Este tipo de distribución se realiza de dos poblaciones binomiales y con dos proporciones
muéstrales. La distribución muestral de diferencia de proporciones es aproximadamente para
una muestra grande y de tamaño normal (𝑛1 𝑝1 ≥ 5, 𝑛1 𝑞1 ≥ 5, 𝑛2 𝑝2 ≥ 5, 𝑛2 𝑞2 ≥ 5 ). Entonces
p1 y p2 tienen distribuciones muéstrales que se aproximan a una distribución normal. Por tanto,
su diferencia p1-p2 también tiene una distribución muestral aproximadamente normal.
(Chihuahua, s.f), siendo estas poblaciones de datos cualitativos.
2021, de http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01c.html
(𝑝1− 𝑝2 ) − (𝑃1− 𝑃2 )
𝑍=
𝑃1 𝑞1 𝑃2 𝑞2
√
𝑛1 + 𝑛2
Datos:
14
𝑃ℎ = 0.12
𝑃𝑤 = 0.10
𝑛ℎ = 100
𝑛𝑚 = 100
𝑝(𝑃ℎ − 𝑃𝑤 ≥ 0,03) =?
Al pasar el 0.11 a los datos de la distribución normal, se obtiene que al menos el 3% de los
hombres a favor de la eutanasia es mayor que el de las mujeres mayores, ya que es de 0,4562.
Es cuando se utiliza un único valor para estimar un parámetro, haciendo uso de un punto en
concreto de la muestra para estimar el valor deseado. Algunos estimadores puntuales son la
media muestral y la proporción muestral.
Permite calcular los valores que existen alrededor de una media muestral. Si se desconoce
la media poblacional de la variable a estudiar, se debe tomar una muestra y realizar la
obtención del intervalo (𝐿1, 𝐿2); de forma que se pueda obtener una probabilidad superior (1 −
𝛼) % a aquella en que la media poblacional permanezca en este intervalo. Por lo general, el
nivel de significancia se fija en 95%, 99% o 90%, con una probabilidad 0.05, 0.01 y 0.1.
Ejemplo: Un centro de estadísticas, tiene entendido que entre más riqueza tenga un territorio,
más altos son sus habitantes. Por tal razón, la central de estadística va a estimar la altura
promedio de los hombres con más de 20 años de Hong Kong con un nivel de significancia de
95%. Asumiendo que la desviación estándar de las alturas de los hombres en Hong Kong es de
1,03. Se obtuvo una muestra de 15 hombres aleatoriamente con las siguientes alturas en (cm):
167, 167, 168, 168, 168, 169, 171, 172, 173, 175, 175, 175, 177, 182, 195. Con los datos
obtenidos, se debe realizar el intervalo de confianza. Para esto, se debe calcular la media de la
muestra obtenida X y los valores de los cuantiles z α 2, en la distribución normal. En el modelo
normal, el cuantil de orden 0.975 se indica mediante el cuantil de orden 0.025 se indica con z
0,975 = −1,96. Alternativamente se puede cambiar el signo al cuantil de orden 0.975, que es lo
realizado cuando la distribución es simétrica.
173 1 173
175 1 525
177 1 177
182 1 182
195 1 195
Total 15 2602
Elaboración propia (2021).
Teniendo una confianza del 95 % de que la altura media, µ, en Singapur está comprendida
entre 171.45 y 175.49 en cuanto a la estatura.
𝑃(1−𝑝)
tipificada y √ 𝑛
corresponde al error de la proporción.
Ecuación 14. Fórmula para estimar intervalos de confianza para las proporciones
𝑃(1 − 𝑝)
𝑃 ± 𝑧𝛼/2 √
𝑛
Ejemplo: En una universidad se realiza una muestra de 50 alumnos, los cuales son sometidos a
una evaluación de conocimientos. De esto, sólo 40 lo aprobaron. ¿Cuál es el intervalo estimado
de la proporción de la población para un nivel de significancia del 95%?
Datos:
40
P= 50
= 0.8
17
0.8(1 − 0.8)
0.8 ± 1.96√ = [0.69; 0.91]
50
Para la construcción del intervalo de confianza se debe tener dos grupos poblacionales con
sus respectivas medias. Así se podrá comparar sus diferencias y determinar si son iguales o si
hay una más grande que la otra.
Ecuación 16. Fórmula para estimar intervalos de confianza para las diferencias de medias
1 1 1 1
(𝑥 𝑥2 − 𝑡𝑎,𝑣 𝑆𝑝 √ +
̅̅̅1 − ̅̅̅) < 𝜇1 − 𝜇2 < (𝑥 𝑥2 + 𝑡𝑎,𝑣 𝑆𝑝 √ +
̅̅̅1 − ̅̅̅)
2 𝑛1 𝑛2 2 𝑛1 𝑛2
1 1 1 1
(78.86 − 61.43) − 1.782 ∗ 4.17√ + < µ1 − µ2 < (78.86 − 61.43) + 1.782 ∗ 4.17√ +
7 7 7 7
Ecuación 18. Fórmula para estimar intervalos de confianza para la diferencia de proporciones
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝑝1 − 𝑝2 ± 𝑧𝛼/2 √ +
𝑛1 𝑛2
Donde el símbolo 𝑧𝛼/2 es el valor crítico de la probabilidad (𝑍 > 𝑧𝛼/2 ) = 𝛼/2 y corresponde
a un intervalo de confianza de 1 − 𝛼 %.
Datos:
75
Antes= = 0.05 = 5%
1500
80
Después=2000 = 0.04 = 4%
Recursos complementarios
Referencias
Glosario
• Interval: Range or distance established between two points, where there is a minimum
number and a maximum number.
• Estimator: It is a statistic that requires certain conditions to be able to calculate
parameters of a population.
• Proportion: Number of observations with a particular characteristic among the
reference population
• Random: phenomenon that when repeated several times gives different results
• Distribution: function that assigns to each event defined on the variable the probability
that said event occurs.