Está en la página 1de 23

TEMA I ESTADISTICA INFERENCIAL I ING.

EN LOGISTICA

TEMA I Distribuciones fundamentales para el muestreo


I.I Introducción a la Estadística inferencial
La Estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos,
así como para sacar conclusiones válidas y tomar decisiones razonables basadas en el análisis.
La Estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya
sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares
de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional.
Las estadísticas son fundamentales tanto para la administración financiera, como para la
administración de operaciones, las ventas, el marketing, las cobranzas, la logística y la gestión
de personal entre otras áreas y actividades de toda corporación.
Definiciones
 Población: Es el conjunto de todos los elementos que se desean analizar y que
presentan una o varias características en común. Dependiendo del número de
elementos que lo conforman, una población puede ser finita o infinita.
 Muestra: Es un subconjunto representativo de elementos provenientes de una
población. La muestra es seleccionada de acuerdo a un plan de muestreo, con el fin de
que la muestra represente adecuadamente a la población.
 Unidad Elemental: Es cada una de las personas, animales u objetos de las que se
requiere información. Estos elementos están afectados por las características que se
desea estudiar. Constituye la unidad más pequeña de la población y de las muestra.
 Variable: Es todo factor o característica que se desea evaluar de las unidades
elementales. Las variables pueden ser cualitativas (nominal ó jerárquicas) ó
cuantitativas (discreta ó continua).
 Parámetro: Es una medida que resume la información de la(s) característica(s) de
interés de la población.
 Estadígrafo: Es una medida que resume la información de la(s) característica(s) de
interés de la muestra.
Ramas de Estadística:
 Estadística Descriptiva. Es la rama de Estadística que se ocupa de la recolección,
clasificación y simplificación de la información. La información recolectada se resume en
cuadros (tablas) y gráficos los cuales deben describir en forma apropiada el
comportamiento de la información recolectada.
 Estadística Inferencial. Es la rama de Estadística que se ocupa de los procesos de
estimación (puntual y por intervalos), análisis y pruebas hipótesis. La finalidad de la
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

estadística inferencial es llegar a conclusiones que brinden una adecuada base científica
para la toma de decisiones, considerando la información muestral recolectada.
En otras palabras la estadística inferencial se ocupa del análisis, interpretación de los
resultados y de las conclusiones a las que se puede llegar a partir de la información obtenida
de una muestra con el fin de extender sus resultados a la población bajo estudio. La
generalización de las conclusiones obtenidas en una muestra a toda la población está sujeta a
riesgo por cuanto los elementos de la muestra son obtenidos mediante un muestreo
probabilístico.
La estadística inferencial provee los procedimientos para efectuar la inferencia inductiva y
medir la incertidumbre de las conclusiones que se van a generalizar. Los problemas más
importantes en este proceso son:
 Estimación Puntual: Es la estimación del valor del parámetro por medio de un único
valor obtenido mediante el cálculo o evaluación de un estimador para una muestra
específica.
Por ejemplo: Si se quiere determinar en cuál de las ciudades, Monterrey o Guadalajara,
el sueldo semanal promedio de un empleado es mayor.
 Estimación por intervalos: Es la estimación del valor de un parámetro mediante un
conjunto de valores contenidos en un intervalo. Para la obtención de intervalos de
confianza se debe considerar el coeficiente de confianza que es la probabilidad de que el
intervalo contenga al parámetro poblacional.
 Prueba de Hipótesis: Es el procedimiento estadístico de comprobación de una
afirmación y se realiza a través de las observaciones de una muestra aleatoria.
El objetivo de la inferencia estadística es hacer inferencias acerca de una población basada en
la información contenida en una muestra. Ahora considerando que las poblaciones están
caracterizadas por medidas descriptivas numéricas llamadas parámetros, a la inferencia
estadística le corresponde hacer inferencias acerca de los parámetros poblacionales.

I.2 Muestreo: Introducción al muestreo y tipos de muestreo.


Los estadísticos enfrentan un problema complejo cuando deben seleccionar una muestra para
un sondeo de opinión o una encuesta electoral, puesto que seleccionar una muestra capaz de
representar con exactitud las preferencias del total de la población no es tarea fácil. Más aún,
un buen muestreo debe proporcionar resultados más oportunos que permitan la obtención
rápida de información de toda una población o sobre un proceso variable.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

Además de lo anterior, vemos que el buen muestreo es indispensable para los problemas
estadísticos donde el estudio de toda la población resulta ser muy caro o, en los casos en que
la información se destruye, no sería factible. Por ejemplo, en el control de calidad sobre la vida
media de las bombillas se llevan a cabo pruebas de tipo destructivo puesto que la muestra se
analiza hasta que las bombillas dejen de funcionar.
En muchas situaciones, el muestreo produce resultados más exactos que en un censo (un
censo se lleva a cabo cuando es indispensable analizar todos los casos de una población), dado
que la pesada carga de trabajo de procesar la información de un censo produce una gran
fatiga que, a su vez, puede ser la responsable de prácticas poco adecuadas por parte de los
investigadores. Asimismo, la población puede ser muy dinámica y no mantenerse en un estado
el tiempo necesario para medir sus características.
Por otro lado, existe infinidad de casos de laboratorio o experimentos que no tienen todos los
datos de la población, ya que ocurren solo con las repeticiones de los experimentos que
pueden ser infinitas. En este sentido, es necesario saber, ¿qué entendemos por muestreo?
El muestreo es simplemente un conjunto de métodos para obtener muestras.
Pero, ¿qué buscamos con el muestreo? Obtener con el mínimo costo, la máxima información
sobre las medidas de la población (parámetros). En otras palabras, encontrar con una muestra
pequeña la mayor información posible de los parámetros.
Al usar un muestreo deben tomarse las precauciones necesarias para asegurar la aleatoriedad
de las muestras. Por consiguiente, existen diferentes técnicas para llevarlo a cabo. A
continuación se mencionan lo más común en los muestreos probabilísticos.
Muestreo aleatorio simple
Cuando hablamos de un muestreo aleatorio simple debe entenderse un muestreo sin
reemplazo. El muestreo aleatorio simple se recomienda cuando las características de interés
presentan gran homogeneidad, pues en caso contrario su uso requeriría muestras grandes,
para lograr una precisión aceptable. Además, cuando se presenta cierta heterogeneidad en los
datos podrían seleccionarse muestras indeseables.
El muestreo aleatorio simple es aquel método que asigna la misma probabilidad de selección a
todas y cada una de las muestras posibles y distintas. Siendo esta probabilidad 1/C Nn , donde N
representa al tamaño de la población y n, el tamaño de la muestra.
Una forma equivalente de seleccionar la muestra es elegir las unidades de una en una y en
forma consecutiva y asignar una probabilidad de selección a las unidades en cada caso.
Ejemplo: Muestreo aleatorio simple
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

De la población estudiantil de los alumnos de primer semestre de ITESA seleccionamos de


manera aleatoria una muestra de 10 estudiantes para encuestar y obtener cierta información.
En estos casos, para respetar la aleatoriedad podemos llevar a cabo la obtención de la muestra
de diferentes formas, la más común consiste en asignar un número diferente a cada
estudiante y luego, con la ayuda de una tabla de números aleatorios o un programa generador
de éstos, elegir 10 números aleatorios y proceder a realizar las entrevistas a los alumnos
seleccionados.
Suponga que contamos a todos los estudiantes de la población de primer semestre de ITESA, y
el resultado es 366 estudiantes. Luego, los etiquetamos con los números 1, 2, 3, hasta 366.
Ahora, mediante tablas de números aleatorios o un programa generador de éstos. Se generan
los 10 números entre 1 y 366, suponga que resultan los números 45, 78, 92, 184, 197, 236,
248, 269, 275 y 291. Es decir, hemos seleccionado a los 10 estudiantes con la técnica de
muestreo aleatorio simple.
https://www.youtube.com/watch?v=vK7KscmDets
https://www.youtube.com/watch?v=M9-wBgqWX-Q
Muestreo estratificado
Cuando se tiene una población que puede ser divida en varias subpoblaciones a las que
llamamos estratos, de acuerdo con ciertas propiedades que deben cumplir sus integrantes,
pensamos en un muestreo de tipo estratificado, cuando éste cumple estas condiciones:
 La población se divide en subpoblaciones denominadas estratos, en las cuales los
integrantes de cada uno cumplen ciertas propiedades comunes.
 Seleccionar una muestra en forma independiente de cada estrato. Si las muestras por
estrato se eligen con el muestreo aleatorio simple, entonces éste se denomina
muestreo aleatorio estratificado (este tipo de muestreo es el que comúnmente se
utiliza). No hay reglas determinantes para elegir el tamaño de cada estrato, pero se
sugiere que sea de forma proporcional a los tamaños de los estratos con respecto al
tamaño poblacional.
 Los estimadores para los parámetros de la población completa se proponen como una
combinación de los correspondientes a los parámetros de los estratos.
Este método de muestreo es flexible en cuanto a la selección de la muestra en cada estrato. Es
válido señalar aquí que los estratos se construyen sin importar que sean geográficamente
contiguos o no. Además, tanto el tamaño de la población completa, como el del estrato deben
ser conocidos.
El muestreo estratificado es ampliamente usado por varias razones, entre las que destacan:
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

 Proporciona estimadores para la población más precisos (esto se logra mediante la


construcción de estratos que sean lo más homogéneos posible).
 Proporciona información sobre los estratos.
 Permite una mejor organización del muestreo.
 Permite una mejor administración de la encuesta.
 Permite una mejor administración de la población.
 Este tipo de muestreo se recomienda cuando se desea tener en la muestra
representantes de cada subpoblación.
Ejemplo: Muestreo estratificado
Suponga que se pide seleccionar una muestra de tamaño 2% de toda la población estudiantil
de la UPIICSA, que tiene 12 500 alumnos. La muestra debe cumplir la condición de que exista
al menos un representante de cada una de las carreras que se imparten en este centro
educativo que tiene las siguientes carreras: administración industrial (4 200), ingeniería
industrial (3 250), ingeniería en transporte (850), ingeniería en informática (1 700) y
licenciatura en informática (2 500).
Por el entorno del ejemplo, podemos decir que están todas las condiciones para llevar a cabo
un muestreo estratificado, donde el tamaño de la muestra es de 250 alumnos (2% de 12 500).
El tamaño de la muestra por estrato, se obtiene de esta forma:
Administración industrial 4 200/12500 ≈ 0.336 ⇒ n1 = 0.336 X 250 = 84
Ingeniería industrial 3 250/12500 ≈ 0.26 ⇒ n2 = 0.260 X 250 = 65
Ingeniería en transporte 850/12500 ≈ 0.068 ⇒ n3 = 0.068 X 250 = 17
Ingeniería en informática 1700/12500 ≈ 0.136 ⇒ n4 = 0.136 X 250 = 34
Licenciatura en informática 2500/12500 ≈ 0.200 ⇒ n5 = 0.200 X 250 = 50
Se cumple que n = n1 + n2 + n3 + n4 +n5 = 84 + 65 + 17 + 34 + 50 = 250

Muestreo sistemático con iniciación aleatoria


El método de muestreo con iniciación aleatoria es un método de muestreo probabilístico que
simplifica la selección de una muestra. En este caso, la primera unidad se selecciona en forma
aleatoria y los restantes elementos, para formar la muestra del tamaño requerido, se toman
siguiendo un patrón establecido. Las ventajas del muestreo sistemático son:
 Es más fácil de realizar en el campo y aun en la oficina.
 Se eliminan errores de los enumeradores, en especial cuando se tiene un marco de
muestreo defectuoso.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

 Extiende la muestra a toda la población, se distribuye mejor y de manera uniforme


sobre la población.
 No precisa la distinción entre muestreo sin reemplazo y con reemplazo.
 Recoge el posible efecto de la estratificación debido al orden en que figuran las
unidades en la población.
 Si la disposición de las unidades en la población es aleatoria, la selección sistemática
equivale a un muestreo aleatorio simple.
Este tipo de muestreo es propicio para realizar estudios como:
1. En una línea de producción que este trabajando en forma continua, se puede hacer un
muestreo de tamaño determinado cada 200 unidades.
2. En la línea de producción anterior el muestreo puede llevarse a cabo cada determinado
tiempo. Por ejemplo, cada hora se selecciona una muestra para su análisis.
3. En el estudio de árboles de un bosque, en el que podemos establecer un patrón de
revisión, elegir el primero y después seleccionar un árbol de cada 100 para su estudio.
4. Cuando se requiere llevar a cabo encuestas a los usuarios del metro, el mejor muestreo
es el sistemático.
Muestreo por conglomerados
Este tipo de muestreo, en cierta forma, es similar al estratificado, puesto que la población se
divide en subpoblaciones (estratos), pero a diferencia del estratificado en éste no se requiere
un representante de cada estrato en la muestra, ya que en primer lugar elegimos una muestra
de estratos y, en segundo, seleccionamos una muestra de cada uno para conformar la muestra
deseada.
El muestreo por conglomerados se usa en poblaciones en extremo grandes, y a diferencia de
las técnicas mencionadas antes, no requiere de un marco de muestreo que liste las unidades
con anterioridad. Proporciona un mayor ahorro de recursos que con cualquiera de las
anteriores, pero se pierde precisión. Además, se usa cuando las unidades se encuentran muy
dispersas geográficamente.
Ejemplo: Muestreo por conglomerados
Suponga que se quiere llevar a cabo una encuesta de los usuarios del metro de la Ciudad de
México (alrededor de cinco millones de usuarios diarios). Como la población en estudio es
demasiado grande, podemos dividir en estratos; por ejemplo, estaciones del metro. Después,
elegimos una muestra de las estaciones y procedemos a realizar la encuesta a los usuarios en
las estaciones seleccionadas (puede ser con el muestreo sistemático). Esta forma de muestreo
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

disminuye considerablemente el costo de la muestra ya que no se requiere numerar con


anterioridad las unidades poblacionales.

Tamaño de la muestra
De manera errónea se piensa que existe una fórmula mágica para calcular el valor deseado de
muestra que sea posible aplicar a cualquier situación o investigación. En general, los
investigadores y estudiantes de áreas aplicadas requieren conocer el tamaño ideal de una
muestra para realizar el estudio de campo de la investigación que llevan a cabo. Existen
diferentes técnicas para determinar el tamaño de la muestra, también hay diferentes
situaciones. Pero, siempre debe tenerse en cuenta que las muestras deben cumplir estas
características:
 Representativa. Todos y cada uno de los elementos de la población deben tener la
misma oportunidad de ser tomados en cuenta para conformar la muestra.
 Adecuada y válida. El error de la muestra debe ser el mínimo posible respecto de la
población.
 Confiable. El tamaño de la muestra debe obtenerse mediante algún proceso
matemático que elimine la incidencia del error.
Podemos establecer que el cálculo del tamaño de la muestra resulta ser uno de los
aspectos clave en la fase previa de cualquier investigación científica o de mercado, ya que
con ésta es posible determinar el grado de credibilidad que podemos asignar a los
resultados de la investigación. Además, al elegir un buen tamaño de muestra y una técnica
adecuada de muestreo, implícitamente hemos reunido información que cumple las
características enunciadas antes para una muestra: representativa, válida y confiable a un
costo mínimo.
I.3 Teorema del límite central.
Cuando se seleccionan muestras aleatorias simples de tamaño n de una población,
la distribución muestral de la media muestral puede aproximarse a una
distribución normal a medida que el tamaño de la muestra se hace grande.
NOTA: La distribución normal es un modelo teórico capaz de aproximar satisfactoriamente el
valor de una variable aleatoria a una situación ideal. En otras palabras, la distribución normal
adapta una variable aleatoria a una función que depende de la media y la desviación típica. Es
decir, la función y la variable aleatoria tendrán la misma representación pero con ligeras
diferencias.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

A continuación se muestra la representación gráfica de una función de densidad de


probabilidad de una variable aleatoria que sigue una distribución normal.

En la figura siguiente se muestra cómo funciona el teorema del límite central en tres
poblaciones diferentes; cada columna se refiere a una de las poblaciones. En el primer renglón
de la figura se muestra que ninguna de las tres poblaciones está distribuida normalmente. La
población I tiene una distribución uniforme. A la población II se le conoce como distribución en
forma de orejas de conejo. Esta distribución es simétrica, pero los valores más probables se
encuentran en las colas de la distribución. La forma de la población III se parece a una
distribución exponencial; es sesgada a la derecha.
ILUSTRACION DEL TEOREMA DE LIMITE CENTRAL CON TRES POBLACIONES
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

En los tres renglones siguientes de la figura se muestran las formas de las distribuciones
muestrales para tamaños de muestras n = 2, n = 5 y n = 30. Cuando el tamaño de la muestra es
2, se observa que cada distribución muestral tiene una forma diferente a la distribución
poblacional correspondiente. Con muestras de tamaño 5, se observa que las formas de las
distribuciones muestrales en los casos de las poblaciones I y II empiezan a parecerse a la forma
de una distribución normal. En el caso de la población III, aun cuando la forma de la
distribución muestral empieza a ser parecida a una distribución normal, todavía se observa
cierto sesgo a la derecha.
Por último, para muestras de tamaño 30, la forma de cada una de las tres distribuciones
muestrales es aproximadamente normal.
Desde el punto de vista de la práctica, será conveniente saber qué tan grande necesita ser el
tamaño de la muestra para que aplique el teorema del límite central y pueda suponer que la
forma de la distribución muestral es aproximadamente normal. En las investigaciones
estadísticas se ha estudiado este problema en distribuciones muestrales de x de muy diversas
poblaciones y para muy diversos tamaños de muestras. Lo que se acostumbra a hacer en la
práctica es suponer que, en la mayor parte de las aplicaciones, la distribución muestral de x se
puede aproximar mediante una distribución normal siempre que la muestra sea de tamaño 30
o mayor. En los casos en que la población es muy sesgada o existen observaciones atípicas,
pueden necesitarse muestras de tamaño 50. Por último, si la población es discreta, el tamaño
de muestra necesario para la aproximación normal suele depender de la proporción
poblacional.

I.4 Distribuciones fundamentales para el muestreo.


I.4.1 Distribución muestral de la media.
La primera distribución muestral importante a considerar es la de la media X . Suponga
que de una población normal con media µ y varianza σ2 se toma una muestra aleatoria de n
observaciones. Cada observación Xi, i = 1, 2,..., n, de la muestra aleatoria tendrá entonces la
misma distribución normal que la población de donde se tomó. Por lo que:
1
X = ( X 1 + X 2 +....+ X n )
n
tiene una distribución normal con media
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

Si tomamos muestras de una población con distribución desconocida, ya sea finita o infinita, la
distribución muestral de X aun será aproximadamente normal con media µ y varianza σ2/n,
siempre que el tamaño de la muestra sea grande. Este resultado es una consecuencia
inmediata del teorema del límite central.

La aproximación normal para X por lo general será buena si n ≥ 30, siempre y cuando la
distribución de la población no sea muy asimétrica. Si n < 30, la aproximación será buena solo
si la población no es muy diferente de una distribución normal y, como antes se estableció, si
se sabe que la población es normal, la distribución muestral de X seguirá siendo una
distribución normal exacta, sin importar que tan pequeño sea el tamaño de las muestras.
El tamaño de la muestra n = 30 es un lineamiento para el teorema del límite central. Sin
embargo, como indica el planteamiento del teorema, la suposición de normalidad en la
distribución de X se vuelve más precisa a medida que n se hace más grande.
Ejemplo: Una empresa de material eléctrico fabrica bombillas que tienen una duración que se
distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar
de 40 horas. Calcule la probabilidad de que una muestra aleatoria de 16 bombillas tenga una
vida promedio de menos de 775 horas.
Solución:
La distribución muestral de X será aproximadamente normal, con µ x = 800 y σ x = 40/√ 16= 10.
La probabilidad que se desea es determinada por el área de la región sombreada de la
siguiente figura.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

775−800
z= = -2.5,
10

y, por tanto, P ( X < 775) = P (Z < -2.5) = 0.0062


TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

EJERCICIOS:
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

1. Se supone que la distribución de la temperatura del cuerpo humano en la población tiene


de media 37° y desviación típica 0,85°. Se elige una muestra de 105 personas, calcula la
probabilidad de que la media sea menor o igual a 36.9°
2. En una distribución N (20, 6), tomamos muestras de tamaño 64. ¿Cuál es la probabilidad de
que la media de la muestra esté comprendida entre 19 y 21?
3. El coeficiente intelectual de los estudiantes se distribuye normalmente con media 100 y
desviación típica 11
a) Si elegimos una persona al azar calcular la probabilidad de que su CI esté entre 100 y
103
b) Se elige al azar una muestra de 25 personas. Calcular la probabilidad de que la media de
sus coeficientes intelectuales esté entre 100 y 103.
4. Una compañía de teléfonos desea conocer la probabilidad de que la media de n=50
llamadas este entre 150 y 155 segundos, teniendo una media para todas las llamadas de
µ=150 y σ=15.
5. Un auditor toma una muestra aleatoria de tamaño 36 de una población de 1 000 cuentas
por cobrar. El valor promedio de las cuentas por cobrar es $ 2 600 con una desviación
estándar de $450 ¿Cuál es la probabilidad de que la media muestral sea inferior a $ 2 500?

I.4.2 Distribución muestral de la diferencia de medias.


Suponga que tenemos dos poblaciones, la primera con media μ1 y varianza σ 21, y la
segunda con media μ2 y varianza σ 22. Representemos con el estadístico X 1 la media de una
muestra aleatoria de tamaño n1, seleccionada de la primera población, y con el estadístico X 2
la media de una muestra aleatoria de tamaño n2 seleccionada de la segunda población,
independiente de la muestra de la primera población. De acuerdo con el teorema del Limite
Central, tanto la variable X 1 como la variable X 2 están distribuidas más o menos de forma
normal con medias μ1 y μ2 y varianzas σ 21/n1 y σ 22/n2, respectivamente. Esta aproximación
mejora a medida que aumentan n1 y n2. Al elegir muestras independientes de las dos
poblaciones nos aseguramos de que las variables X 1 y X 2 sean independientes y, por lo tanto,
concluimos que X 1 y X 2 se distribuyen aproximadamente de forma normal con media:

El teorema del límite central se puede ampliar fácilmente al caso de dos muestras y dos
poblaciones.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

Si se extraen al azar muestras independientes de tamaños n 1 y n2 de dos poblaciones,


2
discretas o continuas, con medias μ1 y μ2 y varianzas σ 21 y σ 2 , respectivamente,
entonces la distribución muestral de las diferencias de las medias, X 1 - X 2 , tiene una
distribución aproximadamente normal, con media y varianza dadas por:

Si tanto n1 como n2 son mayores o iguales que 30, la aproximación normal para la distribución
de X 1 y X 2 es muy buena cuando las distribuciones subyacentes no están tan alejadas de la
normal. Sin embargo, aun cuando n1 y n2 sean menores que 30, la aproximación normal es
hasta cierto punto buena, excepto cuando las poblaciones no son definitivamente normales.
Por supuesto, si ambas poblaciones son normales, entonces X 1 y X 2 tienen una distribución
normal sin importar de qué tamaño sean n1 y n2.

Ejemplo:
Supongamos que los salarios de dos poblaciones, una de hombres y otra de mujeres, siguen
una distribución Normal N(914, 42) y N(883, 30), respectivamente. Escojamos al azar una
muestra de 40 hombres y una muestra de 30 mujeres. ¿Cuál es la probabilidad de que el
sueldo medio de los hombres supere al de las mujeres en 36 euros?
Solución: Como X1 y X2 siguen una distribución Normal, la variable aleatoria X 1 − X2 sigue
también una distribución Normal:

https://calculo.cc/temas/temas_estadistica/muestreo/problemas/
prob_distribuciones2.html
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

https://www.coursehero.com/file/36624061/Trabajo-Estadistica-1/
EJERCICIOS
1. Cada día, miles de personas en un aeropuerto pasan por un control de seguridad en uno de
dos niveles: el nivel A o el nivel B. Supón que, en promedio, a las personas les toma  26
minutos pasar por el control de seguridad en el nivel A con una desviación estándar de 7.5
minutos. En el nivel B, la media y la desviación estándar son de 24 y 4 minutos,
respectivamente.
Cada día, en el aeropuerto ven muestras aleatorias separadas de 100 personas de cada nivel.
a) Calcula la media y la desviación estándar (en minutos) de la distribución muestral de
X A - X B.

b) Calcula P ( X A - X B > 2.0), donde X A y X B son los tiempos promedio que tardan en pasar
por cada control de seguridad.
2. El responsable de la sede central de una empresa afirma que las edades de sus empleados
siguen una distribución normal con una media de 41 años y una desviación típica de 5 años.
Por otro lado, el responsable de una sede de las sucursales de dicha empresa en otro país,
ha determinado que sus empleados también tienen edades que se ajustan a una
distribución normal con una media de 39 años y desviación típica de 3 años.
Con el fin de hacer un estudio comparativo se seleccionan muestras de 40 personas de cada
sede de la empresa.
a) Determina la distribución para la diferencia de las medias muestrales.
b) ¿Cuál es la probabilidad de que los empleados de la sede central tengan una media de
edad de al menos 3 años mayor que los de la sucursal extranjera?
3. Las pruebas de control de calidad para un modelo A de lámparas han determinado que la
duración se distribuye como una normal de media 3300 horas y desviación típica 180 horas;
mientras que para otro modelo B la duración media es de 3200 horas y desviación típica
155 horas.
Si se toman muestras aleatorias de 100 lámparas de cada modelo:
a) ¿Cuáles son los parámetros de media y desviación típica de la diferencia de las medias
muestrales?
b) Halla la probabilidad de que la diferencia de las medias de las duraciones de las
bombillas de cada modelo sea inferior a 40 horas.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

I.4.3 Distribución muestral de la proporción.


En ocasiones no estamos interesados en la media de la muestra, sino deseamos investigar
la proporción de artículos defectuosos o la proporción de alumnos reprobados en la muestra.
La distribución muestral de proporciones es la adecuada para dar respuesta a estas
situaciones. Esta distribución se genera de igual manera que la distribución muestral de
medias, salvo que al extraer las muestras de la población se calcula el estadístico proporción,
donde “x” es el número de éxitos u observaciones de interés y “n” el tamaño de la muestra, en
lugar del estadístico media.
Una población binomial está estrechamente relacionada con la distribución muestral de
proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una
distribución muestral de proporciones contiene las posibilidades o proporciones de todos los
números posibles de éxitos en un experimento binomial, y como consecuencia de esta
relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse
usando la aproximación normal a la binomial, siempre que n(p)≥5 y n(1- p)≥5. Cualquier
evento se puede convertir en una proporción si se divide el número obtenido entre el número
de intentos.
La fórmula que utilizaremos para el cálculo de probabilidad en una distribución muestral de
proporciones está basada en la aproximación de la distribución normal a la binomial. Esta
fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la
muestra.
Media de las proporciones: μ p=P=np

x− p
Desviación media de la binomial z=
√ P (1− p)
Debe agregarse un factor de corrección si se trata de una muestra finita obtenida sin
reemplazamiento.
Factor de corrección:
√ N −n
N −1

Donde:
p es la proporción de la muestra,
P es la media de la proporción,
n es el tamaño de la muestra,
x es el valor buscado y
N es el tamaño de la población
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

Ejemplo
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se
toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción
de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solución:
Media de proporciones: μ p=P=np = 800 X 0.6 = 480

Factor de corrección:
√ N −n
N −1
=
√ 800−480
800−1
=
√ 320
799
= 0.63

x−P 439.37−480 −40.63


Desviación media de la binomial z=
√ P (1− p)
= √ 480(1−0.6) = √ 192 = -2.93
P (x < .55) = P (z < -2.93) = 0.00169
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

EJERCICIOS
1. Un medicamento para malestar estomacal tiene la advertencia de que algunos
usuarios pueden presentar una reacción adversa a él, más aún, se piensa que
alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de
150 personas con malestar estomacal usa el medicamento, encuentre la
probabilidad de que la proporción de la muestra de los usuarios que realmente
presentan una reacción adversa, exceda el 4%.

2. Se sabe que la verdadera proporción de los componentes defectuosos


fabricadas por una firma es de 4%, y encuentre la probabilidad de que una
muestra aleatoria de tamaño 60 tenga:
a) Menos del 3% de los componentes defectuosos.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

b) Más del 1% pero menos del 5% de partes defectuosas

3. Se ha determinado que 85.1% de los estudiantes de una universidad fuman


cigarrillos. Se toma una muestra aleatoria de 200 estudiantes. Calcular la
probabilidad de que no más de 80% de alumnos de la muestra fume.

4. Suponer que de la gente que solicita ingresar a una compañía, 40% pueden
aprobar un examen de aritmética para obtener el trabajo. Si se tomara una
muestra de 20 solicitantes, ¿Cuál sería la probabilidad de que 50% o más de
ellos aprobaran?

5. Considera que el 15 por ciento de 1750 estudiantes de cierta escuela sufrieron


niveles extremos de estrés durante el mes pasado los miembros de un periódico
estudiantil no conocen estos datos pero se interesan en el tema así que deciden
realizar una encuesta a una muestra aleatoria de 160 estudiantes preguntando
si ellos sufrieron niveles extremos de estrés durante el mes pasado más tarde
obtuvieron que el 10 por ciento de la muestra respondía que sí a la pregunta.
Suponiendo que la proporción correcta es del 15%, ¿Cuál es cuál es la
probabilidad aproximada de que más del 10% de los alumnos de la muestra
reporte que ellos sufrieron niveles extremos de estrés durante el mes pasado?

I.4.4 Distribución muestral de la diferencia de proporciones.


Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse
utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos:
 Educación. - ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que
las de los que aprueban inglés?
 Medicina. - ¿Es menor el porcentaje de los usuarios del medicamento A que presentan
una reacción adversa que el de los usuarios del fármaco B que también presentan una
reacción de ese tipo?
 Administración. - ¿Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales.
 Ingeniería. - ¿Existe diferencia entre la proporción de artículos defectuosos que genera
la máquina A y los que genera la máquina B?
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribución muestral de diferencia de proporciones es aproximadamente
normal para tamaños de muestra grande. Entonces p 1 y p2 tienen distribuciones muestrales
aproximadamente normales, así que su diferencia p1-p2 también tiene una distribución
muestral aproximadamente normal.
En el subtema 1.4.3 revisamos la distribución muestral de proporciones y se comprobó que:

por lo que se puede deducir que:


μ p=P=np y σ=
√ Pq
n

μ p −μ p =P1−P2
1 2
y

σ
p1−¿ p =
2
√ P1 q 1 P 2 q 2
n1
+
n2
¿

La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de


proporciones es:

Ejemplo 1.
Los hombres y mujeres adultos radicados en Monterrey difieren en sus opiniones sobre la
promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12%
de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las
mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100
mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de
que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución
binomial y se está utilizando la distribución normal.

P (pH - pM = 3%) = P (z > 0.11) = 0.462 = 46.2 %


Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de
muerte, sea al menos 3% mayor que el de mujeres es de 0.4562.
Ejemplo 2.
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron
despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo
menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria de 320
trabajadores de entre todos los empleados despedidos entre 1979 y 1984. ¿Cuál sería la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos
dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más?
Solución: En este ejercicio se cuenta únicamente con una población, de la cual se están
extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes
en esas dos muestras, por lo que se debe de utilizar la distribución muestral de proporciones
con P1 = P2, ya que es una misma población. Otra de las situaciones con la cual nos
encontramos es que desconocemos la proporción de trabajadores despedidos entre 1979 y
1984 que estuvieron desempleados por un período de por lo menos dos años, sólo se conoce
la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa proporción.
En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se
necesita saber las proporciones de las poblaciones, las cuales en este ejercicio las
desconocemos, por lo que se utilizará el valor de 0.20 como una estimación puntual de P.
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos
dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más?, la
palabra difiera quiere decir que puede existir una diferencia a favor de la muestra uno, o a
favor de la muestra dos, por lo que se tendrán que calcular dos áreas en la distribución y al
final sumarlas.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

La probabilidad de que su proporción muestral de trabajadores sin empleo durante por lo


menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 0.05 o
más es de 0.1260.

EJERCICIOS
1. Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos
y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se
toman muestras de 120 objetos de cada máquina:
a) ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 2 rebase a la máquina 1 en por lo menos 0.10?
b) ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 1 rebase a la máquina 2 en por lo menos 0.15?

2. Un especialista en genética ha detectado que el 26% de los hombres y el 24% de


las mujeres de cierta región del país tiene un leve desorden sanguíneo; si se
toman muestras de 150 hombres y 150 mujeres, determine la probabilidad de
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA

que la diferencia muestral de proporciones que tienen ese leve desorden


sanguíneo sea de: a) Menos de 0.035 a favor de los hombres. b) Entre 0.01 y
0.04 a favor de los hombres.

3. Dos institutos de educación secundaria A y B difieren en el porcentaje de


alumnos aprobados en una determinada asignatura, de tal forma que en el
primer instituto el porcentaje de aprobados en dicha asignatura es de 65%
mientras que en el segundo solo es de 48%. Si se seleccionan aleatoriamente
dos muestras de 45 y 35 alumnos respectivamente, de que la proporción una
prueba objetiva de dicha asignatura. Calcular la probabilidad de que la
proporción muestral de alumnos aprobados en el instituto A supere a la
proporción muestral de instituto B en más de 0.30 puntos

También podría gustarte