Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Para abordar los temas de Inferencia Estadística es conveniente recordar el significado del
término población o universo y sus características utilizadas en Estadística.
1.1 Población o Universo
1
Por otra parte, las variables antes descritas poseen medidas importantes (de tendencia
central, de dispersión, de asimetría, de kurtosis, o algunas proporciones) que son
desconocidas y por lo que se denominan parámetros; los cuales, podrán ser estimados
empleando la inferencia estadística. Ejemplos de parámetros de variables antes descritas
podrán ser los siguientes: a) ingreso medio mensual (µ), la varianza (σ2) y la desviación
estándar (σ) de la variable ingreso mensual, b) gasto medio mensual (µ), la varianza (σ2) y
la desviación estándar (σ) de la variable gasto mensual, c) la edad promedio de los jefes
de hogar, d) la proporción de jefes de hogar con formación profesional universitaria (P), e)
proporción de hogares sin vivienda propia, f) proporción de viviendas de hogares de esa
población sin agua potable, etc., etc.
Finalmente, las variables poblacionales que se investigan tienen diferentes formas de
distribución (Bernoulli, Binomial, Geométrica, Hipergeométrica, Uniforme, Exponencial,
Normal, etc., etc.) que también es importante conocer para utilizar los métodos de la
inferencia estadística.
1.1.1 Clasificación de Poblaciones
Poblaciones Infinitas
Son aquellas que tienen un número numerable de unidades o elementos, ejemplo: número
de pacientes hospitalizados por día en un centro médico. Todas las selecciones o
extracciones de muestras aleatorias sin restitución de poblaciones finitas (N), obviamente
se consideran poblaciones finitas.
Un fabricante de focos no prueba la duración de cada uno de los focos que produce para
determinar el tiempo medio de duración, ya que no tendría que vender. Su departamento
de control de calidad se encarga, con métodos estadísticos de la inferencia estadística de
hacerle conocer cuál es aproximadamente esa duración media, cual es la proporción de
focos defectuosos, cual es la variabilidad media de la duración, etcétera, con solo probar
una muestra relativamente pequeña de focos.
2
Para cuantificar los glóbulos rojos de una persona se recurre a una pequeña muestra de
sangre y no al recuento total, que resultaría imposible de realizar.
Es recomendable el empleo del muestreo en vez del examen de todos los elementos de
una población por varias razones:
Con menor costo y con mayor rapidez se obtiene la información, y en ciertos casos
se obtiene con mayor precisión y confiabilidad.
El costo menor es evidente, ya que al examinar unos cuantos elementos en vez del
total representa menor costo; por ejemplo, resultaría el costo muy elevado de un
censo a los miles de profesionales bolivianos, cuando pueden obtenerse buenos
resultados con una muestra relativamente pequeña, pero representativa.
En la mayor parte de los estudios se requiere presentar los resultados obtenidos
con oportunidad en tiempo breve; las muestras pueden levantarse y analizarse con
mayor rapidez que un censo.
En muchas ocasiones se requiere información que puede ser obtenida por personal
especializado y entrenado; en otras ocasiones se requiere de instrumental
apropiado; por ejemplo obtener información médica, económica, política, etc.
Cuando las poblaciones son pequeñas; puede ser más económica y rápida una
investigación sobre toda la población.
Las muestras no probabilísticas se emplean con frecuencia por causa de la facilidad con
que pueden obtenerse, aun cuando carecen de fundamentos teóricos satisfactorios.
Por ejemplo: si con base a una muestra obtenida del directorio telefónico de una ciudad
grande se estimara la votación de los habitantes de la misma, respecto a una próxima
elección, la muestra no será correcta, ya que la mayoría de los votantes no están
registrados en el directorio y quienes lo están constituyen seguramente una población con
rasgos particulares. En este caso, aun cuando la selección del registro se hiciera con
sumo cuidado, no sería conveniente generalizar los resultados obtenidos a la población
total de la ciudad; en todo caso la generalización pudiera ser válida únicamente para la
población de electores registrados en el directorio.
La selección de una muestra tiene que partir de algunos fundamentos teóricos para que
pueda considerarse propiamente como tal.
La teoría del muestreo solo es aplicable a las muestras, donde cada uno de los elementos
de una población tiene una probabilidad conocida de ser seleccionado y, además, que la
selección de esos elementos se obtenga al azar.
En la práctica poco se utiliza el muestreo aleatorio simple, sin embargo los principios
básicos de la teoría del muestreo se pueden explicar y desarrollar de manera más sencilla
a partir del muestreo aleatorio simple. Todo tipo de muestreo involucra, en una forma,
selección de muestras aleatorias al azar, por ello se describirá brevemente los
procedimientos de selección aleatoria.
Por ejemplo: en una fábrica que tiene 2.500 obreros, se desea obtener una muestra
aleatoria de 200 obreros para una investigación sobre productividad.
La selección de los 200 obreros puede realizarse mediante el uso de una tabla de
números aleatorios, la cual se incluye en el apéndice de los libros de Inferencia Estadística
o de Muestreo Aleatorio; para cuyo propósito se procede como sigue:
4
b) Se selecciona al azar el punto de partida en la tabla de números aleatorios, cuya
explicación simplificada implica recurrir a una columna que tenga cuatro (4) dígitos,
debido a que el tamaño de la población de obreros tiene 4 dígitos (N = 2.500) y la
primera fila (podrían ser otras filas). La muestra de 200 debe estar constituida por
obreros cuyos números asignados en la nómina se encuentran comprendidos entre
0001 y 2.500.
c) En el caso de que un número comprendido entre 0001 y 2.500 ya fue seleccionado
vuelve a repetirse, se debe ignorar. Al terminar la columna se continúa con la
siguiente y al concluir la página se utiliza la siguiente. En el caso de que solo se
disponga de una página, puede recurrirse a ciertos procedimientos que permitan
obtener una muestra grande.
A las unidades elementales de una población están asociadas ciertas características, y por
alguna o por algunas de las cuales existirá el interés de analizar. Estas características se
las conoce con la denominación de variables: por ejemplo, ingreso, gasto, escolaridad,
edad, precio, productividad, y se simbolizan generalmente con las ultimas letras
mayúsculas del alfabeto: X, Y, Z, T, U y V. Así la variable ingreso puede representarse con
X, el gasto con Y, la escolaridad con Z, la edad con T, el precio con U y la productividad
con V. Entonces, Xi es el monto de ingreso de la iésima unidad elemental de la población
de tamaño N; X1, X10, constituyen los ingresos de los hogares a quienes se les asigno los
números 1 y 10 de la nómina; o sea N1 y N10.
Muestra aleatoria es la que se extrae de modo que toda unidad disponible en la población
para la selección o extracción, tiene igual probabilidad de ser seleccionada o extraída para
su inclusión en la misma. Complementariamente, muestra aleatoria de tamaño n tiene
igual probabilidad de ser extraída entre varias muestras posibles.
5
Ejemplo.- Sea una población hipotética finita constituida por cinco hogares (N = 5), cuya
presentación simbólica es la siguiente: {H1, H2, H3, H4, H5}. Suponiendo que el interés
nuestro es analizar la variable gasto mensual (X) expresada en miles de bolivianos (X1; X2;
X3; X4; X5). Además, suponiendo que es conocido el monto de gasto de cada hogar de esa
población que también se denomina población de gastos, cuyos montos en miles de
bolivianos sean los siguientes: {3, 5, 7, 9, 11}. INFERENCIA B 13’08’2021
i) Se extrae una muestra aleatoria de tamaño dos (n = 2) con restitución; luego, el número
de muestras posibles que pueden extraerse son = 5*5 = 52 =25; cuya presentación
simbólica para este procedimiento de selección de muestras aleatorias es la siguiente: Nn.
Las 25 muestras aleatorias posibles de obtenerse son las siguientes: (3, 3) (3, 5) (3, 7)
(3, 9) (3, 11) (5, 3) (5, 5) (5, 7) (5, 9) (5, 11) (7, 3) (7, 5) (7, 7) (7, 9) (7, 11) (9, 3) (9, 5) (9,
7) (9, 9) (9, 11) (11, 3) (11, 5) (11, 7) (11, 9) (11, 11)
El conjunto de las 25 muestras aleatorias descritas anteriormente recibe la denominación
de espacio de la muestra, que es el conjunto de resultados posibles que se obtiene al
realizar esa extracción. El experimento en este caso es la extracción de la muestra
aleatoria de tamaño 2 (n = 2) con restitución de una población finita que es de tamaño 5 (N
= 5).
ii) Se extrae una muestra aleatoria de tamaño dos (n = 2) sin restitución; luego, el número
de muestras posibles que pueden extraerse se determina utilizando la combinación de 5
elementos tomados de 2 en 2; es decir, utilizando la operatoria de una combinación como
sigue: 5C2 = 10; cuya presentación simbólica para este procedimiento de selección de
muestra aleatoria es la siguiente: NCn. Esta notación corresponde a una combinación de N
elementos tomados de n en n.
Las 10 muestras aleatorias posibles de obtenerse son las siguientes:
(3, 5) (3, 7) (3, 9) (3, 11) (5, 7) (5, 9) (5, 11) (7, 9) (7, 11) (9, 11)
Estas 10 muestras aleatorias son distintas, debido a que poseen distintos elementos, por
lo que las 10 muestras son representativas para la población finita; además, todas tienen
igual probabilidad de ser extraídas. Por estas razones en la vida real se utiliza este
procedimiento de extracción de muestras aleatorias sin restitución, y no se utiliza el
procedimiento de selección con restitución; sin embargo, se realiza el análisis de este
último procedimiento solo con fines comparativos.
Como en el caso del inciso i), el conjunto de las 10 muestras aleatorias descritas
anteriormente recibe la denominación de espacio de la muestra, que es el conjunto de
resultados posibles que se obtiene al realizar un experimento; el experimento en este caso
particular es la extracción de las unidades de la muestra aleatoria sin restitución de una
población finita que es de tamaño 5 (N = 5).
Se considera conveniente realizar las aclaraciones correspondientes sobre la definición
anterior de muestra aleatoria con base a los resultados obtenidos en los incisos i) y ii) del
presente ejemplo:
1
i) La probabilidad de extraer una unidad de la población para el primer caso es 5; que
1
en forma general y simbólica es: y la probabilidad de obtener una de las 25
𝑁
6
1
muestras posibles es , que en forma general y simbólica se presenta como sigue:
25
1 1
= 52
𝑁𝑛
ii) Para el ejemplo del inciso ii), la probabilidad de extraer una muestra de todas las
1 1 1
posibles está dada por: (5) = 10; que en forma general se expresa como sigue: (𝑁)
2 𝑛
Una definición rigorosa de muestra aleatoria; es decir, la que permite realizar un análisis
teórico y matemático de la inferencia estadística es la siguiente:
Sea X una variable aleatoria (variable de interés definida en los elementos de una
población) con función de probabilidad P(X; ϴ) o f(X; ϴ) que depende del parámetro ϴ, la
muestra aleatoria de tamaño n extraída de X, es un conjunto de n variables aleatorias: X1,
X2, X3, ……., Xn; las cuales, cumplen las siguientes condiciones:
1) Las n variables aleatorias X1, X2, X3, ……., Xn son independientes.
2) Cada Xi para la i = 1, 2, 3, ……. , n tiene la misma distribución de X y se dice que
tienen distribución idéntica a la de la población; es decir:
a) Si X es una población con media µ y varianza σ 2, y X1, X2, . . . , Xn, es una muestra
aleatoria extraída de X, entonces cada Xi de la muestra tiene la misma distribución de X,
luego algunas medidas importantes de cada elemento de la muestra son:
i) E(Xi) = E(X) = µ para la i = 1, 2, 3, …… , n (1)
7
ii) V(Xi) = V(X) = σ2 para la i = 1, 2, 3, …… , n
La función de probabilidad conjunta de la muestra aleatoria X1, X2, ……, Xn, extraída de
una variable poblacional discreta está dada por:
i) P(X1, X2, ..., Xn; ϴ) = P(X1; ϴ) P(X2; ϴ) P(X3; ϴ) … P(Xn; ϴ) = ∏𝑛1 𝑃(𝑋𝑖 ; ϴ) = ∏𝑛1 𝑃(𝑋; ϴ) =
{𝑃(𝑋; ϴ)}n (3)
En cambio, si la muestra fue extraída de una variable poblacional continua está dada por:
ii) f(X1, X2, …..…, Xn; ϴ) = f(X1; ϴ) f(X2; ϴ) f(X3; ϴ) …. f(Xn; ϴ) = ∏𝑛1 𝑓(𝑋𝑖 ; ϴ) = ∏𝑛1 𝑓(𝑋; ϴ)
= {𝑓(𝑋; ϴ)}n (4)
Los resultados anteriores se obtienen utilizando las dos condiciones de la definición de
muestra aleatoria; es decir, la independencia de las n variables aleatorias y la distribución
idéntica de las mismas P(Xi; ϴ) = P(X ; ϴ) y f(Xi ; ϴ) = f(X ; ϴ) para i = 1, 2, 3, ... , n
b) La función generadora de momentos de la muestra aleatoria X1, X2, X3,……, Xn, está
dada por:
Sea Y = ΣXi luego la función generadora de momentos de Y está dada por:
Por otra parte, el r–esimo momento centrado respecto a la media esperada de una
población (X) con función de probabilidad P(X,ϴ) si X es discreta o f(X,ϴ) si X es continua
está dado por: M’r = E{(X – E(X)}r, para r = 1, 2, 3, ………..
8
e) Momentos Centrados respecto al Origen de una Muestra Aleatoria: Son las medias
aritméticas de las potencias de una muestra aleatoria. Son variables aleatorias, cuyos
valores dependen de la muestra aleatoria extraída; ejemplo: si X1, X2, X3,……, Xn, es una
muestra aleatoria extraída de una población X, con función de probabilidad dada por
P(X,ϴ) o f(X,ϴ), entonces el r–esimo momento centrado respecto al origen (respecto al
∑𝑛 𝑋 𝑟
cero) está dado por: 𝑚𝑟 = 1𝑛 𝑖 , para r = 1, 2, 3, …….
Un caso particular es cuando r = 1, donde: m1 = 𝑋̅ Por lo que, 𝑋̅ es el primer momento
centrado respecto al origen de la muestra aleatoria.
El r–esimo momento centrado respecto a la media aritmética denotado por m’r está dado
∑𝑛 ̅ )𝑟
1 (𝑋𝑖 −𝑋
por: 𝑚𝑟’ = , para r = 1, 2, 3, …….
𝑛
Un caso particular es cuando r = 2, donde: 𝑚2’ = S2; por lo que, S2 es el segundo momento
centrado respecto a la media de la muestra aleatoria.
1.3.1 Introducción
Cuando existe la necesidad de obtener una medida de tendencia central de una variable
de una población de interés, se utiliza el estimador obtenido de una muestra aleatoria,
para cuyo propósito previamente se debe analizar las características de la distribución de
∑𝑛 𝑋
probabilidad del estimador, que en este caso es la media de la muestra 𝑋̅ = 1 𝑖. 𝑛
Teorema.- Sea X una población (una variable aleatoria de interés para el análisis) con
función de probabilidad P(X, µ, σ2) o f(X, µ, σ2), con media µ y varianza σ2. Sea X1, X2,
∑𝑛 𝑋
X3,…, Xn, una muestra aleatoria extraída de X, y sea 𝑋̅ = 1𝑛 𝑖 la media de esa muestra
aleatoria, entonces 𝑋̅ es una variable aleatoria (estimador de µ) con las siguientes
medidas:
9
estimador (𝑋̅), y n es el tamaño de la muestra aleatoria. Por lo que, en esta
igualdad se encuentran los tres elementos básicos de la inferencia estadística.
∑𝑋 ∑ 𝐸(𝑋 ) ∑µ 𝑛µ
a) E(𝑋̅) = E( 𝑛 𝑖) = 𝑛 𝑖 = 𝑛 = 𝑛 = µ
∑𝑋 ∑ 𝑉(𝑋 ) ∑ 𝜎2 𝑛 𝜎2 𝜎2
b) V(𝑋̅) = V( 𝑛 𝑖) = 𝑛2 𝑖 = ; ya que las n variables aleatorias de la
= =
𝑛2 𝑛2 𝑛
muestra son independientes, razon por la cual las covarianzas son
iguales a cero.
Xi P(Xi)
3 0,20
5 0,20
7 0,20
9 0,20
11 0,20
Total 1,00
Grafico 3.1
Distribución del Gasto Mensual de la Población de 5 Hogares
10
0,25
0,15
0,1
0,05
0
0 5 10 15
Valores de X (gasto mensual en miles de Bs)
Los resultados de los tres sub incisos a), b) y c) son medidas o parámetros del gasto
mensual de la población de hogares, por lo que son desconocidos; para el ejemplo en
particular es posible calcular bajo el supuesto de que la población hipotética es
extremadamente pequeña y que el valor de la variable gasto mensual de cada unidad
(hogar) de la población es conocido. En la vida real las poblaciones son grandes y los
valores de todas las variables que se investigan son desconocidos; razones por las
cuales, se eligen muestras al azar; de las cuales, se obtienen los valores de todas las
variables de interés para estimar sus parámetros, la cual es uno de los objetivos
centrales de la inferencia estadística.
Ejemplo.- Se extrae una muestra al azar de X con restitución, a) describir todas las
muestras aleatorias posibles, b) calcular 𝑋̅ para cada una de las muestras, c) elaborar
la distribución de probabilidad de 𝑋̅, d) calcular el valor de E(𝑋̅) y verificar que es igual
al valor de µ, e) calcular la desviación estándar de 𝑋̅ y verificar que el resultado
obtenido es igual al resultado calculado con la ecuación 𝜎𝑋̅ = σ/√𝑛, f) elaborar el
grafico de la distribución de probabilidad de 𝑋̅ y comparar con el grafico de la
distribución de la población de gastos mensuales (X). Comentar el resultado de cada
inciso al final del mismo.
a) Las 25 muestras posibles son: (3, 3) (3, 5) (3, 7) (3, 9) (3, 11) (5, 3) (5, 5) (5, 7) (5, 9)
(5, 11) (7, 3) (7, 5) (7, 7) (7, 9) (7, 11) (9, 3) (9, 5) (9, 7) (9, 9) (9, 11) (11, 3) (11, 5) (11,
7) (11, 9) (11, 11)
En forma general, se puede verificar con análisis similares al ejemplo anterior que todas
las estimaciones obtenidas de parámetros poblacionales con base a muestras
aleatorias representativas, tienen mayor probabilidad de ser iguales al valor de esos
parámetros.
Cuadro 3.2
Distribución de probabilidad de 𝑋̅ de muestras aleatorias
de tamaño 2 extraídas de X con restitución
12
̅ i2 P(𝑋̅i) - [Σ𝑋̅i P(𝑋̅i)]2 = 53 - 72 = 4 (miles de bolivianos)2;
𝜎𝑋2̅ = Σ[(𝑋̅i – E(𝑋̅)]2P(𝑋̅i) = Σ𝑋
por lo que, la desviación estándar de 𝑋̅ resulta: 𝜎𝑋̅ = √4 = 2 miles de Bs. Este resultado
mide la dispersión media de los valores de 𝑋̅ respecto a su media esperada que es
igual a 7 miles de Bs. Utilizando la ecuación (8) de la desviación estándar de 𝑋̅ se
obtiene también: 𝜎𝑋̅ = σ/√𝑛 = 2.83/√2 = 2 miles de Bs. Este resultado es igual a la
desviación estándar obtenida con la información de la distribución de probabilidad de 𝑋̅
contenida en el Cuadro 3.2
Grafico 3.2
Representación Gráfica del Cuadro 3.2
0,25
Probabilidad de obtener el valor de la
0,2
media muestral
0,15
0,1
0,05
0
0 2 4 6 8 10 12
Valores de la media muestral en miles de Bs.
x 25 7 2.041241 3 11
13
.2
.15
Density
.1 .05
0
2 4 6 8 10 12
X
Teorema.- Sea X una población (una variable aleatoria de interés) con función de
probabilidad P(X, µ, σ2) o f(X, µ, σ2), con media µ y varianza σ2. Sea X1, X2, X3,…, Xn, una
muestra aleatoria extraída de X, y sea 𝑋̅ la media de esa muestra aleatoria, entonces 𝑋̅ es
una variable aleatoria (estimador de µ) con las siguientes medidas:
∑𝑋 ∑ 𝐸(𝑋 ) ∑µ 𝑛µ
a) E(𝑋̅) = E( 𝑛 𝑖) = 𝑛 𝑖 = 𝑛 = 𝑛 = µ
𝑁−𝑛
∑𝑋 ∑ 𝑉(𝑋𝑖 ) ∑ 𝜎2 𝑛 𝜎2 𝑁−𝑛 𝜎 2 𝑁−𝑛
b) V(𝑋̅) = V( 𝑛 𝑖) = = 𝑁−1
= = ; ya que 𝑋𝑖 tiene distribución de
𝑛2 𝑛2 𝑛2 𝑁−1 𝑛 𝑁−1
𝑁−𝑛
probabilidad Hipergeométrica, cuya varianza es 𝜎 2 𝑁−1 y las n variables
aleatorias de la muestra son independientes, razón por la cual las
covarianzas son iguales a cero. En el resultado de la varianza de 𝑋̅ el
𝑁−𝑛
cociente 𝑁−1 se denomina factor de corrección de poblaciones finitas.
14
Ejemplo.- Se extrae una muestra al azar de tamaño 2 (n = 2) de X sin restitución, a)
describir todas las muestras aleatorias posibles, b) calcular 𝑋̅ para cada una de las
muestras, c) elaborar la distribución de probabilidad de 𝑋̅, d) calcular el valor de E(𝑋̅) y
verificar que es igual al valor de µ, e) calcular la desviación estándar de 𝑋̅ y verificar que el
𝜎 𝑁−𝑛
resultado obtenido es igual al resultado calculado con la ecuación 𝜎𝑋̅ = √ , f)
√𝑛 𝑁−1
elaborar el grafico de la distribución de probabilidad de 𝑋̅ y comparar con el grafico de la
distribución de X (distribución de la variable de la población). Comentar el resultado de
cada inciso al final del mismo.
Cuadro 3.3
Distribución de probabilidad de 𝑋̅ de muestras aleatorias
de tamaño 2 extraídas de X sin restitución
15
d) E(𝑋̅) = Σ𝑋̅i P(𝑋̅i) = 7. Esta media esperada de la media de la muestra es igual a la media
de la población, aspecto que también será analizado en el siguiente capítulo.
𝜎𝑋2̅ = Σ[(𝑋̅i – E(𝑋̅)]2 P(𝑋̅i) = Σ𝑋̅i2 P(𝑋̅i) - [Σ𝑋̅i P(𝑋̅i)]2 = 52 - 72 = 3 (miles de bolivianos)2; por
lo que, la desviación estándar de 𝑋̅ resulta: 𝜎𝑋̅ = √3 = 1,732 miles de Bs. Este resultado
mide la dispersión media de los valores de 𝑋̅ respecto a su media esperada que es igual a
7 miles de Bs. Utilizando la ecuación matemática (presentada en el inciso e) obtenida por
otro procedimiento de la desviación estándar de 𝑋̅ se tiene:
2.83 5−2
𝜎𝑋̅ = √5−1 = 1,732 miles de Bs. Este resultado es igual a la desviación estándar
√2
obtenida con la información de la distribución de probabilidad de 𝑋̅ contenida en el Cuadro
3.3.
Nuevamente se hace notar que en la vida real se utiliza la ecuación citada anteriormente
para calcular el valor estimado de σ, debido a que no es posible determinar la distribución
de probabilidad de un estimador para poblaciones y muestras grandes, donde el número
de muestras posibles que se pueden obtener es extremadamente grande, cuya
descripción es tarea imposible e innecesaria de realizar.
0,25
Probabilidad de obtener un valor de
0,20
la media muestral
0,15
0,10
0,05
0,00
0 2 4 6 8 10 12
Posibles valores de la media muestral
16
Antes de presentar y demostrar el Teorema Central del Límite se considera necesaria la
presentación de dos propiedades de la función generadora de momentos que son las
siguientes:
Primera Propiedad
Segunda Propiedad
MX(t) = M(𝛔Z + µ)(t) = E[𝑒 (𝜎𝑍+ µ)𝑡 ] = E[𝑒 𝜎𝑍𝑡 𝑒 µ𝑡 ] = 𝑒 µ𝑡 MσZ(t) = 𝑒 µ𝑡 MZ(σt)
2 𝑡 2 /2 2 𝑡 2 /2
= 𝑒 µ𝑡 𝑒 𝜎 = 𝑒 µ𝑡+𝜎 para t > 0.
El teorema central del límite es de enorme importancia tanto para la teoría estadística
como para la estadística aplicada, permite el uso de las propiedades de la distribución
normal, aunque las variables de las poblaciones tengan distribución distinta a la
distribución de la normal. El teorema central del límite, también es una de las
proposiciones más notables de toda la matemática 1.
Se demostrara este teorema como un caso particular para la media de una muestra
aleatoria (𝑋̅); para cuyo propósito se presenta el siguiente teorema
TEOREMA.- Sea X una variable aleatoria de una población discreta o continua, con
distribución de probabilidad de cualquier forma (distinta a la distribución normal), simétrica
1
Alexander M. Mood y Franklin A. Graybill. Introducción a la Teoría de la Estadística. Pág. 172.
17
o asimétrica, pero con media y varianza 2. Sea X 1 , X 2 ,..., Xn una muestra aleatoria
extraída de X; cada cual, distribuida idénticamente según la población con media y
varianza 2 ; es decir, y 2 son finitas y comunes a las n variables aleatorias de la
𝑡 𝑋−µ
( ) ∑𝑛
1 𝑋𝑖
muestra; además, con función generadora de momentos 𝐸 [е√𝑛 𝜎 ]. Sea 𝑋̅ = 𝑛
la
(𝑋̅ − µ)
media de esa muestra aleatoria, y sea U = 𝜎 una nueva variable aleatoria definida en
√𝑛
función de 𝑋̅ (U depende de 𝑋̅). Se demostrara que la variable aleatoria U se distribuye
según la normal estándar, cuando el tamaño de la muestra aleatoria (n) tiende a infinito; es
decir, U N(0,1) cuando n .
El punto importante que se debe retener de este teorema, es el hecho de que en el límite,
la distribución de U no depende de cuál sea la distribución de la población X.
Este resultado establece sin demostración, que cuando dos variables aleatorias tienen la
misma función generadora de momentos se dice que ambas tienen la misma forma de
distribución. Continuando con la demostración se tiene:
𝑡 𝑋1−µ 𝑡 𝑋2 −µ 𝑡 𝑋3 −µ 𝑡 𝑋𝑛 −µ
( ) ( ) ( ) ( )
𝑀𝑈 (𝑡 ) = 𝐸 [е𝑈𝑡 ] = E[е√𝑛 𝜎 ] E[е√𝑛 𝜎 ] E[е√𝑛 𝜎 ] . . . E[е√𝑛 𝜎 ]
𝑡 𝑋−µ 𝑛
( )
= {𝐸 [е √𝑛 𝜎 ]} ; ya que 𝑋1 , 𝑋2 , 𝑋3 , . . . , 𝑋𝑛 tienen distribución idéntica a la
18
𝑛 𝑡𝜃
{𝐸[е𝜃𝑡 ]} ; desarrollando е𝜃𝑡 en la serie de Mac Laurin, se tiene: 𝑀𝑈 (𝑡 )={𝐸 [1 + +
1!
𝑛
𝑡 2 𝜃2 𝑡 3 𝜃3 (𝑋−µ)
+ + . . . ]} ; sustituyendo el valor de 𝜃 = , se obtiene el siguiente resultado:
2! 3! 𝜎 √𝑛
𝑛 𝑛
𝑡(𝑋−µ) 𝑡 2 (𝑋−µ)2 𝑡 3 (𝑋−µ)3 𝑡2 𝑡 3 µ′3
𝑀𝑈 (𝑡 )={𝐸 [1 + + + + . . . ]} =[1 + 2𝑛 + 6𝑛𝜎 3 +. . . ] , ya
𝜎 √𝑛 2𝑛𝜎 2 6𝑛𝜎 3 √𝑛 √𝑛
que E(X - µ) = 0 y E(𝑋 − µ)2 = 𝜎 2 ; además E(𝑋 − µ)3 es el tercer momento de la población
𝑡2 𝑡 3 µ′
centrado respecto a su media esperada. Haciendo X = + 6𝑛𝜎 33 𝑛 + . . . y aplicando
2𝑛 √
2 3
𝑡2 𝑡 3 µ′3 1 𝑡2 𝑡 3 µ′3 1 𝑡2 𝑡 3 µ′3
ln 𝑀𝑈 (𝑡) = n{ + +. . .− [ + +. . .] + [ + +. . .] − ⋯}
2𝑛 6𝑛𝜎3 √𝑛 2 2𝑛 6𝑛𝜎3 √𝑛 3 2𝑛 6𝑛𝜎3 √𝑛
2 3
𝑡2 𝑡 3 µ′ 1 𝑡2 𝑡 3 µ′ 1 𝑡2 𝑡 3 µ′
ln 𝑀𝑈 (𝑡) = { 2 + 6𝜎3 3𝑛 + . . . − 2 [2𝑛 + 6𝑛𝜎3 3 𝑛 + . . . ] + 3 [2𝑛 + 6𝑛𝜎3 3 𝑛 + . . . ] − ⋯ }
√ √ √
Aplicando límites a ambos lados de la igualdad anterior cuando n tiende a infinito, se tiene:
𝑡2
lim𝑛→∞ ln 𝑀𝑈 (𝑡) = ; ya que, todos los restantes términos dentro de la llave tienden a
2
La demostración anterior, es posible realizar para cualquier estimador; por ejemplo, para
𝑃̂; 𝑑𝑋̅1 −𝑋̅2 ; etc.
19
.4
.3
.2
y
.1
0
-4 -2 0 2 4
-4 σ -3 σ -2 σ -1 σ mean 1σ 2σ 3σ 4σ x
Ejemplo.- A continuación se realiza la demostración del teorema central del límite a través
de un ejemplo práctico, que consiste en lo siguiente:
Xi P(Xi)
3 1/5
5 1/5
7 1/5
9 1/5
11 1/5
TOTAL 1,0
Grafico 3.4
Distribución de X
20
1/4
1/7
0
0 5 10 15
Gasto mensual expresado en miles de
bolivianos (X)
b) Suponiendo que se extrae una muestra aleatoria de tamaño dos sin restitución (n = 2)
de la población de gasto mensual, cuyo número de muestras posibles de obtenerse, las
medias de cada una de ellas, así como la distribución de probabilidades de 𝑋̅i y su
representación gráfica son las siguientes:
𝑋̅i P(𝑋̅i)
4 0,10
5 0,10
6 0,20
7 0,20
8 0,20
9 0,10
10 0,10
Totales 1,00
21
iv) La representación gráfica de la distribución anterior se presenta en el Grafico 3.5.
Grafico 3.5
Representación Gráfica del Cuadro 3.5
0,25
Probabilidad de medias
0,2
0,15
0,1
0,05
0
0 5 10 15
Valores de medias
c) Suponiendo que se extrae una muestra aleatoria de tamaño tres sin restitución (n = 3)
de la población de gasto mensual, cuyo número de muestras posibles a obtenerse, las
medias de cada una de ellas, la distribución de probabilidades de 𝑋̅𝑖 y su respectiva
representación gráfica son las siguientes:
i) Las 10 muestras aleatorias posibles de obtenerse son las siguientes: (3, 5, 7) (3, 5, 9) (3,
5, 11) (3, 7, 9) (3, 7, 11) (3, 9, 11) (5, 7, 9) (5, 7, 11) (5, 9, 11) (7, 9, 11)
ii) Las medias de esas muestras posibles de obtenerse (𝑋̅i) son: 5.0; 5.7; 6.3; 6.3; 7.0; 7.7;
7.0; 7.7; 8.3 y 9.0
iii) La distribución de probabilidad de la media de estas muestras aleatorias de tamaño 3
extraídas de X sin restitución se presenta en el Cuadro 3.6
Por la información contenida en el Cuadro 3.6 y Grafico 3.6 se determina que la
distribución de 𝑋̅𝑖 es nuevamente simétrica y se aproxima aún más a la distribución de
probabilidad NORMAL que la distribución de 𝑋̅𝑖 de muestras de tamaño 2 (n=2)
presentada en el Cuadro 3.3; lo cual, significa que cada vez que se incrementa el tamaño
de la muestra aleatoria, la distribución de probabilidad de 𝑋̅𝑖 se aproxima cada vez a la
distribución de probabilidad NORMAL; situación, que demuestra de una forma objetiva el
Teorema Central del Límite.
22
Cuadro 3.6
Distribución de probabilidad de 𝑋̅
𝑋̅i P(𝑋̅i)
5,0 0,1
5,7 0,1
6,3 0,2
7,0 0,2
7,7 0,2
8,3 0,1
9,0 0,1
TOTAL 1,0
Grafico 3.6
Representación Gráfica del Cuadro 3.6
23
0,3
Probabilidad de medias
0,2
0,2
0,1
0,1
0,0
0,0 2,0 4,0 6,0 8,0 10,0
Valores de la media
Solución:
1.5.3 Un sondeo efectuado sobre 400 amas de casa de cierta clase social de una ciudad,
rebeló un gasto medio mensual de Bs. 740.- en productos de tocador, con desviación
estándar de Bs. 400.-, a) Calcular el margen máximo de error del estimador de la media de
esa población de amas de casa con un 99% de confianza, b) Con qué nivel de confianza
se puede afirmar que el gasto medio mensual en artículos de tocador de esa población de
amas de casa queda entre 710.- y 770.- bolivianos.
Solución.-
1.5.4 Con relación al problema anterior, se supone que el objetivo es determinar el tamaño
de la muestra, para el estudio más profundo del gasto mensual en productos de tocador.
Para la estimación de la desviación estándar de la población el investigador utilizó una
muestra piloto de 20 amas de casa, habiendo encontrado que la desviación estándar de
esta muestra es Bs. 50.- Con esta información determine el tamaño de la muestra, si se
desea que el error del estimador de µ no exceda de ± Bs 4.-, con una confianza de 95%.
25
(𝑋̅− µ)
La ecuación se obtiene como sigue: Z = 𝜎 ; aplicando medios y extremos en el
√𝑛
√𝑛(𝑋̅− µ) 𝑍2𝜎2
lado derecho se tiene: Z = ; despejando n se obtiene: n = ℰ 2 , ya que
𝜎
(𝑋̅ − µ) = ℰ, es el margen máximo de error del estimador 𝑋̅. Como (1 − 𝛼)= 0.95,
entonces α = 0,05; luego 𝑍1− 0.05 = 𝑍0.975 = 1.96. Sustituyendo los datos en la ecuación
2
𝑍2 𝛼 𝜎2
(1− 2 ) 1.962 502
anterior, resulta: n = = = 600.25 ≅ 600. Esta muestra garantiza con
𝜉2 42
una confianza del 95% de que el margen máximo de error o precisión del estimador de µ
(𝑋̅) sea a lo sumo ± Bs. 4.-. Si se aumenta el margen máximo de error a Bs 10.-, que
significa disminuir la precisión del estimador en esa magnitud; entonces, el tamaño de
muestra aleatoria disminuye a n = 96. Este tamaño de muestra aleatoria garantiza con una
confianza del 95% de que la precisión o el margen máximo de error de 𝑋̅ no exceda ±
Bs.10.-. Se considera muy importante comparar los tamaños de muestra, cuando se
modifica el valor de ξ; esta variación considerable es por el hecho de que n está
relacionada en forma inversa con ξ; en cambio, con el nivel de confianza; es decir, con el
valor de Z está relacionada en forma directa; razón por la cual, cuando se incrementa el
nivel de confianza, se incrementa el tamaño de la muestra.
Si una muestra de tamaño 𝑛1 se extrae de una población denotada por X1 con media 1 y
varianza σ12, y una segunda muestra de tamaño 𝑛2 de otra población con media 2 y
varianza σ22. Si 𝑋̅1 y 𝑋̅2 son las medias de esas dos muestras obtenidas, entonces se
puede estimar la diferencia de medias de las dos poblaciones (dµ = 1 - 2 ) con la
diferencia de medias de las muestras: d = 𝑋̅1 - 𝑋̅2. Esta diferencia de medias de las
X
muestras es también una variable aleatoria, cuya media esperada y varianza son las
siguientes:
a) Poblaciones infinitas o cuando las unidades de las dos muestras se extraen con
restitución de poblaciones finitas:
26
iii) Si n1 y n2 son suficientemente grandes (mayores a 30), entonces por el Teorema
Central del Límite, la diferencia de medias de esas dos muestras se distribuye
aproximadamente según la normal, con media esperada dµ y varianza 𝜎𝑑2𝑋̅ ; en símbolos,
(𝑑𝑋
̅ −𝑑µ )
se tiene: d ~𝑁 (dµ; 𝜎2𝑑 ̅ ); luego, Z = N(0,1).
X 𝑋 𝜎𝑑 ̅
𝑋
En la ecuación o igualdad anterior, Z está relacionada con el nivel de confianza de 𝒅𝑿̅ ;
(𝑑𝑋̅ − 𝑑µ ) = ξ = Z𝜎𝑑𝑋̅ es la precisión del estimador, denominado también margen
máximo de error del estimador (𝒅𝑿̅ ); 𝑛1 y 𝑛2 son los tamaños de las dos muestras
aleatorias que se encuentran insertados en la desviación estándar de 𝒅𝑿̅ . Estos tres
elementos fundamentales del muestreo aleatorio o de la inferencia estadística se
encuentran relacionados en la igualdad anterior; o sea, que la relación anterior obtenida
por el teorema central del límite es de gran utilidad para la estadística aplicada.
La demostración de los resultados anteriores se deja como tarea para el docente en
clases o tarea para el lector.
Ejemplos
1.6.1 Suponiendo que los focos de una marca A tienen una vida media de 1.400 horas con
desviación estándar de 200 horas, mientras que los focos de marca B tienen una vida
media de 1.200 horas con desviación estándar de 100 horas. a) Si un investigador
27
sostiene que con una muestra de 125 focos de cada marca, los focos de marca A duran
en promedio; cuando menos 250 horas más que los focos de marca B, calcular la
probabilidad de lo que sostiene el investigador, comentar sobre la aseveración del
investigador con el resultado de la probabilidad calculada, b) Calcular la probabilidad de
que la duración media de ambas muestras sea al menos 100 horas, c) Calcular la
probabilidad de que la diferencia de medias de ambas muestras aleatorias sea a lo sumo
50 horas.
Solución.-
Solución.-
28
Si 𝑋1 y 𝑋2 tienen distribución normal (según el enunciado del problema), entonces:
𝑑 ̅ −𝑑µ
𝑑𝑋̅ = (𝑋̅1 − 𝑋̅2 )~𝑁(𝑑µ ; 𝜎𝑑2𝑋̅ ); luego Z = 𝑋𝜎 ~𝑁(0; 1). La desviación estándar de la
𝑑𝑋
̅
100 25
diferencia de medias de ambas muestras está dada por: 𝜎𝑑𝑋̅ =√ 10 + 15 = 3,416 quintales;
−10−(−10)
luego, la probabilidad pedida es: P(|𝑑𝑋̅ | > 10) = 1- P(|𝑑𝑋̅ | ≤ 10) = 1 - P[ ≤𝑍≤
3,416
10−(−10)
] = P(0,0≤ 𝑍 ≤ 5,85) = 0,50. Esta es la probabilidad de que la diferencia de medias
3,416
de ambos métodos de cultivo en las muestras sea mayor a 10 quintales
Teorema.- Sea Y una población distribuida según la Bernoulli con parámetro P y sea Y1,
Y2, . . . , Y n una muestra aleatoria extraída de Y, la proporción de una población está
∑𝑁 𝑌 𝑋
definida por P = 1𝑁 𝑖 = 𝑁, donde X es el número de unidades elementales con cierto
atributo y N el número total de elementos de la población finita de tamaño N. De la misma
∑𝑛 𝑌 𝑋
manera se define la proporción de una muestra por 𝑃̂ = 1 𝑖 = ; donde X es el número de
𝑛 𝑛
unidades que poseen cierto atributo de interés y es una variable aleatoria distribuida según
la Binomial y n es el tamaño de la muestra aleatoria.
Si se extraen las unidades de una muestra aleatoria de tamaño n con restitución de una
población finita, entonces la distribución de la proporción muestral (𝑃̂ ) obedece a la ley de
probabilidades binomial; luego, la media esperada y la varianza de esta proporción de la
muestra están dadas por:
𝑋 𝐸(𝑋) 𝑛𝑃
i) Media Esperada: E(𝑃̂ ) = E( 𝑛 ) = 𝑛 = 𝑛 = P; ya que X se distribuye según la Binomial.
29
ii) Varianza: 𝜎𝑃2̂ = V(𝑃̂) = V(
𝑋
𝑛
) =
𝑉(𝑋)
𝑛2
=
𝑛𝑃𝑄
𝑛2
=
𝑃(1−𝑃)
, ya que X se distribuye según la 𝑛
binomial. La desviación estándar de 𝑃̂ (error estándar de 𝑃̂) es la raíz cuadrada de la
varianza con el signo positivo. P + Q = 1; Q = 1 - P
iii) Si n es muestra grande (n > 30), entonces por el Teorema Central del Límite, la
proporción de esa muestra aleatoria (𝑃̂) se distribuye aproximadamente según la normal
(𝑃̂−𝑃)
con media esperada P y varianza 𝜎𝑃2̂ ; es decir, 𝑃̂ ~ 𝑁(𝑃, 𝜎𝑃2̂ ), luego Z = ~ 𝑁(0,1) 𝜎𝑃
̂
La demostración de los resultados anteriores se deja como tarea para el docente en
clases o para el lector.
b) Selección de unidades de la muestra sin restitución de una población finita:
En el caso de que las unidades de la muestra sean extraídas sin restitución de una
población finita, entonces la distribución de la proporción de esa muestra (𝑃̂) se distribuye
según la ley de probabilidades hípergeométrica. Entonces, la media esperada y la
varianza de esa proporción muestral está dada por:
𝑋 𝐸(𝑋) 𝑛𝑃
i) E(𝑃̂ ) = E( 𝑛 ) = = = P.
𝑛 𝑛
𝑁−𝑛
𝑋 𝑉(𝑋) 𝑛𝑃𝑄 𝑃𝑄 𝑁−𝑛 𝑃(1−𝑃) 𝑁−𝑛
ii) 𝜎𝑃2̂ = V(𝑃̂ ) = V( )= = 𝑁−1
= = ; en donde X se distribuye según
𝑛 𝑛2 𝑛2 𝑛 𝑁−1 𝑛 𝑁−1
𝑁−𝑛
la Hipergeometrica. 𝑁−1 es el factor de corrección de población finita. Luego, la desviación
estándar de 𝑃̂ (error estándar de 𝑃̂) es la raíz cuadrada de la varianza con el signo
positivo.
iii) Si n es muestra grande (n > 30), entonces por el Teorema Central del Límite, la
proporción de esa muestra aleatoria (𝑃̂) se distribuye aproximadamente según la normal
(𝑃̂−𝑃)
con media esperada P y varianza 𝜎𝑃2̂ ; es decir, 𝑃̂ ~ 𝑁(𝑃, 𝜎𝑃2̂ ), luego Z = ~ 𝑁(0,1) 𝜎𝑃
̂
En la ecuación o igualdad anterior, “Z está relacionada con el nivel de confianza de 𝑷 ̂ ”;
(𝑃̂–P) = ξ = Z𝜎𝑃̂ es la “precisión del estimador 𝑷 ̂ ", denominado también “margen
máximo de error del estimador 𝑷 ̂ ” y “n es el tamaño de la muestra aleatoria” que se
encuentra incluido en la desviación estándar de 𝑃̂. Estos tres elementos fundamentales
del muestreo aleatorio o de la inferencia estadística se encuentran relacionados en la
igualdad anterior, y es de gran utilidad para la estadística aplicada; la misma, que se
verificara en los temas de estimación de parámetros y prueba de hipótesis estadística.
La demostración de los resultados anteriores se deja como tarea para el docente en
clases o para el lector.
Ejemplo.- Una población hipotética está constituida por cinco hogares de un determinado
municipio, que podrá simbolizarse por: N = {H1; H2; H3; H4; H5}. Interesa analizar la
variable gasto mensual de esa población, y suponiendo que los montos de gasto (X) de
esa población expresados en miles de bolivianos son conocidos que son los siguientes: X
= {3, 5, 7, 9, 11}. Se extrae una muestra al azar de X de tamaño 2 (n = 2) sin restitución, a)
Detallar todas las muestras aleatorias posibles, b) Sea 𝑃̂ el estimador de P que es la
proporción de hogares de la población con gasto mensual mayor a Bs. 5.000.-, calcular 𝑃̂
para cada una de las muestras, c) elaborar la distribución de probabilidad de 𝑃̂, d) calcular
30
3
el valor de E(𝑃̂ ) y verificar que es igual al valor de P = 5 = 0.6, e) calcular la desviación
estándar de 𝑃̂ y verificar que el resultado obtenido es igual al resultado calculado con la
𝑃(1−𝑃) 𝑁−𝑛
siguiente ecuación: σ(𝑃̂) = √ , f) elaborar el grafico de la distribución de
𝑛 𝑁−1
probabilidad de 𝑃̂, g) comentar el resultado de cada inciso.
b) Por lo que, los posibles valores de 𝑃̂ a obtenerse son: 0/2, 1/2, 1/2, 1/2, 1/2, 1/2, 1/2,
2/2, 2/2, 2/2
c) La distribución de probabilidad de la proporción de hogares con gasto mensual mayor a
Bs. 5.000.- de las 10 muestras aleatorias de tamaño 2 extraídas de X sin restitución se
presenta en el Cuadro x.3
Cuadro x.3
̂
Distribución de 𝑃 de muestras aleatorias de tamaño 2
extraídas de Y sin restitución
Solución.-
Comprobación:
0,172−0,100
P(𝑃̂ > 0,172) = P(𝑍 > ) = P(𝑍 > 1,44) = 1- F(1,44) = 1- 0,9251 = 0,0749 ≅ 0,075;
0.05
la cual, es la probabilidad de detener el proceso de producción.
1.7.2 Un sondeo efectuado en 400 amas de casa de una ciudad reveló que un 52%
consume una marca de aceite sobre otras marcas: a) Obtener el margen máximo de error
o precisión de esa estimación (52%) con un 99% de confianza, b) ¿Con qué nivel de
confianza se puede afirmar que la preferencia por la marca de aceite en estudio, se
encuentra entre el 50% y el 54% para la población de amas de casa de esa ciudad?
Solución.-
32
b) El nivel de confianza por la preferencia de esa marca de aceite en la población de amas
de casa de esa ciudad, es 57,62%; cuyo cálculo es el siguiente: P(0,50≤ 𝑃̂ ≤0,54) =
0,50−0,52 0,54−0,52
P( 0,025 ≤ 𝑍 ≤ 0,025 ) = P(-0,8≤ 𝑍 ≤ 0,8) = F(0.8) – F(-0.8) = F(0.8) – (1- F(0.8))
0,5762 = 2F(0,8) – 1 = 2(0,7881) – 1 = 0,5762
1.7.3 Una muestra de 256 pacientes de cierta enfermedad fueron tratados con una nueva
medicina, la misma que resultó efectiva en 128 casos. Con que nivel de confianza se
podrá afirmar que la efectividad del nuevo medicamento se encuentra comprendida entre
45% y 55%.
Solución.-
1.7.4 En una localidad que tiene 360 heladerías, se requiere realizar un sondeo respecto
al consumo de cierta marca de helados. El estudio debe tener un nivel de confianza de 2
sigma (o sea 95.5%) y un error máximo de ± 5%. Determinar el tamaño de la muestra
aleatoria.
Solución.-
1.7.5 Un fabricante de desodorantes recibe cada semana lotes de 10.000 válvulas para los
botes rociadores. Para aceptar o rechazar esos lotes, ha instituido el siguiente
procedimiento de muestreo. Se seleccionan al azar 100 válvulas de cada lote; si el 2% o
más resultan defectuosas, se rechaza el lote, en caso contrario se acepta el mismo. Hallar
33
la probabilidad de rechazar un lote (población) que contenga el 1% de válvulas
defectuosas.
Solución.-
0.02−0.01
Luego, la probabilidad requerida es: P(𝑃̂ ≥ 0.02) = P(Z≥ 0.01 ) = 1- P(Z< 1) = 1 –
0,8413 = 0,1587. Esta es la probabilidad de rechazar un lote de 10.000 válvulas, con 1%
de defectuosas.
iii) Si n 1 y n 2 son muestras suficientemente grandes (𝑛1 > 30 y 𝑛2 > 30), entonces por el
2 𝑑𝑃
̂ −𝑑𝑃
teorema central del límite: 𝑑𝑃̂ ~𝑁(𝑑𝑃 , 𝜎𝑑 ̂ ) luego Z = se distribuye según la
𝑃 𝜎𝑑 ̂
𝑃
normal estándar; es decir, Z ~ 𝑁(0,1).
b) Selección de las unidades de las dos muestras sin restitución de dos poblaciones
finitas
34
En este caso la distribución de la diferencia de proporciones de esas dos muestras
aleatorias (d𝑃̂) se distribuye según la hípergeométrica; entonces, la media esperada y la
varianza están dadas por:
ii) Varianza:
𝑁 −𝑛 𝑁 −𝑛
𝑛1 𝑃1 𝑄1 1 1 𝑛2 𝑃2 𝑄2 2 2 𝑃1 (1−𝑃1 ) 𝑁1−𝑛1 𝑃2 (1−𝑃2 ) 𝑁2 −𝑛2
= V(𝑃̂1-𝑃̂2 ) = V(𝑃̂1) + V(𝑃̂2 ) =
𝑁1 −1 𝑁2 −1
𝜎𝑑2𝑃̂ 2 + 2 = + ;
𝑛1 𝑛2 𝑛1 𝑁1 −1 𝑛2 𝑁2−1
cuya desviación estándar es la raíz cuadrada de esta varianza con el signo positivo según
la definición.
iii) Si n 1 y n 2 son muestras suficientemente grandes (𝑛1 > 30 y 𝑛2 > 30), entonces por el
2 𝑑𝑃̂ −𝑑𝑃
teorema central del límite 𝑑𝑃̂ ~𝑁(𝑑𝑃 ; 𝜎𝑑 ̂ ); luego, Z = se distribuye según la
𝑃 𝜎 𝑑𝑃
̂
normal estándar; es decir, Z ~ 𝑁(0,1).
Ejemplos.-
1.8.1 Los resultados de una encuesta pre electoral realizada en una ciudad (población) mostró que
un candidato tuvo a su favor el 55% de los votos. Hallar la probabilidad de que en dos muestras
aleatorias extraídas en esa ciudad (población), ambas de 150 electores arrojen una diferencia
mayor al 10% en las proporciones que votaron por el candidato señalado.
Solución.-
1.8.2 Ciertas encuestas de auditorio revelan que el 20% de los varones y el 30% de las mujeres de
cierto estrato social están familiarizados con un producto de consumo masivo. Hallar la
probabilidad de que en 2 muestras aleatorias de 150 varones y 100 mujeres respectivamente,
pertenecientes a ese estrato social se encuentre que la proporción de mujeres familiarizadas con
ese producto, sea igual o mayor que la proporción de varones.
Solución.-
35
Se utiliza la siguiente notación: Varones = 1 y Mujeres = 2
𝑃1 = 0,20 proporción de varones familiarizados con el producto de consumo masivo en la
población.
𝑃2 = 0,30 proporción de mujeres familiarizadas con el producto de consumo masivo en la
población.
𝑃̂1 𝑄̂1 𝑃̂2 𝑄̂2 (0,2)(0,8) (0,3)(0,7)
𝑛1 = 150 varones y 𝑛2 = 100 mujeres; 𝜎𝑑𝑃̂ = √ + =√ + = 0,056
𝑛1 𝑛2 150 100
0−(0,2−0,3)
P(𝑃̂1 ≤ 𝑃̂2 ) = P[(𝑃̂1 − 𝑃̂2 )≤ 0] = P(𝑑𝑃̂ ≤ 0) = P[𝑍 ≤ ] = P(Z≤ 1,79) = 0,9633. Es bastante
0,056
probable que la proporción de mujeres sea mayor o igual a la proporción de varones familiarizados
con el producto de consumo masivo en las dos muestra aleatorias.
1.8.3 Se sabe que cierta marca de producto de uso general tiene el 65% del mercado.
Hallar la probabilidad de que 2 muestras aleatorias de 200 usuarios de cada una, revelen
una diferencia mayor del 10% en las proporciones de uso del producto.
Solución.-
𝑃1 = 0,65 y 𝑃2 = 0,65, proporción de mercado del producto en una misma población iguales;
tamaños de muestras aleatorias iguales 𝑛1 = 𝑛2 = 200; desviación estándar de la diferencia
(0,65)(0,35)
de proporciones de ambas muestras 𝜎𝑑𝑃̂ = √2 ∗ = 0,0477.
200
La probabilidad de que la diferencia de proporciones de ambas muestras sea mayor a 10%
−𝑑 ̂ −𝑑 𝑑 ̂ −𝑑
está dada por la siguiente expresión: P(|𝑑𝑃̂ | > 0.10) = 1 – P( 𝜎𝑃 𝑃 ≤ 𝑍 ≤ 𝑃𝜎 𝑃) = 1–
𝑑𝑃
̂ 𝑑𝑃
̂
−0,10−0,00 0,10−0,00
P( ≤𝑍≤ ) = 1– P(-2,10≤ 𝑍 ≤ 2,10) = 0,0358
0,0477 0,0477
1.8.4 Ciertas encuestas de auditorio revelan que el 25% de los varones y el 33% de las
mujeres de cierto estrato social ven el programa de televisión X. Hallar la probabilidad de
que en 2 muestras aleatorias de 150 varones y 100 mujeres respectivamente,
pertenecientes a ese estrato social se encuentre que la proporción de varones que han
visto el programa X, sea igual o mayor que la proporción de mujeres.
36
La media esperada de esta segunda varianza de la muestra es igual a la varianza de la
∑𝑛 ̅ )2
1 (𝑋− 𝑋
población; es decir, E(𝑠 2 ) = E﴾ ﴿ = σ2; cuya demostración es la siguiente:
𝑛−1
1
Para la varianza de la muestra aleatoria dada por: S2 = 𝑛 ∑𝑛1(𝑋𝑖 − 𝑋̅)2 , se tiene el siguiente
𝜎 2
resultado: nE(S2) = E[∑𝑛1(𝑋𝑖 − 𝑋̅)2 ] = n𝜎 2 - 𝜎 2 ; luego, E(S2) = 𝜎 2 − 𝑛 . Tal como se
Muestras: (3, 5) (3, 7) (3, 9) (3, 11) (5, 7) (5, 9) (5, 11) (7, 9) (7, 11) (9, 11)
Medias: 4, 5, 6, 7, 6, 7, 8, 8, 9, 10
b) Las varianzas de esas muestras aleatorias posibles de obtenerse (s2) son: 2, 8, 18, 32,
2, 8, 18, 2, 8 y 2, respectivamente
c) La distribución de probabilidad de la varianza de esa muestra aleatoria de tamaño 2
extraída de X sin restitución se presenta en el Cuadro x.x
La distribución de probabilidad anterior y el Grafico x.x muestran que esa distribución es
asimétrica, y por otra parte, muestran también que existe mayor probabilidad (0.4) de
obtener el valor 2 para s2, y 8 es la varianza de la población de gastos [σ2 = 8 (miles de
Bs)2]. Este resultado muestra que la distribución de probabilidad de la varianza de la
37
muestra (s2 para muestras pequeñas) es similar a la distribución de la Ji Cuadrado que se
verá posteriormente.
Cuadro x.x
Distribución de probabilidad de s2 de muestras aleatorias
de tamaño 2 extraídas de X sin restitución
si2 ei P(si2) 2 2 2 2
si2 P(si ) (si ) P(si )
2 4 0,4 0,8 1,6
8 3 0,3 2,4 19,2
18 2 0,2 3,6 64,8
32 1 0,1 3,2 102,4
Totales 10 1,0 10,0 188,0
Integrando por partes en forma recurrente se verifica la siguiente igualdad: Г(n) = (n-1)!.
38
∞
Γ(𝑛) = [−𝑋 𝑛−1 е−𝑋 ]∞ −𝑋 𝑛−2
0 + (𝑛 − 1) ∫0 е 𝑋 𝑑𝛸 = (𝑛 − 1) 𝛤(𝑛 − 1) = (𝑛 − 1)(𝑛 − 2)𝛤 (𝑛 − 2)
39
Tal como se anotó anteriormente, esta distribución se obtiene como un caso particular de
𝑛 1
la distribución de probabilidad Gama; es decir, cuando α = 2 y λ = 2 ; para n entero y
positivo, cuya función de densidad (función de probabilidad o distribución de probabilidad)
1
obtenida de la función de densidad de la gama resulta: f(X) = 𝑛 𝑋 (𝑛−2)/2 е−𝑋/2 ;
𝑛
2 2 Г( 2 )
para X > 0 y n entero positivo.
La expresión matemática anterior cumple con los dos requisitos de función de
probabilidad; es decir: i) f(X) ≥ 0 para toda X real, y ii) La integral de esta expresión
matemática en el recorrido de la variable aleatoria distribuida según la Ji Cuadrado (0 a ∞)
es igual a la unidad. Este resultado indica que el área bajo la distribución Ji Cuadrado es
igual a la unidad para un determinado valor de n.
La función generadora de momentos de la variable aleatoria distribuida según la Ji
Cuadrado obtenida de la función generadora de momentos de la distribución gama está
𝑛
1
dada por: 𝑀𝑋 (𝑡) = (1 − 2𝑡)− 2 , para t < y n grados de libertad; utilizando esta función
2
𝑛 1
generadora de momentos o sustituyendo el valor de α = 2 y λ = 2 en la media esperada y
la varianza de la distribución Gama, se obtienen la media esperada y la varianza para la
distribución Ji Cuadrado que son las siguientes: E(X) = n, y 𝜎 2𝑋 = 2𝑛.
Gráfico
Distribución de la Ji Cuadrado para algunos valores de n
40
Teorema.- Si Z es una variable aleatoria distribuida según la normal estándar, entonces
𝑍 2 se distribuye según la Ji Cuadrado con un grado de libertad. En símbolos: Si Z~𝑁(0,1),
entonces z2 ~ ×2(1). La prueba consiste en demostrar que la función generadora de
momentos de Z2 = U es igual a la función generadora de momentos de la Ji Cuadrado con
1
un grado de libertad; es decir: 𝑀𝑈 (𝑡) = (1 − 2𝑡)−1/2 , para t < 2
(𝑛−1)𝑠2
×2 = ~⨉2(𝑛−1).
𝜎2
𝑋𝑖 −µ 2
Demostración.- Tomando en cuenta que ∑𝑛1 ﴾ ﴿ se distribuye según la Ji Cuadrado
𝜎
con n grados de libertad, se procede como sigue:
𝑋𝑖 −µ 2 ∑[𝑋𝑖 −𝑋̅+𝑋̅−µ]2 ∑[(𝑋𝑖 −𝑋̅)+(𝑋̅ −µ)]2 ∑[(𝑋𝑖−𝑋̅ )2 +2(𝑋𝑖 −𝑋̅)(𝑋̅ −µ)+(𝑋̅−µ)2 ] ∑(𝑋𝑖 −𝑋̅)2 +𝑛(𝑋̅ −µ)2
∑𝑛1 ﴾ ﴿ = = = = ;
𝜎 𝜎2 𝜎2 𝜎2 𝜎2
sabiendo que: ∑(𝑋𝑖 − 𝑋̅) = 0 y ∑(𝑋̅ − µ)2 = n(𝑋̅ − µ)2 , se obtiene:
𝑋𝑖 −µ 2 ∑𝑛 ̅ )2
1 (𝑋− 𝑋 (𝑋̅ −µ)2
∑𝑛1 ﴾ ﴿ = + 𝜎2
; igualdad que puede ser escrita también como sigue:
𝜎 𝜎2
𝑛
El segundo término del lado derecho se distribuye según la Ji Cuadrado con un grado de
libertad2; por lo que, como consecuencia el primer término del lado derecho se distribuye
𝜎2 (𝑋̅−µ) (𝑋̅−µ)2
Si X~ N(µ, 𝜎 2 ), entonces 𝑋̅ ~ N(µ , ~ ⨉2(1)
2
), luego: Z = 𝜎 ~ N(0, 1); finalmente Z2 = 𝜎2
𝑛
√𝑛 𝑛
41
según la Ji Cuadrado con (n-1) grados de libertad. En símbolos, se presenta como sigue:
(𝑛−1)𝑠 2 2
⨉2(𝑛) = ⨉2(𝑛−1) + ⨉2(1). Este resultado muestra que 2 ~⨉ (𝑛−1)
𝜎
Utilizando este resultado y tomando en cuenta que se utilizan dos estimadores para
realizar inferencias respecto a 𝜎 2 ; o sea 𝑋̅ y 𝑠 2 , lo cual significa que se pierden 2(n-1)
grados de libertad; por lo que, la varianza de 𝑠 2 , se obtiene como sigue:
(𝑛−1)𝑠2 (𝑛−1)2 2𝜎4
V[ ] = 2(n-1); V(𝑠 2 ) = 2(n-1), de donde se obtiene: V(𝑠 2 ) = 𝑛−1
𝜎2 𝜎4
P(4,57 < 𝛸 2 <13,7) = P(𝛸 2 <13,7) - P(𝛸 2 <4,57) = 0,75 – 0,05 = 0,7.
Si X1, X2, X3, . . . , Xn es una muestra aleatoria de tamaño n, extraída de una población
distribuida según la normal con media µ y varianza 𝜎 2 ; entonces 𝑋̅ se distribuye según la
42
𝜎2 (𝑋̅−µ)
normal con media µ y varianza (para poblaciones infinitas), luego Z = 𝜎 se
𝑛
√𝑛
grados de libertad.
Función de densidad
−(𝑛+1)/2
1 𝛤[(𝑛+1)/2] 𝑡2
𝑓𝑇 (𝑡) = (1 + ) , para - < t <, y n es un entero positivo.
√𝑛𝜋 𝛤(𝑛/2) 𝑛
Propiedades:
Los resultados de esta función de distribución acumulada para los distintos grados de
libertad (n) y distintos valores de X, se presentan en el cuadro adjunto en Anexo.
Ejemplo.- Si n = l4 y (1– α) = 0,99, entonces α = 0,01; del cuadro de la función de
distribución acumulada de la t de student, se obtiene el valor de t(1 - α)(n) = 2.624; es decir,
P(T 2,624) = 0,99. Este resultado suele simbolizarse por: 𝑡0,99(14) = 2,624. De igual
forma, 𝑡0,95(6) = 1,943, es equivalente a P(T 1,943) = 0,95; es decir, dado el valor de n y
de (1- α), de la tabla de la t de Student se obtiene el valor de la variable aleatoria
distribuida según la t de Student, el cual se utiliza en la inferencia estadística; es decir,
para estimar la media de una población distribuida según la normal (µ), proporción de
éxitos de una población distribuida según la Bernoulli (P), diferencia de dos medias de dos
poblaciones distribuidas según la normal (dµ), etc.; tal como se verá en la estimación de
algunos parámetros por intervalo y en la prueba de hipótesis.
Si la probabilidad (1- α) es pequeña, también es posible utilizar la señalada tabla incluida
en Anexo, tomando en cuenta que la distribución de probabilidad de la t de Student es
simétrica respecto a su media esperada E(T) = 0; es decir, se verifica la siguiente
igualdad: P(X - x) = P(X > x) = 1 – P(X < x) = 1 - P(X x).
Ejemplo: Si n = 15 y (1 - α) = 0,01. Utilizando la tabla de la Función de Distribución
Acumulada se verifica P(X 2,602) = 0,99, luego P(X -2,602} = 1 - 0,99 = 0,01. Este
resultado es por la simetría de la distribución t de student respecto a su media esperada
que es E(T) = 0.
X
entonces T = tiene distribución t de Student con (n-1) grados de libertad.
s/ n
44
Demostración: Si X se distribuye según la normal con media y varianza 2 , entonces 𝑋̅
𝜎2
se distribuye también según la normal con media µ y varianza 𝜎𝑋2̅ = para poblaciones
𝑛
(𝑋̅− µ)
infinitas; luego, Z = se distribuye según la normal estándar. Por otra parte, se
𝜎⁄√𝑛
(𝑛−1)𝑠2
demostró que × = 2
~⨉2(𝑛−1); es decir, la variable aleatoria 𝛸 2 se distribuye
𝜎2
según la Ji Cuadrado con (n-1) grados de libertad. Finalmente, utilizando la definición de la
variable aleatoria distribuida según la t de Student, se tiene:
𝑍 √𝑛(𝑋̅−µ)⁄𝜎 (𝑋̅− µ)
T= = = ~ 𝑡(𝑛−1); es decir, la variable aleatoria T de
√𝑋 2⁄(𝑛−1) (𝑛−1)𝑠2 ⁄𝜎2 𝑠⁄√𝑛
√
(𝑛−1)
Student se distribuye según la t con (n-1) grados de libertad. Este último resultado se
utiliza para realizar inferencias respecto al parámetro µ de una población X distribuida
según la normal.
(𝑃̂−𝑃)
T= ~ 𝑡(𝑛−1) ; es decir, la variable aleatoria T de Student se distribuye según la t
√𝑃̂𝑄̂ /𝑛
con (n-1) grados de libertad. Este resultado se utiliza para realizar inferencias respecto al
parámetro P; el cual, es la proporción de éxitos de una población Y distribuida según la
Bernoulli.
según la t con (𝑛1 +𝑛2 -2) grados de libertad. Este resultado se utiliza para realizar
inferencias respecto al parámetro 𝑑µ = µ1 − µ2 ; la cual, es la diferencia de medias de dos
45
(𝑛1 −1)𝑠12+(𝑛2−1)𝑠22 1 1
𝜎̂𝑑𝑋̅ =√ (𝑛 + 𝑛 ); para 𝜎12 = 𝜎22 = 𝜎 2 (Este es un supuesto de
𝑛1 +𝑛2 −2 1 2
(𝑑𝑋
̅ −𝑑µ)
II) T = ~ 𝑡(𝐺) ; es decir, la variable aleatoria T de Student se distribuye según la
𝜎
̂ 𝑑𝑋
̅
t, pero con G grados de libertad. Este resultado se utiliza para realizar inferencias respecto
al parámetro 𝑑µ = µ1 − µ2 ; el cual, es la diferencia de medias de dos poblaciones
𝑠2 𝑠2
respectivamente; donde: 𝜎̂𝑑𝑋̅ =√ 1 + 2 ; para el supuesto de que: 𝜎12 ≠ 𝜎22 ; es decir,
𝑛1 𝑛2
las Varianzas de las dos variables poblacionales son distintas. Los grados de libertad en
este caso están dados por:
2
𝑠21 𝑠2
2
( + )
𝑛1 𝑛2 3
G= 2 2 . Es una aproximación de Welch .
𝑠2 𝑠2
(𝑛1 ) (𝑛2 )
1 2
+
𝑛1 −1 𝑛2 −1
3
Lee C. Adkins y R. Carter Hill , Using Stata for Principles of Econometrics, Fourth Edition, pág. 593.
46
𝑛1 + 𝑛2 𝑛1 ⁄2
﴾ ﴿ 𝑛 𝑛1
f(X) = 𝑛
2
𝑛 ( 1) 𝑋 (𝑛1 −2)⁄2 (1 + 𝑋)−(𝑛1 +𝑛2 )⁄2; para X ≥ 0; 𝑛1 y 𝑛2 enteros
( 21 ) ﴾ 22 ﴿ 𝑛2 𝑛2
Características de la distribución F:
47
El resultado anterior, como Función de Distribución Acumulada se presenta como sigue:
2,88
𝐹𝑋 (2,88) = 𝑃(𝑋 ≤ 2,88) = ∫0 𝑓(𝑠)𝑑𝑠 = 0,90; donde se consideran 5 y 7 grados de
libertad.
1
El resultado anterior puede calcularse también como sigue: 𝐹(1−𝛼)(𝑛1 𝑦 𝑛2 ) = ;o
𝐹(1−𝛼)′(𝑛 𝑦 𝑛 )
2 1
1 1
sea: 𝐹0,05(8 𝑦 6) = 𝐹 = 3,58 = 0,28
0,95(6 𝑦 8)
Teorema.- Sea X11, X12, …, X1𝑛1 una muestra aleatoria extraída de una variable
poblacional distribuida según la normal (𝑋1 ) con media 𝜇1 y varianza 𝜎12 y X21, X22, …,
X2𝑛2 otra muestra aleatoria extraída de otra población distribuida según la normal (𝑋2 ) con
𝑠12⁄𝜎12
media 𝜇2 y varianza 𝜎22 , entonces F = se distribuye según la F con (𝑛1 -1) grados de
𝑠22⁄𝜎22
48
𝑋1 ⁄(𝑛1 −1) 𝑠12⁄𝜎12
F= = 2 2 se distribuye según la F con (𝑛1 -1) y (𝑛2 -1) grados de libertad en el
𝑋2 ⁄(𝑛2 −1) 𝑠2 ⁄𝜎2
𝑛 𝑛
∑1 1(𝑋1𝑖 −𝑋̅1)2 ∑1 2(𝑋2𝑖 −𝑋̅2)2
En donde: 𝑠12 = y 𝑠22 = son las varianzas de las dos
(𝑛1 −1) (𝑛2−1)
muestras aleatorias; las cuales, para fines prácticos se presentan como sigue:
(𝑛1 − 1)𝑠12 = ∑𝑛1 1(𝑋1𝑖 − 𝑋̅1 )2 y (𝑛2 − 1)𝑠22 = ∑𝑛1 2(𝑋2𝑖 − 𝑋̅2 )2 . Las aplicaciones se verán en los
siguientes dos capítulos (Estimación de parámetros y prueba de hipótesis estadística).
Es preciso señalar en forma especial, que no se realiza suposición alguna con relación a
la distribución de probabilidad de X, cuando se obtiene la desigualdad de Chebychev; sin
embargo, se impone un límite a la probabilidad de que X esté dentro o fuera de k
desviaciones estándar de su media esperada.
𝑛𝜉 2
Demostración.- Sea ξ = k𝜎𝑃̂𝑛 = k√𝑃𝑄 ⁄𝑛 ; de donde se obtiene 𝑘 2 = ; sustituyendo en
𝑃𝑄
que el valor de la proporción muestral (𝑃̂𝑛 ) difiera de la proporción poblacional (P) en una
cantidad menor a ξ es segura, cuando n tiende a infinito.
𝑃𝑄
ii) 𝑙𝑖𝑚𝑛→∞ P(|𝑃̂𝑛 - P| ≥ ξ) = 𝑙𝑖𝑚𝑛→∞(𝑛𝜉2) = 0; cuyo significado es: la probabilidad de que
Solución.-
Solución.-
Solución.-
1.13.3.4 Suponiendo que la variable aleatoria X definida sobre una población tiene por
media µ y varianza 100. Una muestra aleatoria de esa población tiene una media muestral
51
𝑋̅. a) Hallar el tamaño de muestra aleatoria de tamaño n que se requiere para que la
probabilidad de que la media muestral difiera de la media poblacional (µ) en menos de 0.1
unidades, sea al menos de 0,95, b) Hallar el tamaño de muestra n que se requiere para
que la probabilidad de que la media muestral difiera de la media poblacional (µ) en menos
de 0.1 unidades, sea al menos de 0,99.
Solución.-
para fines prácticos; por lo que, es necesario realizar un ajuste severo; lo cual, se logra
aumentando el margen máximo de error, por ejemplo a ℰ =±5, que genera una muestra de
tamaño 80.
b) La desigualdad está dada por: P(|𝑋̅ − µ| < 0.1)≥ 0.99. El valor de 𝑘 2 , se determina
1 1
como sigue: 1- 𝑘 2 = 0.99; 𝑘 2 -1=0.99𝑘 2 ; 𝑘 2 = 0.1 = 100; seguidamente se determina el valor
𝜎 𝜎 𝑘𝜎
de n tomando en cuenta lo siguiente: k = 0.1; ya que ℰ = k𝜎𝑋̅ = k 𝑛; √𝑛 = 0.1; de donde se
√𝑛 √
100∗100
obtiene el valor de n; o sea: n = (0.1)2
= 1.000.000. Esta muestra es aún mucho más
grande que del inciso a); por lo que, es necesario realizar el ajuste, tanto en el nivel de
confiabilidad, como en el margen máximo de error, por ejemplo la confiabilidad a 95% y el
margen de error a ±5, para obtener una muestra aleatoria de tamaño 80.
1.13.3.5 ¿Cuántas veces habrá que lanzar un dado a fin de estar un 95% seguro de que la
frecuencia relativa que salga un 6 difiera 0.1 de la probabilidad teórica 1/6?.
Solución. -
1
P = probabilidad de que salga la cara con el seis al lanzar un dado regular; ℰ< 0.10,
6
1
diferencia entre el valor de 𝑃̂ y de P = 6; el nivel de confiabilidad es: 1 – 𝜶 = 0.95. Utilizando
la distribución normal estándar se tiene: P(|𝑃̂ − 𝑃| < 0.1) = 0.95; luego el número de
lanzamientos que se debe realizar para cumplir con los requisitos requeridos está dado
1 5
(1.96)2 ( )( )
6 6
por: n = (0.10)2
= 53.
1.13.3.6 Si una variable de una poblacion (X) tiene por desviación estándar igual a 2 y 𝑋̅ es
52
la media de muestras de tamaño 100. Hallar los límites entre los cuales estará situado el
margen máximo de error o la precisión de 𝑋̅; o sea, ℰ = ±(𝑋̅ - µ) con probabilidad de 0.90.
Utilizar la Desigualdad de Chebychev y el Teorema Central del Límite.
Solución.-
1.14.1 De una determinada población con media desconocida y varianza igual a la unidad,
que tamaño de muestra habrá que tomar, sabiendo que la probabilidad de que la media
muestral difiera menos de 0.5 de la media poblacional, sea al menos de 0.95.
1.14.2 ¿Qué tamaño de muestra se deberá tomar a fin de tener una probabilidad de 0.95
por lo menos, de que la proporción muestral (𝑃̂ ) difiera de la proporción poblacional (P) en
menos de 0.01?.
1.14.4 Utilícese la Desigualdad de Chebychev para hallar cuantas veces debe lanzarse
una moneda bien equilibrada para que la probabilidad de que la proporción de caras esté
comprendida entre 0.4 y 0.6, sea al menos 0.90.
1.14.5 Un fabricante de juguetes empacó éstos a razón de 80 por caja para enviarlos a las
jugueterías. El peso de uno de estos juguetes es una variable aleatoria con media de 12
onzas y desviación estándar 4 onzas. Se representa el peso de esas cajas por Y. Hallar la
probabilidad de que una caja seleccionada al azar pese entre 50 y 70 libras.
1.14.6 En una zona productora de papa el rendimiento medio es de 9.000 kgrs. y una
desviación estándar de 2.400 kgrs. por hectárea. Se representa con Y la producción total
en 250 hectáreas cultivadas en esa zona (n = 250). a) Hallar la distribución de Y. b)
calcular el volumen medio y la desviación estándar de la producción en las 250 has.
53
cultivadas, c) Hallar la probabilidad de que la producción total se encuentre entre 2.000 y
2.500 toneladas.
1.14.7 Suponiendo que, en una empresa de transporte de carga, el peso medio de los
bultos o fardos que se despachan es de 60 kgrs., con desviación estándar de 10 kgrs.
Hallar la probabilidad de que 80 fardos recibidos al azar y cargados en uno de los
camiones de transporte excedan la capacidad máxima de carga del camión señalada en
5.000 kgrs. NOTA: 80 fardos constituyen una muestra aleatoria.
1.14.9 Un ingenio azucarero del país tiene una producción media de 500 toneladas por día
con una desviación estándar de 50 toneladas de azúcar. Los compromisos para proveer al
mercado local y exportaciones alcanzan a 50.000 ton. por trimestre. Hallar la probabilidad
de que ese ingenio azucarero cubra sus compromisos.
1.14.10 Una fábrica ensambla estufas a razón de 500 por día. Al efectuar la inspección
después del ensamblado final, se encuentra que el promedio de estufas defectuosas es de
5%. Hallar la probabilidad de que la producción de los próximos dos meses (n = 40 días)
contenga menos de 900 estufas defectuosas.
54