Capitulo I

CAPITULO I
MUESTREO ALEATORIO Y DISTRIBUCIONES EN EL MUESTREO

1. Introducción
Para abordar los temas de Inferencia Estadística es conveniente recordar el significado del
término población o universo y sus características utilizadas en Estadística.
1.1 Población o Universo
Definición.- En estadística población o universo es un conjunto de personas,

organizaciones, objetos o acontecimientos definidos con relación de por lo menos un rasgo
común que une o identifica a todos sus elementos como componentes de esa población. También
se define como un conjunto de observaciones posibles de valores que puede tomar una
variable asociada en los elementos de una población. Según esta última definición, la
distribución de probabilidad de una variable aleatoria de una población es la distribución
de la población.
Como ejemplos de poblaciones o universos se pueden citar los siguientes casos: a)
hogares de un municipio, b) amas de casa de un mercado, c) unidades productoras de
trigo en una región agrícola, d) unidades productoras de maíz en una región agrícola, e)
micros y pequeñas empresas productoras de lácteos de un determinado municipio, f)
micros y pequeñas empresas productoras de ropa de vestir de fibra de camélidos en un
determinado municipio, g) Micros y pequeñas empresas dedicadas a la crianza de ganado
vacuno de una región del territorio nacional, etc., etc.
De los componentes de una población o universo que también se denominan unidades de
investigación, se analizan variables que son de interés para realizar un determinado
trabajo de investigación. Las variables útiles para esa investigación de la población de:
“hogares de un municipio” podrían ser:
 Ingreso mensual, expresado en bolivianos (Y)

 Gasto corriente mensual en consumo, expresado en bolivianos (C)
 Tamaño del hogar, expresado en número de personas (T)
 Edad del jefe de hogar, expresado en años (ED)
 Máximo nivel de estudios alcanzado por el jefe de hogar (ES), descrito en las
siguientes categorías: inicial, primaria, secundaria, técnico medio, profesional
universitario, post grado
 Forma de tenencia de la vivienda (TEN), descrita en las siguientes categorías:
propia, alquilada, en anticrético, otras formas
 Servicios básicos de la vivienda del hogar, descritos en las siguientes categorías y
sub categorías: Agua potable: Si o No, energía eléctrica: Si o No, alcantarillado: Si
o No, teléfono: Si o No, internet: Si o No.
Las variables antes detalladas pueden ser simbolizadas con las letras mayúsculas
incluidas en ese detalle; pero también, pueden ser simbolizadas con la siguiente notación:
X, Y, Z, T, U, V, W, etc., o en su defecto por: X1, X2, X3, ….. , XK, u otras letras
mayúsculas, o finalmente siglas pero muy cortas.
1
Por otra parte, las variables antes descritas poseen medidas importantes (de tendencia
central, de dispersión, de asimetría, de kurtosis, o algunas proporciones) que son
desconocidas y por lo que se denominan parámetros; los cuales, podrán ser estimados
empleando la inferencia estadística. Ejemplos de parámetros de variables antes descritas
podrán ser los siguientes: a) ingreso medio mensual (µ), la varianza (σ2) y la desviación
estándar (σ) de la variable ingreso mensual, b) gasto medio mensual (µ), la varianza (σ2) y
la desviación estándar (σ) de la variable gasto mensual, c) la edad promedio de los jefes
de hogar, d) la proporción de jefes de hogar con formación profesional universitaria (P), e)
proporción de hogares sin vivienda propia, f) proporción de viviendas de hogares de esa
población sin agua potable, etc., etc.
Finalmente, las variables poblacionales que se investigan tienen diferentes formas de
distribución (Bernoulli, Binomial, Geométrica, Hipergeométrica, Uniforme, Exponencial,
Normal, etc., etc.) que también es importante conocer para utilizar los métodos de la
inferencia estadística.
1.1.1 Clasificación de Poblaciones
Poblaciones Infinitas
Son aquellas que tienen un número no numerable de unidades o elementos; ejemplo:

número de pacientes de un centro médico. Todas las selecciones o extracciones de
muestras aleatorias con restitución de poblaciones finitas se consideran poblaciones
infinitas.
Poblaciones Finitas
Son aquellas que tienen un número numerable de unidades o elementos, ejemplo: número
de pacientes hospitalizados por día en un centro médico. Todas las selecciones o
extracciones de muestras aleatorias sin restitución de poblaciones finitas (N), obviamente
se consideran poblaciones finitas.
1.2 Muestreo Estadístico
1.2.1 Justificación del Uso de Muestreo
Es común, tanto en los problemas cotidianos como en las investigaciones científicas, el

empleo de muestras para inferir alguna o algunas características de las poblaciones de
donde se obtiene la información de la muestra.
Es factible obtener conclusiones sobre un conjunto sin que necesariamente se analice

exhaustivamente a todos los elementos de la población que lo componen.
Un fabricante de focos no prueba la duración de cada uno de los focos que produce para
determinar el tiempo medio de duración, ya que no tendría que vender. Su departamento
de control de calidad se encarga, con métodos estadísticos de la inferencia estadística de
hacerle conocer cuál es aproximadamente esa duración media, cual es la proporción de
focos defectuosos, cual es la variabilidad media de la duración, etcétera, con solo probar
una muestra relativamente pequeña de focos.
2
Para cuantificar los glóbulos rojos de una persona se recurre a una pequeña muestra de
sangre y no al recuento total, que resultaría imposible de realizar.
Si se desea realizar una estimación de radioyentes, de las estaciones de radio de una

ciudad grande, el procedimiento más indicado para realizarlo con rapidez y menor costo
será obtener una muestra representativa de la población total, y con base en los datos de
esta muestra inferir, con cierta seguridad la proporción de radio oyentes para cada
estación. Prácticamente todas las encuestas que se llevan a cabo en sociología,
psicología, administración, política, economía, etc., se realizan con base a muestras.
Es recomendable el empleo del muestreo en vez del examen de todos los elementos de
una población por varias razones:
 Con menor costo y con mayor rapidez se obtiene la información, y en ciertos casos
se obtiene con mayor precisión y confiabilidad.
 El costo menor es evidente, ya que al examinar unos cuantos elementos en vez del
total representa menor costo; por ejemplo, resultaría el costo muy elevado de un
censo a los miles de profesionales bolivianos, cuando pueden obtenerse buenos
resultados con una muestra relativamente pequeña, pero representativa.
 En la mayor parte de los estudios se requiere presentar los resultados obtenidos
con oportunidad en tiempo breve; las muestras pueden levantarse y analizarse con
mayor rapidez que un censo.
 En muchas ocasiones se requiere información que puede ser obtenida por personal
especializado y entrenado; en otras ocasiones se requiere de instrumental
apropiado; por ejemplo obtener información médica, económica, política, etc.
 Cuando las poblaciones son pequeñas; puede ser más económica y rápida una
investigación sobre toda la población.
1.2.2 Muestra No Aleatoria
Por muestra No Aleatoria o Muestra No Probabilística se entiende la selección de una

parte de los elementos de una población, sin que cada uno de los elementos tenga una
probabilidad conocida de ser seleccionado.
Las muestras no probabilísticas se emplean con frecuencia por causa de la facilidad con
que pueden obtenerse, aun cuando carecen de fundamentos teóricos satisfactorios.
Se distinguen DOS tipos de muestras no probabilísticas: Intencionales y

Circunstanciales. En el muestreo intencional, quien diseña la muestra busca que sea
representativa de la población de donde la obtiene, pero esta representatividad depende
de su particular opinión; en todo caso el procedimiento es subjetivo, ya que no hay
posibilidad de fijar la precisión y la confiabilidad de sus estimaciones. Es común que las
muestras intencionales estén influidas por las preferencias y tendencias personales del
investigador. Un ejemplo es el siguiente: si se pretende obtener la opinión de los
estudiantes de una facultad, la muestra intencional puede seleccionarse estableciendo
cuotas de alumnos; además, pueden establecerse cuotas tomando en consideración la
carrera y género. En todo caso la asignación de los elementos que deben incluirse en
cada cuota se realiza a juicio del encuestador, ya que este solo cumple con obtener los
datos de quienes reúnan las condiciones especificadas en su cuota; por ejemplo a un
3
encuestador se le pide levantar 10 cuestionarios de personas que tengan las siguientes
características: varones del primer semestre, en la carrera de psicología.
Se dice que la muestra es Circunstancial cuando los elementos de la muestra se toman

de cualquier manera, generalmente atendiendo razones de comodidad; por ejemplo si a
un encuestador se le pide levantar 10 cuestionarios recurrirá a sus amigos y familiares o
aprovechara la presencia un grupo bien dispuesto sin atender ningún control.
Por ejemplo: si con base a una muestra obtenida del directorio telefónico de una ciudad
grande se estimara la votación de los habitantes de la misma, respecto a una próxima
elección, la muestra no será correcta, ya que la mayoría de los votantes no están
registrados en el directorio y quienes lo están constituyen seguramente una población con
rasgos particulares. En este caso, aun cuando la selección del registro se hiciera con
sumo cuidado, no sería conveniente generalizar los resultados obtenidos a la población
total de la ciudad; en todo caso la generalización pudiera ser válida únicamente para la
población de electores registrados en el directorio.
La selección de una muestra tiene que partir de algunos fundamentos teóricos para que
pueda considerarse propiamente como tal.
La teoría del muestreo solo es aplicable a las muestras, donde cada uno de los elementos
de una población tiene una probabilidad conocida de ser seleccionado y, además, que la
selección de esos elementos se obtenga al azar.
Si en una encuesta por muestreo se pretende estimar la proporción de alumnos que

trabajan en una carrera de educación superior y para ello se entrevista a 100 estudiantes
en el café de la Universidad, la muestra no sería aleatoria, porque el procedimiento de
selección para realizarlo sería intencional; es decir, el entrevistador es el que determinaría
quienes serían entrevistados. Además, no a todos los estudiantes se les daría igual
oportunidad de selección, pues quienes más posibilidades tendrían serian quienes más
frecuentan el café.
1.2.3 Muestreo Aleatorio Simple
En la práctica poco se utiliza el muestreo aleatorio simple, sin embargo los principios
básicos de la teoría del muestreo se pueden explicar y desarrollar de manera más sencilla
a partir del muestreo aleatorio simple. Todo tipo de muestreo involucra, en una forma,
selección de muestras aleatorias al azar, por ello se describirá brevemente los
procedimientos de selección aleatoria.
Por ejemplo: en una fábrica que tiene 2.500 obreros, se desea obtener una muestra
aleatoria de 200 obreros para una investigación sobre productividad.
La selección de los 200 obreros puede realizarse mediante el uso de una tabla de
números aleatorios, la cual se incluye en el apéndice de los libros de Inferencia Estadística
o de Muestreo Aleatorio; para cuyo propósito se procede como sigue:
a) Se enumeran progresivamente los nombres de los 2.500 obreros, de tal manera

que cada número contenga 4 dígitos del valor de N (tamaño de la población), por
ejemplo: 0001, 0002, … , 0099, 0100, … , 2.499, 2.500.
4
b) Se selecciona al azar el punto de partida en la tabla de números aleatorios, cuya
explicación simplificada implica recurrir a una columna que tenga cuatro (4) dígitos,
debido a que el tamaño de la población de obreros tiene 4 dígitos (N = 2.500) y la
primera fila (podrían ser otras filas). La muestra de 200 debe estar constituida por
obreros cuyos números asignados en la nómina se encuentran comprendidos entre
0001 y 2.500.
c) En el caso de que un número comprendido entre 0001 y 2.500 ya fue seleccionado
vuelve a repetirse, se debe ignorar. Al terminar la columna se continúa con la
siguiente y al concluir la página se utiliza la siguiente. En el caso de que solo se
disponga de una página, puede recurrirse a ciertos procedimientos que permitan
obtener una muestra grande.
1.2.4 Notación y Conceptos Básicos
El tamaño de la población finita se simboliza con N mayúscula, por tanto N indica el

número de unidades elementales que constituyen una población o universo: por ejemplo,
hogares de un municipio o de una comunidad, obreros de una fábrica, estudiantes de una
carrera de una universidad, artículos producidos por una fábrica, pacientes de un hospital,
etc.
Las unidades elementales de la población se simbolizan con N1, N2, N3, . . . , NN.
A las unidades elementales de una población están asociadas ciertas características, y por
alguna o por algunas de las cuales existirá el interés de analizar. Estas características se
las conoce con la denominación de variables: por ejemplo, ingreso, gasto, escolaridad,
edad, precio, productividad, y se simbolizan generalmente con las ultimas letras
mayúsculas del alfabeto: X, Y, Z, T, U y V. Así la variable ingreso puede representarse con
X, el gasto con Y, la escolaridad con Z, la edad con T, el precio con U y la productividad
con V. Entonces, Xi es el monto de ingreso de la iésima unidad elemental de la población
de tamaño N; X1, X10, constituyen los ingresos de los hogares a quienes se les asigno los
números 1 y 10 de la nómina; o sea N1 y N10.
1.2.5 Muestra Aleatoria
En la mayoría de las situaciones que se realizan las investigaciones económicas, sociales

y en otras ciencias experimentales, es imposible e innecesario contar con todos los datos
de la población, solo una parte de los datos de la población pueden constituirse en
información necesaria y suficiente para realizar la generalización o inferencia acerca de las
medidas o paramentros de la población, que en su generalidad son desconocidos. Para
realizar la inferencia respecto a los parámetros de una población es suficiente utilizar la
información estadística de una muestra aleatoria representativa. Una parte o subconjunto
de la población se denomina muestra.
Definición
Muestra aleatoria es la que se extrae de modo que toda unidad disponible en la población
para la selección o extracción, tiene igual probabilidad de ser seleccionada o extraída para
su inclusión en la misma. Complementariamente, muestra aleatoria de tamaño n tiene
igual probabilidad de ser extraída entre varias muestras posibles.
5
Ejemplo.- Sea una población hipotética finita constituida por cinco hogares (N = 5), cuya
presentación simbólica es la siguiente: {H1, H2, H3, H4, H5}. Suponiendo que el interés
nuestro es analizar la variable gasto mensual (X) expresada en miles de bolivianos (X1; X2;
X3; X4; X5). Además, suponiendo que es conocido el monto de gasto de cada hogar de esa
población que también se denomina población de gastos, cuyos montos en miles de
bolivianos sean los siguientes: {3, 5, 7, 9, 11}. INFERENCIA B 13’08’2021
i) Se extrae una muestra aleatoria de tamaño dos (n = 2) con restitución; luego, el número
de muestras posibles que pueden extraerse son = 5*5 = 52 =25; cuya presentación
simbólica para este procedimiento de selección de muestras aleatorias es la siguiente: Nn.
Las 25 muestras aleatorias posibles de obtenerse son las siguientes: (3, 3) (3, 5) (3, 7)
(3, 9) (3, 11) (5, 3) (5, 5) (5, 7) (5, 9) (5, 11) (7, 3) (7, 5) (7, 7) (7, 9) (7, 11) (9, 3) (9, 5) (9,
7) (9, 9) (9, 11) (11, 3) (11, 5) (11, 7) (11, 9) (11, 11)
El conjunto de las 25 muestras aleatorias descritas anteriormente recibe la denominación
de espacio de la muestra, que es el conjunto de resultados posibles que se obtiene al
realizar esa extracción. El experimento en este caso es la extracción de la muestra
aleatoria de tamaño 2 (n = 2) con restitución de una población finita que es de tamaño 5 (N
= 5).
ii) Se extrae una muestra aleatoria de tamaño dos (n = 2) sin restitución; luego, el número
de muestras posibles que pueden extraerse se determina utilizando la combinación de 5
elementos tomados de 2 en 2; es decir, utilizando la operatoria de una combinación como
sigue: 5C2 = 10; cuya presentación simbólica para este procedimiento de selección de
muestra aleatoria es la siguiente: NCn. Esta notación corresponde a una combinación de N
elementos tomados de n en n.
Las 10 muestras aleatorias posibles de obtenerse son las siguientes:
(3, 5) (3, 7) (3, 9) (3, 11) (5, 7) (5, 9) (5, 11) (7, 9) (7, 11) (9, 11)
Estas 10 muestras aleatorias son distintas, debido a que poseen distintos elementos, por
lo que las 10 muestras son representativas para la población finita; además, todas tienen
igual probabilidad de ser extraídas. Por estas razones en la vida real se utiliza este
procedimiento de extracción de muestras aleatorias sin restitución, y no se utiliza el
procedimiento de selección con restitución; sin embargo, se realiza el análisis de este
último procedimiento solo con fines comparativos.
Como en el caso del inciso i), el conjunto de las 10 muestras aleatorias descritas
anteriormente recibe la denominación de espacio de la muestra, que es el conjunto de
resultados posibles que se obtiene al realizar un experimento; el experimento en este caso
particular es la extracción de las unidades de la muestra aleatoria sin restitución de una
población finita que es de tamaño 5 (N = 5).
Se considera conveniente realizar las aclaraciones correspondientes sobre la definición
anterior de muestra aleatoria con base a los resultados obtenidos en los incisos i) y ii) del
presente ejemplo:
1
i) La probabilidad de extraer una unidad de la población para el primer caso es 5; que
1
en forma general y simbólica es: y la probabilidad de obtener una de las 25
𝑁
6
1
muestras posibles es , que en forma general y simbólica se presenta como sigue:
25
1 1
= 52
𝑁𝑛
ii) Para el ejemplo del inciso ii), la probabilidad de extraer una muestra de todas las
1 1 1
posibles está dada por: (5) = 10; que en forma general se expresa como sigue: (𝑁)
2 𝑛
En el ejemplo expuesto bajo el procedimiento de extracción con restitución se tienen los

siguientes problemas: 5 de las 25 muestras están constituidas por los mismos elementos:
(3, 3) (5, 5) (7, 7) (9, 9) (11, 11), y varias otras muestras están repetidas, debido a que
están constituidas por los mismos elementos, solo varía el orden de los mismos. Las
siguientes muestras: (3, 5) (3, 7) (3, 9) (3, 11) son iguales a las muestras (5, 3) (7, 3) (9,
3) (11, 3). Las muestras (5, 7) (5, 9) (5, 11) son iguales a las muestras (7, 5) (9, 5) (11, 5).
Las muestras (7, 9) (7, 11) son iguales a (9, 7) (11, 7). La muestra (9, 11) es igual a la
muestra (11, 9); por lo que, las probabilidades de obtener las distintas muestras son
diferentes, situación que presenta contradicción con la definición 2.1, que establece en
sentido de que la probabilidad de obtener cada una de las muestras posibles es igual; en
otras palabras, cada una de las muestras aleatorias tiene igual probabilidad de obtenerse.
Se aclara que una muestra aleatoria es solo un conjunto de unidades o elementos u
observaciones y no interesa el orden de sus elementos.
Por las razones antes expuestas, para extraer muestras aleatorias en la vida real se utiliza
generalmente el segundo procedimiento; es decir, extracción de muestras aleatorias sin
restitución tanto de poblaciones infinitas como finitas. Además, existen otras razones
importantes para utilizar el segundo procedimiento de selección de muestras aleatorias
que serán expuestas posteriormente.
Definición INFERENCIA A 12’08’2021
Una definición rigorosa de muestra aleatoria; es decir, la que permite realizar un análisis
teórico y matemático de la inferencia estadística es la siguiente:
Sea X una variable aleatoria (variable de interés definida en los elementos de una
población) con función de probabilidad P(X; ϴ) o f(X; ϴ) que depende del parámetro ϴ, la
muestra aleatoria de tamaño n extraída de X, es un conjunto de n variables aleatorias: X1,
X2, X3, ……., Xn; las cuales, cumplen las siguientes condiciones:
1) Las n variables aleatorias X1, X2, X3, ……., Xn son independientes.
2) Cada Xi para la i = 1, 2, 3, ……. , n tiene la misma distribución de X y se dice que
tienen distribución idéntica a la de la población; es decir:
I. P(Xi; ϴ) = P(X; ϴ) para toda Xi; tal que i = 1, 2, 3, …… , n

II. f(Xi; ϴ) = f(X; ϴ) para toda Xi; tal que i = 1, 2, 3, …… , n
1.2.6 Implicaciones de la definición anterior de muestra aleatoria
a) Si X es una población con media µ y varianza σ 2, y X1, X2, . . . , Xn, es una muestra
aleatoria extraída de X, entonces cada Xi de la muestra tiene la misma distribución de X,
luego algunas medidas importantes de cada elemento de la muestra son:
i) E(Xi) = E(X) = µ para la i = 1, 2, 3, …… , n (1)
7
ii) V(Xi) = V(X) = σ2 para la i = 1, 2, 3, …… , n
La función de probabilidad conjunta de la muestra aleatoria X1, X2, ……, Xn, extraída de
una variable poblacional discreta está dada por:
i) P(X1, X2, ..., Xn; ϴ) = P(X1; ϴ) P(X2; ϴ) P(X3; ϴ) … P(Xn; ϴ) = ∏𝑛1 𝑃(𝑋𝑖 ; ϴ) = ∏𝑛1 𝑃(𝑋; ϴ) =
{𝑃(𝑋; ϴ)}n (3)
En cambio, si la muestra fue extraída de una variable poblacional continua está dada por:
ii) f(X1, X2, …..…, Xn; ϴ) = f(X1; ϴ) f(X2; ϴ) f(X3; ϴ) …. f(Xn; ϴ) = ∏𝑛1 𝑓(𝑋𝑖 ; ϴ) = ∏𝑛1 𝑓(𝑋; ϴ)
= {𝑓(𝑋; ϴ)}n (4)
Los resultados anteriores se obtienen utilizando las dos condiciones de la definición de
muestra aleatoria; es decir, la independencia de las n variables aleatorias y la distribución
idéntica de las mismas P(Xi; ϴ) = P(X ; ϴ) y f(Xi ; ϴ) = f(X ; ϴ) para i = 1, 2, 3, ... , n
b) La función generadora de momentos de la muestra aleatoria X1, X2, X3,……, Xn, está
dada por:
Sea Y = ΣXi luego la función generadora de momentos de Y está dada por:
MY(t) = E(℮𝑡𝑌 ) = E(℮𝑡 ∑ 𝑋𝑖 ) = E(etX1) E(etX2) E(etX3) …….. E(etXn)
= E(etX) E(etX) E(etX) ………. E(etX) = {E(etX)}n = {MX(t)}n (5)

c) El estadístico o estimador es una variable aleatoria, cuyo valor depende de la muestra
aleatoria elegida; ejemplo: si X1, X2, X3,……, Xn, es una muestra aleatoria extraída de una
población X con parámetros µ (media) y σ2 (varianza), entonces:
𝛴𝑋 𝑛
∑ (𝑋𝑖−𝑋 )̅ 2 ∑𝑛 ̅) 2
1 (𝑋𝑖 −𝑋
𝑋̅ = 𝑛 ; s2 = 1 𝑛−1 y S2 = son estadísticos o estimadores de µ y σ2,
𝑛
respectivamente.
d) Momentos de una Población: El r–esimo momento centrado respecto al origen
(respecto al cero) de una población (X) con función de probabilidad P(X,ϴ) si X es discreta
o f(X,ϴ) si X es continua está dado por: Mr = E(Xr), para r = 1, 2, 3, ……….. ; es decir,
estos momentos son las medias esperadas de las potencias de la variable aleatoria
poblacional.
Casos particulares son cuando r = 1; es decir, M1 es la media esperada de la variable

poblacional, o sea E(X). Si r = 2 se obtiene el segundo momento centrado respecto al
origen de la población, o sea E(X2).
Por otra parte, el r–esimo momento centrado respecto a la media esperada de una
población (X) con función de probabilidad P(X,ϴ) si X es discreta o f(X,ϴ) si X es continua
está dado por: M’r = E{(X – E(X)}r, para r = 1, 2, 3, ………..
Un caso particular es cuando r = 2, donde se obtiene la varianza de la población X; es

decir, M’2 = σ2; etc.
8
e) Momentos Centrados respecto al Origen de una Muestra Aleatoria: Son las medias
aritméticas de las potencias de una muestra aleatoria. Son variables aleatorias, cuyos
valores dependen de la muestra aleatoria extraída; ejemplo: si X1, X2, X3,……, Xn, es una
muestra aleatoria extraída de una población X, con función de probabilidad dada por
P(X,ϴ) o f(X,ϴ), entonces el r–esimo momento centrado respecto al origen (respecto al
∑𝑛 𝑋 𝑟
cero) está dado por: 𝑚𝑟 = 1𝑛 𝑖 , para r = 1, 2, 3, …….
Un caso particular es cuando r = 1, donde: m1 = 𝑋̅ Por lo que, 𝑋̅ es el primer momento
centrado respecto al origen de la muestra aleatoria.
El r–esimo momento centrado respecto a la media aritmética denotado por m’r está dado
∑𝑛 ̅ )𝑟
1 (𝑋𝑖 −𝑋
por: 𝑚𝑟’ = , para r = 1, 2, 3, …….
𝑛
Un caso particular es cuando r = 2, donde: 𝑚2’ = S2; por lo que, S2 es el segundo momento
centrado respecto a la media de la muestra aleatoria.
1.3 Distribución de Probabilidad de la Media de una Muestra Aleatoria
1.3.1 Introducción
Cuando existe la necesidad de obtener una medida de tendencia central de una variable
de una población de interés, se utiliza el estimador obtenido de una muestra aleatoria,
para cuyo propósito previamente se debe analizar las características de la distribución de
∑𝑛 𝑋
probabilidad del estimador, que en este caso es la media de la muestra 𝑋̅ = 1 𝑖. 𝑛
̅ de poblaciones infinitas o selección de los elementos de

1.3.2 Distribución de 𝑿
la muestra con restitución de una población finita:
Teorema.- Sea X una población (una variable aleatoria de interés para el análisis) con
función de probabilidad P(X, µ, σ2) o f(X, µ, σ2), con media µ y varianza σ2. Sea X1, X2,
∑𝑛 𝑋
X3,…, Xn, una muestra aleatoria extraída de X, y sea 𝑋̅ = 1𝑛 𝑖 la media de esa muestra
aleatoria, entonces 𝑋̅ es una variable aleatoria (estimador de µ) con las siguientes
medidas:
a) Media esperada: E(𝑋̅) = µ; la cual es la medida de tendencia central de 𝑋̅.

2
2 𝜎 𝜎
b) Varianza: V(𝑋̅) = 𝜎𝑋̅ = ; cuya desviación estándar es: 𝜎𝑋̅ = .
𝑛 √𝑛
c) Si n es suficientemente grande (n > 30), entonces por el Teorema Central del
Límite, la media de esta muestra (𝑋̅) se distribuye aproximadamente según la
𝜎2 𝜎2
normal con media µ y varianza ; esto en símbolos resulta: 𝑋̅ ~ N(µ ; ), por lo
𝑛 𝑛
(𝑋̅ − µ)
que: Z = 𝜎  N(0,1). En donde, la variable aleatoria normal estándar (Z) está
√𝑛
𝜎
relacionada con el nivel de confianza del estimador 𝑋̅; (𝑋̅ - µ) = ℰ = Z𝜎𝑋̅ = Z se
√𝑛
denomina precisión del estimador o margen máximo de error del
9
estimador (𝑋̅), y n es el tamaño de la muestra aleatoria. Por lo que, en esta
igualdad se encuentran los tres elementos básicos de la inferencia estadística.
La demostración de los incisos a) y b) es:
∑𝑋 ∑ 𝐸(𝑋 ) ∑µ 𝑛µ
a) E(𝑋̅) = E( 𝑛 𝑖) = 𝑛 𝑖 = 𝑛 = 𝑛 = µ
∑𝑋 ∑ 𝑉(𝑋 ) ∑ 𝜎2 𝑛 𝜎2 𝜎2
b) V(𝑋̅) = V( 𝑛 𝑖) = 𝑛2 𝑖 = ; ya que las n variables aleatorias de la
= =
𝑛2 𝑛2 𝑛
muestra son independientes, razon por la cual las covarianzas son
iguales a cero.
Ejemplo.- Para la variable poblacional gasto mensual (X) expresado en miles de

bolivianos Calcular: a) El gasto medio (µ), b) la desviación estándar σ, c) la proporción
de hogares con gasto mensual mayor a 5.000 bolivianos P, d) elaborar la distribución
de probabilidad y el grafico del gasto mensual. Comentar el resultado al final de cada
inciso.
∑𝑁 𝑋
a) µ = 1𝑁 𝑖 = (3+5+7+9+11)/5 = 7 miles de bolivianos, este resultado es el gasto medio
mensual de la población de hogares; si a X se la considera como una variable
aleatoria, entonces la media esperada es igual a la media aritmética:
1 1 1 1 1 1
E(X) = ∑𝑁
1 𝑋𝑖 P(Xi) =35 + 55 + 75 + 95 + 115 = 5(3+5+7+9+11) = 7 miles de bolivianos
b) La varianza de la variable poblacional (X) está dada por:

𝑁 2 1
σ2 = ∑𝑁 2 𝑁 2 2
1 [𝑋𝑖 − 𝐸 (𝑋 )] P(Xi) = ∑1 [𝑋𝑖 − µ] P(Xi) = ∑1 𝑋𝑖 P(𝑋𝑖 ) - µ = 5(3 +5 +7 +9 +11 )
2 2 2 2 2
– 72 = 57 – 49 = 8 (miles de bolivianos)2, luego la desviación estándar es: σ = √8 =

2.83 miles de bolivianos. Este resultado representa la variación media de los
montos de gasto respecto al monto medio de gasto (7 miles de Bs.) de la población
de hogares;
3
c) P = 5 = 0.6 es la proporción de hogares de la población con gasto mensual mayor a
5.000 bolivianos.
Cuadro 3.1
Distribución de Probabilidad de la Población de Gastos (X)
Xi P(Xi)
3 0,20
5 0,20
7 0,20
9 0,20
11 0,20
Total 1,00
Grafico 3.1
Distribución del Gasto Mensual de la Población de 5 Hogares
10
0,25
Probabilidad de obtener un valor de X

0,2
0,15
0,1
0,05
0
0 5 10 15
Valores de X (gasto mensual en miles de Bs)
Los resultados de los tres sub incisos a), b) y c) son medidas o parámetros del gasto
mensual de la población de hogares, por lo que son desconocidos; para el ejemplo en
particular es posible calcular bajo el supuesto de que la población hipotética es
extremadamente pequeña y que el valor de la variable gasto mensual de cada unidad
(hogar) de la población es conocido. En la vida real las poblaciones son grandes y los
valores de todas las variables que se investigan son desconocidos; razones por las
cuales, se eligen muestras al azar; de las cuales, se obtienen los valores de todas las
variables de interés para estimar sus parámetros, la cual es uno de los objetivos
centrales de la inferencia estadística.
d) El Cuadro 3.1 y el Grafico 3.1 corresponden a la distribución de probabilidad del

gasto mensual de la población de hogares (X) y se evidencia que la distribución de
probabilidad de la variable Gasto Mensual expresado en miles de bolivianos de la
población hipotética de hogares es UNIFORME o RECTANGULAR.
Ejemplo.- Se extrae una muestra al azar de X con restitución, a) describir todas las
muestras aleatorias posibles, b) calcular 𝑋̅ para cada una de las muestras, c) elaborar
la distribución de probabilidad de 𝑋̅, d) calcular el valor de E(𝑋̅) y verificar que es igual
al valor de µ, e) calcular la desviación estándar de 𝑋̅ y verificar que el resultado
obtenido es igual al resultado calculado con la ecuación 𝜎𝑋̅ = σ/√𝑛, f) elaborar el
grafico de la distribución de probabilidad de 𝑋̅ y comparar con el grafico de la
distribución de la población de gastos mensuales (X). Comentar el resultado de cada
inciso al final del mismo.
a) Las 25 muestras posibles son: (3, 3) (3, 5) (3, 7) (3, 9) (3, 11) (5, 3) (5, 5) (5, 7) (5, 9)
(5, 11) (7, 3) (7, 5) (7, 7) (7, 9) (7, 11) (9, 3) (9, 5) (9, 7) (9, 9) (9, 11) (11, 3) (11, 5) (11,
7) (11, 9) (11, 11)
b) Las medias de estas muestras posibles de obtenerse (𝑋̅i) son: 3, 4, 5, 6, 7, 4, 5, 6, 7,

8, 5, 6, 7, 8, 9, 6, 7, 8, 9, 10, 7, 8, 9, 10, 11
11
c) La distribución de probabilidad de la media de estas muestras aleatorias de tamaño
2 extraídas de X con restitución se presenta en el Cuadro 3.2
La distribución de probabilidad de 𝑋̅ presentada en el Cuadro 3.2 y el Grafico 3.2

muestran que esa distribución es simétrica respecto a E(𝑋̅) = 7, y por otra parte,
muestran también que existe mayor probabilidad (0.20) de obtener la media de 𝑋̅ = 7
que es igual a la media de la población de gastos (µ = 7 miles de Bs). Este resultado es
extremadamente importante para la vida real, donde se realizan las investigaciones
sobre poblaciones grandes y muestras representativas de las mismas, donde existirá
siempre mayor probabilidad de obtener un valor estimado de 𝑋̅ = 7 igual a la media de
la población.
En forma general, se puede verificar con análisis similares al ejemplo anterior que todas
las estimaciones obtenidas de parámetros poblacionales con base a muestras
aleatorias representativas, tienen mayor probabilidad de ser iguales al valor de esos
parámetros.
Cuadro 3.2
Distribución de probabilidad de 𝑋̅ de muestras aleatorias
de tamaño 2 extraídas de X con restitución
𝑋̅i ei P(𝑋̅i) 𝑋̅i P(𝑋̅i) 𝑋̅i2 P(𝑋̅i)

3 1 0,04 0,12 0,36
4 2 0,08 0,32 1,28
5 3 0,12 0,60 3,00
6 4 0,16 0,96 5,76
7 5 0,20 1,40 9,80
8 4 0,16 1,28 10,24
9 3 0,12 1,08 9,72
10 2 0,08 0,80 8,00
11 1 0,04 0,44 4,84
Totales 25 1,00 7,00 53,00
En donde ei son las frecuencias absolutas esperadas de cada valor de 𝑋̅i.
d) E(𝑋̅) = Σ𝑋̅i P(𝑋̅i) = 7. Esta media esperada de la media de la muestra es igual a la

media de la población, cuyas características serán analizadas en el siguiente capítulo.
e) Para calcular la desviación estándar de 𝑋̅, primero se calcula la varianza de la

misma; cuya expresión, deducida de su definición resulta:
12
̅ i2 P(𝑋̅i) - [Σ𝑋̅i P(𝑋̅i)]2 = 53 - 72 = 4 (miles de bolivianos)2;
𝜎𝑋2̅ = Σ[(𝑋̅i – E(𝑋̅)]2P(𝑋̅i) = Σ𝑋
por lo que, la desviación estándar de 𝑋̅ resulta: 𝜎𝑋̅ = √4 = 2 miles de Bs. Este resultado
mide la dispersión media de los valores de 𝑋̅ respecto a su media esperada que es
igual a 7 miles de Bs. Utilizando la ecuación (8) de la desviación estándar de 𝑋̅ se
obtiene también: 𝜎𝑋̅ = σ/√𝑛 = 2.83/√2 = 2 miles de Bs. Este resultado es igual a la
desviación estándar obtenida con la información de la distribución de probabilidad de 𝑋̅
contenida en el Cuadro 3.2
En la vida real se utiliza la formula debido a que no es posible obtener la distribución de

probabilidad de un estimador para poblaciones y muestras grandes, donde el número
de muestras posibles que se pueden obtener es extremadamente grande, cuya
descripción es tarea imposible e innecesaria de realizar.
f) La representación gráfica de la distribución de probabilidad de 𝑋̅ se presenta en el

Grafico 3.2
Grafico 3.2
Representación Gráfica del Cuadro 3.2
0,25
Probabilidad de obtener el valor de la
0,2
media muestral
0,15
0,1
0,05
0
0 2 4 6 8 10 12
Valores de la media muestral en miles de Bs.
Variable Obs Mean Std. Dev. Min Max
x 25 7 2.041241 3 11
13
.2
.15
Density
.1 .05
0
2 4 6 8 10 12
X
̅ de muestras extraídas sin restitución de una población

1.3.3 Distribución de 𝑿
finita
Teorema.- Sea X una población (una variable aleatoria de interés) con función de
probabilidad P(X, µ, σ2) o f(X, µ, σ2), con media µ y varianza σ2. Sea X1, X2, X3,…, Xn, una
muestra aleatoria extraída de X, y sea 𝑋̅ la media de esa muestra aleatoria, entonces 𝑋̅ es
una variable aleatoria (estimador de µ) con las siguientes medidas:
a) Media esperada: E(𝑋̅) = µ; la cual es la medida de tendencia central de 𝑋̅.

2 𝜎 2 𝑁−𝑛 𝜎 𝑁−𝑛
b) Varianza: V(𝑋̅) = 𝜎𝑋̅ = ; cuya desviación estándar es: 𝜎𝑋̅ = 𝑛.√𝑁−1
𝑛 𝑁−1 √
c) Si n es suficientemente grande (n > 30), entonces por el Teorema Central del
Límite, la media de esa muestra (𝑋̅) se distribuye aproximadamente según la
2 (𝑋̅ − µ)
normal con media µ y varianza 𝜎𝑋̅ , luego; Z = 𝜎  N(0,1)
̅
𝑋
En donde, la variable aleatoria normal estándar (Z) está relacionada con el nivel de
𝜎 𝑁−𝑛
confianza del estimador 𝑋̅; (𝑋̅ - µ) = ℰ = Z𝜎𝑋̅ = Z √ se denomina precisión del
√𝑛 𝑁−1
estimador o margen máximo de error del estimador 𝑋̅, y n es el tamaño de la
muestra aleatoria. Por lo que, en esta igualdad se encuentran también los tres elementos
básicos de la inferencia estadística.
Demostración de los incisos a) y b).-
∑𝑋 ∑ 𝐸(𝑋 ) ∑µ 𝑛µ
a) E(𝑋̅) = E( 𝑛 𝑖) = 𝑛 𝑖 = 𝑛 = 𝑛 = µ
𝑁−𝑛
∑𝑋 ∑ 𝑉(𝑋𝑖 ) ∑ 𝜎2 𝑛 𝜎2 𝑁−𝑛 𝜎 2 𝑁−𝑛
b) V(𝑋̅) = V( 𝑛 𝑖) = = 𝑁−1
= = ; ya que 𝑋𝑖 tiene distribución de
𝑛2 𝑛2 𝑛2 𝑁−1 𝑛 𝑁−1
𝑁−𝑛
probabilidad Hipergeométrica, cuya varianza es 𝜎 2 𝑁−1 y las n variables
aleatorias de la muestra son independientes, razón por la cual las
covarianzas son iguales a cero. En el resultado de la varianza de 𝑋̅ el
𝑁−𝑛
cociente 𝑁−1 se denomina factor de corrección de poblaciones finitas.
14
Ejemplo.- Se extrae una muestra al azar de tamaño 2 (n = 2) de X sin restitución, a)
describir todas las muestras aleatorias posibles, b) calcular 𝑋̅ para cada una de las
muestras, c) elaborar la distribución de probabilidad de 𝑋̅, d) calcular el valor de E(𝑋̅) y
verificar que es igual al valor de µ, e) calcular la desviación estándar de 𝑋̅ y verificar que el
𝜎 𝑁−𝑛
resultado obtenido es igual al resultado calculado con la ecuación 𝜎𝑋̅ = √ , f)
√𝑛 𝑁−1
elaborar el grafico de la distribución de probabilidad de 𝑋̅ y comparar con el grafico de la
distribución de X (distribución de la variable de la población). Comentar el resultado de
cada inciso al final del mismo.
a) Las 10 muestras aleatorias posibles de obtenerse son las siguientes:

(3, 5) (3, 7) (3, 9) (3, 11) (5, 7) (5, 9) (5, 11) (7, 9) (7, 11) (9, 11)
b) Las medias de estas muestras posibles de obtenerse (𝑋̅i) son: 4, 5, 6, 7, 6, 7, 8, 8, 9, 10

c) La distribución de probabilidad de la media de esa muestra aleatoria de tamaño 2
extraída de X sin restitución se presenta en el Cuadro 3.3.
La distribución de probabilidad de 𝑋̅ anterior y el Grafico 3.3 muestran que esa distribución

es simétrica respecto a 𝑋̅ = 7, y por otra parte, muestran también que existe mayor
probabilidad (0.2) de obtener los valores 6, 7 y 8 de 𝑋̅; de los cuales, 7 es igual a la media
de la población de gastos (µ = 7 miles de Bs). Este resultado es también extremadamente
importante, como lo es para el caso de extracción de muestras aleatorias con restitución.
Cuadro 3.3
Distribución de probabilidad de 𝑋̅ de muestras aleatorias
de tamaño 2 extraídas de X sin restitución
𝑋̅i ei P(𝑋̅i) 𝑋̅i P(𝑋̅i) 𝑋̅i2 P(𝑋̅i)

4 1 0,10 0,40 1,60
5 1 0,10 0,50 2,50
6 2 0,20 1,20 7,20
7 2 0,20 1,40 9,80
8 2 0,20 1,60 12,80
9 1 0,10 0,90 8,10
10 1 0,10 1,00 10,00
Totales 10 1,00 7,00 52,00
En donde ei son las frecuencias absolutas esperadas de cada valor de 𝑋̅i.

En forma general, se verifica también, que en este caso de extracción de muestras sin
restitución de una población finita, que uno de los tres valores de 𝑋̅ (6, 7 y 8), tiene mayor
probabilidad de ser igual a la media poblacional.
15
d) E(𝑋̅) = Σ𝑋̅i P(𝑋̅i) = 7. Esta media esperada de la media de la muestra es igual a la media
de la población, aspecto que también será analizado en el siguiente capítulo.
e) Para calcular la desviación estándar de 𝑋̅, primero se calcula la varianza de la misma;

cuya expresión matemática obtenida de la definición de varianza de 𝑋̅ resulta:
𝜎𝑋2̅ = Σ[(𝑋̅i – E(𝑋̅)]2 P(𝑋̅i) = Σ𝑋̅i2 P(𝑋̅i) - [Σ𝑋̅i P(𝑋̅i)]2 = 52 - 72 = 3 (miles de bolivianos)2; por
lo que, la desviación estándar de 𝑋̅ resulta: 𝜎𝑋̅ = √3 = 1,732 miles de Bs. Este resultado
mide la dispersión media de los valores de 𝑋̅ respecto a su media esperada que es igual a
7 miles de Bs. Utilizando la ecuación matemática (presentada en el inciso e) obtenida por
otro procedimiento de la desviación estándar de 𝑋̅ se tiene:
2.83 5−2
𝜎𝑋̅ = √5−1 = 1,732 miles de Bs. Este resultado es igual a la desviación estándar
√2
obtenida con la información de la distribución de probabilidad de 𝑋̅ contenida en el Cuadro
3.3.
Nuevamente se hace notar que en la vida real se utiliza la ecuación citada anteriormente
para calcular el valor estimado de σ, debido a que no es posible determinar la distribución
de probabilidad de un estimador para poblaciones y muestras grandes, donde el número
de muestras posibles que se pueden obtener es extremadamente grande, cuya
descripción es tarea imposible e innecesaria de realizar.
f) La representación gráfica de la distribución de probabilidad de 𝑋̅ se presenta en el

Grafico 3.3.
Grafico 3.3
0,25
Probabilidad de obtener un valor de
0,20
la media muestral
0,15
0,10
0,05
0,00
0 2 4 6 8 10 12
Posibles valores de la media muestral
1.4 Teorema Central del Límite
16
Antes de presentar y demostrar el Teorema Central del Límite se considera necesaria la
presentación de dos propiedades de la función generadora de momentos que son las
siguientes:
Primera Propiedad
Si X es una variable aleatoria con función de probabilidades P(X) o f(X), la función

generadora de momentos de la variable aleatoria kX, siendo k una constante es:
2 𝑡 2 /2
MKX(t) = E(𝑒 𝑘𝑡𝑋 ) = MX(kt) = 𝑒 𝑘 .
Segunda Propiedad
Si Y = X + k; en la cual k es una constante, entonces la función generadora de Y es:
M(Y)(t) = M(X + K)(t) = E[𝑒 𝑡(𝑋+𝑘) ] = 𝐸[𝑒 𝑋𝑡+𝑘𝑡 ] = 𝑒 𝑘𝑡 E(𝑒 𝑡𝑋 ) = 𝑒 𝑘𝑡 MX(t)
1.4.1 Función Generadora de Momentos de una Variable Aleatoria Distribuida

según la Normal
Utilizando la siguiente igualdad: X = σZ + µ y aplicando las dos propiedades de la función

generadora de momentos presentadas anteriormente, se obtiene la función generadora de
momentos de la variable aleatoria X distribuida según la normal:
MX(t) = M(𝛔Z + µ)(t) = E[𝑒 (𝜎𝑍+ µ)𝑡 ] = E[𝑒 𝜎𝑍𝑡 𝑒 µ𝑡 ] = 𝑒 µ𝑡 MσZ(t) = 𝑒 µ𝑡 MZ(σt)
2 𝑡 2 /2 2 𝑡 2 /2
= 𝑒 µ𝑡 𝑒 𝜎 = 𝑒 µ𝑡+𝜎 para t > 0.
Si X es una variable aleatoria distribuida según la normal con media µ y varianza 𝜎 2 ,

𝑋−µ
entonces: Z = 𝜎 es una variable aleatoria distribuida según la normal estándar; es decir,
con media cero y varianza uno, cuya función generadora de momentos está dada por:
2
MZ(t) = 𝑒 𝑡 /2 para t > 0.
1.4.2 Teorema Central del Limite
El teorema central del límite es de enorme importancia tanto para la teoría estadística
como para la estadística aplicada, permite el uso de las propiedades de la distribución
normal, aunque las variables de las poblaciones tengan distribución distinta a la
distribución de la normal. El teorema central del límite, también es una de las
proposiciones más notables de toda la matemática 1.
Se demostrara este teorema como un caso particular para la media de una muestra
aleatoria (𝑋̅); para cuyo propósito se presenta el siguiente teorema
TEOREMA.- Sea X una variable aleatoria de una población discreta o continua, con
distribución de probabilidad de cualquier forma (distinta a la distribución normal), simétrica
1
Alexander M. Mood y Franklin A. Graybill. Introducción a la Teoría de la Estadística. Pág. 172.
17
o asimétrica, pero con media  y varianza 2. Sea X 1 , X 2 ,..., Xn una muestra aleatoria
extraída de X; cada cual, distribuida idénticamente según la población con media  y
varianza  2 ; es decir,  y  2 son finitas y comunes a las n variables aleatorias de la
𝑡 𝑋−µ
( ) ∑𝑛
1 𝑋𝑖
muestra; además, con función generadora de momentos 𝐸 [е√𝑛 𝜎 ]. Sea 𝑋̅ = 𝑛
la
(𝑋̅ − µ)
media de esa muestra aleatoria, y sea U = 𝜎 una nueva variable aleatoria definida en
√𝑛
función de 𝑋̅ (U depende de 𝑋̅). Se demostrara que la variable aleatoria U se distribuye
según la normal estándar, cuando el tamaño de la muestra aleatoria (n) tiende a infinito; es
decir, U  N(0,1) cuando n  .
El punto importante que se debe retener de este teorema, es el hecho de que en el límite,
la distribución de U no depende de cuál sea la distribución de la población X.
La importancia de este teorema en lo que respecta a las aplicaciones prácticas, radica en

el hecho de que la media 𝑋̅𝑛 de una muestra aleatoria proveniente de una población con
distribución cualquiera (distinta a la distribución de la normal) con media  y varianza 2
𝜎2
finitas, se distribuye aproximadamente según la normal con media  y varianza 𝑛 . Por otro
lado, el teorema central del límite se aplica tanto a distribuciones de variables aleatorias
discretas, como a distribuciones de variables aleatorias continuas.
∑𝑋
√𝑛 (𝑋̅ −µ) √𝑛 ( 𝑛 𝑖 −µ)
Demostración.- Presentando a U de la siguiente forma: U = = =
𝜎 𝜎
∑ 𝑋 −𝑛µ
√𝑛 ( 𝑖𝑛 ) √𝑛 ∑𝑛
1 (𝑋𝑖 −µ)
= , multiplicando y dividiendo la división anterior por √𝑛 se obtiene el
𝜎 𝑛𝜎
∑𝑛
1 (𝑋𝑖 −µ)
siguiente resultado: U = ; luego, se demuestra la siguiente igualdad: MU(t) = MZ(t)
𝜎√𝑛
cuando el tamaño de la muestra aleatoria tiende a infinito (n → ∞); es decir, se demuestra
que la función generadora de momentos de la variable aleatoria U es igual a la función
generadora de momentos de la variable aleatoria Z que tiene distribución normal estándar.
Este resultado establece sin demostración, que cuando dos variables aleatorias tienen la
misma función generadora de momentos se dice que ambas tienen la misma forma de
distribución. Continuando con la demostración se tiene:
𝑡 𝑋1−µ 𝑡 𝑋2 −µ 𝑡 𝑋3 −µ 𝑡 𝑋𝑛 −µ
( ) ( ) ( ) ( )
𝑀𝑈 (𝑡 ) = 𝐸 [е𝑈𝑡 ] = E[е√𝑛 𝜎 ] E[е√𝑛 𝜎 ] E[е√𝑛 𝜎 ] . . . E[е√𝑛 𝜎 ]
𝑡 𝑋−µ 𝑛
( )
= {𝐸 [е √𝑛 𝜎 ]} ; ya que 𝑋1 , 𝑋2 , 𝑋3 , . . . , 𝑋𝑛 tienen distribución idéntica a la
distribución de la variable de la población (X) debido a que constituyen una muestra

(𝑋−µ)
aleatoria. Haciendo: 𝜃 = la función generadora de momentos resulta: 𝑀𝑈 (𝑡 ) =
𝜎√𝑛
18
𝑛 𝑡𝜃
{𝐸[е𝜃𝑡 ]} ; desarrollando е𝜃𝑡 en la serie de Mac Laurin, se tiene: 𝑀𝑈 (𝑡 )={𝐸 [1 + +
1!
𝑛
𝑡 2 𝜃2 𝑡 3 𝜃3 (𝑋−µ)
+ + . . . ]} ; sustituyendo el valor de 𝜃 = , se obtiene el siguiente resultado:
2! 3! 𝜎 √𝑛
𝑛 𝑛
𝑡(𝑋−µ) 𝑡 2 (𝑋−µ)2 𝑡 3 (𝑋−µ)3 𝑡2 𝑡 3 µ′3
𝑀𝑈 (𝑡 )={𝐸 [1 + + + + . . . ]} =[1 + 2𝑛 + 6𝑛𝜎 3 +. . . ] , ya
𝜎 √𝑛 2𝑛𝜎 2 6𝑛𝜎 3 √𝑛 √𝑛
que E(X - µ) = 0 y E(𝑋 − µ)2 = 𝜎 2 ; además E(𝑋 − µ)3 es el tercer momento de la población
𝑡2 𝑡 3 µ′
centrado respecto a su media esperada. Haciendo X = + 6𝑛𝜎 33 𝑛 + . . . y aplicando
2𝑛 √
logaritmo neperiano a ambos lados de la función generadora de momentos de la variable

aleatoria U, se tiene: ln 𝑀𝑈 (𝑡 ) = n ln(1+X). Desarrollando ln(1+X) en la serie de Mac
Laurin, se genera: ln 𝑀𝑈 (𝑡 ) = n(𝑋 − 𝑋2

2 𝑋3
+ − ∙ ∙ ∙ ). Sustituyendo el valor de X se obtiene:
3
2 3
𝑡2 𝑡 3 µ′3 1 𝑡2 𝑡 3 µ′3 1 𝑡2 𝑡 3 µ′3
ln 𝑀𝑈 (𝑡) = n{ + +. . .− [ + +. . .] + [ + +. . .] − ⋯}
2𝑛 6𝑛𝜎3 √𝑛 2 2𝑛 6𝑛𝜎3 √𝑛 3 2𝑛 6𝑛𝜎3 √𝑛
2 3
𝑡2 𝑡 3 µ′ 1 𝑡2 𝑡 3 µ′ 1 𝑡2 𝑡 3 µ′
ln 𝑀𝑈 (𝑡) = { 2 + 6𝜎3 3𝑛 + . . . − 2 [2𝑛 + 6𝑛𝜎3 3 𝑛 + . . . ] + 3 [2𝑛 + 6𝑛𝜎3 3 𝑛 + . . . ] − ⋯ }
√ √ √
Aplicando límites a ambos lados de la igualdad anterior cuando n tiende a infinito, se tiene:
𝑡2
lim𝑛→∞ ln 𝑀𝑈 (𝑡) = ; ya que, todos los restantes términos dentro de la llave tienden a
2
cero, cuando n → ∞; luego, calculando el antilogaritmo de la función generadora de

𝑡2
(2)
momentos de U, se tiene: lim𝑛→∞ 𝑀𝑈 (𝑡) = е . Esta es la función generadora de
momentos de una variable aleatoria distribuida según la normal estándar; por lo que, la
variable aleatoria U se distribuye según la normal estándar cuando n tiende a infinito. En
forma simbólica resulta como sigue: U ~ 𝑁(0,1) cuando el tamaño de la muestra aleatoria
(𝑋̅ − µ) 𝜎2
es infinitamente grande (n → ∞); o sea, U = 𝜎 ~ 𝑁(0,1); luego 𝑋̅ ~ N(µ; 𝑛
).
√𝑛
La demostración anterior, es posible realizar para cualquier estimador; por ejemplo, para
𝑃̂; 𝑑𝑋̅1 −𝑋̅2 ; etc.
19
.4
.3
.2
y
.1
0
-4 -2 0 2 4
-4 σ -3 σ -2 σ -1 σ mean 1σ 2σ 3σ 4σ x
Ejemplo.- A continuación se realiza la demostración del teorema central del límite a través
de un ejemplo práctico, que consiste en lo siguiente:
a) Sea una población hipotética de cinco hogares de un determinado municipio N = {H1;

H2; H3; H4; H5}. Suponiendo que el interés es analizar la variable gasto mensual de esta
población; además, suponiendo que los montos de gasto (X) de esta población
expresados en miles de bolivianos son conocidos y son los siguientes: X = {3, 5, 7, 9, 11},
cuya distribución y representación gráfica son las siguientes:
Cuadro 3.4: Distribución de X
Xi P(Xi)
3 1/5
5 1/5
7 1/5
9 1/5
11 1/5
TOTAL 1,0
La representación gráfica de la distribución de probabilidades de la población de gasto

mensual expresado en miles de bolivianos se presenta en el Grafico 3.4
Grafico 3.4
Distribución de X
20
1/4
Probabilidad de obtener un valor de X

1/5
1/7
0
0 5 10 15
Gasto mensual expresado en miles de
bolivianos (X)
Por la información contenida en el Cuadro 3.4 y Grafico 3.4, se determina que la

distribución de probabilidad de la población de gasto mensual de los hogares del señalado
municipio es igual a la DISTRIBUCION UNIFORME O RECTANGULAR y no se asemeja a
la DISTRIBUCION NORMAL, tal como se establece en el enunciado del Teorema Central
de Limite.
b) Suponiendo que se extrae una muestra aleatoria de tamaño dos sin restitución (n = 2)
de la población de gasto mensual, cuyo número de muestras posibles de obtenerse, las
medias de cada una de ellas, así como la distribución de probabilidades de 𝑋̅i y su
representación gráfica son las siguientes:
i) Las 10 muestras aleatorias posibles de obtenerse son las siguientes:

(3, 5) (3, 7) (3, 9) (3, 11) (5, 7) (5, 9) (5, 11) (7, 9) (7, 11) (9, 11)
ii) Las medias de esas muestras posibles de obtenerse (𝑋̅i) son: 4, 5, 6, 7, 6, 7, 8, 8, 9, 10

iii) La distribución de probabilidad de la media de esta muestra aleatoria de tamaño 2
extraída de X sin restitución se presenta en el Cuadro 3.5
Cuadro 3.5
Distribución de probabilidad de 𝑋̅
𝑋̅i P(𝑋̅i)
4 0,10
5 0,10
6 0,20
7 0,20
8 0,20
9 0,10
10 0,10
Totales 1,00
21
iv) La representación gráfica de la distribución anterior se presenta en el Grafico 3.5.
Grafico 3.5
0,25
Probabilidad de medias
0,2
0,15
0,1
0,05
0
0 5 10 15
Valores de medias
Por la información contenida en el Cuadro 3.5 y Grafico 3.5 se determina que la

distribución de 𝑋̅i es simétrica y se aproxima en alguna medida a la distribución de
probabilidad de la NORMAL.
c) Suponiendo que se extrae una muestra aleatoria de tamaño tres sin restitución (n = 3)
de la población de gasto mensual, cuyo número de muestras posibles a obtenerse, las
medias de cada una de ellas, la distribución de probabilidades de 𝑋̅𝑖 y su respectiva
representación gráfica son las siguientes:
i) Las 10 muestras aleatorias posibles de obtenerse son las siguientes: (3, 5, 7) (3, 5, 9) (3,
5, 11) (3, 7, 9) (3, 7, 11) (3, 9, 11) (5, 7, 9) (5, 7, 11) (5, 9, 11) (7, 9, 11)
ii) Las medias de esas muestras posibles de obtenerse (𝑋̅i) son: 5.0; 5.7; 6.3; 6.3; 7.0; 7.7;
7.0; 7.7; 8.3 y 9.0
iii) La distribución de probabilidad de la media de estas muestras aleatorias de tamaño 3
extraídas de X sin restitución se presenta en el Cuadro 3.6
Por la información contenida en el Cuadro 3.6 y Grafico 3.6 se determina que la
distribución de 𝑋̅𝑖 es nuevamente simétrica y se aproxima aún más a la distribución de
probabilidad NORMAL que la distribución de 𝑋̅𝑖 de muestras de tamaño 2 (n=2)
presentada en el Cuadro 3.3; lo cual, significa que cada vez que se incrementa el tamaño
de la muestra aleatoria, la distribución de probabilidad de 𝑋̅𝑖 se aproxima cada vez a la
distribución de probabilidad NORMAL; situación, que demuestra de una forma objetiva el
Teorema Central del Límite.
22
Cuadro 3.6
Distribución de probabilidad de 𝑋̅
𝑋̅i P(𝑋̅i)
5,0 0,1
5,7 0,1
6,3 0,2
7,0 0,2
7,7 0,2
8,3 0,1
9,0 0,1
TOTAL 1,0
iv) La representación gráfica de la distribución anterior se presenta en el Grafico 3.6.
En forma general, se demuestra que cuando el tamaño de la muestra aleatoria tiende a

infinito (n→∞), entonces la distribución de probabilidad de 𝑋̅𝑖 tiende asintóticamente a la
distribución de probabilidad Normal (esto ocurre para todos los estimadores de parámetros
poblacionales). Este resultado es extremadamente importante tanto para la teoría
estadística como para la estadística aplicada, ya que significa lo siguiente:
Cuando n tiende a infinito, la representación gráfica de 𝑋̅𝑖 es igual a la representación

gráfica de la distribución de probabilidad normal; sin embargo, en la vida real no es posible
utilizar una muestra aleatoria infinitamente grande, lo que se puede hacer es seleccionar
una muestra aleatoria suficientemente grande (según autores de libros de Inferencia
Estadística es suficiente cuando n es mayor a 30). En estas condiciones, la mayor
proporción de los valores de 𝑋̅𝑖 se encuentran concentrados alrededor de su media
esperada que es igual a la media de la población E(𝑋̅𝑖 ) = µ; que a su vez, significa la
existencia de mayor probabilidad de seleccionar una muestra que arroje un valor de 𝑋̅𝑖
igual al valor de la media de la población (µ), o un valor muy próximo a este. Todo ello
demuestra la gran importancia del Teorema Central del Límite, tanto para la teoría
estadística como la estadística aplicada.
Grafico 3.6
23
0,3
Probabilidad de medias
0,2
0,2
0,1
0,1
0,0
0,0 2,0 4,0 6,0 8,0 10,0
Valores de la media
1.5 Problemas resueltos:
1.5.1 El monto medio de solicitudes que realizan los vendedores detallistas de un

determinado producto de consumo masivo de una localidad (población) a cierto mayorista
es Bs. 1.593.- semanales, con desviación estándar de Bs. 180.- Si se elige al azar una
muestra de 400 solicitudes, Hallar la probabilidad de que la media de esta muestra: a) Sea
a lo sumo Bs. 1.600.-, b) Se encuentre entre 1.500 y 1.600 bolivianos, c) Sea menor a Bs
1.550.-
Solución:
X: Monto semanal de solicitudes de detallistas en bolivianos; µ𝑋 = µ = Bs. 1.593.- gasto

medio mensual de la población (supuesto conocido); 𝜎𝑋 = σ = Bs. 180.- desviación
estándar de la población (supuesto conocida), n = 400 muestra aleatoria grande de
𝜎 180
solicitudes, la desviación estándar de la media de esta muestra es: 𝜎𝑋̅ = 𝑛 = 400 = 9 Bs.
√ √
1.600−1.593
a) P(𝑋̅ ≤ 1.600)=P(Z≤ )=P(Z≤ 0.78) = F(0.78)= 0,7823. Esta es la probabilidad
9
de que la media de esa muestra sea a lo sumo Bs. 1.600.- por semana.
1.500−1.593 1.600−1.593
b) P(1.500≤ 𝑋̅ ≤1.600) = P( ≤ Z ≤ ) = P(-10.33≤ Z ≤0.78) = 0.7823.
9 9
Esta es la probabilidad de que la media de esa muestra de tamaño 400 se encuentre entre
Bs. 1.500.- y Bs. 1.600.-.
1.550−1.593
c) P(𝑋̅ <1.550) = P(𝑍 < ) = P(Z < −4.78) = P(Z > 4.78) = 1-F(4.78) = 1-1 = 0.
9
Esta es la probabilidad de que la media de esa muestra sea menor a Bs. 1.550; o sea, es
improbable que la media de esa muestra sea menor a Bs. 1.550.
1.5.2 Una empresa almacena aceite comestible en envases de ½ litro. Su departamento

de producción utiliza el siguiente procedimiento de muestreo para controlar el proceso del
llenado automático de los envases. Se toma una muestra de 36 envases cada hora
seleccionada al azar. Si la media de cualquier muestra es menor que cierto límite crítico
X0, se detiene el proceso del llenado y se reajusta la máquina. Si la media es igual o
superior al límite crítico, la operación continua. Determine el valor de X0, de modo que la
probabilidad de detener el llenado automático sea de 1%, sabiendo que el proceso de
llenado tiene una desviación estándar de 0.15 litros.
24
Solución.-
X: Contenido de aceite de envases (población de envases); µ = 0.50 litros, es el contenido

medio de envases de la población (supuesto conocido); σ = 0.15 litros, es la desviación
estándar de la población X (supuesto conocida); n = 36, es la muestra aleatoria grande de
0.15
envases, y 𝜎𝑋̅ = 36 = 0.025 litros es la desviación estándar de la media de esa muestra.
√
Si 𝑋̅ < 𝑋0 se detiene el proceso de llenado en la fábrica y se reajusta la máquina que
realiza el llenado automático de envases; en caso contrario, continúa el proceso de
llenado.
𝑋 −0.50 𝑋 −0.50
P(𝑋̅ < 𝑋0 ) = 0.01; P(Z< 00.025 ) = 0.01; 00.025 = -2.33 (ver tabla de Función de Distribución
Acumulada de la normal estándar). Calculando el valor 𝑋0 de esta última igualdad, se
obtiene: 𝑋0 = 0.44 litros. Si la media de cualquier muestra de tamaño 36 es menor a 0.44
litros se detiene el proceso de llenado de envases, en caso contrario continúa.
0.44−0.50
Comprobación: P(𝑋̅ <0.44) = P(Z< 0.025 ) = P(Z< −2.40) = P(Z> 2.40) = 1 - F(2.40) =
1- 0.9918 = 0.0082 ≅ 0.01
1.5.3 Un sondeo efectuado sobre 400 amas de casa de cierta clase social de una ciudad,
rebeló un gasto medio mensual de Bs. 740.- en productos de tocador, con desviación
estándar de Bs. 400.-, a) Calcular el margen máximo de error del estimador de la media de
esa población de amas de casa con un 99% de confianza, b) Con qué nivel de confianza
se puede afirmar que el gasto medio mensual en artículos de tocador de esa población de
amas de casa queda entre 710.- y 770.- bolivianos.
Solución.-
X: Gasto mensual en productos de tocador de la población de amas de casa de esa

ciudad; µ es el gasto medio mensual de esta población; n = 400 amas de casa, es la
muestra aleatoria; 𝑋̅ = Bs 740.-, es el gasto medio mensual de esta muestra; s = Bs 400.-
𝑠 400
es la desviación estándar de la muestra; 𝜎̂𝑥̅ = 𝑛 = 400 = Bs 20.-, es la desviación estándar
√ √
de la media de esa muestra aleatoria.
a) 𝜉 = 𝑍(1− 𝛼) 𝜎̂𝑥̅ = 𝑍0.995𝜎̂𝑥̅ = (2,576)(20) = Bs 52.51, es el margen máximo de error del
2
valor estimado de µ (𝑋̅ = Bs 740.-), que también se denomina precisión de ese valor
estimado, con un 99% de confianza.
710−740 770−740
b) P(710 ≤ 𝑋̅ ≤ 770) = P( 20 ≤ Z ≤ 20 ) = P(- 1.5 ≤ Z≤1.5) = F(1.5) - [1 − 𝐹 (1.5)] =
0.8664. Este es el nivel de confianza estimado de que el gasto medio mensual de esa
población de amas de casa, se encuentre entre 710.- y 770.- bolivianos por mes.
1.5.4 Con relación al problema anterior, se supone que el objetivo es determinar el tamaño
de la muestra, para el estudio más profundo del gasto mensual en productos de tocador.
Para la estimación de la desviación estándar de la población el investigador utilizó una
muestra piloto de 20 amas de casa, habiendo encontrado que la desviación estándar de
esta muestra es Bs. 50.- Con esta información determine el tamaño de la muestra, si se
desea que el error del estimador de µ no exceda de ± Bs 4.-, con una confianza de 95%.
25
(𝑋̅− µ)
La ecuación se obtiene como sigue: Z = 𝜎 ; aplicando medios y extremos en el
√𝑛
√𝑛(𝑋̅− µ) 𝑍2𝜎2
lado derecho se tiene: Z = ; despejando n se obtiene: n = ℰ 2 , ya que
𝜎
(𝑋̅ − µ) = ℰ, es el margen máximo de error del estimador 𝑋̅. Como (1 − 𝛼)= 0.95,
entonces α = 0,05; luego 𝑍1− 0.05 = 𝑍0.975 = 1.96. Sustituyendo los datos en la ecuación
2
𝑍2 𝛼 𝜎2
(1− 2 ) 1.962 502
anterior, resulta: n = = = 600.25 ≅ 600. Esta muestra garantiza con
𝜉2 42
una confianza del 95% de que el margen máximo de error o precisión del estimador de µ
(𝑋̅) sea a lo sumo ± Bs. 4.-. Si se aumenta el margen máximo de error a Bs 10.-, que
significa disminuir la precisión del estimador en esa magnitud; entonces, el tamaño de
muestra aleatoria disminuye a n = 96. Este tamaño de muestra aleatoria garantiza con una
confianza del 95% de que la precisión o el margen máximo de error de 𝑋̅ no exceda ±
Bs.10.-. Se considera muy importante comparar los tamaños de muestra, cuando se
modifica el valor de ξ; esta variación considerable es por el hecho de que n está
relacionada en forma inversa con ξ; en cambio, con el nivel de confianza; es decir, con el
valor de Z está relacionada en forma directa; razón por la cual, cuando se incrementa el
nivel de confianza, se incrementa el tamaño de la muestra.
Distribución de la Diferencia de Medias de dos Muestras Aleatorias
En algunas ocasiones existe la necesidad de realizar la comparación de las medias de dos

poblaciones o variables aleatorias que están definidas en los elementos de dos
poblaciones independientes, ocasiones que se presentan a menudo en el campo de la
investigación científica; por ejemplo, cuando se trata de comparar el ingreso medio
mensual de dos sectores de trabajadores de un municipio, o cuando se trata de comparar
la producción media por hectárea de trigo de los valles con la producción media de los
llanos del país, etc. En estos casos se utiliza la distribución de la diferencia de medias de
dos muestras aleatorias para realizar inferencias respecto a la diferencia de medias de dos
poblaciones independientes, bajo el siguiente procedimiento:
Si una muestra de tamaño 𝑛1 se extrae de una población denotada por X1 con media  1 y
varianza σ12, y una segunda muestra de tamaño 𝑛2 de otra población con media  2 y
varianza σ22. Si 𝑋̅1 y 𝑋̅2 son las medias de esas dos muestras obtenidas, entonces se
puede estimar la diferencia de medias de las dos poblaciones (dµ =  1 -  2 ) con la
diferencia de medias de las muestras: d = 𝑋̅1 - 𝑋̅2. Esta diferencia de medias de las
X
muestras es también una variable aleatoria, cuya media esperada y varianza son las
siguientes:
a) Poblaciones infinitas o cuando las unidades de las dos muestras se extraen con
restitución de poblaciones finitas:
i) Media Esperada: E(d X ) = E(𝑋̅1 - 𝑋̅2) =  1 -  2 = dµ

𝜎 2 𝜎 2 𝜎 𝜎 2 2
ii) Varianza: 𝜎𝑑2𝑋̅ = V(𝑋̅1 - 𝑋̅2) = 𝑛1 + 𝑛2 , y desviación estándar 𝜎𝑑𝑋̅ = √𝑛1 + 𝑛2
1 2 1 2
26
iii) Si n1 y n2 son suficientemente grandes (mayores a 30), entonces por el Teorema
Central del Límite, la diferencia de medias de esas dos muestras se distribuye
aproximadamente según la normal, con media esperada dµ y varianza 𝜎𝑑2𝑋̅ ; en símbolos,
(𝑑𝑋
̅ −𝑑µ )
se tiene: d ~𝑁 (dµ; 𝜎2𝑑 ̅ ); luego, Z =  N(0,1).
X 𝑋 𝜎𝑑 ̅
𝑋
En la ecuación o igualdad anterior, Z está relacionada con el nivel de confianza de 𝒅𝑿̅ ;
(𝑑𝑋̅ − 𝑑µ ) = ξ = Z𝜎𝑑𝑋̅ es la precisión del estimador, denominado también margen
máximo de error del estimador (𝒅𝑿̅ ); 𝑛1 y 𝑛2 son los tamaños de las dos muestras
aleatorias que se encuentran insertados en la desviación estándar de 𝒅𝑿̅ . Estos tres
elementos fundamentales del muestreo aleatorio o de la inferencia estadística se
encuentran relacionados en la igualdad anterior; o sea, que la relación anterior obtenida
por el teorema central del límite es de gran utilidad para la estadística aplicada.
La demostración de los resultados anteriores se deja como tarea para el docente en
clases o tarea para el lector.
b) Selección de unidades de la muestra sin restitución de una población finita
i) Media Esperada: E(d X

) = E(𝑋̅1 - 𝑋̅2) = E(𝑋̅1) - E(𝑋̅2) =  1 -  2 = dµ
𝜎12 𝑁1 − 𝑛1 𝜎22 𝑁2 − 𝑛2
ii) Varianza: 𝜎𝑑2𝑋̅ = V(𝑋̅1 - 𝑋̅2) = V(𝑋̅1) + V(𝑋̅2) = + , debido a que 𝑋̅1 y 𝑋̅2
𝑛1 𝑁1−1 𝑛2 𝑁2 −1
tienen distribución hipergeometrica; además, son independientes ya que corresponden a
muestras aleatorias independientes, razón por la cual, la covarianza de ambas medias es
igual a cero. La desviación estándar denotada por 𝜎𝑑𝑥̆ es la raíz cuadrada de la expresión
anterior (varianza) con el signo positivo, según la definición de la desviación estándar.
iii) Si n1 y n2 son suficientemente grandes (mayores a 30), entonces por el Teorema

Central del Límite, la diferencia de medias de esas dos muestras se distribuye
aproximadamente según la normal con media esperada dµ y varianza 𝜎𝑑2𝑋̅ ; en símbolos, se
(𝑑𝑋
̅ −𝑑µ )
tiene: d ~𝑁 (dµ; 𝜎2𝑑 ̅ ); luego, Z =  N(0,1).
X 𝑋 𝜎𝑑 ̅
𝑋
En la ecuación o igualdad anterior, Z está relacionada con el nivel de confianza de 𝒅𝑿̅ ;

(𝑑𝑋̅ − 𝑑µ ) = ξ = Z𝜎𝑑𝑋̅ es la precisión del estimador, denominado también margen
máximo de error del estimador (𝒅𝑿̅ ); 𝑛1 y 𝑛2 son los tamaños de las dos muestras
aleatorias que se encuentran insertos en la desviación estándar de 𝒅𝑿̅ . Estos tres
elementos fundamentales del muestreo aleatorio o de la inferencia estadística se
encuentran relacionados en la igualdad anterior; o sea que la relación anterior obtenida
por el teorema central del límite es de gran utilidad para la estadística aplicada.
clases o tarea para el lector.
Ejemplos
1.6.1 Suponiendo que los focos de una marca A tienen una vida media de 1.400 horas con
desviación estándar de 200 horas, mientras que los focos de marca B tienen una vida
media de 1.200 horas con desviación estándar de 100 horas. a) Si un investigador
27
sostiene que con una muestra de 125 focos de cada marca, los focos de marca A duran
en promedio; cuando menos 250 horas más que los focos de marca B, calcular la
probabilidad de lo que sostiene el investigador, comentar sobre la aseveración del
investigador con el resultado de la probabilidad calculada, b) Calcular la probabilidad de
que la duración media de ambas muestras sea al menos 100 horas, c) Calcular la
probabilidad de que la diferencia de medias de ambas muestras aleatorias sea a lo sumo
50 horas.
Solución.-
𝑋1 : Duración de focos marca A=1 en horas (población de focos marca A).

µ1 = 1.400 horas, duración media de focos marca A=1.
𝜎1 = 200 horas, desviación estándar de duración de focos marca A=1.
𝑋2 : Duración de focos marca B=2 en horas (población de focos marca B).
µ2 = 1.200 horas, duración media de focos marca B=2.
𝜎2 = 100 horas, desviación estándar de duración de focos marca B=2.
𝑛1 = 𝑛2 = 125, muestras aleatorias de igual tamaño de ambas marcas.
2002 1002
𝜎𝑑𝑋̅ = √ 125 + = 20 horas, desviación estándar de la diferencia de medias de ambas
125
muestras.
250−200
a) P(𝑑𝑋̅ ≥250) = P[(𝑋̅1 − 𝑋̅2 ) ≥ 250] = P(Z≥ 20 ) = 1- F(2.50) = 1- 0.9938 = 0.0062. Es
poco probable que la duración media de focos marca A, sea mayor o igual en 250 horas a
la duración media de focos marca B.
−100−200 100−200
b) P(|𝑑𝑋̅ | ≥ 100) = 1- P(|𝑑𝑋̅ | < 100) = 1- P( 20 ≤ 𝑍 ≤ 20 ) = 1- P(-15≤ 𝑍 ≤ −5) = 1.
Es segura la probabilidad de que la diferencia de medias de ambas muestras sea al
menos 100 horas.
−50−200 50−200
c) P(|𝑑𝑋̅ | ≤ 50) = P( 20 ≤ 𝑍 ≤ 20 ) = P(-12.5≤ 𝑍 ≤ −7.5) = 0. Es improbable que la
diferencia de medias de ambas muestras sea a lo sumo 50 horas.
1.6.2 Se realizan dos pruebas de cultivos para estimar la diferencia de producciones

medias de dos métodos de cultivo de trigo en una región agrícola. Diez parcelas de cultivo
se experimentan con arado superficial y quince con arado profundo. La producción media
por hectárea del primer método es 40 quintales y del segundo 50 quintales. Suponiendo
que la desviación estándar del primer método es 10 quintales y del segundo 5 quintales.
Hallar la probabilidad de que la diferencia de medias de esas dos muestras aleatorias sea
mayor a 10 quintales, suponiendo que las producciones por hectárea de ambos métodos
de cultivo tienen distribución normal.
Solución.-
𝑋1 : Producción de trigo por hectárea por el primer método de cultivo en quintales.

µ1: Producción media de trigo por hectárea por el primer método de cultivo en quintales.
𝜎1 : Desviación estándar de 𝑋1 , expresada en quintales.
𝑋2 : Producción de trigo por hectárea por el segundo método de cultivo en quintales.
µ2 : Producción media de trigo por hectárea por el segundo método de cultivo en quintales.
𝜎2 : Desviación estándar de 𝑋2 , expresada en quintales.
28
Si 𝑋1 y 𝑋2 tienen distribución normal (según el enunciado del problema), entonces:
𝑑 ̅ −𝑑µ
𝑑𝑋̅ = (𝑋̅1 − 𝑋̅2 )~𝑁(𝑑µ ; 𝜎𝑑2𝑋̅ ); luego Z = 𝑋𝜎 ~𝑁(0; 1). La desviación estándar de la
𝑑𝑋
̅
100 25
diferencia de medias de ambas muestras está dada por: 𝜎𝑑𝑋̅ =√ 10 + 15 = 3,416 quintales;
−10−(−10)
luego, la probabilidad pedida es: P(|𝑑𝑋̅ | > 10) = 1- P(|𝑑𝑋̅ | ≤ 10) = 1 - P[ ≤𝑍≤
3,416
10−(−10)
] = P(0,0≤ 𝑍 ≤ 5,85) = 0,50. Esta es la probabilidad de que la diferencia de medias
3,416
de ambos métodos de cultivo en las muestras sea mayor a 10 quintales
1.6.3 Dos marcas Q y S de tabletas antiácidas efervescentes registran el mismo tiempo

medio de disolución en el agua, con desviación estándar de 12 segundos para la marca Q
y 24 segundos para la marca S. Asumiendo que el tiempo de disolución tiene distribución
normal. Hallar la probabilidad de que con una muestra de 36 tabletas de cada marca, las
tabletas Q registran un promedio de tiempo de disolución, cuando menos 5 segundos más
rápido que el promedio de las tabletas S.
1.6 Distribución de la Proporción de una Muestra Aleatoria
En los trabajos de investigación que se elaboran, existe la necesidad de estimar diversas

proporciones de poblaciones en las cuales se realizan las investigaciones; tales como,
proporción de hogares sin vivienda propia, proporción de hogares con ingreso mensual
inferior a Bs. 5.000.-, proporción de viviendas de hogares sin alcantarillado, etc., etc. En
estos casos, esas proporciones poblacionales se estiman utilizando la proporción de
muestras aleatorias extraídas de esas poblaciones. La teoría utilizada en este caso se
describe a continuación:
Teorema.- Sea Y una población distribuida según la Bernoulli con parámetro P y sea Y1,
Y2, . . . , Y n una muestra aleatoria extraída de Y, la proporción de una población está
∑𝑁 𝑌 𝑋
definida por P = 1𝑁 𝑖 = 𝑁, donde X es el número de unidades elementales con cierto
atributo y N el número total de elementos de la población finita de tamaño N. De la misma
∑𝑛 𝑌 𝑋
manera se define la proporción de una muestra por 𝑃̂ = 1 𝑖 = ; donde X es el número de
𝑛 𝑛
unidades que poseen cierto atributo de interés y es una variable aleatoria distribuida según
la Binomial y n es el tamaño de la muestra aleatoria.
a) Poblaciones infinitas o selección de unidades de la muestra con restitución de

una población finita
Si se extraen las unidades de una muestra aleatoria de tamaño n con restitución de una
población finita, entonces la distribución de la proporción muestral (𝑃̂ ) obedece a la ley de
probabilidades binomial; luego, la media esperada y la varianza de esta proporción de la
muestra están dadas por:
𝑋 𝐸(𝑋) 𝑛𝑃
i) Media Esperada: E(𝑃̂ ) = E( 𝑛 ) = 𝑛 = 𝑛 = P; ya que X se distribuye según la Binomial.
29
ii) Varianza: 𝜎𝑃2̂ = V(𝑃̂) = V(
𝑋
𝑛
) =
𝑉(𝑋)
𝑛2
=
𝑛𝑃𝑄
𝑛2
=
𝑃(1−𝑃)
, ya que X se distribuye según la 𝑛
binomial. La desviación estándar de 𝑃̂ (error estándar de 𝑃̂) es la raíz cuadrada de la
varianza con el signo positivo. P + Q = 1; Q = 1 - P
iii) Si n es muestra grande (n > 30), entonces por el Teorema Central del Límite, la
proporción de esa muestra aleatoria (𝑃̂) se distribuye aproximadamente según la normal
(𝑃̂−𝑃)
con media esperada P y varianza 𝜎𝑃2̂ ; es decir, 𝑃̂ ~ 𝑁(𝑃, 𝜎𝑃2̂ ), luego Z = ~ 𝑁(0,1) 𝜎𝑃
̂
clases o para el lector.
b) Selección de unidades de la muestra sin restitución de una población finita:
En el caso de que las unidades de la muestra sean extraídas sin restitución de una
población finita, entonces la distribución de la proporción de esa muestra (𝑃̂) se distribuye
según la ley de probabilidades hípergeométrica. Entonces, la media esperada y la
varianza de esa proporción muestral está dada por:
𝑋 𝐸(𝑋) 𝑛𝑃
i) E(𝑃̂ ) = E( 𝑛 ) = = = P.
𝑛 𝑛
𝑁−𝑛
𝑋 𝑉(𝑋) 𝑛𝑃𝑄 𝑃𝑄 𝑁−𝑛 𝑃(1−𝑃) 𝑁−𝑛
ii) 𝜎𝑃2̂ = V(𝑃̂ ) = V( )= = 𝑁−1
= = ; en donde X se distribuye según
𝑛 𝑛2 𝑛2 𝑛 𝑁−1 𝑛 𝑁−1
𝑁−𝑛
la Hipergeometrica. 𝑁−1 es el factor de corrección de población finita. Luego, la desviación
estándar de 𝑃̂ (error estándar de 𝑃̂) es la raíz cuadrada de la varianza con el signo
positivo.
iii) Si n es muestra grande (n > 30), entonces por el Teorema Central del Límite, la
proporción de esa muestra aleatoria (𝑃̂) se distribuye aproximadamente según la normal
(𝑃̂−𝑃)
con media esperada P y varianza 𝜎𝑃2̂ ; es decir, 𝑃̂ ~ 𝑁(𝑃, 𝜎𝑃2̂ ), luego Z = ~ 𝑁(0,1) 𝜎𝑃
̂
En la ecuación o igualdad anterior, “Z está relacionada con el nivel de confianza de 𝑷 ̂ ”;
(𝑃̂–P) = ξ = Z𝜎𝑃̂ es la “precisión del estimador 𝑷 ̂ ", denominado también “margen
máximo de error del estimador 𝑷 ̂ ” y “n es el tamaño de la muestra aleatoria” que se
encuentra incluido en la desviación estándar de 𝑃̂. Estos tres elementos fundamentales
del muestreo aleatorio o de la inferencia estadística se encuentran relacionados en la
igualdad anterior, y es de gran utilidad para la estadística aplicada; la misma, que se
verificara en los temas de estimación de parámetros y prueba de hipótesis estadística.
clases o para el lector.
Ejemplo.- Una población hipotética está constituida por cinco hogares de un determinado
municipio, que podrá simbolizarse por: N = {H1; H2; H3; H4; H5}. Interesa analizar la
variable gasto mensual de esa población, y suponiendo que los montos de gasto (X) de
esa población expresados en miles de bolivianos son conocidos que son los siguientes: X
= {3, 5, 7, 9, 11}. Se extrae una muestra al azar de X de tamaño 2 (n = 2) sin restitución, a)
Detallar todas las muestras aleatorias posibles, b) Sea 𝑃̂ el estimador de P que es la
proporción de hogares de la población con gasto mensual mayor a Bs. 5.000.-, calcular 𝑃̂
para cada una de las muestras, c) elaborar la distribución de probabilidad de 𝑃̂, d) calcular
30
3
el valor de E(𝑃̂ ) y verificar que es igual al valor de P = 5 = 0.6, e) calcular la desviación
estándar de 𝑃̂ y verificar que el resultado obtenido es igual al resultado calculado con la
𝑃(1−𝑃) 𝑁−𝑛
siguiente ecuación: σ(𝑃̂) = √ , f) elaborar el grafico de la distribución de
𝑛 𝑁−1
probabilidad de 𝑃̂, g) comentar el resultado de cada inciso.
Los resultados de esos incisos son los siguientes:

a) Las 10 muestras aleatorias posibles a obtenerse sin restitución son:
(3, 5) (3, 7) (3, 9) (3, 11) (5, 7) (5, 9) (5, 11) (7, 9) (7, 11) (9, 11)
b) Por lo que, los posibles valores de 𝑃̂ a obtenerse son: 0/2, 1/2, 1/2, 1/2, 1/2, 1/2, 1/2,
2/2, 2/2, 2/2
c) La distribución de probabilidad de la proporción de hogares con gasto mensual mayor a
Bs. 5.000.- de las 10 muestras aleatorias de tamaño 2 extraídas de X sin restitución se
presenta en el Cuadro x.3
En donde ei son las frecuencias absolutas esperadas de cada valor de 𝑃̂ i.
La distribución de probabilidad de 𝑃̂ presentada en el Cuadro x.3 y el Grafico x.3 muestran

que esa distribución no es simétrica respecto a E(𝑃̂) = 0.6; sin embargo, muestran que
existe mayor probabilidad (0.6) de obtener el valor de 𝑃̂, = 0.5, que es bastante próximo a
la proporción de la población considerada en el ejemplo anterior (P = 0.6).
Cuadro x.3
̂
Distribución de 𝑃 de muestras aleatorias de tamaño 2
extraídas de Y sin restitución
𝑃̂i ei P(𝑃̂i) 𝑃̂ I P(𝑃̂i) 𝑃̂2I P(𝑃̂ i)

0,0 1 0,1 0,0 0,0
0,5 6 0,6 0,3 0,2
1,0 3 0,3 0,3 0,3
Totales 10 1,0 0,6 0,5
FALTA INCORPORAR EL GRAFICO

“Este resultado es extremadamente importante para la estadística aplicada
(Inferencia Estadística); ya que en la realidad se extrae una sola muestra de la cual
se obtienen las estimaciones de parámetros poblacionales (para obtener la
distribución de probabilidad de un estimador se consideran todas las muestras
aleatorias posibles de obtenerse); sin embargo, si el tamaño de la población finita es
grande, digamos N = 500 en vez de N = 5, y una muestra aleatoria de tamaño mayor
a 30 (n>30); la probabilidad de que esta muestra aleatoria arroje una proporción
igual o aproximada a la proporción de la población (N = 500) es alta (0.6)”.
Esta es la razón fundamental por la cual se determinan las distribuciones de probabilidad
de los estimadores con base a poblaciones finitas y muestras aleatorias muy pequeñas.
31
En la realidad es imposible (y no es necesario) construir la distribución de probabilidad de
un estimador del parámetro de una población. Por ejemplo, si la población es finita de
tamaño 500 (N = 500) y la muestra aleatoria es de tamaño 30 (n = 30) extraída de esa
población, existen millones de muestras aleatorias de tamaño 30 que pueden obtenerse
de esa población de tamaño 500; lo cual es tarea imposible de realizar.
Ejemplos.-
1.7.1 En cierto proceso de producción de un determinado producto se utiliza el siguiente

procedimiento de control de calidad. Se elige una muestra aleatoria de 36 productos; si la
proporción de producción defectuosa de la muestra excede de P 0, se detiene el proceso
de fabricación para localizar las fallas y realizar ajustes en la maquinaria. Si se sabe que el
proceso de fabricación en la población ocasiona en promedio un 10% de piezas
defectuosas, hallar el valor de P0, sabiendo que la probabilidad de detener el proceso de
fabricación es 0,075.
Solución.-
P = Proporción de producción defectuosa de la población = 0.10 (supuesto); n = 36

𝑃𝑄 (0.1)(0.9)
muestra aleatoria de productos; 𝜎𝑃̂ = √ 𝑛 = √ = 0.05.
36
𝑃 −𝑃 𝑃 −0.10 𝑃 −0.10
P(𝑃̂ > 𝑃0 ) = 0,075; P(𝑍 > 0 ) = 0,075; 1- P(𝑍 ≤ 0 ) = 0,075; P(𝑍 ≤ 0 ) = 0,925;
𝜎𝑃
̂ 0.05 0.05
𝑃0 −0.10
= 1.44; de esta igualdad se obtiene: 𝑃0 = 0,172; o sea, si la proporción de cualquier
0.05
muestra aleatoria de tamaño 36 es mayor a 0,172; es decir, si 𝑃0 > 0,172 se detiene el
proceso de producción, en caso contrario continua.
Comprobación:
0,172−0,100
P(𝑃̂ > 0,172) = P(𝑍 > ) = P(𝑍 > 1,44) = 1- F(1,44) = 1- 0,9251 = 0,0749 ≅ 0,075;
0.05
la cual, es la probabilidad de detener el proceso de producción.
1.7.2 Un sondeo efectuado en 400 amas de casa de una ciudad reveló que un 52%
consume una marca de aceite sobre otras marcas: a) Obtener el margen máximo de error
o precisión de esa estimación (52%) con un 99% de confianza, b) ¿Con qué nivel de
confianza se puede afirmar que la preferencia por la marca de aceite en estudio, se
encuentra entre el 50% y el 54% para la población de amas de casa de esa ciudad?
Solución.-
n = 400 amas de casa es la muestra aleatoria; 𝑃̂ = 0.52 es la proporción de amas de casa

de esa muestra que prefieren la marca de aceite en estudio; la deviación estándar
𝑃̂ 𝑄̂ (0.52)(0.48)
estimada de la proporción muestral es: 𝜎̂𝑃̂ = √ =√ = 0,025; 𝑍(1− 𝛼) = 𝑍(1− 0.01) =
𝑛 400 2 2
𝑍(0,995) = 2,576.
a) El margen máximo de error o precisión de la proporción estimada de amas de casa que
prefieren esa marca de aceite es: ℰ = |𝑃̂ − 𝑃| = ∓ 𝑍(1− 𝛼) 𝜎
̂ 𝑃̂ = ∓(2,576)(0,025) = ∓ 0,06.
2
32
b) El nivel de confianza por la preferencia de esa marca de aceite en la población de amas
de casa de esa ciudad, es 57,62%; cuyo cálculo es el siguiente: P(0,50≤ 𝑃̂ ≤0,54) =
0,50−0,52 0,54−0,52
P( 0,025 ≤ 𝑍 ≤ 0,025 ) = P(-0,8≤ 𝑍 ≤ 0,8) = F(0.8) – F(-0.8) = F(0.8) – (1- F(0.8))
0,5762 = 2F(0,8) – 1 = 2(0,7881) – 1 = 0,5762
1.7.3 Una muestra de 256 pacientes de cierta enfermedad fueron tratados con una nueva
medicina, la misma que resultó efectiva en 128 casos. Con que nivel de confianza se
podrá afirmar que la efectividad del nuevo medicamento se encuentra comprendida entre
45% y 55%.
Solución.-
La muestra aleatoria de pacientes tratados con la nueva medicina es: n = 256.

La proporción de pacientes de la muestra curados con el tratamiento de la nueva medicina
128
es: 𝑃̂ = 256 = 0.50; La desviación estándar de la proporción de la muestra está dada por:
𝑃̂ 𝑄̂ (0.5)(0.5)
𝜎̂ 𝑃̂ = √ =√ = 0,03125.
𝑛 256
La efectividad del nuevo medicamento se encuentre entre 45% y 55% en el tratamiento de
pacientes de la población es 89.04%; cuyo cálculo es el siguiente: P(0,45≤ 𝑃̂ ≤0,55) =
0,45−0,50 0,55−0,50
P( 0,03125 ≤ 𝑍 ≤ 0,03125 ) = P(-1,60≤ 𝑍 ≤ 1,60) = 0,8904 = F(1,60) – F(-1,60) = F(1,60) –
(1-F(1,60)) = 2F(1,60) -1 = 2(0,9452) -1 = 1,8904 -1 = 0,8904
1.7.4 En una localidad que tiene 360 heladerías, se requiere realizar un sondeo respecto
al consumo de cierta marca de helados. El estudio debe tener un nivel de confianza de 2
sigma (o sea 95.5%) y un error máximo de ± 5%. Determinar el tamaño de la muestra
aleatoria.
Solución.-
N = 360, población de heladerías de la señalada localidad; P = Proporción de heladerías

que comercializan una determinada marca de helados de esa población de 360
heladerías; ℰ = ± 0.05, margen máximo de error admitido para la estimación de la
proporción poblacional (P); (1 − 𝛼 ) = 0,955 nivel de confianza para la estimación de P;
𝑍(1− 𝛼) = 𝑍(1− 0,045) = 𝑍(0,9775) ≅ 2,0
2 2
𝑍 2 𝑁𝑃𝑄 22 ∗360∗𝑃𝑄 1.440∗𝑃𝑄
n = (𝑁−1)ℰ 2 +𝑍2 𝑃𝑄 = (360−1)∗0,052 +22 𝑃𝑄 = 0,8975+4∗𝑃𝑄
Si se supone que el 50% de las heladerías de esa localidad comercializan la marca de

1.440∗(0.5)(0.5)
helados en estudio, el tamaño de muestra es: n = = 190 heladerías. Esta
0,8975+4∗(0.5)(0.5)
muestra garantiza con una confianza del 95,5% de que el margen máximo de error, o la
precisión de la proporción de la muestra (𝑃̂ ), sea ± 0.05.
1.7.5 Un fabricante de desodorantes recibe cada semana lotes de 10.000 válvulas para los
botes rociadores. Para aceptar o rechazar esos lotes, ha instituido el siguiente
procedimiento de muestreo. Se seleccionan al azar 100 válvulas de cada lote; si el 2% o
más resultan defectuosas, se rechaza el lote, en caso contrario se acepta el mismo. Hallar
33
la probabilidad de rechazar un lote (población) que contenga el 1% de válvulas
defectuosas.
Solución.-
N = 10.000 población de válvulas; n = 100 muestra de válvulas; P = 0,01 proporción de

𝑃𝑄 ̂ ̂ (0.01)(0.99)
válvulas defectuosas en la población (conocida); 𝜎̂ 𝑃̂ = √ 𝑛 = √ = 0,01. Nota.- no
100
𝑛 100
se usa el factor de corrección de poblaciones finitas, debido a que = 10.000 = 0.01< 0.05
𝑁
0.02−0.01
Luego, la probabilidad requerida es: P(𝑃̂ ≥ 0.02) = P(Z≥ 0.01 ) = 1- P(Z< 1) = 1 –
0,8413 = 0,1587. Esta es la probabilidad de rechazar un lote de 10.000 válvulas, con 1%
de defectuosas.
1.7 Distribución de la Diferencia de Proporciones de dos Muestras Aleatorias
Cuando se extraen dos muestras aleatorias de dos poblaciones independientes o

variables distribuidas según la Bernoulli, se pueden comparar esas proporciones a través
de las proporciones de esas muestras. En este caso, se procede como sigue: Se extraen
dos muestras aleatorias independientes, la primera de tamaño n 1 de una población Y1
distribuida según la Bernoulli con proporción desconocida 𝑃1, y la segunda de tamaño n 2
de una segunda población Y2 también distribuida según la Bernoulli con proporción
desconocida 𝑃2 ; luego, la diferencia de proporciones de las dos poblaciones está dada
por: 𝑑𝑃 = 𝑃1 − 𝑃2 y la diferencia de las dos proporciones muéstrales (estimador de 𝑑𝑃 ),
está dada por: 𝑑𝑃̂ = 𝑃̂1-𝑃̂2; la cual, es también una variable aleatoria cuyas medidas de
tendencia central y de dispersión son:
a) Poblaciones infinitas o selección de unidades de las muestras con restitución de

dos poblaciones independientes finitas
En este caso la media esperada y la varianza de 𝑑𝑃̂ son:
i) Media Esperada: E(𝑑𝑃̂ ) = E(𝑃̂ 1 - 𝑃̂ 2) = E(𝑃̂ 1) – E(𝑃̂ 2) = 𝑃1 − 𝑃2 = 𝑑𝑃
ii) Varianza: 𝜎𝑑2𝑃̂ = V(𝑃̂1-𝑃̂2) = 𝑉(𝑋

𝑛2
1) 𝑉(𝑋 ) 𝑛 𝑃 𝑄 𝑛 𝑃 𝑄 𝑃 (1−𝑃 )
1
𝑃 (1−𝑃 )
+ 𝑛22 = 1𝑛12 1 + 2𝑛22 2 = 1 𝑛 1 + 2 𝑛 2 , ya que
2
𝑋1 y
1 2 1 2
𝑋2 tienen distribución binomial; además son independientes, razón por la cual la
covarianza de las dos variables aleatorias es igual a cero. La desviación estándar es la
raíz cuadrada de la anterior varianza con el signo positivo.
iii) Si n 1 y n 2 son muestras suficientemente grandes (𝑛1 > 30 y 𝑛2 > 30), entonces por el
2 𝑑𝑃
̂ −𝑑𝑃
teorema central del límite: 𝑑𝑃̂ ~𝑁(𝑑𝑃 , 𝜎𝑑 ̂ ) luego Z = se distribuye según la
𝑃 𝜎𝑑 ̂
𝑃
normal estándar; es decir, Z ~ 𝑁(0,1).
b) Selección de las unidades de las dos muestras sin restitución de dos poblaciones
finitas
34
En este caso la distribución de la diferencia de proporciones de esas dos muestras
aleatorias (d𝑃̂) se distribuye según la hípergeométrica; entonces, la media esperada y la
varianza están dadas por:
i) Media Esperada: E(𝑑𝑃̂ ) = E(𝑃̂ 1 - 𝑃̂ 2) = E(𝑃̂ 1) – E(𝑃̂ 2) = 𝑃1 − 𝑃2 = 𝑑𝑃
ii) Varianza:
𝑁 −𝑛 𝑁 −𝑛
𝑛1 𝑃1 𝑄1 1 1 𝑛2 𝑃2 𝑄2 2 2 𝑃1 (1−𝑃1 ) 𝑁1−𝑛1 𝑃2 (1−𝑃2 ) 𝑁2 −𝑛2
= V(𝑃̂1-𝑃̂2 ) = V(𝑃̂1) + V(𝑃̂2 ) =
𝑁1 −1 𝑁2 −1
𝜎𝑑2𝑃̂ 2 + 2 = + ;
𝑛1 𝑛2 𝑛1 𝑁1 −1 𝑛2 𝑁2−1
cuya desviación estándar es la raíz cuadrada de esta varianza con el signo positivo según
la definición.
iii) Si n 1 y n 2 son muestras suficientemente grandes (𝑛1 > 30 y 𝑛2 > 30), entonces por el
2 𝑑𝑃̂ −𝑑𝑃
teorema central del límite 𝑑𝑃̂ ~𝑁(𝑑𝑃 ; 𝜎𝑑 ̂ ); luego, Z = se distribuye según la
𝑃 𝜎 𝑑𝑃
̂
normal estándar; es decir, Z ~ 𝑁(0,1).
Ejemplos.-
1.8.1 Los resultados de una encuesta pre electoral realizada en una ciudad (población) mostró que
un candidato tuvo a su favor el 55% de los votos. Hallar la probabilidad de que en dos muestras
aleatorias extraídas en esa ciudad (población), ambas de 150 electores arrojen una diferencia
mayor al 10% en las proporciones que votaron por el candidato señalado.
Solución.-
Se utiliza la siguiente notación: Votantes a favor de A = 1 y Votantes a favor de B = 2

𝑃1 = 0,55 proporción de votantes a favor de A en la población.
𝑃2 = 0,45 proporción de votantes a favor de B en la población.
𝑛1 = 150 y 𝑛2 = 150; muestras aleatorias de igual tamaño de la misma población
𝑑𝑃̂ = (𝑃̂1 − 𝑃̂2 ) = Diferencia de proporciones a favor del candidato A en las dos muestras (Estimador
(0,55)(0,45) (0,55)(0,45)
de la diferencia de proporciones poblacional; 𝑑𝑃 = 𝑃1 - 𝑃2 ); 𝜎𝑑𝑃̂ = √ + = 0,057.
150 150
𝑑𝑃
̂ −𝑑𝑃
Por tratarse de muestras aleatorias grandes, 𝑑𝑃̂ ~𝑁(𝑑𝑃 ; 𝜎 2 𝑑𝑃̂ ); luego: Z = ~𝑁(0,1); razón por
𝜎𝑑 ̂
𝑃
la cual, la probabilidad pedida se calcula utilizando la distribución normal estándar.
−0,1−0,0 0,1−0,0
P(|𝑑𝑃̂ | > 0,10) = 1- P(|𝑑𝑃̂ | ≤ 0,10) = 1- P( ≤𝑍≤ ) = 1- P(-1,75≤ 𝑍 ≤ 1,75) = 0,0802
0,057 0,057
=1- (F(1,75) – F(-1,75)) = 1- (F(1,75 – (1 – F(1,75))) = 1-F(1,75) +1-F(1,75) = 2 – 2F(1,75) = 2 –
2(0,9599) = 0,0802. La probabilidad de la diferencia de proporciones a favor del candidato A en las
dos muestras aleatorias extraídas de la misma población es pequeña.
1.8.2 Ciertas encuestas de auditorio revelan que el 20% de los varones y el 30% de las mujeres de
cierto estrato social están familiarizados con un producto de consumo masivo. Hallar la
probabilidad de que en 2 muestras aleatorias de 150 varones y 100 mujeres respectivamente,
pertenecientes a ese estrato social se encuentre que la proporción de mujeres familiarizadas con
ese producto, sea igual o mayor que la proporción de varones.
Solución.-
35
Se utiliza la siguiente notación: Varones = 1 y Mujeres = 2
𝑃1 = 0,20 proporción de varones familiarizados con el producto de consumo masivo en la
población.
𝑃2 = 0,30 proporción de mujeres familiarizadas con el producto de consumo masivo en la
población.
𝑃̂1 𝑄̂1 𝑃̂2 𝑄̂2 (0,2)(0,8) (0,3)(0,7)
𝑛1 = 150 varones y 𝑛2 = 100 mujeres; 𝜎𝑑𝑃̂ = √ + =√ + = 0,056
𝑛1 𝑛2 150 100
0−(0,2−0,3)
P(𝑃̂1 ≤ 𝑃̂2 ) = P[(𝑃̂1 − 𝑃̂2 )≤ 0] = P(𝑑𝑃̂ ≤ 0) = P[𝑍 ≤ ] = P(Z≤ 1,79) = 0,9633. Es bastante
0,056
probable que la proporción de mujeres sea mayor o igual a la proporción de varones familiarizados
con el producto de consumo masivo en las dos muestra aleatorias.
1.8.3 Se sabe que cierta marca de producto de uso general tiene el 65% del mercado.
Hallar la probabilidad de que 2 muestras aleatorias de 200 usuarios de cada una, revelen
una diferencia mayor del 10% en las proporciones de uso del producto.
Solución.-
𝑃1 = 0,65 y 𝑃2 = 0,65, proporción de mercado del producto en una misma población iguales;
tamaños de muestras aleatorias iguales 𝑛1 = 𝑛2 = 200; desviación estándar de la diferencia
(0,65)(0,35)
de proporciones de ambas muestras 𝜎𝑑𝑃̂ = √2 ∗ = 0,0477.
200
La probabilidad de que la diferencia de proporciones de ambas muestras sea mayor a 10%
−𝑑 ̂ −𝑑 𝑑 ̂ −𝑑
está dada por la siguiente expresión: P(|𝑑𝑃̂ | > 0.10) = 1 – P( 𝜎𝑃 𝑃 ≤ 𝑍 ≤ 𝑃𝜎 𝑃) = 1–
𝑑𝑃
̂ 𝑑𝑃
̂
−0,10−0,00 0,10−0,00
P( ≤𝑍≤ ) = 1– P(-2,10≤ 𝑍 ≤ 2,10) = 0,0358
0,0477 0,0477
1.8.4 Ciertas encuestas de auditorio revelan que el 25% de los varones y el 33% de las
mujeres de cierto estrato social ven el programa de televisión X. Hallar la probabilidad de
que en 2 muestras aleatorias de 150 varones y 100 mujeres respectivamente,
pertenecientes a ese estrato social se encuentre que la proporción de varones que han
visto el programa X, sea igual o mayor que la proporción de mujeres.
1.8 Distribución de Probabilidad de la Varianza de una Muestra Aleatoria
La varianza de una variable es una medida de mucha importancia para la teoría

estadística y la estadística aplicada, cuyas expresiones matemáticas por definición están
dadas por:
∑𝑁
𝑖=1(𝑋𝑖− µ)
2 ∑𝑁 2
1 𝑋𝑖
Varianza de una población finita: σ2 = = − µ2 ; cuyo estimador esta dado
𝑁 𝑁
1 ∑𝑛
1𝑋
2
por: S2 = 𝑛 ∑𝑛1(𝑋𝑖 − 𝑋̅)2 = - 𝑋̅ 2 . La cuasi varianza de la población finita por definición
𝑛
∑𝑁
𝑖=1(𝑋− µ)
2 𝑁 ∑𝑁 2
1 𝑋𝑖 𝑁
está dada por: 𝑉 2 = = ( − µ2 ) = 𝜎 2 ; cuyo estimador, también por
𝑁−1 𝑁−1 𝑁 𝑁−1
∑𝑛 ̅ )2
1 (𝑋𝑖 −𝑋 𝑛 ∑ 𝑋2 𝑛
definición está dado por: 𝑠 2 = = [ − 𝑋̅ 2 ] = 𝑛−1 𝑆 2
𝑛−1 𝑛−1 𝑛
36
La media esperada de esta segunda varianza de la muestra es igual a la varianza de la
∑𝑛 ̅ )2
1 (𝑋− 𝑋
población; es decir, E(𝑠 2 ) = E﴾ ﴿ = σ2; cuya demostración es la siguiente:
𝑛−1
(𝑛 − 1)E(𝑠 2 ) = E[∑𝑛1(𝑋𝑖 − 𝑋̅)2 ] = E[∑𝑛1(𝑋𝑖 − 𝑋̅ − µ + µ)2 ] = E{∑𝑛1[(𝑋𝑖 − µ) − (𝑋̅ − µ)]2 }=

E{∑𝑛1[(𝑋𝑖 − µ)2 − 2(𝑋𝑖 − µ)(𝑋̅ − µ) + (𝑋̅ − µ)2 ]}. Aplicando las propiedades de la sumatoria,
a cada uno de los términos del lado derecho, luego multiplicando y dividiendo por “n” a
2
ambos lados de la igualdad, se obtiene: (𝑛 − 1)E(𝑠 2 ) = E[∑𝑛1(𝑋𝑖 − µ) − 𝑛(𝑋̅ − µ)2 ] =
2
[∑𝑛1 𝐸 (𝑋𝑖 − µ) − 𝑛𝐸 (𝑋̅ − µ)2 ]= n𝜎 2 - 𝜎 2 = (𝑛 − 1)𝜎 2 . Hallando la solución para E(𝑠 2 ), se
tiene la siguiente igualdad: E(𝑠 2 ) = 𝜎 2
1
Para la varianza de la muestra aleatoria dada por: S2 = 𝑛 ∑𝑛1(𝑋𝑖 − 𝑋̅)2 , se tiene el siguiente
𝜎 2
resultado: nE(S2) = E[∑𝑛1(𝑋𝑖 − 𝑋̅)2 ] = n𝜎 2 - 𝜎 2 ; luego, E(S2) = 𝜎 2 − 𝑛 . Tal como se
demostrara en el tema de propiedades de un buen estimador, que S 2 es un estimador

sesgado de 𝜎 2 (varianza de la variable de una población); sin embargo, si n es una
muestra aleatoria infinitamente grande, entonces S2 es un estimador insesgado de 𝜎 2 ,
igual que 𝑠 2 ; ya que E(S2) = 𝜎 2 .
Ejemplo.- Para la población hipotética constituida por 5 hogares de un determinado

municipio N = {H1; H2; H3; H4; H5}. El interés es analizar la variable monto de gasto
mensual de esa población, y además, suponiendo que los montos de gasto (X) de esa
población expresados en miles de bolivianos son conocidos y son los siguientes: X = {3, 5,
7, 9, 11}. Se extrae una muestra aleatoria de X de tamaño 2 (n = 2) sin restitución, a)
describir todas las muestras aleatorias posibles, b) calcular s2 para cada una de las
muestras, c) elaborar la distribución de probabilidades de s2, d) calcular el valor de E(s2) y
verificar que es igual al valor de σ2, e) elaborar el grafico de la distribución de probabilidad
de s2
a) Las 10 muestras aleatorias posibles y medias a obtenerse son las siguientes:
Muestras: (3, 5) (3, 7) (3, 9) (3, 11) (5, 7) (5, 9) (5, 11) (7, 9) (7, 11) (9, 11)
Medias: 4, 5, 6, 7, 6, 7, 8, 8, 9, 10
b) Las varianzas de esas muestras aleatorias posibles de obtenerse (s2) son: 2, 8, 18, 32,
2, 8, 18, 2, 8 y 2, respectivamente
c) La distribución de probabilidad de la varianza de esa muestra aleatoria de tamaño 2
extraída de X sin restitución se presenta en el Cuadro x.x
La distribución de probabilidad anterior y el Grafico x.x muestran que esa distribución es
asimétrica, y por otra parte, muestran también que existe mayor probabilidad (0.4) de
obtener el valor 2 para s2, y 8 es la varianza de la población de gastos [σ2 = 8 (miles de
Bs)2]. Este resultado muestra que la distribución de probabilidad de la varianza de la
37
muestra (s2 para muestras pequeñas) es similar a la distribución de la Ji Cuadrado que se
verá posteriormente.
Cuadro x.x
Distribución de probabilidad de s2 de muestras aleatorias
de tamaño 2 extraídas de X sin restitución
si2 ei P(si2) 2 2 2 2
si2 P(si ) (si ) P(si )
2 4 0,4 0,8 1,6
8 3 0,3 2,4 19,2
18 2 0,2 3,6 64,8
32 1 0,1 3,2 102,4
Totales 10 1,0 10,0 188,0
En donde ei son las frecuencias absolutas esperadas de cada valor de si2.

2
d) E(s2) = Σ si2 P(si ) = 10. Esta media esperada de la varianza de la muestra no es igual
a la varianza de la población que es igual a σ2 = 8; sin embargo, es igual al valor de la
∑𝑁
1 (𝑋−µ)
2
Cuasi Varianza de la población cuya expresión por definición es: 𝑉 2 = = 10 (miles
𝑁−1
∑𝑛 ̅ )2
1 (𝑋− 𝑋
de Bs)2, cuyo estimador es justamente: s2 = .
𝑛−1
1.9 Distribución de Probabilidad Ji Cuadrado
Para comparar la varianza de una muestra aleatoria con la varianza hipotética de la

población, se utiliza la distribución Ji Cuadrado que también se lee como distribución de la
"Chi-Cuadrado". Esta distribución es de mucha utilidad para las pruebas de significación
de varianzas; es decir, en los casos en que se desea comprobar si la varianza de una
muestra aleatoria se adecua o no a la varianza de una variable poblacional, cuya
comprobación se efectúa a través del empleo de la prueba de hipótesis formulada
respecto a un valor específico de  2 .
1.9.1 Distribución de probabilidad Gama
La distribución de probabilidad de la Ji Cuadrado se obtiene como un caso particular de la

distribución de probabilidad Gama; para lo cual, se procede como sigue:
En primer lugar se realiza un breve repaso sobre la función gama del campo de los reales;
en este caso, la misma está definida por:
∞
Г(n) = ∫0 𝑋 𝑛−1 е−𝑋 𝑑𝑋 , para n entero y positivo.
Integrando por partes en forma recurrente se verifica la siguiente igualdad: Г(n) = (n-1)!.
La integración por partes se realiza bajo el siguiente procedimiento: Sea U = 𝑋 𝑛−1 , la

diferencial de U es: 𝑑𝑈 = (𝑛 − 1)𝑋 𝑛−2 𝑑𝑋; por otra parte ∫ 𝑑𝑉 = ∫ е−𝑋 𝑑𝑋, luego, el valor de
V resulta: V = −е−𝑋 . Utilizando la ecuación de integración por partes; la cual es: UV-∫ 𝑉𝑑𝑈,
se obtiene el siguiente resultado:
38
∞
Γ(𝑛) = [−𝑋 𝑛−1 е−𝑋 ]∞ −𝑋 𝑛−2
0 + (𝑛 − 1) ∫0 е 𝑋 𝑑𝛸 = (𝑛 − 1) 𝛤(𝑛 − 1) = (𝑛 − 1)(𝑛 − 2)𝛤 (𝑛 − 2)
= (𝑛 − 1)(𝑛 − 2)(𝑛 − 3) . . . Γ(1) = (𝑛 − 1)! debido a que Γ(1) = 1.

En segundo lugar, se analiza la Distribución de probabilidad Gama, cuyas
características son las siguientes:
a) Definición.- Sea X una variable aleatoria continua que toma valores no negativos;
luego, se dice que X tiene distribución de probabilidad Gama, si su función de probabilidad
𝜆𝛼
está dada por: f(x) = Г(α) 𝑋 𝛼−1 е−𝜆𝑋 para X > 0; además λ y α son enteros positivos.
b) Considerando que f(x) ≥ 0 para todo valor de X, e integrando por partes

recurrentemente la función de probabilidad anterior en el recorrido de la variable aleatoria
(0 a ∞) se demuestra que es igual a la unidad. Estos resultados permiten verificar que la
expresión correspondiente a la función de densidad de la variable aleatoria Gama es una
verdadera función de probabilidad.
c) Teorema.- Si X es una variable aleatoria distribuida según la Gama, entonces la media
𝛼 𝛼
esperada y la varianza son las siguientes: Media Esperada: E(X) = 𝜆 ; Varianza: 𝜎𝑋2 = 𝜆2
La demostración del teorema anterior se efectúa mediante el uso de la Función

Generadora de Momentos de la variable aleatoria distribuida según la Gama, la misma
𝜆𝛼
que resulta: 𝑀𝑋 (t) = ( 𝜆−𝑡)𝛼 , para λ > 𝑡; cuya demostración es la siguiente:
𝜆𝛼 ∞ 𝜆𝛼 ∞
𝑀𝑋 (t) = E(е𝑡𝑋 ) = ∫0 е𝑡𝑋 𝑋 𝛼−1 е−𝜆𝑋 𝑑𝑋 = ∫0 𝑋 𝛼−1 е−(𝜆−𝑡)𝑋 𝑑𝑋. Integrando por partes
Г(α) Г(α)
en forma recurrente α veces, se tiene: U = 𝑋 𝛼−1 ; dU = (𝛼 − 1) 𝑋 𝛼−2 )𝑑𝑋; dv = е−(𝜆−𝑡)𝑋 𝑑𝑋,

е−(𝜆−𝑡)𝑋
integrando de 0 a ∞ ambos lados de esta última igualdad se obtiene: v = - (𝜆−𝑡)
.
Sustituyendo en la ecuación de integración por partes se obtiene:

∞
𝜆𝛼 е−(𝜆−𝑡)𝑋 (𝛼−1) ∞ 𝜆𝛼 (𝛼−1)! 𝜆𝛼
𝑀𝑋 (t) = Г(α) {[−𝑋 𝛼−1 (𝜆−𝑡) 0
] + ∫ 𝑋 𝛼−2 е−(𝜆−𝑡)𝑋 𝑑𝑋 } = Г(α)
(𝜆−𝑡) 0 (𝜆−𝑡)𝛼
= ( 𝜆−𝑡)𝛼 , para λ> 𝑡
Utilizando esta función generadora de momentos y calculando la primera y segunda

𝑑𝑀𝑋 (t) 𝛼𝜆𝛼 𝑑2 𝑀𝑋 (t) 𝛼𝜆𝛼 (𝛼+1)(𝜆−𝑡)𝛼
derivada respecto a la variable real t, que son: = (𝜆−𝑡)𝛼+1
; = ;y
𝑑𝑡 𝑑𝑡 2 (𝜆−𝑡)2𝛼+2
haciendo t igual a cero en estas dos derivadas se obtienen los dos primeros momentos
𝛼 𝛼 2 +𝛼
centrados respecto al origen, que son: 𝑀𝑋′ (0) = y 𝑀𝑋′′ (0) = ; resultados que a su vez
𝜆 𝜆2
𝛼
permiten obtener la media esperada y la varianza; o sea: 𝑀𝑋′ (0) = E(X) = y la varianza
𝜆
𝛼 2 +𝛼 𝛼2 𝛼
V(X) = 𝜎𝑋2 = 𝑀𝑋′′ (0) - [𝑀𝑋′ (0)]2 = - = 𝜆2
𝜆2 𝜆2
1.9.2 Distribución de Probabilidad Ji Cuadrado

1.9.3 Función de Densidad
39
Tal como se anotó anteriormente, esta distribución se obtiene como un caso particular de
𝑛 1
la distribución de probabilidad Gama; es decir, cuando α = 2 y λ = 2 ; para n entero y
positivo, cuya función de densidad (función de probabilidad o distribución de probabilidad)
1
obtenida de la función de densidad de la gama resulta: f(X) = 𝑛 𝑋 (𝑛−2)/2 е−𝑋/2 ;
𝑛
2 2 Г( 2 )
para X > 0 y n entero positivo.
La expresión matemática anterior cumple con los dos requisitos de función de
probabilidad; es decir: i) f(X) ≥ 0 para toda X real, y ii) La integral de esta expresión
matemática en el recorrido de la variable aleatoria distribuida según la Ji Cuadrado (0 a ∞)
es igual a la unidad. Este resultado indica que el área bajo la distribución Ji Cuadrado es
igual a la unidad para un determinado valor de n.
La función generadora de momentos de la variable aleatoria distribuida según la Ji
Cuadrado obtenida de la función generadora de momentos de la distribución gama está
𝑛
1
dada por: 𝑀𝑋 (𝑡) = (1 − 2𝑡)− 2 , para t < y n grados de libertad; utilizando esta función
2
𝑛 1
generadora de momentos o sustituyendo el valor de α = 2 y λ = 2 en la media esperada y
la varianza de la distribución Gama, se obtienen la media esperada y la varianza para la
distribución Ji Cuadrado que son las siguientes: E(X) = n, y 𝜎 2𝑋 = 2𝑛.
Gráfico
Distribución de la Ji Cuadrado para algunos valores de n
1.9.4 Función de Distribución Acumulada
La Función de Distribución Acumulada de X distribuida según la Ji Cuadrado por definición

1 𝑥
está dada por: 𝐹𝑋 (𝑥 ) = 𝑃(𝑋 ≤ 𝑥) = 𝑛
𝑛
∫0 𝑠 (𝑛−2)/2 е−𝑠/2 ds = 1- α. Los resultados
2 2 Г( 2 )
de esta función de distribución acumulada para distintos valores de X y grados de libertad

(n), se presentan en la Tabla adjunta en Anexo.
1.9.5 Relación de la Ji Cuadrado con la Normal Estándar
40
Teorema.- Si Z es una variable aleatoria distribuida según la normal estándar, entonces
𝑍 2 se distribuye según la Ji Cuadrado con un grado de libertad. En símbolos: Si Z~𝑁(0,1),
entonces z2 ~ ×2(1). La prueba consiste en demostrar que la función generadora de
momentos de Z2 = U es igual a la función generadora de momentos de la Ji Cuadrado con
1
un grado de libertad; es decir: 𝑀𝑈 (𝑡) = (1 − 2𝑡)−1/2 , para t < 2
Teorema.- Si 𝑍𝑖 para la i = 1, 2, 3, …, n son variables aleatorias independientes

𝑋𝑖 −µ 2
distribuidas idénticamente según la normal estándar, entonces V = ∑𝑛1 𝑍𝑖 2 = ∑𝑛1 ﴾ ﴿ se
𝜎
distribuye según la Ji Cuadrado con n grados de libertad.
Demostración: En razón de que 𝑍𝑖2 para i = 1, 2, … ,n se distribuye idénticamente según

la ji cuadrado con un grado de libertad, con función generadora de momentos común
(1 − 2𝑡)−1/2 ; por lo que, la función generadora de momentos de V es:
2 2 2 2 2 2 2 2
𝑀𝑉 (𝑡) = E﴾е𝑡𝑉 ﴿ = E(е𝑡 ∑ 𝑍𝑖 ) = E(е𝑡𝑍1 )E(е𝑡𝑍2 ) E(е𝑡𝑍3 ) … E (е𝑡𝑍𝑛 ) = E(е𝑡𝑍 )E(е𝑡𝑍 )E(е𝑡𝑍 ) …
2 𝑛 1
E(е𝑡𝑍 ) = [(1 − 2𝑡)−1⁄2 ] = (1 − 2𝑡)−𝑛/2 ; para t < 2; esta es la función generadora de
momentos de la Ji Cuadrado con n grados de libertad, calculada en una página anterior
empleando un procedimiento distinto.
∑𝑛(𝑋 − 𝑋̅)2
Teorema.- Si s2 = 1 𝑖 es la varianza de una muestra aleatoria de tamaño n, extraída
𝑛−1
de una población X, distribuida según la normal con media µ y varianza 𝜎 2 , entonces:
(𝑛−1)𝑠2
×2 = se distribuye según la Ji Cuadrado con (n-1) grados de libertad; es decir:
𝜎2
(𝑛−1)𝑠2
×2 = ~⨉2(𝑛−1).
𝜎2
𝑋𝑖 −µ 2
Demostración.- Tomando en cuenta que ∑𝑛1 ﴾ ﴿ se distribuye según la Ji Cuadrado
𝜎
con n grados de libertad, se procede como sigue:
𝑋𝑖 −µ 2 ∑[𝑋𝑖 −𝑋̅+𝑋̅−µ]2 ∑[(𝑋𝑖 −𝑋̅)+(𝑋̅ −µ)]2 ∑[(𝑋𝑖−𝑋̅ )2 +2(𝑋𝑖 −𝑋̅)(𝑋̅ −µ)+(𝑋̅−µ)2 ] ∑(𝑋𝑖 −𝑋̅)2 +𝑛(𝑋̅ −µ)2
∑𝑛1 ﴾ ﴿ = = = = ;
𝜎 𝜎2 𝜎2 𝜎2 𝜎2
sabiendo que: ∑(𝑋𝑖 − 𝑋̅) = 0 y ∑(𝑋̅ − µ)2 = n(𝑋̅ − µ)2 , se obtiene:
𝑋𝑖 −µ 2 ∑𝑛 ̅ )2
1 (𝑋− 𝑋 (𝑋̅ −µ)2
∑𝑛1 ﴾ ﴿ = + 𝜎2
; igualdad que puede ser escrita también como sigue:
𝜎 𝜎2
𝑛
𝑋𝑖 −µ 2 (𝑛−1)𝑠2 (𝑋̅ −µ)2

∑𝑛1 ﴾ ﴿ = + 𝜎2
𝜎 𝜎2
𝑛
El segundo término del lado derecho se distribuye según la Ji Cuadrado con un grado de
libertad2; por lo que, como consecuencia el primer término del lado derecho se distribuye
𝜎2 (𝑋̅−µ) (𝑋̅−µ)2
Si X~ N(µ, 𝜎 2 ), entonces 𝑋̅ ~ N(µ , ~ ⨉2(1)
2
), luego: Z = 𝜎 ~ N(0, 1); finalmente Z2 = 𝜎2
𝑛
√𝑛 𝑛
41
según la Ji Cuadrado con (n-1) grados de libertad. En símbolos, se presenta como sigue:
(𝑛−1)𝑠 2 2
⨉2(𝑛) = ⨉2(𝑛−1) + ⨉2(1). Este resultado muestra que 2 ~⨉ (𝑛−1)
𝜎
Utilizando este resultado y tomando en cuenta que se utilizan dos estimadores para
realizar inferencias respecto a 𝜎 2 ; o sea 𝑋̅ y 𝑠 2 , lo cual significa que se pierden 2(n-1)
grados de libertad; por lo que, la varianza de 𝑠 2 , se obtiene como sigue:
(𝑛−1)𝑠2 (𝑛−1)2 2𝜎4
V[ ] = 2(n-1); V(𝑠 2 ) = 2(n-1), de donde se obtiene: V(𝑠 2 ) = 𝑛−1
𝜎2 𝜎4
Ejemplo.- La variable aleatoria X se distribuye según la 𝑋 2 con 10 grados de libertad,

entonces utilizando la tabla de la función de distribución acumulada de la Ji Cuadrado
presentada en anexo, se pueden calcular las siguientes probabilidades:
a) P(X > 12,51) = 1 - P(X  12,51) = 1- 0,75 = 0,25
b) P(X > 4,9) = 1 - P(X  4,9) = 1 - 0,1 = 0,9
Ejemplo.- Se extrae una muestra aleatoria de 12 observaciones de una variable aleatoria
distribuida según la normal con media  y varianza  2 , ambas medidas desconocidas;
(12−1)𝑠2
luego: 𝑋 2 = es una variable aleatoria distribuida según la Ji Cuadrado con (n-1)=11
𝜎2
grados de libertad. Utilizando la tabla de la función de distribución acumulada de esta

distribución, se calcula la probabilidad de que la varianza de la muestra se encuentra
cerca de la varianza poblacional, como sigue:
P(4,57 < 𝛸 2 <13,7) = P(𝛸 2 <13,7) - P(𝛸 2 <4,57) = 0,75 – 0,05 = 0,7.
1.10 Distribución de Probabilidad de la T de Student
Después de la distribución normal estándar y de la ji cuadrado, la tercera distribución, de

considerable importancia para la estadística aplicada, es la distribución "t" de Student. En
muchos trabajos de investigación estadística, la media (µ) y la varianza (𝜎 2 ) de una
población distribuida según la normal, se estiman con base a muestras aleatorias
relativamente pequeñas (n ≤ 30), utilizando como estimadores 𝑋̅ y. 𝑠 2 En el primer caso se
utiliza la distribución t de Student y en el segundo caso se utiliza la distribución Ji
Cuadrado.
Cuando es conocido el valor de 𝜎 2 , debe emplearse la distribución normal para realizar

inferencias respecto a la media (µ) y otros parámetros; en caso contrario, se debe emplear
la distribución t de Student en función del tamaño de la muestra; de la cual, se calcula:
∑𝑛 ̅ )2
1 (𝑋𝑖 −𝑋
𝑠2 = 𝑛−1
Si X1, X2, X3, . . . , Xn es una muestra aleatoria de tamaño n, extraída de una población
distribuida según la normal con media µ y varianza 𝜎 2 ; entonces 𝑋̅ se distribuye según la
42
𝜎2 (𝑋̅−µ)
normal con media µ y varianza (para poblaciones infinitas), luego Z = 𝜎 se
𝑛
√𝑛
distribuye según la normal estándar; lo cual, es cuando se conoce el valor de σ; sin

embargo, cuando es desconocido el valor de σ se debe estimar µ utilizando la varianza de
∑𝑛 ̅ )2
1 (𝑋𝑖−𝑋 (𝑋̅−µ)
la muestra 𝑠 2 = , luego T = 𝑠 , se distribuye según la t de Student con (n-1)
𝑛−1
√𝑛
grados de libertad.
La distribución t es conocida también con la denominación de Distribución Student en

honor a William S. Gosset, quien público sus estudios relacionados con el tema bajo el
seudónimo de Student en el año 1908; por lo cual, esta distribución se la conoce como
distribución t de Student, cuya definición está dada por:
Función de densidad
Definición.- Sean Z y X dos variables aleatorias independientes, la primera distribuida

según la normal estándar y la segunda según la Ji Cuadrado con n grados de libertad;
𝑍
entonces T = se distribuye según la t de Student con n grados de libertad, cuya
√𝑋/𝑛
función de probabilidad (función de densidad) o distribución de probabilidad está dada por:
−(𝑛+1)/2
1 𝛤[(𝑛+1)/2] 𝑡2
𝑓𝑇 (𝑡) = (1 + ) , para - < t <, y n es un entero positivo.
√𝑛𝜋 𝛤(𝑛/2) 𝑛
La representación gráfica de la función de densidad de la t de Student para n = 3 y n = 10,

comparadas con la distribución de la normal estándar, se presente a continuación:
Representación gráfica de la distribución t de Student
Propiedades:
i) f(t) ≥ 0 para toda t real

43
∞
ii) ∫−∞ 𝑓(𝑡)𝑑𝑡 = 1, lo que significa que el área bajo la distribución t de Student para valores
de n es igual a la unidad.
iii) La función de densidad de la t de Student es simétrica con respecto a su media
esperada que es igual a cero, similar al caso de la distribución normal estándar; es decir,
𝑛
E(T) = 0, para n > 1 y la varianza de la variable aleatoria T es: 𝜎𝑇2 = 𝑛−2, para n > 2
La varianza de la distribución normal estándar es igual a la unidad (1), en cambio de la t

de Student es mayor a la unidad para valores pequeños de n; razón por la cual, la
distribución de la t es más aplanada que la distribución normal estándar; lo que significa,
que la distribución de la t tiene mayor dispersión que la normal estándar, especialmente
para valores pequeños de n; sin embargo, cuando n → ∞, la distribución de la t de Student
converge asintóticamente a la distribución normal estándar.
La función de distribución acumulada de la variable aleatoria T, distribuida según la t de

𝑡
Student, por definición está dada por: 𝐹𝑇 (𝑡) = 𝑃(𝑇 ≤ 𝑡) = ∫−∞ 𝑓(𝑥 )𝑑𝑥 = 1- α
Los resultados de esta función de distribución acumulada para los distintos grados de
libertad (n) y distintos valores de X, se presentan en el cuadro adjunto en Anexo.
Ejemplo.- Si n = l4 y (1– α) = 0,99, entonces α = 0,01; del cuadro de la función de
distribución acumulada de la t de student, se obtiene el valor de t(1 - α)(n) = 2.624; es decir,
P(T  2,624) = 0,99. Este resultado suele simbolizarse por: 𝑡0,99(14) = 2,624. De igual
forma, 𝑡0,95(6) = 1,943, es equivalente a P(T  1,943) = 0,95; es decir, dado el valor de n y
de (1- α), de la tabla de la t de Student se obtiene el valor de la variable aleatoria
distribuida según la t de Student, el cual se utiliza en la inferencia estadística; es decir,
para estimar la media de una población distribuida según la normal (µ), proporción de
éxitos de una población distribuida según la Bernoulli (P), diferencia de dos medias de dos
poblaciones distribuidas según la normal (dµ), etc.; tal como se verá en la estimación de
algunos parámetros por intervalo y en la prueba de hipótesis.
Si la probabilidad (1- α) es pequeña, también es posible utilizar la señalada tabla incluida
en Anexo, tomando en cuenta que la distribución de probabilidad de la t de Student es
simétrica respecto a su media esperada E(T) = 0; es decir, se verifica la siguiente
igualdad: P(X  - x) = P(X > x) = 1 – P(X < x) = 1 - P(X  x).
Ejemplo: Si n = 15 y (1 - α) = 0,01. Utilizando la tabla de la Función de Distribución
Acumulada se verifica P(X  2,602) = 0,99, luego P(X  -2,602} = 1 - 0,99 = 0,01. Este
resultado es por la simetría de la distribución t de student respecto a su media esperada
que es E(T) = 0.
Teorema: Si X es una variable aleatoria distribuida según la normal con media  y
varianza  2 , y X 1 , X 2 ,....,X n es una muestra aleatoria de n observaciones extraída de X,
X 
entonces T = tiene distribución t de Student con (n-1) grados de libertad.
s/ n
44
Demostración: Si X se distribuye según la normal con media  y varianza  2 , entonces 𝑋̅
𝜎2
se distribuye también según la normal con media µ y varianza 𝜎𝑋2̅ = para poblaciones
𝑛
(𝑋̅− µ)
infinitas; luego, Z = se distribuye según la normal estándar. Por otra parte, se
𝜎⁄√𝑛
(𝑛−1)𝑠2
demostró que × = 2
~⨉2(𝑛−1); es decir, la variable aleatoria 𝛸 2 se distribuye
𝜎2
según la Ji Cuadrado con (n-1) grados de libertad. Finalmente, utilizando la definición de la
variable aleatoria distribuida según la t de Student, se tiene:
𝑍 √𝑛(𝑋̅−µ)⁄𝜎 (𝑋̅− µ)
T= = = ~ 𝑡(𝑛−1); es decir, la variable aleatoria T de
√𝑋 2⁄(𝑛−1) (𝑛−1)𝑠2 ⁄𝜎2 𝑠⁄√𝑛
√
(𝑛−1)
Student se distribuye según la t con (n-1) grados de libertad. Este último resultado se
utiliza para realizar inferencias respecto al parámetro µ de una población X distribuida
según la normal.
Realizando operaciones matemáticas similares al caso anterior, se obtiene el siguiente

resultado, referido a la distribución de la proporción de éxitos de una muestra aleatoria
pequeña.
(𝑃̂−𝑃)
T= ~ 𝑡(𝑛−1) ; es decir, la variable aleatoria T de Student se distribuye según la t
√𝑃̂𝑄̂ /𝑛
con (n-1) grados de libertad. Este resultado se utiliza para realizar inferencias respecto al
parámetro P; el cual, es la proporción de éxitos de una población Y distribuida según la
Bernoulli.
De forma similar, se obtienen resultados para realizar inferencias respecto a la diferencia

de dos medias correspondientes a dos poblaciones independientes distribuidas según la
normal.
(𝑑𝑋
̅ −𝑑µ)
I) T = ~ 𝑡(𝑛1+𝑛2−2); es decir, la variable aleatoria T de Student se distribuye
𝜎
̂ ̅
𝑑𝑋
según la t con (𝑛1 +𝑛2 -2) grados de libertad. Este resultado se utiliza para realizar
inferencias respecto al parámetro 𝑑µ = µ1 − µ2 ; la cual, es la diferencia de medias de dos
poblaciones independientes distribuidas según la normal, cada una con medias µ1 y µ2 ;

varianzas 𝜎12 y 𝜎22 respectivamente; donde:
45
(𝑛1 −1)𝑠12+(𝑛2−1)𝑠22 1 1
𝜎̂𝑑𝑋̅ =√ (𝑛 + 𝑛 ); para 𝜎12 = 𝜎22 = 𝜎 2 (Este es un supuesto de
𝑛1 +𝑛2 −2 1 2
que las varianzas de las dos poblaciones son iguales)
(𝑑𝑋
̅ −𝑑µ)
II) T = ~ 𝑡(𝐺) ; es decir, la variable aleatoria T de Student se distribuye según la
𝜎
̂ 𝑑𝑋
̅
t, pero con G grados de libertad. Este resultado se utiliza para realizar inferencias respecto
al parámetro 𝑑µ = µ1 − µ2 ; el cual, es la diferencia de medias de dos poblaciones
independientes distribuidas según la normal, con medias µ1 y µ2 ; varianzas 𝜎12 y 𝜎22
𝑠2 𝑠2
respectivamente; donde: 𝜎̂𝑑𝑋̅ =√ 1 + 2 ; para el supuesto de que: 𝜎12 ≠ 𝜎22 ; es decir,
𝑛1 𝑛2
las Varianzas de las dos variables poblacionales son distintas. Los grados de libertad en
este caso están dados por:
2
𝑠21 𝑠2
2
( + )
𝑛1 𝑛2 3
G= 2 2 . Es una aproximación de Welch .
𝑠2 𝑠2
(𝑛1 ) (𝑛2 )
1 2
+
𝑛1 −1 𝑛2 −1
1.11 Distribución de Probabilidades F de Fisher
Otra de la distribución muy importante aplicada en la inferencia estadística sobre la razón

de dos varianzas poblacionales, es la denominada distribución F de Fisher; por lo tanto, la
distribución muestral de la razón entre dos varianzas de dos muestras aleatorias extraídas
de dos variables poblacionales distribuidas según la normal con medias µ1 y µ2 ; varianzas
𝜎12 y 𝜎22 , respectivamente, resulta de gran utilidad para las investigaciones científicas. Esta
distribución fue propuesta y presentada por R. A. Fisher en el año 1924.
Definición.- Sean X1 y X2 dos variables aleatorias independientes; la primera distribuida
según la Ji Cuadrado con 𝑛1 grados de libertad y la segunda también distribuida según la
𝑋1⁄𝑛1
Ji Cuadrado con 𝑛2 grados de libertad; luego X = se distribuye según la F con 𝑛1
𝑋2⁄𝑛2
grados de libertad en el numerador y 𝑛2 grados de libertad en el denominador.
La Función de Densidad de la variable aleatoria distribuida según la F está dada por:
3
Lee C. Adkins y R. Carter Hill , Using Stata for Principles of Econometrics, Fourth Edition, pág. 593.
46
𝑛1 + 𝑛2 𝑛1 ⁄2
﴾ ﴿ 𝑛 𝑛1
f(X) = 𝑛
2
𝑛 ( 1) 𝑋 (𝑛1 −2)⁄2 (1 + 𝑋)−(𝑛1 +𝑛2 )⁄2; para X ≥ 0; 𝑛1 y 𝑛2 enteros
( 21 ) ﴾ 22 ﴿ 𝑛2 𝑛2
positivos y  es la Función Gama.
Gráfico: Distribuciones de F para algunos valores de 𝑛1 y 𝑛2
Características de la distribución F:
i) f(x) ≥ 0 para toda x real

∞
ii) ∫0 𝑓(𝑥)𝑑𝑥 = 1, lo que significa que el área bajo la distribución F para cierto par
de valores de 𝑛1 y 𝑛2 es igual a la unidad.
𝑛2
iii) 𝐸 (𝑋 ) = , es la media esperada de la F, para 𝑛2 > 2
𝑛2 −2
2𝑛22 (𝑛1 + 𝑛2 −2)

iv) V(X) = , es la varianza de la F, para 𝑛2 > 4
𝑛1 (𝑛2 −2)2 (𝑛2 −4)
La función de distribución acumulada de la F, distribuida según la F de Fisher, por

𝑥
definición está dada por: 𝐹𝑋 (𝑥 ) = 𝑃(𝑋 ≤ 𝑥) = ∫0 𝑓(𝑠)𝑑𝑠 = (1 – α)
Los resultados de esta función de distribución acumulada para 𝑛1 grados de libertad en el
numerador, 𝑛2 grados de libertad en el denominador y los distintos valores de X,
incluyendo las probabilidades de F = (1 – α) se presentan en el cuadro anexo adjunto.
Si X tiene distribución F con (𝑛1 ; 𝑛2 ) grados de libertad. El siguiente ejemplo muestra el

uso del señalado cuadro presentado en anexo.
Ejemplo.- Si X tiene distribución F con (𝑛1 ; 𝑛2 ) = (5; 7) y (1 – α) = 0,90, del cuadro se

obtiene x = 2,88. Esta información, en la parte de la estadística aplicada se simboliza
como sigue: 𝐹0,90(5 ; 7) = 2,88
47
El resultado anterior, como Función de Distribución Acumulada se presenta como sigue:
2,88
𝐹𝑋 (2,88) = 𝑃(𝑋 ≤ 2,88) = ∫0 𝑓(𝑠)𝑑𝑠 = 0,90; donde se consideran 5 y 7 grados de
libertad.
Si X se distribuye según la F con (𝑛1 ; 𝑛2 ) = (7; 5) y (1 – α) = 0,975; entonces del cuadro se

obtiene el valor de x = 6,85; cuya simbología práctica es: 𝐹𝑜,975(7 ; 5) = 6,85
En forma general, se simboliza como sigue: 𝐹(1− 𝛼)(𝑛1; 𝑛2 ) = 𝑥
El resultado anterior, como Función de Distribución Acumulada se presenta como sigue:

6,85
𝐹𝑋 (6,85) = 𝑃(𝑋 ≤ 6,85) = ∫0 𝑓𝑠𝑑𝑠 = 0,975; donde se consideran 7 y 5 grados de libertad.
Se observa que en el cuadro de la función de distribución acumulada de la F solo figuran

para valores de (1– α) cercanos a la unidad; sin embargo, es posible obtener valores de x
para valores pequeños de (1– α); para cuyo propósito se utiliza la siguiente propiedad:
1
Si X tiene distribución F con (𝑛1 ;𝑛2 ) grados de libertad, entonces: P(X ≤ 𝑥) = 1 − 𝑃(𝑌 ≤ 𝑥),
donde Y es una variable aleatoria distribuida según la F con (𝑛2 ;𝑛1 ) grados de libertad;
cambian los grados de libertad, los del numerador van al denominador y de este al
numerador y se utiliza el complemento de (1- α); o sea, (1 − 𝛼 )′
Ejemplo.- Si X se distribuye según la F con (8 y 6) grados de libertad, se desea hallar el
1
valor de x, tal que P(X ≤ 𝑥) = 0,05. En este caso, se verá en los cuadros el valor 𝑥 para el
1
que P(Y≤ 𝑥) = 0,95; donde Y se distribuye según la F con (6 y 8) grados de libertad; o sea,
1 1
se encuentra en la tabla del apéndice: = 3,58; luego x = 3,58 = 0,28.
𝑥
1
El resultado anterior puede calcularse también como sigue: 𝐹(1−𝛼)(𝑛1 𝑦 𝑛2 ) = ;o
𝐹(1−𝛼)′(𝑛 𝑦 𝑛 )
2 1
1 1
sea: 𝐹0,05(8 𝑦 6) = 𝐹 = 3,58 = 0,28
0,95(6 𝑦 8)
1.11.3 Distribución de la Razón de Varianzas de Dos Muestras Aleatorias
Teorema.- Sea X11, X12, …, X1𝑛1 una muestra aleatoria extraída de una variable
poblacional distribuida según la normal (𝑋1 ) con media 𝜇1 y varianza 𝜎12 y X21, X22, …,
X2𝑛2 otra muestra aleatoria extraída de otra población distribuida según la normal (𝑋2 ) con
𝑠12⁄𝜎12
media 𝜇2 y varianza 𝜎22 , entonces F = se distribuye según la F con (𝑛1 -1) grados de
𝑠22⁄𝜎22
libertad en el numerador y (𝑛2 -1) grados de libertad en el denominador.

(𝑛1 −1)𝑠12 (𝑛2−1)𝑠22
Demostración: Sean 𝑋1 = y 𝑋2 = variables aleatorias distribuidas según la
𝜎12 𝜎22
Ji Cuadrado con (𝑛1 − 1) y (𝑛2 − 1) grados de libertad respectivamente; luego, utilizando

la definición de la variable aleatoria F, se tiene:
48
𝑋1 ⁄(𝑛1 −1) 𝑠12⁄𝜎12
F= = 2 2 se distribuye según la F con (𝑛1 -1) y (𝑛2 -1) grados de libertad en el
𝑋2 ⁄(𝑛2 −1) 𝑠2 ⁄𝜎2
numerador y denominador respectivamente.
𝑛 𝑛
∑1 1(𝑋1𝑖 −𝑋̅1)2 ∑1 2(𝑋2𝑖 −𝑋̅2)2
En donde: 𝑠12 = y 𝑠22 = son las varianzas de las dos
(𝑛1 −1) (𝑛2−1)
muestras aleatorias; las cuales, para fines prácticos se presentan como sigue:
(𝑛1 − 1)𝑠12 = ∑𝑛1 1(𝑋1𝑖 − 𝑋̅1 )2 y (𝑛2 − 1)𝑠22 = ∑𝑛1 2(𝑋2𝑖 − 𝑋̅2 )2 . Las aplicaciones se verán en los
siguientes dos capítulos (Estimación de parámetros y prueba de hipótesis estadística).
1.12 La Desigualdad de Chebychev y la Ley de los Grandes Números
1.12.1 Desigualdad de Chebychev
La Desigualdad de Chebychev muestra la importancia de la desviación estándar para la

distribución de probabilidad de una variable aleatoria; la obtuvo por primera vez el
matemático ruso Chebychev en 1867.
La desigualdad establece un límite a la probabilidad de que una variable aleatoria se

encuentre dentro o fuera de k desviaciones estándar de su media esperada; cuyo
resultado se presenta en el siguiente enunciado:
Si X es una variable aleatoria con distribución de probabilidad cualquiera, pero con media
esperada E(X) = μ y desviación estándar 𝜎𝑋 = σ, entonces la desigualdad de Chebychev
para la distribución de esa variable aleatoria X (variable poblacional) está dada por:
1 1
P(|X - μ|< kσ) ≥ (1 - 𝐾2); cuyo complemento es: P(|X - μ| ≥ kσ) ≤ 𝐾2
1
La primera desigualdad se puede escribir como sigue: P[(µ - kσ) ≤ X ≤ (kσ + µ)] ≥ (1– 𝐾2);
cuyo significado es: “la probabilidad de que X tenga valores comprendidos dentro del
𝟏
intervalo ( - k y  + k) es al menos (1- 𝑲𝟐)”, y de la segunda, “la probabilidad de que
𝟏
X tenga valores fuera del intervalo ( - k y  + k) es igual o menor a 𝑲𝟐”
Es preciso señalar en forma especial, que no se realiza suposición alguna con relación a
la distribución de probabilidad de X, cuando se obtiene la desigualdad de Chebychev; sin
embargo, se impone un límite a la probabilidad de que X esté dentro o fuera de k
desviaciones estándar de su media esperada.
1.12.2 Ley de los Grandes Números
El significado de la Ley de los Grandes Números, se explica utilizando un ejemplo sencillo,

que consiste en lo siguiente: Sea una población hipotética constituida por hogares de un
49
determinado municipio. Suponiendo que el interés particular es analizar la variable gasto
mensual (X) expresado en bolivianos. Además, suponiendo que la proporción de hogares
de esa población (municipio) con monto de gasto mensual mayor a Bs 5.000.- es P = 0.40.
Se extrae al azar una muestra de n hogares de esa población hipotética de hogares. Sea
Xn el número de hogares con gasto mensual mayor a Bs 5.000.- de la muestra, y sea 𝑃̂ =
Xn/n la proporción de hogares con gasto mensual mayor a Bs 5.000.- de la misma. Se
espera que 𝑃̂ = Xn/n se aproxime a P = 0.40 a medida que n se incrementa cada vez;
pero no se puede asegurar con certeza que 𝑃̂ = Xn/n sea igual a 0,40 para un determinado
n grande; sin embargo, se puede demostrar que la probabilidad de que 𝑃̂𝑛 difiera de P =
0,40 en una cantidad pequeña (ξ > 0) cualquiera tiende a cero, conforme crece n. Este es
un caso particular de la Ley de los Grandes Números, que se presenta en el siguiente
teorema:
Teorema.- Suponiendo que Y1, Y2, . . . , Yn es una secuencia de variables aleatorias
independientes, distribuidas idénticamente según la Bernoulli, cada una con media
∑𝑛
1 𝑌𝑖 𝑋𝑛
esperada P y varianza σ2 = PQ. Sea 𝑃̂𝑛 = = para n = 1, 2, 3, . . . , una nueva
𝑛 𝑛
secuencia de variables aleatorias: 𝑃̂1, 𝑃̂2, . . . ; entonces: 𝑙𝑖𝑚𝑛→∞ P(|𝑃̂𝑛 - P| < ξ) = 1, y en su

forma complementaria: 𝑙𝑖𝑚𝑛→∞ P(|𝑃̂𝑛 - P| ≥ ξ) = 0,
𝑛𝜉 2
Demostración.- Sea ξ = k𝜎𝑃̂𝑛 = k√𝑃𝑄 ⁄𝑛 ; de donde se obtiene 𝑘 2 = ; sustituyendo en
𝑃𝑄
la desigualdad de Chebychev y aplicando límite cuando n → ∞ se obtienen los siguientes

resultados:
𝑃𝑄
i) 𝑙𝑖𝑚𝑛→∞P(|𝑃̂𝑛 - P| < ξ) = 𝑙𝑖𝑚𝑛→∞ (1- ) = 1; cuyo significado es: la probabilidad de
𝑛𝜉 2
que el valor de la proporción muestral (𝑃̂𝑛 ) difiera de la proporción poblacional (P) en una
cantidad menor a ξ es segura, cuando n tiende a infinito.
𝑃𝑄
ii) 𝑙𝑖𝑚𝑛→∞ P(|𝑃̂𝑛 - P| ≥ ξ) = 𝑙𝑖𝑚𝑛→∞(𝑛𝜉2) = 0; cuyo significado es: la probabilidad de que
el valor de la proporción muestral (𝑃̂𝑛 ) difiera de la proporción poblacional (P) en una

cantidad mayor o igual a ξ es improbable, cuando el tamaño de la muestra tiende a infinito.
1.12.3 Problemas resueltos
1.13.3.1 Un investigador de mercados desea estimar la media de una población utilizando

una muestra suficientemente grande, a fin de que la probabilidad de que la media de la
muestra no difiera de la media poblacional en más del 25% de su desviación estándar sea
al menos de 0.95. Calcular el tamaño de la muestra que deberá tomarse.
Solución.-
P(|𝑋̅ − µ| ≤ 0.25𝜎)≥ 0.95. Se utiliza la Desigualdad de Chebychev debido a que no se

50
conoce la forma de distribución de la variable aleatoria poblacional X; solo se conoce su
media esperada y su varianza.
1 1
Primero se determina el valor de 𝑘 2 , o sea: 1- 𝑘 2 = 0.95; 𝑘 2 -1=0.95𝑘 2 ; luego 𝑘 2 = 0.05 = 20;
𝜎
seguidamente se determina el valor de n tomando en cuenta lo siguiente: k = 0.25σ; ya
√𝑛
𝜎 𝑘𝜎 20
que ℰ = k𝜎𝑋̅ = k 𝑛; √𝑛 = 0.25σ; de donde se obtiene el valor de n; o sea: n = (0.25)2 = 320.
√
Este tamaño de muestra aleatoria garantiza con una confianza de al menos 95% de que el
margen máximo de error de 𝑋̅ sea a lo sumo 0.25σ.
1.13.3.2 Una industria produce instrumentos de precisión para oftalmología, de la cual el

2% resulta defectuosa. Se analiza un número grande de dichos instrumentos
estableciéndose la proporción (𝑃̂ ). ¿Cual deberá el tamaño de la muestra a tomarse con
una confianza del 95% de que la proporción muestral difiera de la proporción poblacional
(2%) en menos de 1%?.
Solución.-
P=0.02 Proporción de producción defectuosa de la población de instrumental de precisión.

Se utiliza la distribución normal debido a que se señala que la muestra aleatoria sea
suficientemente grande; por otra parte, se señala también que la probabilidad de que el
margen máximo de error de 𝑃̂ sea menor al 1% es igual a 0.95: P(|𝑃̂ − 𝑃| < 0.01) = 0.95.
Los datos son los siguiente: 𝑍(1− 0.05) = 𝑍0,975 = 1,96; ℰ =±0.01
2
𝑍 2 𝑃𝑄 1,962 (0.02)(0.98)
n = = = 753. Esta muestra es demasiado grande; por lo que, se debe
ℰ2 (0.01)2
disminuir la precisión del estimador, lo que significa aumentar el valor del margen máximo
1.962 (0.02)(0.98)
de error; por ejemplo a: ℰ = ±0.04; con el cual, el valor de n resulta: n = = 47.
0.042
Esta muestra podría ser considerada bastante razonable en comparación a la primera.
1.13.3.3 Una industria manufacturera produce instrumentos de precisión para relojería

(población), de la cual el 1% es defectuosa. Se analiza un número grande de tales
instrumentos estableciéndose la proporción de defectuosos (𝑃̂ ). ¿Cual deberá ser el
tamaño de la muestra con una probabilidad de 0.98 de que la proporción muestral difiera
de la proporción poblacional (1%) en menos del 3%?.
Solución.-
P=0.01 Proporción de producción defectuosa de la población de instrumental de precisión.

Se utiliza la distribución normal debido a que se señala que la muestra aleatoria sea
suficientemente grande; por otra parte, se señala también que la probabilidad de que el
margen máximo de error de 𝑃̂ sea menor al 3% es igual a 0.98: P(|𝑃̂ − 𝑃| < 0.03) = 0.98.
Los datos son los siguiente: 𝑍(1− 0.02) = 𝑍0,99 = 2,33; ℰ =±0.03
2
𝑍 2 𝑃𝑄 2,332 (0.01)(0.99)
n= = = 60. Esta muestra garantiza con una confianza de 98% de que el
ℰ2 (0.03)2
margen máximo de error de la proporción muestral sea menor al 3%.
1.13.3.4 Suponiendo que la variable aleatoria X definida sobre una población tiene por
media µ y varianza 100. Una muestra aleatoria de esa población tiene una media muestral
51
𝑋̅. a) Hallar el tamaño de muestra aleatoria de tamaño n que se requiere para que la
probabilidad de que la media muestral difiera de la media poblacional (µ) en menos de 0.1
unidades, sea al menos de 0,95, b) Hallar el tamaño de muestra n que se requiere para
que la probabilidad de que la media muestral difiera de la media poblacional (µ) en menos
de 0.1 unidades, sea al menos de 0,99.
Solución.-
Se utiliza la Desigualdad de Chebychev debido a que no se conoce la forma de distribución

de la variable aleatoria poblacional X; su media es µ y su varianza es 𝜎 2 = 100.
a) La desigualdad está dada por: P(|𝑋̅ − µ| < 0.1)≥ 0.95. El valor de 𝑘 2 , se determina
1 1
como sigue: 1- = 0.95; 𝑘 2 -1=0.95𝑘 2 ; 𝑘 2 = = 20; seguidamente se determina el valor
𝑘2 0.05
𝜎 𝜎 𝑘𝜎
de n tomando en cuenta lo siguiente: k = 0.1; ya que ℰ = k𝜎𝑋̅ = k 𝑛; √𝑛 = 0.1; de donde se
√𝑛 √
20∗100
obtiene el valor de n; o sea: n = (0.1)2
= 200.000. Esta muestra es extremadamente grande
para fines prácticos; por lo que, es necesario realizar un ajuste severo; lo cual, se logra
aumentando el margen máximo de error, por ejemplo a ℰ =±5, que genera una muestra de
tamaño 80.
b) La desigualdad está dada por: P(|𝑋̅ − µ| < 0.1)≥ 0.99. El valor de 𝑘 2 , se determina
1 1
como sigue: 1- 𝑘 2 = 0.99; 𝑘 2 -1=0.99𝑘 2 ; 𝑘 2 = 0.1 = 100; seguidamente se determina el valor
𝜎 𝜎 𝑘𝜎
de n tomando en cuenta lo siguiente: k = 0.1; ya que ℰ = k𝜎𝑋̅ = k 𝑛; √𝑛 = 0.1; de donde se
√𝑛 √
100∗100
obtiene el valor de n; o sea: n = (0.1)2
= 1.000.000. Esta muestra es aún mucho más
grande que del inciso a); por lo que, es necesario realizar el ajuste, tanto en el nivel de
confiabilidad, como en el margen máximo de error, por ejemplo la confiabilidad a 95% y el
margen de error a ±5, para obtener una muestra aleatoria de tamaño 80.
1.13.3.5 ¿Cuántas veces habrá que lanzar un dado a fin de estar un 95% seguro de que la
frecuencia relativa que salga un 6 difiera 0.1 de la probabilidad teórica 1/6?.
Solución. -
1
P = probabilidad de que salga la cara con el seis al lanzar un dado regular; ℰ< 0.10,
6
1
diferencia entre el valor de 𝑃̂ y de P = 6; el nivel de confiabilidad es: 1 – 𝜶 = 0.95. Utilizando
la distribución normal estándar se tiene: P(|𝑃̂ − 𝑃| < 0.1) = 0.95; luego el número de
lanzamientos que se debe realizar para cumplir con los requisitos requeridos está dado
1 5
(1.96)2 ( )( )
6 6
por: n = (0.10)2
= 53.
1.13.3.6 Si una variable de una poblacion (X) tiene por desviación estándar igual a 2 y 𝑋̅ es
52
la media de muestras de tamaño 100. Hallar los límites entre los cuales estará situado el
margen máximo de error o la precisión de 𝑋̅; o sea, ℰ = ±(𝑋̅ - µ) con probabilidad de 0.90.
Utilizar la Desigualdad de Chebychev y el Teorema Central del Límite.
Solución.-
X es una variable aleatoria poblacional con 𝜎𝑋 = 2; n = 100 y 𝑋̅ es la media de esta muestra

aleatoria, calcular el valor de ℰ = |𝑋̅ − µ| con un 90% de confianza.
1
a) Utilizando la Desigualdad de Chebychev se obtiene: P(|𝑋̅ − µ| ≤ ℰ)≥ 0.90; 1 - 𝑘 2 = 0.90;
1 𝜎 2
𝑘 2 -1=0.90𝑘 2 ; luego 𝑘 2 = 0.10 = 10; ℰ = ±k = ±3,1623 = ±0,632.
√𝑛 √100
𝜎 2
b) Utilizando la distribución normal estándar se obtiene: ℰ = ±Z = ±1,645 = ±0,329.
√𝑛 √100
c) La diferencia está en que al utilizar la Desigualdad de Chebychev no se conoce la forma
de distribución de la variable aleatoria poblacional X; en cambio, al utilizar la distribución
normal estándar se supone que la variable aleatoria poblacional X tiene distribución normal
general. En este último caso, los valores de 𝑋̅ están concentrados alrededor de µ; en
cambio en el primer caso no. Estas son las razones por las cuales, se presenta la
diferencia.
1.14 Problemas propuestos para resolver.-
1.14.1 De una determinada población con media desconocida y varianza igual a la unidad,
que tamaño de muestra habrá que tomar, sabiendo que la probabilidad de que la media
muestral difiera menos de 0.5 de la media poblacional, sea al menos de 0.95.
1.14.2 ¿Qué tamaño de muestra se deberá tomar a fin de tener una probabilidad de 0.95
por lo menos, de que la proporción muestral (𝑃̂ ) difiera de la proporción poblacional (P) en
menos de 0.01?.
1.14.3 Determinados artículos se producen de tal manera que la probabilidad de que un

artículo sea defectuoso es P (desconocida). Un número grande de estos artículos (n) se
clasifican como defectuosos o no defectuosos. Cuál debe ser el tamaño de la muestra
aleatoria, de modo que podamos estar seguros el menos el 95% de que la proporción
muestral de los defectuosos (𝑃̂ ) difiera de la proporción poblacional (P) en menos de 0.05.
1.14.4 Utilícese la Desigualdad de Chebychev para hallar cuantas veces debe lanzarse
una moneda bien equilibrada para que la probabilidad de que la proporción de caras esté
comprendida entre 0.4 y 0.6, sea al menos 0.90.
1.14.5 Un fabricante de juguetes empacó éstos a razón de 80 por caja para enviarlos a las
jugueterías. El peso de uno de estos juguetes es una variable aleatoria con media de 12
onzas y desviación estándar 4 onzas. Se representa el peso de esas cajas por Y. Hallar la
probabilidad de que una caja seleccionada al azar pese entre 50 y 70 libras.
1.14.6 En una zona productora de papa el rendimiento medio es de 9.000 kgrs. y una
desviación estándar de 2.400 kgrs. por hectárea. Se representa con Y la producción total
en 250 hectáreas cultivadas en esa zona (n = 250). a) Hallar la distribución de Y. b)
calcular el volumen medio y la desviación estándar de la producción en las 250 has.
53
cultivadas, c) Hallar la probabilidad de que la producción total se encuentre entre 2.000 y
2.500 toneladas.
1.14.7 Suponiendo que, en una empresa de transporte de carga, el peso medio de los
bultos o fardos que se despachan es de 60 kgrs., con desviación estándar de 10 kgrs.
Hallar la probabilidad de que 80 fardos recibidos al azar y cargados en uno de los
camiones de transporte excedan la capacidad máxima de carga del camión señalada en
5.000 kgrs. NOTA: 80 fardos constituyen una muestra aleatoria.
1.14.8 El propietario de un supermercado (sección carnicería) ha determinado que la

demanda diaria de carne tiene una distribución normal, con media de 240 kgr. y desviación
estándar de 23 kgr. Que cantidad de carne debe estar disponible semanalmente (siete
días) para atender al 99% de la demanda semanal.
1.14.9 Un ingenio azucarero del país tiene una producción media de 500 toneladas por día
con una desviación estándar de 50 toneladas de azúcar. Los compromisos para proveer al
mercado local y exportaciones alcanzan a 50.000 ton. por trimestre. Hallar la probabilidad
de que ese ingenio azucarero cubra sus compromisos.
1.14.10 Una fábrica ensambla estufas a razón de 500 por día. Al efectuar la inspección
después del ensamblado final, se encuentra que el promedio de estufas defectuosas es de
5%. Hallar la probabilidad de que la producción de los próximos dos meses (n = 40 días)
contenga menos de 900 estufas defectuosas.
54

Capitulo I - Muestreo Aleatorio y Distribuciones Muestrales

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Capitulo I - Muestreo Aleatorio y Distribuciones Muestrales

Cargado por

Copyright:

Formatos disponibles

MUESTREO ALEATORIO Y DISTRIBUCIONES EN EL MUESTREO

Definición.- En estadística población o universo es un conjunto de personas,

 Ingreso mensual, expresado en bolivianos (Y)

Son aquellas que tienen un número no numerable de unidades o elementos; ejemplo:

1.2 Muestreo Estadístico

1.2.1 Justificación del Uso de Muestreo

Es común, tanto en los problemas cotidianos como en las investigaciones científicas, el

Es factible obtener conclusiones sobre un conjunto sin que necesariamente se analice

Si se desea realizar una estimación de radioyentes, de las estaciones de radio de una

1.2.2 Muestra No Aleatoria

Por muestra No Aleatoria o Muestra No Probabilística se entiende la selección de una

Se distinguen DOS tipos de muestras no probabilísticas: Intencionales y

Se dice que la muestra es Circunstancial cuando los elementos de la muestra se toman

Si en una encuesta por muestreo se pretende estimar la proporción de alumnos que

1.2.3 Muestreo Aleatorio Simple

a) Se enumeran progresivamente los nombres de los 2.500 obreros, de tal manera

1.2.4 Notación y Conceptos Básicos

El tamaño de la población finita se simboliza con N mayúscula, por tanto N indica el

1.2.5 Muestra Aleatoria

En la mayoría de las situaciones que se realizan las investigaciones económicas, sociales

En el ejemplo expuesto bajo el procedimiento de extracción con restitución se tienen los

I. P(Xi; ϴ) = P(X; ϴ) para toda Xi; tal que i = 1, 2, 3, …… , n

1.2.6 Implicaciones de la definición anterior de muestra aleatoria

MY(t) = E(℮𝑡𝑌 ) = E(℮𝑡 ∑ 𝑋𝑖 ) = E(etX1) E(etX2) E(etX3) …….. E(etXn)

= E(etX) E(etX) E(etX) ………. E(etX) = {E(etX)}n = {MX(t)}n (5)

Casos particulares son cuando r = 1; es decir, M1 es la media esperada de la variable

Un caso particular es cuando r = 2, donde se obtiene la varianza de la población X; es

1.3 Distribución de Probabilidad de la Media de una Muestra Aleatoria

̅ de poblaciones infinitas o selección de los elementos de

a) Media esperada: E(𝑋̅) = µ; la cual es la medida de tendencia central de 𝑋̅.

La demostración de los incisos a) y b) es:

Ejemplo.- Para la variable poblacional gasto mensual (X) expresado en miles de

b) La varianza de la variable poblacional (X) está dada por:

– 72 = 57 – 49 = 8 (miles de bolivianos)2, luego la desviación estándar es: σ = √8 =

Probabilidad de obtener un valor de X

d) El Cuadro 3.1 y el Grafico 3.1 corresponden a la distribución de probabilidad del

b) Las medias de estas muestras posibles de obtenerse (𝑋̅i) son: 3, 4, 5, 6, 7, 4, 5, 6, 7,

La distribución de probabilidad de 𝑋̅ presentada en el Cuadro 3.2 y el Grafico 3.2

𝑋̅i ei P(𝑋̅i) 𝑋̅i P(𝑋̅i) 𝑋̅i2 P(𝑋̅i)

En donde ei son las frecuencias absolutas esperadas de cada valor de 𝑋̅i.

d) E(𝑋̅) = Σ𝑋̅i P(𝑋̅i) = 7. Esta media esperada de la media de la muestra es igual a la

e) Para calcular la desviación estándar de 𝑋̅, primero se calcula la varianza de la

En la vida real se utiliza la formula debido a que no es posible obtener la distribución de

f) La representación gráfica de la distribución de probabilidad de 𝑋̅ se presenta en el

Variable Obs Mean Std. Dev. Min Max

̅ de muestras extraídas sin restitución de una población

a) Media esperada: E(𝑋̅) = µ; la cual es la medida de tendencia central de 𝑋̅.

Demostración de los incisos a) y b).-

a) Las 10 muestras aleatorias posibles de obtenerse son las siguientes:

b) Las medias de estas muestras posibles de obtenerse (𝑋̅i) son: 4, 5, 6, 7, 6, 7, 8, 8, 9, 10

La distribución de probabilidad de 𝑋̅ anterior y el Grafico 3.3 muestran que esa distribución

𝑋̅i ei P(𝑋̅i) 𝑋̅i P(𝑋̅i) 𝑋̅i2 P(𝑋̅i)

En donde ei son las frecuencias absolutas esperadas de cada valor de 𝑋̅i.

e) Para calcular la desviación estándar de 𝑋̅, primero se calcula la varianza de la misma;

f) La representación gráfica de la distribución de probabilidad de 𝑋̅ se presenta en el

1.4 Teorema Central del Límite

Si X es una variable aleatoria con función de probabilidades P(X) o f(X), la función

Si Y = X + k; en la cual k es una constante, entonces la función generadora de Y es:

M(Y)(t) = M(X + K)(t) = E[𝑒 𝑡(𝑋+𝑘) ] = 𝐸[𝑒 𝑋𝑡+𝑘𝑡 ] = 𝑒 𝑘𝑡 E(𝑒 𝑡𝑋 ) = 𝑒 𝑘𝑡 MX(t)

1.4.1 Función Generadora de Momentos de una Variable Aleatoria Distribuida

Utilizando la siguiente igualdad: X = σZ + µ y aplicando las dos propiedades de la función

Si X es una variable aleatoria distribuida según la normal con media µ y varianza 𝜎 2 ,