Está en la página 1de 19

Variables aleatorias conjuntas

M. en A. Vctor D. Pinilla Morn


Facultad de Ingeniera, UNAM
Resumen
La finalidad de la Inferencia Estadstica. El concepto y la
definicin de muestra aleatoria y estadstico.
El concepto, la definicin y las diferencias de la distribucin
poblacional, la muestral y la de frecuencias. El concepto y la
definicin de un estimador de un parmetro. Diferencia entre
parmetros de la poblacin y sus estimadores estadsticos y los
valores de estos estadsticos que se obtienen de la muestra. Las
medidas de la muestra como puntos del estadstico
correspondiente.
Estudio y caracterizacin de las distribuciones muestrales de la
media, diferencia de medias, varianza, relacin de varianzas,
proporcin y diferencia de proporciones.
Distribuciones t-Student, X2 (ji-cuadrada), y F-Fisher.

6.1 El concepto y la definicin de


muestra aleatoria y estadstico.
Muestreo aleatorio simple.

Los conceptos bsicos de Probabilidad y de


distribuciones muestrales sirven como
introduccin al mtodo de Inferencia
Estadstica; esta se compone en dos reas:
Estimacin
Pruebas de Hiptesis
La estimacin se encarga de buscar
establecer los valores de los parmetros de
la poblacin.
Las pruebas de Hiptesis constituyen un
proceso relacionado con aceptar o rechazar
declaraciones acerca de los parmetros de la
poblacin.
Supngase que un fabricante de lpices
compra a un proveedor borradores
engomados. El fabricante tiene que decidir
si el lote de borradores del proveedor es de

Probabilidad y Estadstica
Noviembre 2009

M.A. Vctor Damin Pinilla Morn.


81

calidad aceptable, si contiene el 15% o


menos borradores defectuosos.
Desde luego, no puede inspeccionar cada
borrador engomado del lote. Debido a esto,
obtiene una muestra de 20 borradores de
cada lote y la inspecciona. Decide que si
hay 3 o menos borradores defectuosos en la
muestra, aceptar un lote; si hay ms de 3
defectuoso rechazar el lote y lo de volver
al proveedor. Sin embargo, si acepta un lote
cuando ste contiene ms del 15% de
borradores defectuosos, ha cometido un
error. Por otra parte si rechaza un lote
cundo contiene menos del 15% de
borradores defectuosos, tambin ha
cometido un error.
Con base en la evidencia proporcionada por
la muestra, el fabricante ha tratado de
responder a la pregunta tiene el lote una
proporcin de lpices defectuoso tan grande
que sea necesario rechazarlo?
Al responder a esto, el fabricante de lpices
ha tomado una decisin acerca de la
proporcin de defectos en la poblacin
general, ya que la proporcin en la
poblacin es un parmetro de la poblacin y
las decisiones acerca de los parmetros de
la poblacin constituyen el proceso de
pruebas de hiptesis, en realidad el
fabricante ha realizado la tarea de probar
hiptesis.
Si el fabricante est interesado en estimar la
verdadera proporcin de defectos con base
a su informacin muestral, tendr que
intentar responder a la pregunta Qu
afirmacin puedo hacer acerca de la
proporcin de la poblacin que es
defectuosa? Esta pregunta corresponde a
Estimacin.
Finalidad. La Teora de la Inferencia
Estadstica, se compone de aquellos
mtodos con los cuales se pueden realizar
generalizaciones de una poblacin a partir
de los atributos de una muestra.

Probabilidad y Estadstica
Noviembre 2009

Concepto y definicin de muestra


aleatoria y estadstico. La esencia de la
inferencia estadstica es conocer la
naturaleza de las poblaciones. Una
poblacin representa el estado de la
naturaleza o la forma de las cosas con
respecto a un fenmeno aleatorio en
particular, mismo que puede identificarse a
travs de una caracterstica medible X. La
manera en que ocurren las cosas en relacin
con X pueden definirse por un modelo de
probabilidad que recibe el nombre de
distribucin de probabilidad de la
poblacin.
Por otro lado, la muestra es una coleccin
de datos que se obtienen al llevar a cabo
repetidos ensayos de un experimento para
lograr una evidencia representativa acerca
de la poblacin en relacin con la
caracterstica X. Si la manera de obtener la
muestra es imparcial y tcnicamente buena,
entonces la muestra puede contener
informacin til con respecto al estado de la
naturaleza y a partir de ello se podrn
formular inferencias. Ahora bien, estas
ltimas son inductivas y, por lo tanto, estn
sujetas a riesgo, dado que representan un
razonamientos que va de lo particular a lo
general.
Como la inferencia estadstica se formula
con base en una muestra de objetos de la
poblacin de inters, el proceso por medio
del cual se obtiene ser aquel que asegure la
seleccin de una buena muestra. El proceso
que se privilegia es el muestreo aleatorio
simple, En este contexto, la palabra
aleatorio sugiere una total imparcialidad en
la seleccin de la muestra.
En el caso de experimentos que involucran
fenmenos aleatorios en la Ingeniera y las
ciencias fsicas, la poblacin se considera
constituida por un nmero infinito de
posibles
resultados
para
alguna
caracterstica medible de inters.

M.A. Vctor Damin Pinilla Morn.


82

El procedimiento para muestrear este tipo


de poblacin es disear un experimento y se
llevarlo a cabo para proporcionar la
observacin X1 de la caracterstica medible
X. El experimento se repite bajo las mismas
condiciones proporcionando el valor X2. El
proceso se continuar hasta tener n
observaciones de la caracterstica X.
En esencia, las observaciones bajo las
mismas condiciones como resultado de
repetidos ensayos independientes de un
experimento constituye un muestreo
aleatorio simple con reemplazo. De acuerdo
con lo anterior, cada una de las
observaciones X1, X2, X3, . . ., Xn es una
variable aleatoria cuya distribucin de
probabilidad es idntica a la de la
poblacin.
De tal forma, si las variables aleatorias X1,
X2, X3, . . ., Xn tienen la misma distribucin
de probabilidad que la distribucin de la
poblacin y su funcin conjunta de
probabilidad es igual al producto de las
marginales, entonces X1, X2, X3, . . ., Xn
forman un conjunto de n variables
aleatorias independientes e idnticamente
distribuidas que constituyen una muestra
aleatoria de la poblacin.
Para colocar a las estadsticas en una mejor
perspectivas se debe definir y analizar un
parmetro de la poblacin.
Un parmetro es una caracterizacin
numrica de la distribucin de la poblacin
de manera que describe, parcial o
completamente, la funcin de densidad de
probabilidad de la caracterstica de inters.
Desde un punto de vista clsico (no
bayesiano), un parmetro se considera
como una constante fija cuyo valor se
desconoce.
Desde
una
perspectiva
bayesiana un parmetro siempre es una
variable aleatoria con algn
tipo de
distribucin de probabilidad.
Un estadstico1 es cualquier funcin de las
variables aleatorias que se observaron en la
muestra de manera que esta funcin no
contiene cantidades desconocidas.
1

Tambin son llamados estadsticas

Probabilidad y Estadstica
Noviembre 2009

De manera general, dentese a un


estadstico como T = ( X ) . Dado que T
es una funcin de variables aleatorias, es en
s misma una variable aleatoria. Si se utiliza
un estadstico T para estimar un parmetro
desconocido , entonces T recibe el
nombre de estimador de . Esto es, un
estimador es un estadstico que identifica el
mecanismo funcional por medio del cual,
una vez que las observaciones en la muestra
se realizan, se obtiene una estimacin.
Un estadstico es, sustancialmente, diferente
de un parmetro. Un parmetro es una
constante y un estadstico es una variable
aleatoria
Los parmetros o sus funciones se estiman
se estiman con base en estadsticos que, a
su vez se obtienen a partir de la informacin
contenida en una muestra aleatoria.
Concepto, definicin y diferencias de la
distribucin poblacional, muestral y de
frecuencias. Como se ha comentado ya, la
forma en que la estadstica descriptiva
organiza los datos obtenidos a partir de un
proceso de muestreo se denomina
distribucin de frecuencias; su uso
fundamental es construir las grficas
descriptivas histograma, polgono y ojiva
de frecuencias.
Asimismo, la distribucin poblacional es
aquella que describe el comportamiento de
un atributo de una poblacin. Se ha dicho
que los atributos (parmetros) son
constantes, aunque no siempre conocidos.
La distribucin muestral de un estadstico T
es la distribucin de probabilidad de T que
puede obtenerse como resultado de un
nmero infinito de muestras aleatorias
independientes, cada una de tamao n,
provenientes de la poblacin de inters.
Dado que se supone que las muestras son
aleatorias, la distribucin de un estadstico
es un tipo de modelo de probabilidad
conjunta
para
variables
aleatorias
independientes, en donde cada variable
posee una funcin de densidad de
M.A. Vctor Damin Pinilla Morn.
83

probabilidad igual a las dems. De manera


general, la distribucin de muestreo de un
estadstico no tiene a misma forma que la
funcin de densidad de probabilidad en la
distribucin de la poblacin.

La media de la poblacin es:

El concepto y la definicin de un
estimador de un parmetro. Diferencia
entre parmetros de la poblacin y sus
estimadores estadsticos y los valores de
estos estadsticos que se obtienen de la
muestra. Un estimador es una regla o
frmula que nos dice cmo calcular una
estimacin numrica con base en las
determinaciones contenidas en una muestra,
es decir, es la regla de correspondencia a
partir de la cual con un estimador podemos
inferir el valor de un parmetro. Como se
ha mencionado, los estadsticos provienen
de muestras obtenidas aleatoriamente, por
lo cual un estadstico es una variable
aleatoria, mientras que los parmetros son
caractersticas de una poblacin, que si bien
pueden ser desconocidas, se consideran
constantes.

La varianza: 2 =

= X P( X ) =
i =1

1
(1 + 2 + 3 + 4 + 5 + 6) = 3.5
6

( X ) P( X )
2

i =1

La desviacin estndar: = 1.708


Ahora bien, se define el experimento lanzar
el dado en dos ocasiones y obtener el
promedio de los dos resultados de las caras
que quedan hacia arriba. De esta forma el
experimento consiste en tomar muestras
independientes de tamao dos y repetirlo 36
veces.
El espacio muestral del experimento es:

Las medidas de la muestra como puntos del


estadstico correspondiente.
Ejemplo. Una poblacin perteneciente al
lanzamiento de un dado se compone de
todos sus posibles resultados, es decir, de
los nmeros 1,2,3,4,5 y 6 (son el nmero
que queda en la cara superior al lanzarlo).
Consideraciones:
El dado no est cargado, lo que
implica la independencia de los
resultados si el dado es lanzado en
varias ocasiones.
El dado se puede lanzar el nmero
de veces deseado. Esto implica que
el experimento se puede realizar un
nmero infinito de veces.

1,1
1,2
1,3
1,4
1,5
1,6

2,1
2,2
2,3
2,4
2,5
2,6

3,1
3,2
3,3
3,4
3,5
3,6

4,1
4,2
4,3
4,4
4,5
4,6

5,1
5,2
5,3
5,4
5,5
5,6

6,1
6,2
6,3
6,4
6,5
6,6

La distribucin de las medias de los


resultados es:
1
1.5
2
2.5
3
3.5

1.5
2
2.5
3
3.5
4

2
2.5
3
3.5
4
4.5

2.5
3
3.5
4
4.5
5

3
3.5
4
4.5
5
5.5

3.5
4
4.5
5
5.5
6

Estos elementos nos permiten afirmar que


corresponden a un muestreo aleatorio
simple con reemplazo.

Probabilidad y Estadstica
Noviembre 2009

M.A. Vctor Damin Pinilla Morn.


84

La media de la distribucin de resultados


es:

X =

1
[1 + 1.5 + 2 + 2.5 + ... + 5.5 + 6] = 3.5
36

A partir del Teorema del Lmite Central:

X = X

2
X

X2
n

Comprobando con nuestro ejemplo:


La varianza y desviacin estndar son:

X = 3.5

X = 3 .5

X2 = 1.458
X2
n

= 1.208
Contrastando ambos grupos de resultados:

Media
Varianza
Desviacin Estndar

Poblacin
3.5
2.9173
1.708

Muestra
3.5
1.458
1.208

Qu es lo que debi esperarse de esta


comparacin?

2.9173
= 1.458
2

Como se ver posteriormente, la


importancia de la Distribucin Normal no
estriba en el hecho de que realmente se
obtengan numerosas variables distribuidas
de una forma aproximadamente normal,
sino tambin la gran cantidad de mtodos y
tablas estadsticas que es posible deducir
para la distribucin normal, y que se pueden
aplicar, incluso en el caso de distribuciones
que se apartan de la normal. En particular,
mltiples tcnicas estadsticas para el
muestreo emplean la distribucin normal.

6.2 Teorema del lmite central.


Este fenmeno es descrito por el Teorema
de Lmite Central, el cual establece:
Cuando una muestra de tamao n se toma
de una poblacin con media y varianza
finita 2 , se tienen n variables aleatorias
independientes X1, X2, X3, . . . , Xn que
poseen la misma distribucin, al
incrementarse n, la distribucin de las
medias muestrales se aproxima a la normal
con media y varianza

X2
n

La nica limitacin en la distribucin


subyacente consiste en que la varianza es
finita, y esto ocurre en casi todos los
problemas de ciencias e Ingeniera.

Probabilidad y Estadstica
Noviembre 2009

Estudio y caracterizacin de las


distribuciones muestrales. Las muestras
aleatorias obtenidas de una poblacin son,
por naturaleza propia, impredecibles. No
esperaramos que dos muestras aleatorias
del mismo tamao y tomadas de la misma
poblacin tengan la misma media muestral
o que sean completamente parecidas; puede
esperarse que cualquier estadstico, como la
media muestral, calculado a partir de las
medidas en una muestra aleatoria, cambie
su valor de una muestra a otra; por ello,
queremos estudiar la distribucin de todos
los valores posibles de un estadstico. Tales
distribuciones sern muy importantes en el
estudio de la estadstica inferencial, porque
las inferencias sobre poblaciones se harn
usando estadsticas muestrales.
Con el anlisis de las distribuciones
asociadas con los estadsticos muestrales,
podemos juzgar la confiabilidad de un
estadstico muestral como un instrumento

M.A. Vctor Damin Pinilla Morn.


85

para hacer inferencias sobre un parmetro


poblacional desconocido.
Como los valores de un estadstico varan
de una muestra aleatoria a otra, se le puede
considerar como una variable aleatoria con
su
correspondiente
distribucin
de
frecuencias. La distribucin de frecuencia
de un estadstico muestral se denomina
distribucin muestral. En general, la
distribucin muestral de un estadstico es la
de todos sus valores posibles calculados a
partir de muestras del mismo tamao.

Dado lo anterior, existen distribuciones de


muestreo para la media ( X ), diferencia de
medias ( X 1 X 2 ), varianza ( S 2 ), relacin
de

varianzas

S12
),
S 22

proporciones

diferencia de proporciones, entre otros.

6.3 Distribucin de la media muestral.


Distribucin muestral para X (media de
la muestra). La media muestral se utiliza
para estimar a la media de la poblacin.

X=

n
1
( X 1 + X 2 + X 3 + ... + X n ) = 1 X i
n
n i =1

y como se ha dicho, es una variable


aleatoria.
Partiendo del hecho de que se desconoce la
distribucin de la poblacin, y por ende la
distribucin de X i , lo que implica que es
imposible obtener una distribucin muestral
de X .
Ms adelante se explicar que una de las
cualidades ms importantes de un estimador
es que se cumpla la siguiente propiedad:

E {} =

donde : es un estimador y es un
parmetro.

En la pgina siguiente se muestra un


diagrama a bloques que denota los efectos
del reemplazo en el muestreo aleatorio
simple.
En resumen, la Distribucin muestral de un
estadstico T es la distribucin de
probabilidad de T que puede obtenerse
como resultado de un nmero infinito de
muestras aleatorias independientes, cada
una de tamao n, provenientes de la
poblacin de inters.
Probabilidad y Estadstica
Noviembre 2009

M.A. Vctor Damin Pinilla Morn.


86

Connotaciones derivadas por el tipo de reemplazo en el Muestreo Aleatorio Simple

Caso 1

Experimento que arroja


resultados independientes
(generalmente intangibles)

M. A. S.
con reemplazo

Cada una de las


observaciones representa
una variable aleatoria cuya
distribucin de probabilidad
es idntica a la de la
poblacin

Variable Aleatoria
Independiente e
Indnticamente Distribuida

IID

Caso comn en los


experimentos de
Ingeniera o Ciencias
Duras

Caso 2

Se extrae un objetgo, se
observa y se regresa a la
poblacin

M. A. S.
con reemplazo

Se obtienen
consecutivamente sin
reemplazo

M. A. S.
sin reemplazo

Este es un caso
particular del caso 1,
ya que si la
poblacin es
relativamente
pequea, durante el
muestreo es muy
probable que el
mismo objeto sea
seleccionado ms de
una vez.

Los objetos medibles son


finitos

Cada una de las


observaciones son variables
aleatorias cuyas
distribuciones marginales
son iguales a las de la
poblacin

Caso 3

E{X } =

Conceptualmente, pensemos que el valor


esperado de la media de la muestra ser la
media de la poblacin.

sustituyendo en esta ltima expresin la


definicin (1)

Debe recordarse que el valor esperado de


una variable aleatoria X i es la media .

E{X } =

E{X i } = --- (1)


Si X =

1
[E{X 1 }+ E{X 2 }+ ... + E{X n }]
n

1
[ + + ... + ] = 1 [n ]
n
n
E{X } =

1 n
X i entonces
n i =1

De la misma forma, utilizando el operador


varianza:

E{X } = E X i = E ( X 1 + X 2 + ... + X n )
n

i =1

Probabilidad y Estadstica
Noviembre 2009

1 n

Var{X } = Var X i = Var ( X 1 + X 2 + ... + X n )


n
n

i =1

M.A. Vctor Damin Pinilla Morn.


87

Var{X } =

1
[Var{X 1 }+ Var{X 2 }+ ... + Var{X n }]
n2

Var{X } =

1
[ + + ... + ] = 12 [n ]
2
n
n
Var{X } =

Estas ltimas expresiones son el resultado


de aplicar los operadores valor esperado y
varianza
para
variables
aleatorias
independientes.
Tal y como lo manifest el Teorema del
Lmite Central, estas expresiones son
vlidas
para
variables
aleatorias
independientes, es decir, para aquellas que
provienen de muestreos aleatorios con
reemplazo, o bien, para poblaciones
infinitas (muy grandes).

Desde un punto de vista prctico, lo que


importa en realidad, cuando el muestreo se
hace sin reemplazo y se calcula X es el
tamao de la muestra con respecto al de la
poblacin; entre los investigadores hay un
acuerdo generalizado de que cuando el
tamao de la muestra no es mayor del 5%
del de la poblacin, la poblacin puede
considerarse grande respecto al tamao de
la muestra, y la independencia estadstica
de los valores muestrales se supone
generalmente como una aproximacin a la
realidad; sin embargo, cuando se toman
muestras sin reemplazo de poblaciones
pequeas, la dependencia estadstica entre
los valores debe tomarse en consideracin.
Supongamos que la desviacin estndar de
una poblacin grande de la que se toman
muestras es = 12 , y que se han elegido
muestras de tamao n = 4 . El error
estndar es:

Resumiendo:

X = x
X2 =

X2
n

A X (desviacin estndar) se le suele


denominar como error estndar. La
desviacin estndar de la distribucin
muestral de la media X se ve afectada por
el tipo de muestreo. Si la muestra se toma
de una poblacin pequea y con reemplazo,
cada medida en la muestra es independiente
de cualquier otro valor, y el muestreo puede
hacerse indefinidamente como si se tratara
de una poblacin grande; en poblaciones
grandes, donde el muestreo se hace sin
reemplazo, la dependencia estadstica de un
valor a otro es tan insignificante que
usualmente se ignora, pero si el muestreo se
hace en una poblacin pequea y sin
reemplazo, los valores muestrales no son
estadsticamente independientes y este
hecho debe tomarse en cuenta cuando se
calcula X .

Probabilidad y Estadstica
Noviembre 2009

X =

X
n

12
=6
4

Si ahora se aumenta el tamao de la


muestra a n = 16 , ahora:

X =

X
n

12
=3
16

Se observa que si el tamao de la muestra


crece, el error estndar decrece, lo que
implica que las medias muestrales se
acumulan ms cercanamente a su media .
Si el tamao de la muestra es grande, la
media ser ms parecida a la media
poblacional como cualquier otra media en
la misma distribucin muestral de la media,
ya que las medias se acumulan
cercanamente alrededor de .
Por otra parte, cuando la poblacin es finita
y el muestreo se hace sin reemplazo, el
error estndar se altera; esto debido a la
alteracin de la probabilidad al seleccionar
una muestra.

M.A. Vctor Damin Pinilla Morn.


88

Para reducir esta alteracin se debe


multiplicar al error estndar por un factor
de correccin, usualmente denominado
Factor de Correccin para Poblacin Finita.

FCPF =

N n
N 1

Por lo anterior, el error estndar para


poblaciones finitas con muestreo sin
reemplazo es:

X =

N n
N 1

donde N es el tamao de la poblacin y n es


el tamao de la muestra.

La desviacin estndar poblacional es:

(6 4)2 + (4 4)2 + (2 4)2

X =

Todas las posibles muestras son:


Muestras

Antigedad

Hugo, Luis
Luis, Hugo
Luis, Paco
Paco, Luis
Hugo, Paco
Paco, Hugo

(6,2)
(2,6)
(2,4)
(4,2)
(6,4)
(4,6)

uno si N .

N n
tiende a
N 1

Trabajador
Hugo
Paco
Luis

Antigedad
6
4
2

Suponga que se toman muestras aleatorias


de tamao 2 sin reemplazo y se calcula la
antigedad media para cada una de ellas; la
coleccin de las medias muestrales
constituir la distribucin muestral de la
media.
La media poblacional es:

2+4+6
=4
3

Probabilidad y Estadstica
Noviembre 2009

4
4
3
3
5
5

La media muestral es:


X=

4+ 4+3+3+5+5
=4
6

El error estndar es:


X =

Ejemplo. Se dispone de tres trabajadores


con las siguientes antigedades:

Media Muestral

El error estndar corregido es equivalente al


error estndar para el muestreo con
reemplazo cuando N es infinitamente
grande, ya que el valor de

= 1.63

(4 4)2 + (4 4)2 + (3 4)2 + (3 4)2 + (5 4)2 + (5 4)2


6

Comprobando la relacin entre la


desviacin estndar poblacional y el error
estndar:

X =

X
n

N n 1.63 3 2
=
= 0.82
N 1
2 3 1

Si bien es imposible determinar la


distribucin muestral de X cuando se
desconoce la distribucin de la poblacin,
posible calcular la distribucin lmite
cuando n de una variable aleatoria
cuyos
valores
estn
estrechamente
relacionados con X . Por otra parte, se
puede demostrar que para un valor grande
de n la distribucin de
X
es
aproximadamente normal. De hecho, no
importa si no se conoce la distribucin de la
poblacin mientras la media y la varianza
existan, la distribucin de muestreo de X
se encontrar aproximada por la
distribucin normal con media y
M.A. Vctor Damin Pinilla Morn.
89

= 0.82

desviacin estndar

para valores

grandes de n, es decir, tal y como lo indica


el Teorema del Lmite Central, de acuerdo a
la siguiente definicin:
Sean X1, X2, ... , Xn n variables aleatorias
IID con una distribucin de probabilidad no
especificada y que tiene una media y
varianza

X=

1
( X 1 + X 2 + ... + X n )
n

tiene

una

2
n

que tiende hacia la distribucin normal


conforme n tiende a infinito:

Limn

=Z

n
Debe hacerse notar que si la distribucin de
probabilidad de la poblacin es semejante a
la distribucin normal (relativamente
simtrica y una concentracin relativa
alrededor del eje de simetra), la
aproximacin a la normal ser aceptable.
En caso contrario, slo se tendr una
aproximacin aceptable para muestras
grandes, que en casos prcticos ocurre
cuando n > 30 .

Z=

conclusin,

aleatoria Y = X 1 + X 2 + ... + X n =

se

la

variable

utiliza

para

X=

1 n
Xi .
n i =1

expresiones X =

Probabilidad y Estadstica
Noviembre 2009

ambas

se sustituye en la definicin de la variable


aleatoria Z:

n (Y ) Y n
Z=
= n
=
=

n
n
n
n
X

Ejemplo. Una empresa de ferrocarriles ha


determinado que con un nuevo equipo se
requiere, en promedio, 6 horas para renovar
un km de va, con una desviacin estndar
de 3h. Cul es la probabilidad de que
tarden ms de 550 h para reemplazar 85 km
de va ?

6 + 3 hrs.

6 + 3 hrs.

6+3

Existen varios usos de esta variable


aleatoria Z conforme al Teorema del Lmite
Central.

i =1

Y
. Esta ltima expresin
n

formular

de la varianza poblacional 2 . La variable


Z obedece a la distribucin normal estndar
cuando el muestreo se lleva a cabo sobre
una poblacin que tiene distribucin
normal, o bien, cuando se desconoce su
distribucin, se considera normal si n es
grande.

Enfrentando

aleatoria

inferencias de cuando se conoce el valor

que representa la sumatoria de los efectos


de cada una de las variables aleatorias. Si

finita. El promedio muestral

distribucin con media y varianza

En

Efecto aditivo del TLC. Sea la variable

h
Se puede observar que cada uno de los 85
Km que se pretenden renovar es una
variable aleatoria, con media = 6 h y
= 3 h , por lo cual, la suma de todas ellas,

Y = 550 h , nos conforma el total del


experimento, cuyo plazo total se desconoce.

Y = X km1 + X km 2 + ... + X km85 = 550 h

M.A. Vctor Damin Pinilla Morn.


90

La pregunta de investigacin es:

P (Y > 550 ) = ?

Zn =

Y n n x

x n

68 70
= 2.11
6
40
72 70
=
= 2.11
6
40

Z inf =

550 85(6)
= 1.4462
3 85

Z sup

Por lo que:

P (68 < X < 72 ) = P ( 2.11 < Z < 2.11) .

A partir del uso de tablas:

1.45

Distribucin
Normal

De tablas:

P (Y > 550 ) = P (Z > 1.45) = 7.35%

Efecto promedio del TLC. La expresin


bsica que define a la variable aleatoria

Z=

= 70m
= 6m
n = 40

Se percibe que la solucin al problema


implica el rea promedio que puede cubir
un bote de pintura perteneciente a la
muestra obtenida al azar, lo que la define
como una variable aleatoria. Por otra parte,
al proporcionarse dos valores extremos se
infiere que la solucin ser un intervalo.
La pregunta es:
Aplicando el TLC:
Probabilidad y Estadstica
Noviembre 2009

-2.11

70
Muestra Normalizada

72
2.11

1 n
donde X = X i .
n i =1

Ejemplo. Una empresa fabricante de


pintura conoce que un bote cubre en
promedio 70 m2 con una desviacin
estndar de 6 m. Cul es la probabilidad de
que el rea media cubierta por un bote de
pintura de una muestra de tamao 40 est
entre 68 y 72 m2 ?
Datos:

68

De la misma forma en la cual se ha


estudiado el comportamiento del estadstico
X con el fin de realizar inferencias sobre el
parmetro , pueden desarrollarse otros
estadsticos ms. No obstante, si bien
X obedece a una distribucin normal
estndar, otros estadsticos obedecen a
distribuciones de probabilidad diferentes.
Principalmente son tres las distribuciones
de probabilidad ms utilizadas en procesos
de inferencia comunes. Conviene entonces,
antes de continuar con el desarrollo de
nuevos
estadsticos,
conocer
estas
distribuciones. Estas distribuciones al ser
aplicadas a estadsticos, los cuales
provienen de muestras, reciben el nombre
de Distribuciones Muestrales.

P (68 < X < 72 ) = ?

M.A. Vctor Damin Pinilla Morn.


91

6.4 Distribucin X 2 (ji cuadrada o chi


cuadrada).
Esta distribucin es un caso particular de
otras distribucin denominada gamma, que
no es motivo de esta curso, pero bien
conviene darla a conocer:
x

1
1

x
e
f ( x, , ) = ( )

x>0
otros casos

donde ( ) = x 1 e x dx

para =

y =2

La distribucin X 2 es un caso particular de


la distribucin gamma con =

y =2.

presenta un sesgo muy alto. A medida que


aumentan los grados de libertad, el peso de
la distribucin se desplaza a la derecha y se
vuelve menos sesgada.
Distribucin de muestreo de S 2 . Un
estadstico muy importante que permita
hacer inferencias sobre la varianza de la
poblacin 2 es la varianza de la muestra
S2.
A diferencia de la deduccin de la
distribucin de la media muestral, la cual
utilizando las ventajas del TLC no requiere
conocer la distribucin de la poblacin. En
la deduccin del muestreo de S 2 se
requiere de la suposicin de una poblacin
normalmente distribuida.
Se define a la varianza de la muestra como:

S2 =

(X
X

se define de la
La distribucin X
siguiente forma: Sean Z1, Z2, ... , Zn
variables aleatorias IID con distribucin
normal
estndar.
Entonces
2
2
2
2
2
X = Z1 + Z 2 + Z 3 + ... + Z n
es una
variable aleatoria que tiene la funcin de
densidad:

x
1
1
x 2 e 2

f x 2 ( x ) = 2 2

x>0
otros casos

la cual recibe el nombre de distribucin X 2


con grados de libertad. Esta distribucin
se denota por X (2 ) .
La media para la distribucin X 2 es : =
y su varianza : 2 = 2.
La distribucin

donde X1, X2, ... , Xn son una muestra


aleatoria con distribucin normal con media
y varianza 2 .
n
n
X
S 2 = i
= Zi

i =1
i =1
2

En la figura se muestran diversas formas de


la distribucin X 2 para distintos grados de
libertad. L a distribucin no es negativa y
es asimtrica a la derecha. A medida que
aumenta la distribucin se vuelve mas
simtrica. Cuando k , la forma limite
de la distribucin X 2 es la distribucin
normal.
PAGINA 267 HIMES

X 2 tiene como nico

parmetro a los grados de libertad , slo


posee valores positivos. Cuando los grados
de libertad son bajos, la distribucin
Probabilidad y Estadstica
Noviembre 2009

M.A. Vctor Damin Pinilla Morn.


92

La distribucin X 2 tiene media E { X 2 } =


y varianza Var { X 2 } = 2.
La distribucin X 2 presenta caractersticas
de aditividad de acuerdo con lo siguiente:
Sean

X 12 , X 22 ,..., X n2 variables aleatorias

independientes con distribucin X 2 y 1 ,


2 ,,n
grados de libertad
respectivamente.
La variable
Y = X 2 1 + X 2 2 +,..

S 2 es un estadstico importante, utilizado


para hacer inferencias con respecto a la
varianza de la poblacin. La varianza
muestral tiene la misma importancia para
formular inferencias sobre la varianza
poblacional 2 como la que representa la
x para la media
media muestral
poblacional x .
La varianza muestral se define como:

S2 =

+ X 2n =
con =

i tienen distribucin X 2

1 n
( Xi X )2

n i =1

i =1
n

grados de libertad.

S2 =

i =1

Con base en la definicin anterior, se define


el siguiente estadstico:
X 1 , X 2 ,...., X n una muestra
Sean
aleatoria con distribucin normal con media
y varianza 2 conocidas. Sea la
variable aleatoria Y, definida por:
n

Y=

(X
I =1

varianza 2 desconocidas. Asimismo, X


tiene distribucin normal con media y

Para obtener la distribucin del estadstico


S 2 se procede en la siguiente forma:
n

S2 =

Xi

i =1

Noviembre 2009

i =1

manipulando:

n 1

(n 1)S
2

( Xi X )

i =1

que

Y = Z 12 + Z 12 + ..... + Z n2 =
2

Probabilidad y Estadstica

( Xi X )

obtiene

Tiene distribucin
libertad.

La diferencia entre las dos versiones de S 2


se denotar captulos ms adelante, as
como la preferencia en su uso.

El estadstico Z tiene distribucin normal


estndar con = 0 y 2 =1
Se

tiene
Cada una de las muestras X I
distribucin normal con media y
varianza, por lo que es posible
estandarizarlas:

ZI =

donde X i es una variable aleatoria con


distribucin normal con media y

varianza

1 n
( Xi X )2

n 1 i =1

( X i ) 2

con grados de

tomando
n

exclusivamente

( Xi X )

el

trmino
igualmente

i =1

manipulndolo:

M.A. Vctor Damin Pinilla Morn.


93

despejando:
n

( Xi X ) = [( Xi ) ( X )]
2

i =1

( Xi )

i =1

i =1

= ( Xi ) 2( Xi )( X ) + ( X )
i =1

= ( Xi ) 2( X ) ( Xi ) + n( X )
2

i =1

(n 1) S 2

n( X ) 2

Analizando;
3

( Xi )

i =1

i =1

corresponde a

Z
i =1

2
i

de la cual se conoce que tiene distribucin


X 2 con = n grados de libertad.

Del segundo sumando se extrae el trmino


n

( Xi )
i =1

( Xi ) = Xi n
i =1

i =1

1 n
pero: X = Xi
n i =1

n( X ) 2

distribucin X

lo que implica

( X ) 2

tambin tiene

Xi = nX

pero al tratarse slo de X 2 , es decir, una


sola variable aleatoria, tiene un solo grado
de libertad.

i =1

( Xi ) = n( X )
i =1

Para que se cumpla la igualdad, se concluye


que:

sustituyendo de nuevo:
n

( Xi X )
i =1

= ( Xi ) 2 n ( X ) + n ( X )
2

i =1

(n 1) S 2

tiene distribucin X 2 con

V= n-1 grados de libertad.

= ( Xi ) 2 n( X ) 2

El estadstico utilizado para estudiar a la

i =1

sustituyendo de nuevo en la definicin


original

(n 1) S 2

( Xi )
i =1

Probabilidad y Estadstica
Noviembre 2009

n( X ) 2

varianza poblacional es X 2 =

(n 1) S 2

que tienen distribucin X 2


con = n-1 grados de
libertad, donde:

S2 =

1 n
( Xi X ) 2
n 1 i =1

M.A. Vctor Damin Pinilla Morn.


94

(a) P(S2 >50)

Xi tienen distribucin normal con media


y varianza 2 y X tiene tambin

Utilizando

distribucin normal pero con media y


varianza

X2 =

el

(n 1) S

estimador:

(24)(50) = 12
100

P(S2 >50) = P( X2 >12)


Finalmente,

Y=

(n 1)

definiendo

S 2 =

de tablas:

n 1

, entonces:

P( X2 >12)= 0.975

P(S2 >50)= 0.975

(b) P(S2 >150)

2 y 2
2
{
}
=
=
(n 1) = 2
E S 2 = E
E
y

1
1
1
n

n
n

{ }

X 2 = (24 )(150) 100 = 36


P(S2 >150)= P(X2 >36) = 0.05
(c)

[ ]

{ }

Var S 2 =
Ejemplo AL disear mecanismos para
lanzar cohetes hacia el espacio, es muy
importante estudiar la varianza de las
distancias al centro del blanco a las que cae
el proyectil. Esa varianza debe ser tan
pequea
como
sea
posible,
para
determinado mecanismo de lanzamiento se
sabe que esas distancias tienen una
distribucin normal cuya varianza es
2 = 100m 2 . Se lleva a cabo un
experimento en el que hay 25 lanzamientos.
Sea S2 la varianza de las distancias entre el
impacto del proyectil y el centro del blanco.
(a) Estimar P(S2 >50);
(b) Hallar P(S2 >50);
(c) Calcular E S 2 y V S 2 =100 m2

[ ]

[ ]

Datos:
Las distancias tienen distribucin
normal
2 = 100m 2
n = 25

Probabilidad y Estadstica
Noviembre 2009

[ ]

E S 2 y V S 2 =100 m2
2 4 2(100) 2
=
= 833.33
24
n 1

6.5 Distribucin t Student


Se recordar que cuando se muestra una
poblacin con distribucin normal con
desviacin estndar conocida , la
distribucin del estadstico Z =

es

n
la normal estndar.
Desde un punto de vista prctico, la
necesidad de conocer implica formular
inferencias con respecto a debido a que
generalmente se conoce el valor de la
desviacin estndar de la poblacin. Resulta
lgico entonces reemplazar con una
estimacin S; en consecuencia, la
distribucin de

X
cuando se muestrea
S
n

una poblacin normal con media

varianza desconocidas.
Se observan dos variables aleatorias X2 y
Z;
2

M.A. Vctor Damin Pinilla Morn.


95

X2
tiene distribucin chi-cuadrada

con grados de libertad


Z

tiene distribucin
estndar

La distribucin t tiene un valor esperado

E{} = 0

normal

para

Se define a la variable aleatoria como:

X2

x
S
n
1 n
S2 =
( Xi X ) 2 .

n 1 i =1

La variable aleatoria tiene distribucin tStudent con V grados de libertad y funcin


de densidad de probabilidad dada por:

t=

al valor

< t <

v +1

donde

Que se utiliza para hacer inferencias con


respecto a la media cuando el muestreo se
lleva a cabo sobre una poblacin normal
con media y varianza desconocidas.

v>0
Ejemplo. La resistencia a la tensin de
cierto tipo de alambre se distribuye
normalmente con y 2

recibe el nombre de

x2
v

v>2.

t=

v +1

2
2 t
1
ft (t ) =
+
v

En resumen, la principal aplicacin de la


distribucin t-student radica en la obtencin
del estadstico:

y varianza Var{} =

Desconocidas. Se seleccionan al azar seis


segmentos de alambre de un rollo grande y
se midi su resistencia a la tensin.
Encuentre la probabilidad de que el
promedio de la resistencia est a lo ms

variable aleatoria t-student.


La forma de la distribucin t-Student es
simtrica y uninodal e idntica en forma a
la curva normal, a diferencia de que esta
siempre est centrada en cero. Se puede
demostrar que la distribucin t-Student
tiende a ser la normal cuando
.

2S
de la verdadera media poblacional.
n

Regresando a la variable aleatoria ; de


acuerdo a su definicin:

Z
x

n
(n 1) S

n
S

x x
=
S
S
n

n 1

La probabilidad pedida es :

que tiene distribucin t-Student con = n-1


grados de libertad.

Probabilidad y Estadstica
Noviembre 2009

M.A. Vctor Damin Pinilla Morn.


96

= P( 2 < t < 2) = 0.9

Retomando cada caso.

Distribucin de la eficiencia entre dos


medias muestrales.
Una forma de aumentar el potencial de las
distribuciones y los estimadores obtenidos
es comparar dos poblaciones a travs de sus
muestras.
Poblacin X

Poblacin Y

x , x2

y , y2

Caso a) Retomando la distribucin de la


media muestral que es la distribucin con

Muestra Y

X , S x2 , n x

Y , S y2 , n y

media

ny
por lo que sustituyendo en el estadstico Z .

d) El muestreo se lleva acabo sobre


dos
poblaciones
normales
independientes
son
varianzas
diferentes conocidas x2 y2 .

e) El muestreo se lleva acabo sobre


dos
poblaciones
normales
independientes
con
varianzas
diferentes
desconocidas
x2 y2 .

( X Y ) ( x y )
1
1
+
nx n y

Caso b) Resulta necesario definir las


varianzas muestrales S x2 y S y2 , por lo que

c) El muestreo se lleva a cabo sobre


dos
poblaciones
normales
independientes
con
varianzas
iguales
desconocidas
2
2
x = y = .

y2

en virtud de que x2 = y2 son conocidas.

a) El muestreo se lleva a cabo sobre


dos poblaciones normales
b) independientes
con
varianzas
2
iguales desconocidas x = y2 .

, podemos decir

E{X Y } = E{X } E{Y } =

Se detectan cuatro casos posibles.

que la diferencia de medias muestrales


X Y tienen distribucin normal con

Z=
Muestra x

media y varianza

(n x 1)S x2
2

(n

1)S y2

son variables

independientes con distribucin X 2


y
n x 1 y n y 1 grados de libertad
respectivamente. Por la propiedad aditiva
de X 2 , se tiene:
W=

(n x 1)S x2 (n y 1)S 2 (n x 1)S x2 + (n y 1)S y2


2

que tambin tienen distribucin X 2 con


n x + n y 2 grados de libertad.
Se recordara que para una problemtica
similar, aunque relativa a una sola
poblacin, se defini a la variable aleatoria
.

Z
X2

que tienen una distribucin t-student con n1 grados l.


Probabilidad y Estadstica
Noviembre 2009

M.A. Vctor Damin Pinilla Morn.


97

Ejemplo. Se llevan
a cabo dos
experimentos independientes en los que se
comparan dos tipos diferentes de pintura.
Se pintan 18 especmenes con el tipo A y
en cada uno se registra el tiempo de secado
en horas. L o mismo se hace con el tipo B,
se sabe que las desviaciones estndar de la
poblacin son ambas 1.0.
Suponga que el tiempo medio de secado es
igual para los dos tipos de pintura,
encuentre P ( X A X B > 1.0 ), donde X A

Anlogamente

XB
y
secado.

son los tiempos promedio de

Datos.
Dos experimentos independientes

n A = n B = 18
A = B = 1 .0
tiempo medio de secado es igual para
los dos tipos de pintura A = B = 0
El problema puede resolverse conforme al
caso a) c) indistintamente.

Z=
donde

S =
2
p

(n x 1)S x2 + (n y 1)S y2

(n

+ n y 2)

Caso c) Relativo a lo obtenido para el caso


anterior:

Z=

( X Y ) ( x y )
x2
nx

y2
ny

tienen distribucin normal estndar con


= 0 y 2 =1
Caso d) La solucin de este caso es
denominado como problema de Fisher
Behrens y se encuentra fuera de los
alcances de este curso.

Probabilidad y Estadstica
Noviembre 2009

( X Y ) ( x y )
x2
nx

y2

ny

1 0
=3
1 1
+
18 18
P ( X A X B > 1.0) = P ( Z A B > 3.0) = 0.0013
Ejemplo. Los cinescopios de televisin del
fabricante A tienen una duracin media de
6.5 aos y un desviacin estndar de 0.9
aos, mientras que los del fabricante B
tienen una duracin media de 6.0 aos y
una desviacin estndar de 0.8 aos.
Cul es la probabilidad de que una muestra
aleatoria de 36 cinescopios del fabricante A
tenga una duracin media que sea al menos
de un ao ms que la duracin media de
una muestra de 49 cinescopios del
fabricante B?

M.A. Vctor Damin Pinilla Morn.


98

Datos
Fabricante A

Fabricante B

A = 6.5
A = 0.9

B = 6.0
B = 0.8

n A = 36

n B = 49

La respuesta es:

Z A B =

P ( X A X B 1 .0 )

1 (6.5 6.0 )

(0.9)2 + (0.8)2
36

= 2.6514

49

P ( X A X B 1 .0 ) =
P ( Z A B 2.6514) = 0.0040

Bibliografa
Canavos, Probabilidad y Estadstica,
Edit. Mc Graw Hill, Mxico 1988.
Borras, et. al. Apuntes de Probabilidad
y Estadstica, Facultad de Ingeniera
UNAM, Mxico 1985.
Villarreal , Probabilidad y Modelos
Probabilsticos, UAEM, Mxico 1989.
Hines, Montgomery; Probabilidad y
Estadstica, Edit. CECSA, 3 edicin,
Mxico 1993.

Captura y Edicin:
M.A. Mara Torres Hernndez.

Probabilidad y Estadstica
Noviembre 2009

M.A. Vctor Damin Pinilla Morn.


99