Está en la página 1de 70

143

Tercera
Unidad Didctica

"DISTRIBUCIONES DE PROBABILIDAD
DISCRETAS"

3.1 Parte bsica

144

3.1.1 Variables aleatorias


En

cualquier

experimento

aleatorio

tenemos

resultados

cualitativos

cuantitativos. Con el objeto de facilitar el estudio matemtico, a cada uno de estos


resultados le hacemos corresponder un nmero real.
Por ejemplo, el resultado de tomar un espaol al azar y medir su estatura es un
nmero; el resultado de tomar una familia al azar y anotar el nmero de hijos es un
nmero; el resultado de aplicar un tratamiento a un enfermo y observar si se cura o no,
es un dato cualitativo, que puede convertirse en cuantitativo asignando un "1" al
enfermo que se cura y un "0" al enfermo que no se cura.
En realidad lo que estamos haciendo es asignar a cada suceso del espacio muestral
un nmero, pero esta asignacin no tiene por qu ser nica.
Pongamos un ejemplo: lanzamos dos dados al aire y a cada suceso elemental le
podemos asignar la suma, el producto, etc., de los nmeros que aparecen en las caras
superiores.
Al igual que los resultados de un fenmeno aleatorio no son predecibles, los
resultados de una variable aleatoria tampoco lo son, pero podemos calcular la
probabilidad de que ocurra un determinado suceso.
A veces puede ocurrir que los valores que toma la variable aleatoria son los
mismos, pero no ocurre lo mismo con las probabilidades. Pongamos un ejemplo.
Se dispone de dos frmacos A y B distintos para curar una misma enfermedad; los
resultados de la variable aleatoria solamente pueden ser 1 0 y uno de ellos puede
curar el 20% de los casos y el otro el 70%.
Para tener identificada una variable aleatoria no basta con indicar los valores que
pueda tomar, hay que indicar tambin sus probabilidades.
Una variable aleatoria X es toda funcin que toma diversos valores
numricos (dependientes del resultado de un fenmeno aleatorio) con
distintas probabilidades.

145

Cuando la variable aleatoria toma un nmero finito o infinito numerable* de


valores, diremos que es una "variable aleatoria discreta".
Veamos ejemplos:
En el caso del lanzamiento de un dado perfecto, la variable aleatoria X= "nmero
que sale en la cara superior" puede tomar los valores X={1, 2, 3, 4, 5, 6} con
probabilidades P(X)={1/6, 1/6, 1/6, 1/6, 1/6, 1/6}.
Si consideramos la variable aleatoria X= "nmero de varones en una familia de
dos hijos", X={0, 1, 2} y P(X)={1/4, 1/2, 1/4}.
(Observar el espacio muestral del experimento aleatorio).

En general diremos, que una variable aleatoria discreta estar identificada si


conocemos sus posibles valores X = {x1 , x 2 , ..., x n } y sus respectivas
probabilidades P(X = x i ) = P i

Observemos que la suma de las probabilidades es 1: ! Pi = 1


i

A toda regla que permita asociar a cada valor xi de la variable aleatoria su


probabilidad Pi, la llamaremos "funcin de probabilidad".
Tal funcin de probabilidad puede venir dada por una tabla:
X

P(X)

1/4

1/2

1/4

o bien por una frmula matemtica.


Tambin podemos definir la variable aleatoria a travs de la "funcin de
distribucin".
F(X) = P(X ! x)

Un conjunto infinito A se dice que es numerable si se puede establecer una aplicacin


biyectiva f entre el conjunto de los naturales y A.

146

F(X) no es ms que la probabilidad de que la variable X tome valores menores o


iguales que x.
En el ejemplo anterior:
F(0) = P(X ! 0) = P(X = 0)
F(1) = P(X ! 1) = P(X = 0) + P(X = 1)
F(2) = P(X ! 2) = P(X = 0) + P(X = 1) + P(X = 2)

De un modo general, a toda tabla, grfica o expresin matemtica que


indique los valores que puede tomar una variable aleatoria y las
probabilidades con que los toma, se llamar "distribucin de probabilidad
de dicha variable aleatoria".
El concepto de variable aleatoria proporciona un medio para relacionar cualquier
resultado con una medida cuantitativa.

3.1.2 Esperanza, varianza y desviacin


tpica de una variable aleatoria
Se llama esperanza de la variable aleatoria discreta X, al nmero:

E [ X] = x1 p1 + x 2 p 2 +... +x n p n

x1 , x2 ,. .., xn son los valores de la variable aleatoria y p1 , p 2 , ..., p n las


probabilidades respectivas.

La esperanza de una variable aleatoria X tambin se representa por , y se llama


media de la distribucin. Por tanto, "esperanza de la variable aleatoria" y "media de la
distribucin" son expresiones equivalentes.
n

= ! p ix i = E[ X]
i=1

El conocimiento de la media de la distribucin no es suficiente para caracterizar la


distribucin, ya que hay distribuciones con la misma media y distintas unas de otras.

147

Para medir la dispersin de los valores de una variable aleatoria X respecto de su


media , se define el siguiente estadstico llamado varianza:

V [X ] = E ( x ! )

Es decir:
V[X] = (x1 ! ) p1 + ( x2 ! ) p2 +...+ ( xn ! ) p n
2

Puesto que la varianza no podra medirse en las mismas unidades que la variable,
utilizamos la raz cuadrada de la varianza y a este nmero la llamamos desviacin
tpica.

Desv[ X] = V[X]

Desv[ X] =

(x1 ! )2 p1 + ( x2 ! )2 p2 +...+( xn ! )2 p n

EJEMPLO 3.1:
Calcular la media y la varianza del nmero de hijos varones de una familia con dos
hijos.
Solucin:
E={VV, VH, HV, HH}
X={0, 1, 2}= "nmero de hijos varones de una familia con dos hijos"

P1 = P(X = 0) = 1/ 4

!#
P 2 = P(X = 1) = 2 / 4 = 1 / 2 " 1 / 4 + 1 / 2 + 1/ 4 = 1
#$
P3 = P(X = 2) = 1/ 4
En promedio, una familia con dos hijos tiene un hijo varn con una varianza de
1/2.

148

EJEMPLO 3.2:
Tras una intervencin quirrgica de un tipo determinado, el equipo mdico
mantuvo en el hospital a unos pacientes cinco das y a otros ocho. De stos ltimos no
regres ninguno al hospital y el coste de cada uno ascendi a 90.000 pts., mientras que
de los dados de alta a los cinco das, las dos terceras partes no regresaron al hospital y el
coste por cada individuo fue de 50.000 pts. El otro tercio restante tuvo que regresar al
hospital ocasionando unos gastos totales por individuo de 150.000 pts.
En trminos puramente econmicos, es preferible dar de alta a los enfermos a los
cinco o a los ocho das?.
Solucin:
Se trata de calcular el coste promedio en ambos casos. En el supuesto de que los
pacientes estn ingresados 8 das, el coste promedio es de 90.000 pts., y en el supuesto
de que los pacientes estn 5 das, la variable aleatoria se distribuye de la siguiente
forma:
X

50.000

150.000

P(X)

2/3

1/3

El coste promedio en este caso ser:

2
1
E[X] = 50.000 + 150.000 = 83.330pts.
3
3
Puesto que 83.333 < 90.000, esto indica que es preferible, desde el punto de vista
econmico, tener ingresados a los pacientes cinco das.
La varianza la calculamos de la siguiente forma:

V[X] = (50.000 ! 83.000)2

2
1
+ (150.000 ! 83.330)2 = 2, 2 109
3
3

149

3.1.3 Distribucin Binomial


Hay muchas situaciones en las que slo interesa conocer si un determinado suceso
se produce o no se produce.
Si el suceso ocurre, diremos que hemos obtenido un xito y lo simbolizamos por E
y si no ocurre diremos que hemos obtenido un fracaso y lo simbolizamos por F.
La probabilidad de xito la llamamos p
La probabilidad de fracaso la llamamos q
Lgicamente p+q=1
Se trata de un experimento aleatorio que no tiene ms que dos resultados posibles
E y F tales que P(E)=p y P(F)=q
Es interesante el caso en el que se repitan pruebas independientes del mismo
experimento y la probabilidad de xito se mantenga constante en todas ellas.
Supongamos que el nmero de pruebas es cinco (n=5). Un posible resultado sera:
EFFEE
Si queremos calcular la probabilidad, teniendo en cuenta que las pruebas son
independientes:
P(EFFEE) = P(E) P(F) P(F) P(E) P(E) = p q q p p = p3 q2
Responden a este modelo experimentos como los siguientes:
- Lanzar una moneda varias veces considerando xito la obtencin de cara.
Entonces p=q=1/2
- Lanzar un dado varias veces, considerando xito que salga el 6 y fracaso que no
salga el 6. En este caso p=1/6 y q=5/6.

150

- La clasificacin de las piezas fabricadas por una mquina, considerando xito las
piezas aceptables y fracaso las piezas defectuosas. En este caso p y q se asignan
haciendo un estudio de gran nmero de piezas.

Diremos que un experimento sigue un modelo binomial si, en cada


ejecucin, slo hay dos posibles resultados (E y F), las pruebas son
independientes y la probabilidad de xito es constante.
La idea es la de construir un modelo de asignacin de probabilidades de estas
caractersticas.
Llamaremos variable aleatoria binomial a:
X = "nmero de xitos en n pruebas"
Se pueden asignar probabilidades mediante un diagrama en rbol:
COMIENZO

1 PRUEBA

2 PRUEBA

p
p
p

q
p

p
q

q
p

RESUL.

PROB.

E EE

p3

EE F

p2q

E FE

p2q

EF F

pq 2

FEE

p2q

FEF

pq 2

F FE

pq 2

FF F

q3

q
p

3 PRUEBA

151

Construir el rbol puede ser una tarea larga y conviene buscar una frmula general
para un experimento binomial.
Convengamos en identificar todos aquellos resultados que tienen el mismo
nmero de xitos. Tras n pruebas nos encontraramos con:

EE...E !!" p n
EE...EF !!" np n#1q
EE...EFF!!" n(n # 1)pn#2 q2
.............................................
EF...F !!" npq n#1
FF... F !!" q n
Las distintas probabilidades son los sumandos del desarrollo del binomio (p+q)n,
por lo que:

! n$
P( X = r ) = # p r q n& r
"r%
Convenimos en designar al experimento binomial con n pruebas, siendo p la
probabilidad de xito, como B(n,p).

EJEMPLO 3.3:
Se lanza un dado 7 veces. Calcular la probabilidad de obtener 3 seises.
p = P(E) = 1/6 n=7
q = P(F) =5/6

K=3

Solucin:
X = "nmero de seises que aparecen al lanzar un dado 7 veces".

!# 7$ ! 1 $ 3! 5 $ 4
P(X = 3) =
= 0' 08
" 3% " 6 % " 6 %

152

EJEMPLO 3.4:
Calcular la probabilidad de obtener al menos una cara, al lanzar una moneda
cinco veces.
Solucin:
X = "nmero de caras que se obtienen al lanzar una moneda cinco veces"
P(x>1) = P(x=2)+P(x=3)+P(x=4)+P(x=5)
Utilizando el suceso contrario:
P(x>1) = 1-P(x1) = 1-(P(x=0)+P(x=1)) =
= 1 - 1/2 1/2 1/2 1/2 1/2 - 1/2 1/2 1/2 1/2 1/2
EJEMPLO 3.5:
Supongamos que en un departamento de control de calidad se examinan lotes de
cuatro artculos y se sabe que la probabilidad de que un artculo sea defectuoso es
P(D)=1/10 (por lo que la probabilidad de que sea aceptable es P(A)=1-P(D)=9/10).
Definimos la variable aleatoria de manera que a cada elemento del espacio
muestral, le asociamos el nmero de piezas defectuosas. x={0,1,2,3,4}. Calcular la
probabilidad asociada a cada valor de la variable.
Solucin:
Calculamos sus probabilidades:

9 4
P(x = 0) = ! # = 0, 6561
" 4$
P(x = 1) =

1 ! 9 # 3 !% 4#
= 0, 2961
10 " 10 $ " 1$

! 4$
Incluimos el nmero combinatorio #
" 1%

porque se pueden dar cuatro

posibilidades.
DAAA, ADAA, AADA, AAAD

153

P(x = 2) =

2
2
! 1 # ! 9 # !% 4#
= 0, 0486
" 10 $ " 10 $ " 2$

! 1 3 9 !% 4#
P(x = 3) = " #$
= 0, 0036
10 10 " 3$
! 1 #4
P(x = 4) = " $ = 0, 0001
10

EJEMPLO 3.6:
Hallar las probabilidades del experimento binomial B(4,1/3).
Solucin:

!# 4$ ! 1$ 0 ! 2 $ 4
P(x = 0) =
= 0,1975
" 0% " 3% " 3 %
!4 1 1 2 3
P(x = 1) = # $ ! $ ! $ = 0, 3951
" 1% " 3% " 3 %
! 4$ ! 1 2 ! 2 2
P(x = 2) = # " $% " $% = 0, 2963
" 2% 3
3
! 4$ ! 1 3 2
P(x = 3) = # " $%
= 0, 0988
" 3% 3 3
! 4$ ! 1 4
P(x = 4) = # " $% = 0, 0123
" 4% 3
EJEMPLO 3.7:
En una empresa de fabricacin de automviles se ha observado que el 2%
presenta algn defecto. Calcular la probabilidad de que en una muestra aleatoria de 5
automviles se encuentren a lo sumo dos defectuosos.
Solucin:
La variable X = "nmero de automviles defectuosos", sigue una B(50,0'02).

P( X ! 2) = P(X = 0 ) + P( X = 1) + P(X = 2) =
"$ 50%
" 50
" 50
(0, 02) 0 (0, 98)50 + $ % (0, 02)(0, 98)49 + $ % (0, 02)2 (0, 98) 48
# 0&
#1&
#2&

154

P(X ! 2) = 0' 9216

A medida que aumenta el valor de n se complican los clculos y es conveniente


utilizar tablas.

3.1.3.1 Manejo de tablas


Las tablas estn elaboradas con la siguiente estructura (figura 3.1):
n
2

...
10

r
0
1
2
0
1
2
3
...
0
1
...
10

0.01

0.05

...

0.50

...

...

...

...

Figura 3.1: Estructura de la tabla de la Distribucin Binomial

Si estamos en una B(5,0'45), buscaremos el 5 en la columna de n y si nos piden


P(X=4), dentro del grupo n=5, buscamos r=4. En la fila de p buscamos 0'45 y en la
confluencia de la horizontal y la vertical, tendremos el valor de la probabilidad.
Podemos encontrarnos con un problema en el caso de ser p>0'5, pues no puede
emplearse la tabla directamente, sino que tendremos que tener en cuenta la siguiente
propiedad:

! n$
! n $ n& r r
P( X = r ) = # p r q n& r = #
p q
"r%
" n & r%
Funcin de densidad de una variable aleatoria que siga una B(n,p) con n-r
xitos.
P(X=r) en una B(n,p) = P(X=n-r) en una B(n,q)

155

3.1.3.2 Media y desviacin tpica de una variable


Binomial
MEDIA:

= E[ x] = x 0p 0 + x1p1 +...+x n pn =
!n
!n
!n
= 0# $ q n + 1# $ pqn &1 +...+n # $ p n = np
" 0%
" 1%
" n%

VARIANZA:
n

! 2 = V[ x] = # ( x " ) pi = npq
2

i=1

DESVIACIN TPICA:

! = npq

EJEMPLO 3.8:
Supongamos que tenemos cinco instrumentos y que sabemos que en promedio un
determinado instrumento est averiado uno de cada diez das. Cul es la probabilidad
de que en un da ms de tres instrumentos estn averiados?. Cul es el nmero
esperado de instrumentos averiados al da?.
Solucin:
Nuestra variable ser:
X = "nmero de instrumento averiados en un da"
Slo hay dos posibles sucesos:
E: Estar averiado
F: No estar averiado.
X ~ B(n=5, p=0'1)
La funcin de densidad ser:

156

!5
!5
P( x = r) = # $ p r q 5&r = # $ 0,1r 0, 95& r
" r%
" r%
P( x > 3) = P(x = 4 ) + P(x = 5) = 4
! 5$
! 5$
= # p 4q + # 0,150, 9 0 = 4, 6 10&4
" 4%
" 5%
E [x] = np = 5 0,1 = 0, 5
Se avera un instrumento cada dos das.

EJEMPLO 3.9:
La probabilidad de que un estudiante obtenga el ttulo de Licenciado en Biologa
es 0'3. Hallar la probabilidad de que de un grupo de 7 estudiantes matriculados en
primer curso:
a) Ninguno de los siete finalice la carrera.
b) La finalicen todos.
c) Al menos dos acaben la carrera.
Asimismo, hallar la media y la desviacin tpica del nmero de alumnos que
acaban la carrera.
Solucin:
Los sucesos son:
E(xito): acabar la carrera

P(E) = p = 0'3

F(fracaso): no acabar la carrera P(F) = q = 0'7


El nmero de pruebas es siete

n=7

Las pruebas son independientes, porque lo que ocurra con un alumno no tiene
nada que ver con lo que le ocurra a otro.
a)

! n$
P( X = r ) = # p r q n& r
"r%

157

! n$
! 7$
P(x = 0) = # p0 q n = # q 7 = 0, 77 = 0, 0824
" 0%
" 0%
b)

! 7$ 7 0
P(x = 7) = # 0, 3 q = 0, 0002 Imposible
" 7%

c)

P( X ! 2) = P(X = 2 ) + P( X = 3)+...+ P(X = 7) =


1 " P(X # 1) = 1 " (P(r = 0) + P(r = 1)) =
= 1 " 0, 0824 " 0, 2471 = 0, 6705

Parmetros:

E [x] = np = 7 0, 3 = 2,1
V[x] = npq = 2, 1 0, 7 = 1, 47
! = 1, 47

EJEMPLO 3.10:
En recientes estudios realizados sobre pacientes portadores de SIDA, se ha
podido determinar que el 70% consume algn tipo de droga. En la sala de espera de
una consulta especializada en esta enfermedad se encuentran en un determinado
momento seis personas. Cul es la probabilidad de que ninguno haya consumido
droga?.
Solucin:
E: "No consumir droga"

P(E) = 0'3 = p

F: "Consumir droga"

P(F) = 0'7 = q

Cada paciente es un caso distinto n=6

! 6$
P( x = 0 ) = # p 0q 6 = 0, 1176
" 0%

EJEMPLO 3.11:
Una poblacin de 20 animales insectvoros se introduce en una zona donde el
14% de los insectos que le sirven de alimento son venenosos. Cada animal devora al
da 5 insectos.
Calcular la probabilidad de que al cabo de una semana queden, como mnimo, la
mitad.

158

Solucin:
Suponiendo independencia se tiene:
P(no comer insecto venenoso) = 1-0'14 = 0'86
P(un animal no se envenene en un da) = P(comer 5 insectos no venenosos) =
= (0'86)5 = 0'47042
P(un animal no se envenene en 7 das) = (0,47042)7=0,005
P(un animal se envenene en 7 das) = 1-0'005 = 0'995
Sea X: "nmero de animales envenenados en una semana.
X ~ B(20,0'995)
10 " 20%
P( x ! 10) = ' $
0, 995 k0, 00510( k = 2, 08975 10 (18
#
k
&
k=0

3.1.4 Distribucin de Poisson


En este caso la variable aleatoria representa el nmero de sucesos independientes
que ocurren, a una velocidad constante, en el tiempo o en el espacio.
Su nombre lo debe al francs Simen Denis Poisson, que fue el primero en
describirla en el Siglo XIX.
Veamos algunos ejemplos tpicos de esta distribucin:

El nmero de personas que llega a una tienda de autoservicio en un

tiempo determinado.

El nmero de solicitudes de seguro procesadas por una compaa en

un perodo especfico.
El

nmero de bacterias en un cultivo.

La distribucin de Poisson es el modelo de probabilidad que ms se utiliza para


analizar problemas de listas de espera.
Podemos hablar de las siguientes caractersticas de una distribucin de Poisson:

159

1- Debemos tener un fenmeno dicotmico (ocurrencia o no de un


determinado suceso).
2- Las pruebas que se realicen han de ser independientes y la
probabilidad de xito se ha de mantener constante en todas ellas.
3- Los sucesos han de ser poco comunes, por eso se le conoce como
"Ley de los sucesos raros".
4- Puesto que la probabilidad de xito ha de ser pequea, entendemos
que p<0.05 y puesto que n ha de ser grande, entendemos n>100.
5- Los sucesos ocurren en un intervalo de tiempo.
6- Se caracteriza por un parmetro ! , que es el nmero medio de
ocurrencia del suceso aleatorio por unidad de tiempo.
7- Siempre que la media y la varianza sean similares, podemos pensar
en un modelo de Poisson.
Media:

E [x] = np = !

Varianza:

V[x] = ! = E[ x]

Es importante el hecho de que una distribucin binomial en la que n es grande y


p pequeo tiene una aproximacin excelente con la distribucin de Poisson. La funcin
de probabilidad ser el lmite de la funcin de densidad de la binomial cuando
n ! ", p ! 0 y np ! "

$ n'
$ n'
lim & pr q n )r = lim & lim p r lim q n )r
n !" % r (
n! "% r ( p!0
n! "
p!0
np !#

Teniendo en cuenta que p =

p! 0

!
n

160

n!
%$' r
%
$ n#r
lim 1 # '
=
n(
n!" r!(n # r)! & n ( n! "&
lim

%
$
1# '
&
n(

n(n # 1)...(n # r + 1) $ r
lim
r
r!
n!"
n r n!" %
$
1# '
&
n(

= lim

%
$'n
lim
1
#
$r
n(n # 1)...(n # r + 1) n!"&
n(
=
lim
r
r! n!"
n
%
$'r
lim 1 #
n(
n! "&

[1]

Calculamos cada uno de estos lmites:

n n # 1 n # r +1
...
! 1
n
n
n!" n
lim

n
+
# .
%
' $
% $'n
1 * 0
)
lim 1 #
! lim - 1 + n
* 0
n(
n!" &
n!" )
-&
#$ ( 0
,
/

#$

! e #$

% $ r
lim 1 # ' !1
n(
n!" &
Sustituyendo en [1] tenemos:
!r " !
P(!) =
e
r!

Es la funcin de densidad de la distribucin de Poisson.

EJEMPLO 3.12:
Un comprador de grandes cantidades de circuitos integrados ha adoptado un
plan para aceptar un envo de stos, que consiste en inspeccionar una muestra de 100
circuitos provenientes del lote. Si el comprador encuentra no ms de dos circuitos
defectuosos en la muestra, acepta el lote; de otra forma, lo rechaza. Si se enva al
comprador un lote que contiene el 1% de circuitos defectuosos, cul es la
probabilidad de que sea aceptado el lote?.
Solucin:

161

Nuestra variable es:


X: "nmero de circuitos defectuosos en la muestra".
X~B(n=100, p=0'01)

np=1

Si n50 y p0,1 se comporta aproximadamente como una Poisson.

P(aceptar el lote) = P(x ! 2) = P( x = 0 ) + P( x = 1) + P(x = 2) =


10
11
12
"1
"1
"1
=e
+e
+e
= 0, 9197
0!

1!

2!

P(aceptar el lote) = 90%


EJEMPLO 3.13:
Es conocido el hecho de que cierto tipo de bacterias poseen, adems de sus
cromosomas, otras estructuras de ADN llamadas factores de resistencia. Estos factores
confieren a la bacteria resistencia a uno o varios antibiticos. En un determinado
medio el 0,06% de las bacterias no poseen dicha propiedad. Sobre una poblacin de
10.000 se desea saber:
a) La probabilidad de que el nmero de bacterias no poseyendo dicha resistencia
sea superior a 6, pero inferior a 15.
b) La probabilidad de que haya exactamente 5 sin resistencia antibitica.
Solucin:
Sea X el "nmero de bacterias que no poseen resistencia a los antibiticos".
X~B(n=10.000, p=0'0006)~P( ! =np=6)
a) P(6 < x < 15) = P(x ! 14 ) " P(x ! 6) = 0, 9986 " 0, 6063 = 0, 3923
b) P( x = 5) = e

!6 6

5!

= 0,1606

EJEMPLO 3.14:
La probabilidad de que dos aminocidos determinados se combinen para formar
un dipptido es muy pequea y, en consecuencia, el nmero de dipptidos de una

162

determinada composicin que puedan observarse al analizar un conjunto de protenas


sigue una distribucin de Poisson, que por otras investigaciones sabemos que tiene
parmetro ! =0,4.
Si denominamos como X el nmero de dipptidos observados en una composicin
determinada:
a) Calcular la probabilidad de no encontrar ninguno de tales dipptidos en dicha
composicin.
b) Probabilidad de encontrar dos o ms.
Solucin:
a)
P( x = 0 ) = e !"

b)

"0
= e !0,4
0!

P(x ! 2) = 1" P(x < 1) = 1 " P(x = 0) " P(x = 1) =


= 1 " e "0,4

#0
0, 41
1
0, 4
" e "0,4
= 1" 0,4 " 0,4
0!
1!
e
e

EJEMPLO 3.15:
El nmero medio de automviles que llega a una estacin de suministro de
gasolina es de 210 por hora. Si dicha estacin puede atender a un mximo de diez
automviles por minuto, determinar la probabilidad de que en un minuto dado, lleguen
a la estacin de suministro ms automviles de los que puedan atender.
Solucin:
La variable aleatoria X es el "nmero de automviles que llegan a la estacin de
servicio en un minuto ".
El suceso xito (1) consiste en que en un instante cualquiera llegue un automvil a
la estacin de suministro .
p es la probabilidad de xito y es suficientemente pequea, sin embargo , la
prueba puede repetirse un nmero suficientemente grande de veces.

163

Ocurre un determinado suceso en un intervalo de tiempo .


Cumple las condiciones de Poisson.
P ( x = r) =

!r "!
e
r!

! es el nmero medio de veces que se da el suceso de probabilidad p.


!=

210
= 3, 5
60

La estacin no podr atender si llegan ms de 10 automviles por minuto.


!

10

r=11

r=0

P( X > 10) = " P(x = r ) = 1 # " P(x = r ) =

$ 3,50 #3,5
3,510 #3,5 '
=1#&
e
+...+
e
)( = 1 # 0, 9991 = 0, 0009
10!
% 0!

EJEMPLO 3.16:
El nmero de clientes que llega a un banco es una variable de Poisson. Si el
nmero promedio es de 120 por hora, cul es la probabilidad de que en un minuto
lleguen por lo menos tres clientes?.
Solucin:
X: "nmero de clientes que llega a un banco en un minuto".
E[x]=120 clientes por hora.

E[X] =

120
= 2=!
60

P( X ! 3) = 1" P(X < 3) = 1 " [P( x = 0 ) + P( x = 1) + P( x = 2 )] =


= 1 " 0,1353 " 0, 2707 " 0, 2707 = 0, 3233
La probabilidad es de un 33% aproximadamente.

164

EJEMPLO 3.17:
Del volumen de produccin diario en dos plantas diferentes de una fbrica, se
sabe que la probabilidad de que resulten r unidades defectuosa es:
4r !4
- en la 1a planta:
para r = 0, 1, 2, ...
e
r!
6r
- en la 2a planta: e !6 para r = 0, 1, 2, ...
r!
Determinar la probabilidad de que, en un da determinado:
a) resulten cinco o ms unidades defectuosas en la 1a planta.
b) resulten cuatro o menos unidades defectuosas en la 2a planta.
c) resulten ocho o ms unidades defectuosas del total de la produccin de la
fbrica.
Solucin:
a) X1: "nmero de unidades defectuosas en la 1a planta". ! P(4)
P( X1 ! 5) = 1" P(X1 < 5) = 1 " [ P( x1 = 0 )+...+ P(x1 = 4)]

P( X1 ! 5) = 0, 3711

b) X2: "nmero de unidades defectuosas en la 2a planta". ! P(6)

P( X2 ! 4 ) = P( x2 = 0)+...+P (x 2 = 4) = 0, 2851
c) X3: "nmero de unidades defectuosas del total de la produccin."

P( X3 ! 8) = 1" P( x3 < 8) = 0, 7797


Da la impresin de que la empresa debera revisar su produccin.

3.1.5 Distribucin Hipergeomtrica


En la distribucin binomial siempre aseguramos la independencia, es decir, el
muestreo se realiza con reemplazamiento y la probabilidad de xito es constante en cada

165

una de las pruebas. Supongamos que esto no ocurre, no hay reemplazamiento y la


variable aleatoria sigue otro tipo de distribucin. Veamos un ejemplo:
Sea N el nmero de profesores de un Centro de Enseanza Secundaria que deben
elegir Director entre dos candidatos A y B. Sea n el nmero de profesores que apoyan al
candidato A y N-n el nmero de profesores que apoyan al candidato B. Supongamos
que queremos hacer un sondeo antes de la votacin final, tomamos una muestra con K
profesores y le preguntamos el candidato al que piensan votar. Supongamos que X es la
variable aleatoria que nos mide el nmero de profesores de la muestra que piensan votar
al candidato A. El inters est en calcular la probabilidad de que X=r, es decir, que en la
muestra haya r personas que piensan votar al candidato A.
Deduciremos la frmula utilizando la Ley de Laplace.
De cuntas maneras puedo elegir muestras de tamao n entre N elementos que
tiene la poblacin?.

!# N$
casos posibles
"n%
De stos, cules sern favorables a nuestro suceso?. Aquellas que tengan r xitos
y N-r fracasos.
(r veces) (n! r veces )

EE
...#
E FF
...#
F
!
#"
$
!
#"
$
Np

Nq

Es preciso conocer la probabilidad de xito y la probabilidad de fracaso en la


poblacin. El nmero de casos favorables ser:

!# Np$ !# Nq $
" r % " n & r%
Por consiguiente:

Media:

!# Np$ !# Nq $
" r % " n & r%
P( X = r ) =
; r = 0,1,2,..., n
!# N$
" n%

E [x] = np

166

Varianza:

Cuando

V[x] = npq

N !n
N !1

n
! 0, 05 , la distribucin hipergeomtrica se aproxima a la binomial.
N

EJEMPLO 3.18:
Un fabricante asegura que slo el 1% de su produccin total se encuentra
defectuosa. Supngase que se ordenan 1000 artculos y se seleccionan 25 al azar para
inspeccionarlos. Si el fabricante se encuentra en lo correcto, cul es la probabilidad
de observar dos o ms artculos defectuosos en la muestra?.
Solucin:
Tenemos una poblacin de tamao N=1000
X: "nmero de artculos defectuosos en la muestra".
P(xito)=0,0 l
Tamao de la muestra n=25
Si inspeccionamos uno de los 25, ese no lo volvemos a inspeccionar, luego no hay
reemplazamiento, la p de las distintas pruebas no se mantiene constante. Se trata de una
distribucin hipergeomtrica.

P( x ! 2) = l " P(x < 2) = l " [P(x = 0 ) + P(x = 1)]


!# 1000 0, 01$ !# 1000 0, 99$
&
(
"
0
%"
25
%
P( X = 0 ) =
= 0, 7754
(
!# 1000$
(
" 25 %
'P( X * 2) = 0, 0239
!# 10$ !# 990 $
(
" 1 % " 24 %
(
P( X = 1) =
= 0, 2007
!# 1000$
(
" 25 %
)

167

Puesto que

n
25
=
= 0, 025 < 0, 05
N 1000

Podemos aproximar por una binomial:

P( x ! 2) = l " [ P( x = 0) + P( x = 1)] =
# 25&
# 25&
=1"%
0, 010 0, 9925 " %
0, 011 0, 9924 =
$0'
$1'
1 " 0, 7778 " 0,1964 = 0, 0258

EJEMPLO 3.19:
Supngase que se tienen 50 representantes de cierto estado, en una convencin
poltica nacional, de los cuales 30 apoyan al candidato A y 20 al candidato B.
Si se seleccionan aleatoriamente 5 representantes, cul es la probabilidad de
que, entre estos cinco, por lo menos dos apoyen al candidato A?.
Solucin:
X: "nmero de personas de la muestra que apoyan al candidato A.

N = 50!#
3
&
n = 5 "X % H' 50, 5, ()
5
3
p= #
5$
P( x ! 2) = l " P(x < 2) = 1 " [ P(x = 0) + P( x = 1)]
3 #
2 )
#
50 & 50 &
%
5( %
5( +
$ 0 '$ 5 ' +
P(X = 0) =
#% 50&
+
+
$ 5'
P( X ! 2) = 0, 9241
3& #
2& *
#
50
50
%
5( %
5( +
$ 1 '$ 4 ' +
P(X = 1) =
#% 50&
+
+,
$ 5'
No hay duda de que al menos dos apoyarn al candidato A. con una probabilidad
del 92%.

168

EJEMPLO 3.20:
En una clase en la que hay 20 estudiantes, 15 estn insatisfechos con el texto que
se utiliza. Si se le pregunta acerca del texto a cuatro estudiantes tomados al azar,
determine la probabilidad de que:
a) exactamente tres estn insatisfechos con el texto.
b) cuando menos tres estn insatisfechos.
Solucin:
Hay dos sucesos mutuamente excluyentes:
P(estar satisfechos) = 5/20 = 1/4
P(no estar satisfecho) = 15/20 = 3/4
Las pruebas son sin reemplazamiento, no tiene sentido volver a preguntar al
mismo estudiante que se le pregunt antes.
X: "nmero de alumnos que estn insatisfechos con el texto".

3
!
Es una H" 20;4, #$
4
a)

!# Np$ !# Nq $ !# 15$ !# 5$
" r % " n & r% " 3 % " 1%
P( X = 3) =
=
= 0, 469
!# N$
!# 20$
" n%
" 4%

b)

P( X ! 3) = P(x = 3) + P(x = 4 ) = 0, 75

EJEMPLO 3.21:
Un equipo departamental incluye cinco bilogos especialistas en microbiologa y
nueve mdicos. Si se eligen al azar cinco personas y se les asigna un proyecto, cul es
la probabilidad de que el equipo del proyecto incluya exactamente a dos bilogos?.

169

Solucin:
X: "nmero de bilogos incluidos en el proyecto".
P(bilogo) = 5/14
P(mdico) = 9/14

5
"
X ! H# 14;5, $%
14
!# 5$ !# 9$
" 2% " 3%
P( X = 2 ) =
= 0, 42
!# 14$
" 5%

EJEMPLO 3.22:
Considrese un fabricante de ordenadores que compra los microprocesadores a
una compaa donde se fabrican bajo estrictas especificaciones. El fabricante recibe un
lote de 40 microprocesadores. Su plan para aceptar el lote consiste en seleccionar 8, de
manera aleatoria y someterlos a prueba. Si encuentra que ninguno de los
microprocesadores presenta serios defectos, el fabricante acepta el lote; de otra forma
lo rechaza. Suponiendo que el lote contenga dos microprocesadores con serios
defectos, cul es la probabilidad de que sea aceptado?
Solucin:
X: "nmero de microprocesadores defectuosos en la muestra".

20
1
19
"
X ! H# 40;8, $% p =
q=
40
20
20
"& 2 $ "& 38$
# 0% # 8 %
P( X = 0) =
= 0, 6359
"& 40$
# 8%
Si la persona que vende sabe que le controlarn el producto, procurar que la
empresa efecte un control de calidad antes de iniciar las ventas. Aumentar la calidad
del producto.

170

EJEMPLO 3.23:
Una compaa dedicada a la produccin de artculos electrnicos, utiliza un esquema
para la aceptacin de artculos, para su ensamblaje, antes de ser embarcados, que
consiste en lo siguiente:
Los artculos estn embalados en cajas de 25 unidades y un tcnico de la compaa
selecciona aleatoriamente tres artculos, de tal manera que si no encuentra ningn
artculo defectuoso, la caja se embarca.
a) Cul es la probabilidad de que se embarque una caja que contiene tres artculos
defectuosos'?.
b) Cul es la probabilidad de que una caja que contiene slo un artculo defectuoso
regrese para su verificacin?.
Solucin:
X: "nmero de artculos defectuosos en la muestra".
a) Si la caja contiene tres artculos defectuosos, la distribucin es:

3
22
q=
25
25
!# Np$ !# Nq $ !# 3$ !# 22 $
" xi % " n & x i % " 0% " 3 & 0%
P( X = 0 ) =
=
= 0, 6696
!# N$
!# 25$
"n%
" 3%
N = 25

N1 = 3

N2 = 22

p=

Hay una probabilidad del 67% de que se embarque la caja.


b) La caja slo contiene un articulo defectuoso.
1
24
N = 25
p=
q=
25
25
1 $!
24 $
!
25
25
#
&
#
25
25 &
" 0 %" 3 %
P( X = 0 ) =
= 0, 88
!# 25$
"3%
Lgicamente la probabilidad de que no embarque es: 1-0,88 = 0,12
Lo ms probable es que las cajas que tengan un artculo defectuoso sean
embarcadas.

171

EJEMPLO 3.24:
Supongamos que una compaa hace el estudio de la calidad conforme a otro
esquema.
Se toma un artculo, se inspecciona y se devuelve a la caja; lo mismo ocurre con
un 2 y un 3er artculo.
La caja no se embarca si cualquiera de los tres artculos es defectuoso.
Solucin:

! 3
a) B 3, #
" 25 $

! 1
b) B 3, #
" 25 $

! 3$ ! 3 0 ! 22 3
P( x = 0 ) = # " $% " $% = 0, 6815
" 0% 25
25

!# 3$ ! 1 $ 0 ! 24 $ 3
P( x = 0 ) =
= 0, 8847
" 0% " 25% " 25 %

La probabilidad de no embarcar sera: 1 - 0,8847 = 0,1153

EJEMPLO 3.25:
Considrese un fabricante de automviles que compra los motores a una
compaa donde se fabrican bajo estrictas especificaciones. El fabricante recibe un
lote de 40 motores. Su plan para aceptar el lote consiste en seleccionar 8, de manera
aleatoria, y someterlos a prueba. Si encuentra que ninguno de los motores presenta
serios defectos, el fabricante acepta el lote; contiene dos motores con serios defectos,
cul es la probabilidad de que sea aceptado?.
Solucin:
X: "nmero de motores defectuosos en la muestra".

172

2
1
!
H" 40;8, #$
40
20
!% 2# !% 38#
" 0$ " 8 $
P(X = 0) =
= 0, 6359
!% 40#
" 8$

N = 40

n=8

p=

173

"DISTRIBUCIONES DE PROBABILIDAD
CONTINUAS"

3.2 Parte bsica

174

3.2.1 Distribucin normal.


3.2.1.1 Introduccin
La distribucin Normal es la distribucin continua ms importante del Clculo de
Probabilidades y de la Estadstica. Aparece por primera vez en 1733 en los trabajos de
DE MOIVRE relativos al clculo de la distribucin lmite de una variable binomial.
Posteriormente, en 1809, GAUSS y ms tarde, en 1812, LAPLACE la estudiaron en
relacin con la teora de errores de datos experimentales, al tratar de hallar el valor
correcto ms probable entre una serie de medidas. Primero, GAUSS, pens que la
media aritmtica de los valores sera el valor correcto. Ms tarde, al dibujar la
distribucin de frecuencias, observaron cmo los valores extremos eran incorrectos y
cada vez las medidas se hacen ms iguales y ms numerosas, hasta concentrarse en un
valor medio que es el valor ms frecuente. Por esto, la distribucin normal se conoce
tambin con el nombre de distribucin de GAUSS-LAPLACE.
Una primera aproximacin de la distribucin normal puede observarse con el
experimento que realiz SIR FRANCIS GALTON, que construy un ingenioso aparato,
formado por un tablero inclinado, en el que se distribuyen regularmente un sistema de
clavos, para acabar finalmente en compartimentos estrechos. Al deslizar muchas bolas
desde un depsito superior, estas chocan con los clavos, y se alejan ms o menos de la
lnea central de cada. Las alturas alcanzadas por las bolas en los compartimentos
estrechos da una idea de la curva de la distribucin normal (ver figura 3.2).

Figura 3.2: Dispositivo de Galton

175

El nombre de distribucin normal se debe al hecho de que una mayora de las


variables aleatorias de la Naturaleza siguen esta distribucin, lo que hizo pensar que
todas las variables continuas de la Naturaleza eran normales, llamando a las dems
distribuciones "anormales". No obstante, hoy en da, ya no se piensa de la misma
manera, ya que ningn estadstico dice que una distribucin que no sea normal, es
anormal. No obstante, la distribucin normal es la ms importante por sus propiedades
sencillas, porque aparece frecuentemente en la Naturaleza, (fenmenos relacionados con
psicologa, biologa, etc. ), y por una propiedad de algunos fenmenos que se aproximan
asintticamente a la distribucin normal (Teorema Central del Lmite).

3.2.1.2 Definicin
De modo riguroso, se dice que una variable aleatoria sigue una distribucin
normal de media , y desviacin tpica , y se designar por N(, ), si se cumplen las
siguientes condiciones:
La variable recorre toda la recta real, y la funcin de densidad es de la forma:

f(x) =

1
# 1 ( x# ) 2
e 2 !
! 2"

donde e = 2.71828; = 3.14159; es la media de la distribucin y es la desviacin


tpica.
Esta funcin de densidad que parece en principio con una expresin matemtica
aparentemente complicada, tiene la siguiente representacin (figura 3.3):

0
Figura 3.3: Representacin grfica da la campana de Gauss
conocida como campana de Gauss, y con las siguientes propiedades:

176

1.- La curva tiene forma campaniforme y es simtrica respecto a la recta vertical x = .


ya que el valor de la densidad es idntico en + c y en - c, para todo valor de c, pues:
2

# ( +c #2)
#c2
1
1
f( + c) =
e 2!
=
e 2!
! 2"
! 2"
#
1
f( # c) =
e
! 2"

( #c # ) 2
2!2

2
# c2
1
2!
=
e
! 2"

2.- La ordenada es mxima en x = .


La derivada de la funcin de densidad es:
#
1
f' (x) =
e
! 2"

(x# ) 2
2! 2

#
1
$ 1
'
&% # 2! 2 (x # ))( = # ! 3 2" e

(x# ) 2
2! 2

(x # )

como la exponencial es siempre distinta de cero, se verifica que:


f' (x) = 0 ! (x " ) = 0 ! x =

como la derivada segunda es:

f'' (x) = ! 3
e
" 2#

! (x!)2

2"

2
$
1
' $ 2(x ! ) ! (x!2")2 '
+ &! 3
(x ! ) ) & !
e
)=
% " 2#
(%
2" 2
(

=! 3
e
" 2#

! (x !)2
2"

$ (x ! )2 '
&%1 ! "2 )(

como se verifica que :

1
1
f'' () = ! 3
e 0 (1 ! 0) = ! 3
<0
" 2#
" 2#
luego en x = la funcin de densidad presenta un mximo de valor

f() =

1
! 2"

177

3.- El rea del recinto encerrado bajo la campana y el eje x es igual a la unidad.
Por tratarse de una funcin de densidad. Y al ser simtrica, deja igual rea, 0,5, a
la izquierda y a la derecha de la recta x = . Esto se verifica porque:
+"

+"

!
1
f(x) =
e
!"
!" $ 2%

(x !) 2
2$ 2

dx =

x!
= y , entonces dx = dy, y por lo tanto
"

haciendo el cambio de variable

2
+$ # y2
1
1
1
# y2
=
e !dy =
e 2 dy =
2" = 1
2" #$
2"
#$ ! 2"

+$

ya que la ltima integral, conocida como la integral de Gauss vale


I=

+" ! y 2
2

#!"

dy = 2

+" ! y 2
2

#0

2! , ya que:

dy = 2I1

y al multiplicar I1 por s misma, y mediante mtodos de integracin doble, resulta su


cuadrado igual a /2.

4.- Presenta puntos de inflexin en los puntos de abscisas + y - , donde cambia


de concavidad (lo que determina que cunto mayor sea , ms achatada sea la curva).
El punto de inflexin se obtiene al igualar a cero la derivada segunda, por lo tanto:

f'' (x) = 0 ! 1 "

(x " )2
x"
= 0!
= 1 ! x = #
2
#
#

As, pues, presenta puntos de inflexin en los puntos x = + y en x = - ,


donde las coordenadas de los puntos son: en x = +
#
1
f( + !) =
e
! 2"

y en el punto x = -

( +! # )2
2! 2

# !2
1
1
1
#1
=
e 2! =
e 2=
! 2"
! 2"
! 2"e

178

!
1
f( ! ") =
e
" 2#

( !" ! )2
2" 2

! "2
1
1
1
!1
=
e 2" =
e 2=
" 2#
" 2#
" 2#e

5.- Es asinttica al eje de abscisas.


Pues como ex tiende a 0 cuando x tiende a infinito, entonces:
%
1
lim f(x) = lim
e
x!+"
x!+" # 2$

(x% ) 2
2# 2

=0

es decir, el eje OX es una asntota horizontal, e igual para x tendiendo a -.

En la figura 3.4 puede observarse que para fijo, el variar tiene el efecto de
desplazar la curva hacia la derecha o la izquierda; manteniendo constante, el cambio
de tiene por efecto acercar o alargar del valor medio los puntos de inflexin, es
decir, un apuntamiento o aplastamiento de la curva (ver figura 3.5).

-a

+a

Figura 3.4: Efecto de la variacin de en la distribucin normal

179

Figura 3.5: Efecto de la variacin de manteniendo constante

3.2.1.3 La distribucin normal estndar N(0,1)


En las familias representadas por las distribuciones normales ocupa un lugar
especial la distribucin que tiene de media cero ( = 0) y por desviacin tpica la unidad
( = 1). Esta distribucin se llama la distribucin normal estndar, o reducida.
Su funcin de densidad es:
f(x) =

1 " x22
e
2!

x #("$, +$)

y su funcin de distribucin es la siguiente:


x

F( x) = P( ! " x) = 1

2#

&

e$

$%

y cuyas representaciones aparecen en las figura 3.6:

x2

dx

180

1,2
1
,8
,6

1
2!

,4
,2
0
-,2
-4

-3

-2

-1

Figura 3.6: Representacin de las funciones de densidad y distribucin de la N(0,1).

La funcin de distribucin de la ley normal estndar proporciona el rea del


recinto que encierra la funcin de densidad, hasta el punto x, y con el fin de facilitar el
clculo de sta superficie, y no tener que utilizar en todo momento el clculo integral, se
han elaborado unas tablas de fcil uso, entre las que se encuentran las que aparecen a
continuacin:
x

0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9

0.00
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981

0.01
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8655
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982

0.02
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982

0.03
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983

0.04
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984

0.05
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984

0.06
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8870
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985

Tablas de la distribucin normal estndar

0.07
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985

0.08
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986

0.09
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986

181

3.2.1.4 Manejo de las tablas de la normal estndar


Las tablas anteriores nos proporcionan directamente la funcin de distribucin de
la variable normal estndar, por lo que ellas nos darn directamente la probabilidad de
que la variable tome valores menores o iguales que un determinado valor (P( x)).
Veamos su utilizacin con un ejemplo sencillo. Si Z es una variable que sigue una
distribucin N(0,1), calcularemos la probabilidad de que la variable Z tome valores
menores o iguales a 1.37.
La probabilidad pedida es el rea sombreada de la figura 3.7.

Figura 3.7: rea hasta el valor 1.37

y se encuentra directamente en la tabla sin ms que buscar 1.3 en la primera columna, y


0.07 en la primera fila; su interseccin nos da la probabilidad:

Es decir:
P(Z 1.37) = 0.9147
que quiere decir que el 91.47% de las observaciones se encuentran distribuidas entre -
y 1.37.

182

Existen adems de las tablas anteriores otros tipos de tablas publicadas de la


distribucin normal estndar. Quiz las ms importantes sean las siguientes:

1.- Tabla de dos colas :


Esta tabla da las reas de las dos colas de la distribucin, es decir, da la siguiente
probabilidad
P( |Z| a ) = P( - < Z -a ) + P( a Z < + )

-a

Figura 3.8: rea de la tabla de dos colas

2.- Tabla de una cola :


Nos da el rea de la cola derecha de la distribucin, es decir, la siguiente
probabilidad
P( Z a )

3.- Tabla de valores :


Que contiene todos los valores entre 0 e infinito.

183

4.- Tabla de reas acumuladas :


Nos da la probabilidad de que un valor est comprendido entre - y a, es decir, la
siguiente probabilidad
P( - < Z -a )
Este ltimo tipo de tablas es el que hemos utilizado anteriormente, pues nos
proporciona la funcin de distribucin de la variable.

3.2.1.5 Tipificacin de la variable


Hemos indicado anteriormente que la distribucin normal estndar N(0,1) se
encuentra tabulada, lo que nos permite un clculo rpido de las probabilidades asociadas
a sta distribucin. Pero no existen tablas para el clculo de las probabilidades de otras
distribuciones normales, adems de que tendran que existir infinitas tablas (una para
cada posible par de combinaciones de media y desviacin tpica). Aprovechando que el
comportamiento de las curva de las distribuciones normales es siempre el mismo, nos
hace pensar que podra existir una distribucin normal que permanezca invariable, sea
cul sea la variable. Esta es la distribucin normal estndar, y el proceso de pasar de una
distribucin normal cualquiera a una distribucin normal estndar se denomina
tipificacin de la variable, que equivale a cambiar la escala de partida de los valores de
X en una nueva escala patrn. Esto se lleva a cabo en dos pasos:
1 Centrar, es decir, trasladar la media de la distribucin al origen de
coordenadas, lo que equivale a hacer = 0.
2 Reducir la desviacin tpica a 1, que equivale a dilatar o contraer la grfica
de la distribucin hasta que coincida con la grfica de la funcin normal
estndar.
Esto se consigue mediante el cambio de variable siguiente:

Z=

X!
"

que produce la siguiente transformacin de escala de medidas:

184

Valores de X
-2!

-!

+!

+2!

Valores de Z
-2

-1

3.2.1.6 Propiedades de la distribucin normal


SUMA O RESTA DE VARIABLES NORMALES
Si X1 es una variable que se distribuye normalmente N(1, 1), y X2 es otra
variable que se distribuye normalmente N(2, 2). Entonces la variable X = X1 X2
sigue tambin una distribucin normal con media = 1 2, y cuya varianza es 2 =
12+ 22. Es decir, la variable X sigue una distribucin

N( 1 2 , ! 12 + ! 22 )

TEOREMA DE DE MOIVRE
Si X es una variable binomial de parmetros n y p; entonces si n es grande y p, ni
pequeo ni grande, (o sea, ni p ni q prximos a cero) podemos considerar que esa
variable X sigue una ley normal de media np y varianza npq, y por lo tanto, la variable

Z=

X ! np
npq

sigue una distribucin normal N(0,1).


En este caso hemos de tener en cuenta que X era una variable aleatoria discreta y
queremos tratarle cmo continua, por lo que es preciso hacer una correccin para
continuidad. As se verifica que:
P(X = 3) = P(2.5 < X 3.5)
P(X 3) = P(X 3.5)
P(X < 3) = P(X 2.5)

185

Obviamente stas no son igualdades ciertas, pero permiten tratar la variable


discreta como continua.
Si en lugar de trabajar con una variable aleatoria binomial partisemos de una
variable de Poisson o una Hipergeomtrica, la aproximacin sera absolutamente
similar.

TEOREMA CENTRAL DEL LMITE


Si X es una variable aleatoria (no importa como se distribuya) con media y
varianza 2, y tomamos una muestra de n elementos, entonces la distribucin muestral
de la media aritmtica de la muestra es aproximadamente normal con media y
varianza 2/n, siendo mejor la aproximacin a medida que aumenta el tamao de la
muestra.
Lgicamente, si X es una variable que se distribuye normalmente, la media
muestral se distribuye exactamente como una distribucin normal.
Este teorema es importante en posteriores unidades, ya que nos dar pie a
resultados fundamentales de la Inferencia Estadstica.

186

3.2.2 Modelo Chi-cuadrado (de Pearson)


3.2.2.1 Definicin
Es otra distribucin de gran importancia en Estadstica, que fue descubierta por
HELMET (1876), pero cay en el olvido hasta que en 1900 fue descubierta de nuevo
por PEARSON.
Es una variable obtenida al sumar los cuadrados de n variables aleatorias normales
estndar, independientes entre s. Recibe el nombre de 2 n de PEARSON, con n grados
de libertad, o sea,

2 n = Z12 + Z22 + ..... + Zn2

siendo cada Zi una variable normal N(0,1), e independientes.


Esta variable depende, pues, del nmero de sumandos que la forman, llamado
"grados de libertad", y el rango es el semieje real positivo (ya que es una suma de
cuadrados).
La funcin de densidad de una variable 2 n es la siguiente:

1
x
n
$
e " 2 x 2 "1 si
n
f(x) = % 2 2 !(n 2)
0
si
&

x# 0*
x<0

Para cada valor de n se tiene una curva distinta, como representacin de su


funcin de densidad. La figura 3.9 representa las funciones de densidad de variables
Chi-cuadrado para diferentes valores de n.

#
n "1 "x
e dx
(n) es la funcin gamma, que denota la siguiente integral: !( n ) = $ x
0

si n en entero (n) = (n-1)! ; adems (n/2) = .

que verifica, que

187

Figura 3.9: Comparacin entre las funciones de densidad de la variable


chi-cuadrado para distintos valores de n.

3.2.2.2 Propiedades de la distribucin chi-cuadrado


1.- La variable solo puede tomar valores positivos.
2.- Es asimtrica.
3.- Depende del parmetro n (grados de libertad).
4.- Su esperanza matemtica es n, y su varianza, 2n.
5.- Propiedad aditiva o reproductiva :Si 2n y 2m son dos variables Chicuadrado con n y m grados de libertad respectivamente, independientes
entre s, entonces la suma de las dos variables es una variable Chi-cuadrado
con n+m grados de libertad. Esto se puede generalizar a la suma de
cualquier nmero de variables Chi-cuadrado, independientes.
6.- Al aumentar el nmero de grados de libertad, la distribucin Chicuadrado se aproxima asintticamente a una distribucin normal.
Esta aproximacin es de la siguiente forma:
para n > 30, la variable
N( 2n ! 1,1) .

2! 2n se aproxima asintticamente a una variable

7.- En una variable aleatoria normal N(, ), si tomamos una muestra de


tamao n se verifica que

188

(n ! 1)s2
"

es aproximadamente 2n-1

2
siendo s la cuasivarianza muestral.

3.2.2.3 Manejo de las tablas de la chi-cuadrado


A continuacin aparecen las tablas en las que figuran tabuladas las distribuciones
Chi-cuadrado.
Dentro de la tabla figura el valor de la variable que en una distribucin Chicuadrado con los grados de libertad que vienen indicados en la primera columna, deja
un rea , indicado en la primera fila, a su derecha.

189

g.l \
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0.9950
0.0000393
0.0100
0.0717
0.207
0.412
0.676
0.989
1.344
1.735
2.156
2.603
3.074
3.565
4.075
4.601
5.142
5.697
6.265
6.844
7.434
8.034
8.643
9.260
9.886
10.520
11.160
11.808
12.461
13.121
13.787

0.9750
0.000982
0.0506
0.216
0.484
0.831
1.237
1.690
2.180
2.700
3.247
3.816
4.404
5.009
5.629
6.262
6.908
7.564
8.231
8.907
9.591
10.283
10.982
11.689
12.401
13.120
13.844
14.573
15.308
16.047
16.791

0.950
0.00393
0.103
0.352
0.711
1.]45
1.635
2.167
2.733
3.325
3.940
4.575
5.226
5.897
6.571
7.261
7.962
8.672
9.390
10.117
10.851
11.591
12.338
13.091
13.848
14.611
15.379
16.151
16.928
17.708
18.493

0.900
0.0158
0.211
0.584
1.064
1.610
2.204
2.833
3.490
4.168
4.865
5.578
6.304
7.047
7.790
8.547
9.312
10.085
10.865
11.651
12.443
13.240
14.041
14.848
15.659
16.473
17.292
18.114
18.939
19.769
20.599

0.200
1.642
3.219
4.642
5.989
7.289
8.558
9.803
11.030
17.242
13.442
14.631
15.812
16.985
18.151
19.311
20.465
21.615
22.760
23.900
25.038
26.171
27.301
28.429
29.553
30.675
31.795
32.912
34.027
35.139
36.250

0.10
2.706
4.605
6.251
7.779
9.236
10.645
17.017
13.362
14.684
15.987
17.275
18.549
19.812
21.064
22.307
23.452
24.769
25.989
27.204
28.412
29.615
30.813
32.007
33.196
34.382
35.563
36.741
37.916
39.087
40.256

0.050
3.841
5.g91
7.851
9.488
11.070
17.592
14.067
15.507
16.919
18.307
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
31.410
32.671
33.924
35.172
36.415
37.652
38.885
40.113
41.337
42.557
43.773

0.025
5.024
2.378
9.348
11.143
12.833
14.449
16.013
17.535
19.023
20.483
21.920
23.337
24.736
26.119
27.488
28.845
30.191
31.526
32.857
34.170
35.479
36.781
38.076
39.364
40.646
41.923
43.195
44.461
45.722
46.979

0.010
6.631
9.210
11.345
13.277
15.086
16.812
18.475
20.090
21.666
23.209
24.725
26.217
27.588
29.141
30.578
32.000
33.409
34.805
36.191
37.566
38.932
40.289
41.638
42.980
44.314
45.642
46.963
48.278
49.588
50.892

Tabla de la distribucin Chi-cuadrado

EJEMPLO 3.26:
Si X sigue una distribucin Chi-cuadrado con 12 grados de libertad.
Cul es el valor de la variable que deja a su derecha un rea de 0.05?
Solucin:
Buscando en la tabla: 21.026

0.001
10.828
13.816
16.266
18.467
20.515
22.458
74.327
26.124
77.877
29.588
31.264
32.909
34.528
36.173
37.697
39.752
40.790
42.312
43.820
45.315
46.797
48.268
49.728
51.179
57.620
54.052
55.476
56.892
58.301
59.703

190

3.2.3 Distribucin t de Student


3.2.3.1 Definicin
La distribucin "t" es sumamente importante en Inferencia Estadstica; fue
descubierta por GOSSET (1908). El nombre de STUDENT es el seudnimo con el que
firm sus publicaciones estadsticas, y puede pensarse de l que es el fundador de la
inferencia estadstica exacta, pues hasta 1908 era corriente tratar a la variable

(x ! )
s n
como una variable normal.
En su definicin matemtica, sean (, 1, 2, ....., n) n+1 variables aleatorias
normales N(0,1) e independientes

Se define la variable "t" de STUDENT con n grados de libertad como

tn =

!
!12 + !22 +!+!2n
n

Tambin puede definirse a travs de una variable Z normal estndar N(0,1), y una
variable 2 que siga una distribucin Chi-cuadrado con n grados de libertad; se define
entonces la variable "t" de STUDENT con n grados de libertad como

tn =

Z
! 2n
n

La funcin de densidad de esta variable es:


2&)
!( n+1
) #
x
2
%1 + (
f(x) =
n"!( n2 ) $
n'

n+1
2

191

3.2.3.2 Propiedades de la distribucin "t"


1.- Depende de un nico parmetro, el nmero de grados de libertad.
2.- El rango de la variable es todo el eje real (-, +).
3.- Su grfica es simtrica respecto al eje de ordenadas OY.
4.- El valor x = 0 es la media, mediana y moda de la distribucin.
5.- Al aumentar n, se va haciendo cada vez ms apuntada la grfica de su
funcin de densidad, siendo el lmite para n ! la curva normal tipificada.

Distr. Normal

Distr. t de Student

0
Figura 3.10: Funcin de densidad de la distribucin normal y de la "t".

6.- En el muestreo de una poblacin normal N(, ), si tomamos una


muestra de tamao n de media x y varianza S2, la variable
(x ! )
t n!1 = s
n !1

sigue una distribucin "t" de STUDENT con n-1 grados de libertad.


Esta propiedad es muy utilizada en la estimacin y el contraste de hiptesis sobre
la media de la poblacin.

192

3.2.3.3 Manejo de las tablas de la distribucin "t"


Existen diferentes tipos de tablas de la distribucin "t", siendo las ms utilizadas
las de una cola, y las de dos colas.
Nosotros expondremos la utilizacin de las tablas de dos colas que aparecen a
continuacin:
gl

0.50

0.40

0.30

0.20

0.10

0.05

0.02

0.01

0.001

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
80
100

1.000
0.816
0.765
0.741
1.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.691
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.682
0.681
0.680
0.679
0.679
0.678
0.677
0.674

1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.852
0.851
0.850
0.849
0.848
0.846
0.845
0.842

1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.07~
1.076
1.074
1.071
1.069
1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.052
1.050
1.049
1.047
1.046
1.043
1.042
1.036

3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.306
1.303
1.301
1.299
1.296
1.292
1.290
1.282

6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.690
1.684
1.679
1.676
1.671
1.664
1.660
1.645

12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.030
2.021
2.014
2.009
2.000
1.990
1.984
1.960

31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.438
2.423
2.412
2.403
2.390
2.374
2.364
2.326

63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.724
2.705
2.690
2.678
2.660
2.639
2.626
2.576

636.619
31.598
12.929
8.610
6.869
5.959
5.408
5.041
4.781
4.587
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
3.850
3.819
3.792
3.767
3.745
3.725
3.707
3.690
3.674
3.659
3.646
3.592
3.551
3.521
3.497
3.461
3.417
3.391
3.291

Tabla de la distribucin t de Student

en ellas aparece el valor de la variable que para los grados de libertad indicados en la
primera columna, deja un rea en las dos colas de valor indicado en la primera fila.
EJEMPLO 3.27:
Si X es una distribucin que sigue una distribucin "t" con 10 grados de
libertad, calcular el valor de la variable, tal que a la izquierda de -2.228 y a la
derecha de 2.228 deja un rea total de 0.05.

193

Solucin:

194

3.2.4
Distribucin "F" de FisherSnedecor
3.2.4.1 Definicin
Supongamos que X e Y sean dos variables aleatorias independientes, que siguen
distribuciones Chi-cuadrado con n y m grados de libertad respectivamente, y tales que
n

X=

X 2i

i=1

Y=

! Yj2
j=1

siendo las variables Xi e Yj que siguen distribuciones normal estndar.


Se define la variable F de Snedecor (o de Fisher-Snedecor), la definida por
X
F= Yn
m

denominada distribucin F de Fisher-Snedecor con n y m grados de libertad.


Su funcin de densidad est definida por la funcin:
n
%!( n + m )( n ) n 2
x 2 #1
'
2
m
"
si x > 0
fn,m (x) = & !( n )!( m ) (1 + n x)(n+ m) 2
2
2
m
'(
0
si x $ 0
Su representacin grfica es de la siguiente forma:

Figura 3.11: Representacin de la funcin de densidad de la distribucin F de Snedecor

195

3.2.4.2 Propiedades de la distribucin F de Snedecor


1.- El recorrido de la variable F es el intervalo (0,).
2.- Depende de dos parmetros, los grados de libertad n y m.
3.- Presenta asimetra positiva, con un grado que depende conjuntamente de
los grados de libertad del numerador y del denominador.

s2
4.- El cociente 1 2 sigue una distribucin con n1-1 y n2-1 grados de
s2
libertad, siendo s12 y s22 las cuasivarianza muestrales de dos muestras de
tamaos n1 y n2 respectivamente, provenientes de dos poblaciones normales
N(1, 1) y N(2, 2) respectivamente.

Esto es consecuencia de que el teorema de Fisher indica que la variable

(n1 ! 1)s12
"2

sigue una distribucin Chi-cuadrado con n1-1 grados de libertad, y


anlogamente, la variable

(n 2 ! 1)s22

"2
sigue una distribucin Chi-cuadrado con n2-1 grados de libertad. Entonces,
el cociente

( n1 ! 1)s12
(n1 ! 1)" 2
( n2 ! 1)s22
(n 2 ! 1)" 2
sigue una distribucin F de Snedecor con n1-1 y n2-1 grados de libertad, y si
las varianzas poblacionales son iguales, se verifica entonces el resultado
indicado.

196

5.- La distribucin F juega un papel importante en el anlisis de la varianza


(ANOVA) y en el anlisis de la regresin.

3.2.4.3 Utilizacin de las tablas de la distribucin F


de Snedecor
Las tablas de la distribucin F de Snedecor contienen los valores F tales que
P(F>F ) = , para n y m grados de libertad, y para cada nivel de significacin en cada
una de las tablas.
n2\n1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

10

20

30

40

60

120

161.4
18.51
10.13
7.71
6.61
S~99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.23
4.21
4.20
4.18
4.17
4.08
4.00
3.92
3.84

199.5
19.00
9.55
6.94
5~79
5.14
4.74
4.46
4.26
4.10
3.98
3.89
3.81
3.74
3.68
3.63
3.59
3.55
3.52
3.49
3.47
3.44
3.42
3.40
3.39
3.37
3.35
3.34
3.33
3.32
3.23
3.15
3.07
3.00

215.7
19.16
9.28
6.59
5.41
4.76
4.35
4.07
3.86
3.71
3.59
3.49
3.41
3.34
3.29
3.24
3.20
3.16
3.13
3.10
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93
2.92
2.84
2.76
2.68
2.60

224.6
19.25
9.12
6.39
5.19
4~53
4.12
3.84
3.63
3.48
3.36
3.26
3.18
3.11
3.06
3.01
2.96
2.93
2.90
2.87
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70
2.69
2.61
2.53
2.45
2.37

230.2
19.30
9.01
6.26
5.05
4.39
3.97
3.69
3.48
3.33
3.20
3.11
3.03
2.96
2.90
2.85
2.81
2.77
2.74
2.71
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.55
2.53
2.45
2.37
2.29
2.21

234.0
19.33
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.53
2.51
2.49
2.47
2.46
2.45
2.43
2.42
2.34
2.25
2.18
2.10

236.8
19.35
6.89
6.09
4.88
4.21
3.79
3.50
3.29
3.14
3.01
2.91
2.83
2.76
2.71
2.66
2.61
2.58
2.54
2.51
2.49
2.46
2.44
2.42
2.40
2.39
2.37
2.36
2.35
2.33
2.25
2.17
2.09
2.01

238.9
19.37
8.85
6.04
4.82.
4.15
3.73
3.44
3.23
3.07
2.95
2.85
2.77
2.70
2.64
2.59
2.55
2.51
2.48
2.45
2.42
2.40
2.37
2.36
2.34
2.32
2.31
2.29
2.28
2.27
2.18
2.10
2.02
1.94

240.5
19.38
8.81
6.00
4.77
4.10
3.68
3.39
3.18
3.02
2.90
2.80
2.71
2.65
2.59
2.54
2.49
2.46
2.42
2.39
2.37
2.34
2.32
2.30
2.28
2.27
2.25
2.24
2.22
2.21
2.12
2.04
1.96
1.88

241.9
19.40
8.79
5.97
4.73
4.06
3.64
3.35
3.14
2.98
2.85
2.75
2.67
2.60
2.54
2.49
2.45
2.41
2.38
2.35
2.32
2.30
2.27
2.25
2.24
2.22
2.20
2.19
2.18
2.16
2.08
1.99
1.91
1.83

248.0
19.45
8.66
5.80
4.56
3.87
3.44
3.15
2.94
2.77
2.65
2.54
2.46
2.39
2.33
2.28
2.23
2.19
2.16
2.12
2.10
2.07
2.05
2.03
2.01
1.99
1.97
1.96
1.94
1.93
1.84
1.75
1.66
1.57

250.1
19.46
8.62
5.74
4.50
3.81
3.38
3.08
2.86
2.70
2.57
2.47
2.38
2.31
2.25
2.19
2.15
2.11
2.07
2.04
2.01
1.98
1.96
1.94
1.92
1.90
1.88
1.87
1.85
1.84
1.74
1.65
1.55
1.46

251.1
19.47
8.59
5.72
4.46
3.77
3.34
3.04
2.83
2.66
2.53
2.43
2.34
2.27
2.20
2.15
2.10
2.06
2.03
1.99
1.96
1.94
1.91
1.89
1.87
1.85
1.84
1.82
1.81
1.79
1.69
1.59
1.50
1.39

252.2
19.48
8.57
5.69
4.43
3.74
3.31
3.00
2.79
2.62
2.49
2.38
2.30
2.22
2.16
2.11
2.06
2.02
1.98
1.95
1.92
1.89
1.86
1.84
1.82
1.80
1.79
1.77
1.75
1.74
1.64
1.53
1.43
1.32

253.3
19.49
8.55
5.66
4.40
3.70
3.27
2.97
2.75
2.58
2.45
2.34
2.25
2.18
2.11
2.06
2.01
1.97
1.93
1.90
1.87
1.84
1.81
1.79
1.77
1.75
1.73
1.71
1.70
1.68
1.58
1.47
1.35
1.22

254.3
19.50
8.53
5.63
4.36
3.67
3.23
2.93
2.71
2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
1.81
1.78
1.76
1.73
1.71
1.69
1.67
1.65
1.64
1.62
1.51
1.39
1.25
1.00

Tabla de la distribucin F de Fisher-Snedecor al nivel del 5%

EJEMPLO 3.28:
Calcular F para =0.05, y n=5; m=15 grados de libertad.
Solucin:
Se busca en la tabla correspondiente al nivel del 5%, en la primera fila, los
grados de libertad del numerador (5), y en la primera columna los grados de libertad
del denominador (15), apareciendo el valor de F en la confluencia de dicha fila y
columna:

197

As, se verifica que:


F0.05; 5, 15 = 2.90

EJEMPLO 3.29:
Calcular F para =0.95, y n=15; m=5 grados de libertad.
Solucin:
Teniendo en cuenta la siguiente propiedad

F !;n,m =

1
F1"!;m,n

se verifica que
F0.95;15,5 =

1
F1!0.95;5,15

1
F0.05;5,15

1
= 0.345
2.90

198

"DISTRIBUCIN NORMAL"

3.3 Ampliacin

199

Obviamente al profesor le bastara con tener en cuenta que la representacin


grfica de la funcin de densidad es una curva simtrica y que el rea bajo la curva es
la unidad, pero entendemos que puede resultarle cmodo disponer de un juego de
ejercicios que contemplen distintos casos de uso frecuente.
El siguiente apartado est redactado de acuerdo a esta idea.

3.3.1 Algunos casos de inters en el


manejo de tablas de la normal
Dada la importancia y el gran uso de la distribucin normal, vamos a analizar en
detalle distintos casos que se suelen presentar a la hora de trabajar con esta distribucin.

PRIMER CASO
Supondremos como primer caso, el ms trivial: calcular la probabilidad de que la
variable aleatoria Z, que sigue una distribucin normal estndar, sea menor o igual que
un valor positivo a.
Basta con buscar en la tabla directamente el valor de a, teniendo en cuenta que en
la primera columna de la tabla aparecen las unidades y las dcimas del valor a y en la
primera fila el valor de las centsimas.
Como interseccin de la fila y la columna correspondiente aparece el valor

P( Z ! a )

200

Figura 3.12: Representacin grfica de la informacin que nos suministra de manera directa
la tabla de la normal con la que vamos a trabajar: P ( Z ! a )

SEGUNDO CASO: En una distribucin

N(0,1)

calcular

P( Z ! "a ) .

Como segundo caso consideraremos, por ejemplo, calcular la probabilidad de que


la variable aleatoria Z tome valores menores o iguales que una cierta cantidad a
negativa, o sea P( Z ! "a )
La tabla no distingue entre desviaciones positivas y negativas; es decir, en la tabla
slo aparecen valores positivos. Analicemos, pues, geomtricamente la situacin.

Figura 3.13.a: El rea rayada de la curva representa


representa

P (Z ! " a )

Figura 3.13.b: El rea rayada de la curva

P (Z ! a )

La probabilidad pedida se corresponde con el rea rayada en la figura 3.13a. El rea


rayada en la figura de la izquierda (figura 3.13a) es igual al rea rayada en la figura de
la derecha (figura 3.13b). A su vez, ese rea es igual al rea total, que vale 1, menos el
rea no rayada. El rea de la superficie no rayada en la grfica de la derecha es la que
viene en la tabla.
Por tanto:

201

P( Z ! "a ) = 1 " P( Z ! a )
EJEMPLO 3.30:
Calcular P(Z-2)
Solucin:

P( Z ! "2 ) = P (Z # 2) = 1 " P(Z < 2) = 0.9772

TERCER CASO: En una distribucin

N(,!) ,

calcular

P( Z ! a )

Como tercer caso consideraremos la misma situacin que en el caso primero pero
suponiendo ahora, que la variable aleatoria sigue una distribucin normal no estndar,
de parmetros , .

En este caso, hemos de cambiar previamente de escala de medida; es decir, es


x!
preciso tipificar primero la variable. El cambio adecuado es z =
y por tanto:
"

a " &
$ x " a " &
$
P( X ! a ) = P%
!
= P% z !
'
#
#
# '
encontrndonos, una vez efectuado el cambio, en la misma situacin del primer caso.

EJEMPLO 3.31:
Calcular en una N(2,3) la P(X 2.14):
Solucin:

# x " 2 2.14 " 2 %


P( X ! 2.14) = P$
!
= P( z ! 0.05) = 0.519
3
3 &
Valor que se obtiene directamente de las tablas, como en el caso anterior.

202

CUARTO CASO: En una distribucin

N(,!) ,

obtener

P( Z ! "a ) .

Se trata, lo mismo que en el caso anterior de dar solucin a uno de los supuestos
ya vistos, en concreto al supuesto segundo, pero considerando ahora que trabajamos con
una normal no estndar.
Lo primero que tenemos que hacer es tipificar ya que si no, la igualdad anterior no
se verifica, por tanto:

a " &
a " &
$ x " "a " &
$
$
P( X ! "a ) = P%
!
=
P
z
!
"
=
1"
P
z
<
%
%
#
# '
# '
# '

EJEMPLO 3.32:
En una N(5,3) calcular P( X ! "8)
Solucin:

13
13
# x " 5 "8 " 5%
#
#
P( X ! "8) = P$
!
= P$ z ! " %& = 1 " P$ z < %& =
&
3
3
3
3

= 1 ! P(z " 4.33) = 1 ! 0.9999 = 0.0001

QUINTO CASO: En una distribucin

N (0,1)

calcular

Figura 3.14: El rea rayada de la curva representa P ( Z ! a )

Obviamente P( Z ! a ) = 1 " P(Z < a ) .

P( Z ! a )

203

SEXTO CASO: En una distribucin

N(,!)

Obtener

P( X ! a ) :

a"&
$ x " a " &
$
P( X ! a ) = P%
!
=
1"
P
z
<
%
#
# '
# '

SPTIMO CASO: En una distribucin N(0,1) calcular P(a ! Z ! b)

Figura 3.15. El rea rayada de la curva representa P ( a ! Z ! b )

Observando el grfico de la figura 3.15 y teniendo en cuenta las propiedades de la


Normal, tenemos:

P(a ! Z ! b) = P( Z ! b) " P(Z < a )

OCTAVO CASO: En una N(,!) obtener P(a ! X ! b)


Si en lugar de trabajar con una N(0,1) trabajsemos con una N(,!) sera preciso,
como en casos anteriores, tipificar. Es decir:

b " &
a " &
$a " x " b " &
$
$
P(a ! X ! b) = P%
!
!
=
P
z
!
"
P
z
<
%
%
#
#
# '
# '
# '

204

EJEMPLO 3.33:
En una N(0,1) calcular P(1! X ! 1.85)
Solucin:

P(1! X ! 1.85) = P(X ! 1.85) " P( X < 1) = 0.9678 " 0.8413 = 0.1265

NOVENO CASO: En una N(0,1)

calcular

P( !a " Z " !b)

Figura 3.16. El rea rayada de la curva representa P ( ! a " Z " ! b)

P( !a " Z " !b) = P(Z " ! b) ! P( Z < !a )


Tal como ya sabemos esto se puede escribir:

P( Z ! "b) " P(Z < "a ) = 1" P( Z < b) " [1 " P(Z ! a )] =
= 1 " P (Z < b ) " 1 + P (Z ! a ) = P ( Z ! a ) " P (Z < b )

EJEMPLO 3.34:
En una N(0,1) calcular P( !2.3 " Z " !1.8)
Solucin:
P( !2.3 " Z " !1.8) = P(Z " !1.8) ! P(Z < !2.3) =
= 1! P( Z < 1.8) ! 1 + P( Z " 2.3) = P( Z " 2.3) ! P( Z < 1.8) =
= 0.9893 ! 0.9641 = 0.0252

205

Si en lugar de estar en una N(0,1) estuvisemos en una N(,!) , hubisemos


seguido el mismo razonamiento pero despus de tipificar.

DCIMO CASO: Clculo del percentil correspondiente a una probabilidad dada.


Puede ocurrir que conocida la probabilidad p, se nos pregunte qu valor de a
verifica que P( X ! a ) = p
Podemos distinguir dos casos:
a) La variable aleatoria sigue una N(0,1):
En este caso, basta buscar en el interior de la tabla el valor ms aproximado a p y
anotar cual es el correspondiente valor de a (en las filas y columnas exteriores de la
tabla)

EJEMPLO 3.35:
Cul es el valor de a para el que P( Z ! a ) = 0.9251 ?
Solucin:
Buscamos dentro de la tabla el valor 0.9251 y vemos que el correspondiente valor
de a es 1.44.
b) La variable aleatoria sigue una normal de parmetros N(,!)
En este caso, hemos de tipificar previamente; es decir, expresar a en la escala
correspondiente a una N(0,1)

EJEMPLO 3.36:
Obtener el valor de a que verifica que P( X ! a ) = 0.8413 en una distribucin
N(5,3)

206

Solucin:

a " 5%
#
P( X ! a ) = P$ Z !
= 0.8413
3 &
Buscando esa probabilidad en las tablas obtenemos el valor 1.0; es decir:

a!5
= 1" a = 3 + 5 = 8
3

207

"DISTRIBUCIN NORMAL"

3.4 Trabajo de investigacin

208

3.4.1 Aplicacin del manejo de tablas


de la normal a un ejemplo de
investigacin
Se sabe que el dimetro de los hemates de individuos
normales sigue un modelo N(7.5, 0.2) y que el dimetro de los
hemates de individuos cirrticos sigue un modelo N(8.5 , 0.6).
Supongamos que estamos interesados en clasificar a un
individuo en uno de dos grupos: normal cirrtico en base a una
cierta variable: dimetro de los hemates.
En trabajos reales el estudio se lleva a cabo no slo considerando la informacin
de una variable sino de varias, y la solucin se obtiene a travs de un anlisis
multivariante, pero esto excede el nivel de este trabajo.
Para clasificar correctamente a los individuos necesitaramos conocer cul es el
mximo valor del dimetro de los hemates en individuos normales.
Obviamente ese valor no es conocido ya que slo disponemos de la informacin
de que el valor del dimetro es una cantidad aleatoria que se ajusta a una normal de
parmetros determinados.
Debemos fijar, pues, el valor M para el dimetro como valor mximo de
forma que los individuos con dimetro menor sern clasificados como normales y
aqullos que tengan dimetro mayor sern clasificados como patolgicos
Fijaremos esta cantidad de forma que el 95%, por ejemplo, de los individuos
sanos quede correctamente clasificado, es decir, de forma que slo un 5% de los
individuos sanos tenga un dimetro mayor de esa cantidad M.

209

La situacin podra representarse grficamente de la siguiente manera (figura


3.17):

NORMALES N(7.5; 0.2)

CIRROTICOS N(8.5; 0.6)

0
6.5

7.5

8.5

9.5

10

M=?
Figura 3.17. Representacin grfica de la distribucin del dimetro de los hemates
en individuos sanos y en individuos cirrticos. M ser el punto de corte a partir del cual
el individuo ser clasificado en una o en otra categora.

La cantidad M se calcula de forma que se verifique que P (X ! M ) = 0. 95


teniendo en cuenta que la variable X sigue una ley Normal de media 7.5 y desviacin
tpica 0.2.
El clculo es inmediato:
M / P(X<M) = 0.95

en una N(7.5 , 0.2)

P(X<M) = P(Z < (M-7.5)/0.2) = 0.95


(M-7.5)/0.2= 1.645
M = 7.5 + 1.645 . 0.2 = 7.829
Por tanto: Declararemos enfermo (cirrtico) a todo individuo con dimetro de
los hemates superior a 7.829

210

Debemos tener en cuenta que, segn este convenio de clasificacin, el 5% de los


individuos sanos sern declarados patolgicos errneamente, es decir, el
procedimiento propuesto proporciona un 5% de "falsos positivos". Llamaremos a este
error, por ejemplo error

! .

Teniendo en cuenta que el dimetro de los hemates en individuos cirrticos se


ajusta a una ley Normal de media 8.5 y desviacin 0.6 es evidente que, con este criterio,
algn individuo enfermo puede ser declarado errneamente normal. Llamaremos
a este error , que nos indica el porcentaje de "falsos negativos." Hemos de determinar
qu error cometemos cuando fijamos un riesgo

! del 5%, es decir, cuando

consideramos que el punto de corte para decidirnos en declarar a los individuos en


sanos o en patolgicos es de 7.829.
Para obtener el porcentaje de personas que declararemos como sanas cuando en
realidad son cirrticas basta con determinar en una N (8.5, 0.6) (la de los individuos
cirrticos) la probabilidad de que la variable aleatoria tome valores menores al valor
prefijado como cota.
Es decir:
P(X < 7.829)

en una normal N(8.5, 0.6)

P(X < 7.829) = P(Z < (7.829 - 8.5)/0.6) =


P(Z < -1.12) = P(Z> 1.12) = 1 - P(Z<1.12) = 1 - 0.8686
= 0.1314
Observamos como siguiendo el criterio de partida, de prefijar el porcentaje de
falsos positivos en un 5%, obtenemos un 13.14% de malas clasificaciones en individuos
enfermos: El 13.14% de los cirrticos sern declarados normales.
La regla: DECLARAR CIRRTICO a un individuo con dimetro de
hemates superior a 7.829 y NORMAL en caso contrario, da lugar a que:
Un 5% de los normales sern declarados cirrticos (falsos positivos) y
un 13.14% de los cirrticos sern declarados sanos (falsos negativos)
Grficamente la situacin sera (figura 3.18):

211

NORMALES N(7.5; 0.2)

" = 0.1314

! = 0.05(fijado)
CIRROTICOS N(8.5; 0.6)

0
6.5

7.5

8.5

9.5

10

M = 7.8 29
Figura 3.18: Representacin grfica de la distribucin del dimetro de hemates en las dos poblaciones.
Prefijado queda delimitado el valor de M y el valor de

Al observar esta situacin podramos pensar en ser ms restrictivos y prefijar un


error ms pequeo, por qu no un 1% por ejemplo.
Por qu habramos de arriesgarnos en declarar enfermos a un 5% de los sanos, lo
que socialmente podra tener connotaciones negativas (declaramos cirrticos a
individuos que no lo son), si podemos prefijar este error tan pequeo como queramos.?
Desafortunadamente disminuir el trae consigo aumentar el .

Observemos qu ocurrira si quisiramos disminuir cualquiera de los errores, por


ejemplo qu ocurrira si disminuysemos ?:
Si disminuye, aumenta
En efecto:
Si

! disminuye, por ejemplo ! = 1% , M aumenta.

Veamos como esta afirmacin es cierta. Realizar este clculo es idntico al caso
anterior slo que ahora la regla de decisin es distinta:

212

Buscamos un M' (dimetro de las hemates) que slo lo superan un 1% de


individuos normales. Se trata de localizar en una N(7.5, 0.2) un valor de la variable que
verifique que el 1% es mayor que l, o lo que es lo mismo un 99% de los individuos
tenga el dimetro de los hemates menor que dicho valor.
Sea M / P(X<M)=0.99

en una N(7.5 , 0.2)

P(X<M) = P(Z < (M-7.5)/0.2) = 0.99


(M-7.5)/0.2 = 2.33
M = 7.5 + 2.33 x 0.2 = 7.966
Observamos que segn este criterio el valor de corte es ahora mayor M> M
Hemos conseguido disminuir el porcentaje de falsos positivos pero cmo saber
cmo se ha modificado el ! .
Se trata de buscar en la normal de los cirrticos la probabilidad de encontrarnos
valores menores que 7.966
P(X < 7.966) = P(Z < (7.966-8.5)/0.6) = 0.1867
El 18.67% de los cirrticos sern declarados normales.
Luego:
Si el porcentaje de falsos positivos disminuye hasta el 1%, el porcentaje de falsos
negativos sobrepasa el 18%.
Nos interesa prefijar los errores pequeos, obviamente a nadie le gusta
asumir riesgos grandes, pero hay que tener cuidado al prefijar los riesgos ya
que ambos tipos de errores estn claramente relacionados y disminuir uno de
ellos trae consigo aumentar el otro considerablemente.

También podría gustarte