Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3 Distribuciones
3 Distribuciones
144
145
Cuando la variable aleatoria toma un nmero finito o infinito numerable* de valores, diremos que es una "variable aleatoria discreta". Veamos ejemplos: En el caso del lanzamiento de un dado perfecto, la variable aleatoria X= "nmero que sale en la cara superior" puede tomar los valores X={1, 2, 3, 4, 5, 6} con probabilidades P(X)={1/6, 1/6, 1/6, 1/6, 1/6, 1/6}. Si consideramos la variable aleatoria X= "nmero de varones en una familia de dos hijos", X={0, 1, 2} y P(X)={1/4, 1/2, 1/4}.
(Observar el espacio muestral del experimento aleatorio).
En general diremos, que una variable aleatoria discreta estar identificada si conocemos sus posibles valores X = {x1 , x 2 , ..., x n } y sus respectivas probabilidades P(X = x i ) = P i
A toda regla que permita asociar a cada valor xi de la variable aleatoria su probabilidad Pi, la llamaremos "funcin de probabilidad". Tal funcin de probabilidad puede venir dada por una tabla: X P(X) o bien por una frmula matemtica. Tambin podemos definir la variable aleatoria a travs de la "funcin de distribucin".
F(X) = P(X ! x)
0 1/4
1 1/2
2 1/4
Un conjunto infinito A se dice que es numerable si se puede establecer una aplicacin biyectiva f entre el conjunto de los naturales y A.
146
F(X) no es ms que la probabilidad de que la variable X tome valores menores o iguales que x. En el ejemplo anterior:
F(0) = P(X ! 0) = P(X = 0) F(1) = P(X ! 1) = P(X = 0) + P(X = 1) F(2) = P(X ! 2) = P(X = 0) + P(X = 1) + P(X = 2)
De un modo general, a toda tabla, grfica o expresin matemtica que indique los valores que puede tomar una variable aleatoria y las probabilidades con que los toma, se llamar "distribucin de probabilidad de dicha variable aleatoria". El concepto de variable aleatoria proporciona un medio para relacionar cualquier resultado con una medida cuantitativa.
E [ X] = x1 p1 + x 2 p 2 +... + x n p n
La esperanza de una variable aleatoria X tambin se representa por , y se llama media de la distribucin. Por tanto, "esperanza de la variable aleatoria" y "media de la distribucin" son expresiones equivalentes.
= ! p ix i = E[ X]
i= 1
El conocimiento de la media de la distribucin no es suficiente para caracterizar la distribucin, ya que hay distribuciones con la misma media y distintas unas de otras.
147
Para medir la dispersin de los valores de una variable aleatoria X respecto de su media , se define el siguiente estadstico llamado varianza:
V [X ] = E ( x ! )
]
2
Es decir:
V[X] = (x1 ! ) p1 + ( x2 ! ) p2 +... + ( xn ! ) p n
2 2
Puesto que la varianza no podra medirse en las mismas unidades que la variable, utilizamos la raz cuadrada de la varianza y a este nmero la llamamos desviacin tpica.
Desv[ X] = V[X]
Desv[ X] =
(x1 ! )2 p1 + ( x2 ! )2 p2 +... +( xn ! )2 p n
EJEMPLO 3.1: Calcular la media y la varianza del nmero de hijos varones de una familia con dos hijos. Solucin: E={VV, VH, HV, HH} X={0, 1, 2}= "nmero de hijos varones de una familia con dos hijos"
P1 = P(X = 0) = 1/ 4
148
EJEMPLO 3.2: Tras una intervencin quirrgica de un tipo determinado, el equipo mdico mantuvo en el hospital a unos pacientes cinco das y a otros ocho. De stos ltimos no regres ninguno al hospital y el coste de cada uno ascendi a 90.000 pts., mientras que de los dados de alta a los cinco das, las dos terceras partes no regresaron al hospital y el coste por cada individuo fue de 50.000 pts. El otro tercio restante tuvo que regresar al hospital ocasionando unos gastos totales por individuo de 150.000 pts. En trminos puramente econmicos, es preferible dar de alta a los enfermos a los cinco o a los ocho das?. Solucin: Se trata de calcular el coste promedio en ambos casos. En el supuesto de que los pacientes estn ingresados 8 das, el coste promedio es de 90.000 pts., y en el supuesto de que los pacientes estn 5 das, la variable aleatoria se distribuye de la siguiente forma: X P(X) El coste promedio en este caso ser: 50.000 2/3 150.000 1/3
149
150
- La clasificacin de las piezas fabricadas por una mquina, considerando xito las piezas aceptables y fracaso las piezas defectuosas. En este caso p y q se asignan haciendo un estudio de gran nmero de piezas.
Diremos que un experimento sigue un modelo binomial si, en cada ejecucin, slo hay dos posibles resultados (E y F), las pruebas son independientes y la probabilidad de xito es constante. La idea es la de construir un modelo de asignacin de probabilidades de estas caractersticas. Llamaremos variable aleatoria binomial a: X = "nmero de xitos en n pruebas" Se pueden asignar probabilidades mediante un diagrama en rbol:
COMIENZO 1 PRUEBA 2 PRUEBA 3 PRUEBA RESUL. PROB.
p p p
E
E EE EE F E FE EF F
FEE FEF F FE FF F
q
F
p q
F
q p
F E
p q
q p
F E
151
Construir el rbol puede ser una tarea larga y conviene buscar una frmula general para un experimento binomial. Convengamos en identificar todos aquellos resultados que tienen el mismo nmero de xitos. Tras n pruebas nos encontraramos con:
EE...E ! ! "pn EE...EF ! ! " np n# 1q EE...EFF ! ! " n( n # 1) pn # 2 q2 ............................................. EF...F ! ! " npq n #1 FF... F ! ! "qn
Las distintas probabilidades son los sumandos del desarrollo del binomio (p+q)n, por lo que:
! n$ P( X = r ) = # p r q n& r "r%
Convenimos en designar al experimento binomial con n pruebas, siendo p la probabilidad de xito, como B(n,p).
EJEMPLO 3.3: Se lanza un dado 7 veces. Calcular la probabilidad de obtener 3 seises. p = P(E) = 1/6 n=7 q = P(F) =5/6 Solucin: X = "nmero de seises que aparecen al lanzar un dado 7 veces". K=3
152
EJEMPLO 3.4: Calcular la probabilidad de obtener al menos una cara, al lanzar una moneda cinco veces. Solucin: X = "nmero de caras que se obtienen al lanzar una moneda cinco veces" P(x>1) = P(x=2)+P(x=3)+P(x=4)+P(x=5) Utilizando el suceso contrario: P(x>1) = 1-P(x!1) = 1-(P(x=0)+P(x=1)) = = 1 - 1/2 1/2 1/2 1/2 1/2 - 1/2 1/2 1/2 1/2 1/2 EJEMPLO 3.5: Supongamos que en un departamento de control de calidad se examinan lotes de cuatro artculos y se sabe que la probabilidad de que un artculo sea defectuoso es P(D)=1/10 (por lo que la probabilidad de que sea aceptable es P(A)=1-P(D)=9/10). Definimos la variable aleatoria de manera que a cada elemento del espacio muestral, le asociamos el nmero de piezas defectuosas. x={0,1,2,3,4}. Calcular la probabilidad asociada a cada valor de la variable. Solucin: Calculamos sus probabilidades:
153
P(x = 2) =
EJEMPLO 3.6: Hallar las probabilidades del experimento binomial B(4,1/3). Solucin:
4$ ! 1$ 0 ! 2 $ 4 ! # P(x = 0) = = 0,1975 " 0% " 3% " 3 % !4 1 1 2 3 P(x = 1) = # $ ! $ ! $ = 0, 3951 " 1% " 3% " 3 % ! 4$ ! 1 2 ! 2 $ 2 P(x = 2) = # " $ = 0, 2963 " 2% 3% " 3 % ! 4$ ! 1 3 2 P(x = 3) = # " $ = 0, 0988 " 3% 3 % 3 ! 4$ ! 1 4 P(x = 4) = # " $ = 0, 0123 " 4% 3 %
EJEMPLO 3.7: En una empresa de fabricacin de automviles se ha observado que el 2% presenta algn defecto. Calcular la probabilidad de que en una muestra aleatoria de 5 automviles se encuentren a lo sumo dos defectuosos. Solucin: La variable X = "nmero de automviles defectuosos", sigue una B(50,0'02).
P( X ! 2) = P(X = 0 ) + P( X = 1) + P(X = 2) = " $ 50% (0, 02) 0 (0, 98)50 + " $ 50% (0, 02)(0, 98)49 + " $ 50% (0, 02)2 (0, 98) 48 # 0& #1& #2&
154
A medida que aumenta el valor de n se complican los clculos y es conveniente utilizar tablas.
... 10
...
...
...
...
Si estamos en una B(5,0'45), buscaremos el 5 en la columna de n y si nos piden P(X=4), dentro del grupo n=5, buscamos r=4. En la fila de p buscamos 0'45 y en la confluencia de la horizontal y la vertical, tendremos el valor de la probabilidad. Podemos encontrarnos con un problema en el caso de ser p>0'5, pues no puede emplearse la tabla directamente, sino que tendremos que tener en cuenta la siguiente propiedad:
155
VARIANZA:
! 2 = V[ x] = # ( x " ) pi = npq
2 i= 1
DESVIACIN TPICA:
! = npq
EJEMPLO 3.8: Supongamos que tenemos cinco instrumentos y que sabemos que en promedio un determinado instrumento est averiado uno de cada diez das. Cul es la probabilidad de que en un da ms de tres instrumentos estn averiados?. Cul es el nmero esperado de instrumentos averiados al da?. Solucin: Nuestra variable ser: X = "nmero de instrumento averiados en un da" Slo hay dos posibles sucesos: E: Estar averiado F: No estar averiado. X ~ B(n=5, p=0'1) La funcin de densidad ser:
156
!5 !5 P( x = r) = # $ p r q 5& r = # $ 0,1r 0, 95& r " r% " r% P( x > 3) = P(x = 4 ) + P(x = 5) = 4 ! 5$ ! 5$ = # p 4q + # 0,150, 9 0 = 4, 6 10& 4 " 4% " 5% E [x] = np = 5 0,1 = 0, 5
Se avera un instrumento cada dos das.
EJEMPLO 3.9: La probabilidad de que un estudiante obtenga el ttulo de Licenciado en Biologa es 0'3. Hallar la probabilidad de que de un grupo de 7 estudiantes matriculados en primer curso: a) Ninguno de los siete finalice la carrera. b) La finalicen todos. c) Al menos dos acaben la carrera. Asimismo, hallar la media y la desviacin tpica del nmero de alumnos que acaban la carrera. Solucin: Los sucesos son: E(xito): acabar la carrera P(E) = p = 0'3
Las pruebas son independientes, porque lo que ocurra con un alumno no tiene nada que ver con lo que le ocurra a otro. a)
! n$ P( X = r ) = # p r q n& r "r%
157
c)
Parmetros:
EJEMPLO 3.10: En recientes estudios realizados sobre pacientes portadores de SIDA, se ha podido determinar que el 70% consume algn tipo de droga. En la sala de espera de una consulta especializada en esta enfermedad se encuentran en un determinado momento seis personas. Cul es la probabilidad de que ninguno haya consumido droga?. Solucin: E: "No consumir droga" F: "Consumir droga" P(E) = 0'3 = p P(F) = 0'7 = q
! 6$ P( x = 0 ) = # p 0q 6 = 0, 1176 " 0%
EJEMPLO 3.11: Una poblacin de 20 animales insectvoros se introduce en una zona donde el 14% de los insectos que le sirven de alimento son venenosos. Cada animal devora al da 5 insectos. Calcular la probabilidad de que al cabo de una semana queden, como mnimo, la mitad.
158
Solucin: Suponiendo independencia se tiene: P(no comer insecto venenoso) = 1-0'14 = 0'86 P(un animal no se envenene en un da) = P(comer 5 insectos no venenosos) = = (0'86)5 = 0'47042 P(un animal no se envenene en 7 das) = (0,47042)7=0,005 P(un animal se envenene en 7 das) = 1-0'005 = 0'995 Sea X: "nmero de animales envenenados en una semana. X ~ B(20,0'995)
10 " 20% P( x ! 10) = ' $ 0, 995 k0, 00510( k = 2, 08975 10 ( 18 # k & k =0
El nmero de personas que llega a una tienda de autoservicio en un El nmero de solicitudes de seguro procesadas por una compaa en nmero de bacterias en un cultivo.
tiempo determinado.
un perodo especfico.
El
La distribucin de Poisson es el modelo de probabilidad que ms se utiliza para analizar problemas de listas de espera. Podemos hablar de las siguientes caractersticas de una distribucin de Poisson:
159
1- Debemos tener un fenmeno dicotmico (ocurrencia o no de un determinado suceso). 2- Las pruebas que se realicen han de ser independientes y la probabilidad de xito se ha de mantener constante en todas ellas. 3- Los sucesos han de ser poco comunes, por eso se le conoce como "Ley de los sucesos raros". 4- Puesto que la probabilidad de xito ha de ser pequea, entendemos que p<0.05 y puesto que n ha de ser grande, entendemos n>100. 5- Los sucesos ocurren en un intervalo de tiempo. 6- Se caracteriza por un parmetro ! , que es el nmero medio de ocurrencia del suceso aleatorio por unidad de tiempo. 7- Siempre que la media y la varianza sean similares, podemos pensar en un modelo de Poisson. Media:
E [x] = np = ! V[x] = ! = E[ x]
Varianza:
Es importante el hecho de que una distribucin binomial en la que n es grande y p pequeo tiene una aproximacin excelente con la distribucin de Poisson. La funcin de probabilidad ser el lmite de la funcin de densidad de la binomial cuando n ! ", p ! 0 y np ! "
$ n' $ n' lim & pr q n ) r = lim & lim p r lim q n ) r n !" % r ( n! "% r ( p!0 n! "
p! 0 np !# p! 0
! n
160
n! %$' r % $ n #r lim 1 # ' = n( n !" r!(n # r)! & n ( n! "& lim = lim n(n # 1)...(n # r + 1) $ r lim r r! n !" n r n !" % $ 1# ' & n(
[1]
% $ 1# ' & n(
% $'n lim 1 # $r n(n # 1)...(n # r + 1) n !"& n( = lim r r! n !" n % $'r lim 1 # n( n! "&
Calculamos cada uno de estos lmites:
! e #$
EJEMPLO 3.12: Un comprador de grandes cantidades de circuitos integrados ha adoptado un plan para aceptar un envo de stos, que consiste en inspeccionar una muestra de 100 circuitos provenientes del lote. Si el comprador encuentra no ms de dos circuitos defectuosos en la muestra, acepta el lote; de otra forma, lo rechaza. Si se enva al comprador un lote que contiene el 1% de circuitos defectuosos, cul es la probabilidad de que sea aceptado el lote?. Solucin:
161
Nuestra variable es: X: "nmero de circuitos defectuosos en la muestra". X~B(n=100, p=0'01) np=1
5!
= 0,1606
EJEMPLO 3.14: La probabilidad de que dos aminocidos determinados se combinen para formar un dipptido es muy pequea y, en consecuencia, el nmero de dipptidos de una
162
determinada composicin que puedan observarse al analizar un conjunto de protenas sigue una distribucin de Poisson, que por otras investigaciones sabemos que tiene parmetro ! =0,4. Si denominamos como X el nmero de dipptidos observados en una composicin determinada: a) Calcular la probabilidad de no encontrar ninguno de tales dipptidos en dicha composicin. b) Probabilidad de encontrar dos o ms. Solucin: a)
P( x = 0 ) = e !" "0 = e !0,4 0!
b)
P(x ! 2) = 1 " P(x < 1) = 1 " P(x = 0) " P(x = 1) = = 1 " e "0,4 #0 0, 41 1 0, 4 " e " 0,4 = 1 " 0,4 " 0,4 0! 1! e e
EJEMPLO 3.15: El nmero medio de automviles que llega a una estacin de suministro de gasolina es de 210 por hora. Si dicha estacin puede atender a un mximo de diez automviles por minuto, determinar la probabilidad de que en un minuto dado, lleguen a la estacin de suministro ms automviles de los que puedan atender. Solucin: La variable aleatoria X es el "nmero de automviles que llegan a la estacin de servicio en un minuto ". El suceso xito (1) consiste en que en un instante cualquiera llegue un automvil a la estacin de suministro . p es la probabilidad de xito y es suficientemente pequea, sin embargo , la prueba puede repetirse un nmero suficientemente grande de veces.
163
10
$ 3,50 # 3,5 3,510 #3,5 ' =1#& e +... + e = 1 # 0, 9991 = 0, 0009 ) 10! % 0! (
EJEMPLO 3.16: El nmero de clientes que llega a un banco es una variable de Poisson. Si el nmero promedio es de 120 por hora, cul es la probabilidad de que en un minuto lleguen por lo menos tres clientes?. Solucin: X: "nmero de clientes que llega a un banco en un minuto". E[x]=120 clientes por hora.
E[X] =
120 = 2=! 60
P( X ! 3) = 1 " P(X < 3) = 1 " [P( x = 0 ) + P( x = 1) + P( x = 2 )] = = 1 " 0,1353 " 0, 2707 " 0, 2707 = 0, 3233
La probabilidad es de un 33% aproximadamente.
164
EJEMPLO 3.17: Del volumen de produccin diario en dos plantas diferentes de una fbrica, se sabe que la probabilidad de que resulten r unidades defectuosa es: 4r ! 4 - en la 1a planta: para r = 0, 1, 2, ... e r! 6r - en la 2a planta: e ! 6 para r = 0, 1, 2, ... r! Determinar la probabilidad de que, en un da determinado: a) resulten cinco o ms unidades defectuosas en la 1a planta. b) resulten cuatro o menos unidades defectuosas en la 2a planta. c) resulten ocho o ms unidades defectuosas del total de la produccin de la fbrica. Solucin: a) X1: "nmero de unidades defectuosas en la 1a planta". ! P(4)
P( X1 ! 5) = 1 " P(X1 < 5) = 1 " [ P( x1 = 0 )+... + P(x1 = 4)]
P( X1 ! 5) = 0, 3711
P( X2 ! 4 ) = P( x2 = 0)+... + P (x 2 = 4) = 0, 2851
c) X3: "nmero de unidades defectuosas del total de la produccin."
165
una de las pruebas. Supongamos que esto no ocurre, no hay reemplazamiento y la variable aleatoria sigue otro tipo de distribucin. Veamos un ejemplo: Sea N el nmero de profesores de un Centro de Enseanza Secundaria que deben elegir Director entre dos candidatos A y B. Sea n el nmero de profesores que apoyan al candidato A y N-n el nmero de profesores que apoyan al candidato B. Supongamos que queremos hacer un sondeo antes de la votacin final, tomamos una muestra con K profesores y le preguntamos el candidato al que piensan votar. Supongamos que X es la variable aleatoria que nos mide el nmero de profesores de la muestra que piensan votar al candidato A. El inters est en calcular la probabilidad de que X=r, es decir, que en la muestra haya r personas que piensan votar al candidato A. Deduciremos la frmula utilizando la Ley de Laplace. De cuntas maneras puedo elegir muestras de tamao n entre N elementos que tiene la poblacin?.
Es preciso conocer la probabilidad de xito y la probabilidad de fracaso en la poblacin. El nmero de casos favorables ser:
Media:
E [x] = np
166
Varianza:
V[x] = npq
N !n N !1
Cuando
EJEMPLO 3.18: Un fabricante asegura que slo el 1% de su produccin total se encuentra defectuosa. Supngase que se ordenan 1000 artculos y se seleccionan 25 al azar para inspeccionarlos. Si el fabricante se encuentra en lo correcto, cul es la probabilidad de observar dos o ms artculos defectuosos en la muestra?. Solucin: Tenemos una poblacin de tamao N=1000 X: "nmero de artculos defectuosos en la muestra". P(xito)=0,0 l Tamao de la muestra n=25 Si inspeccionamos uno de los 25, ese no lo volvemos a inspeccionar, luego no hay reemplazamiento, la p de las distintas pruebas no se mantiene constante. Se trata de una distribucin hipergeomtrica.
167
Puesto que
P( x ! 2) = l " [ P( x = 0) + P( x = 1)] = # 25& # 25& =1"% 0, 010 0, 9925 " % 0, 011 0, 9924 = $0' $1' 1 " 0, 7778 " 0,1964 = 0, 0258
EJEMPLO 3.19: Supngase que se tienen 50 representantes de cierto estado, en una convencin poltica nacional, de los cuales 30 apoyan al candidato A y 20 al candidato B. Si se seleccionan aleatoriamente 5 representantes, cul es la probabilidad de que, entre estos cinco, por lo menos dos apoyen al candidato A?. Solucin: X: "nmero de personas de la muestra que apoyan al candidato A.
N = 50! # 3 & n = 5 "X % H' 50, 5, ( 5) 3 p= # 5$ P( x ! 2) = l " P(x < 2) = 1 " [ P(x = 0) + P( x = 1)] 3 # 2 ) # 50 & 50 & % 5( % 5( + $ 0 '$ 5 ' + P(X = 0) = # % 50& + + $ 5' P( X ! 2) = 0, 9241 3& # 2& * # 50 50 % 5( % 5( + $ 1 '$ 4 ' + P(X = 1) = # + % 50& + $ 5' ,
No hay duda de que al menos dos apoyarn al candidato A. con una probabilidad del 92%.
168
EJEMPLO 3.20: En una clase en la que hay 20 estudiantes, 15 estn insatisfechos con el texto que se utiliza. Si se le pregunta acerca del texto a cuatro estudiantes tomados al azar, determine la probabilidad de que: a) exactamente tres estn insatisfechos con el texto. b) cuando menos tres estn insatisfechos. Solucin: Hay dos sucesos mutuamente excluyentes: P(estar satisfechos) = 5/20 = 1/4 P(no estar satisfecho) = 15/20 = 3/4 Las pruebas son sin reemplazamiento, no tiene sentido volver a preguntar al mismo estudiante que se le pregunt antes. X: "nmero de alumnos que estn insatisfechos con el texto".
! # Np$ ! # Nq $ ! # 15$ ! # 5$ " r % " n & r% " 3 % " 1% P( X = 3) = = = 0, 469 ! ! # N$ # 20$ " n% " 4%
b)
P( X ! 3) = P(x = 3) + P(x = 4 ) = 0, 75
EJEMPLO 3.21: Un equipo departamental incluye cinco bilogos especialistas en microbiologa y nueve mdicos. Si se eligen al azar cinco personas y se les asigna un proyecto, cul es la probabilidad de que el equipo del proyecto incluya exactamente a dos bilogos?.
169
5 " X ! H# 14;5, $ 14 %
! # 5$ ! # 9$ " 2% " 3% P( X = 2 ) = = 0, 42 ! # 14$ " 5%
EJEMPLO 3.22: Considrese un fabricante de ordenadores que compra los microprocesadores a una compaa donde se fabrican bajo estrictas especificaciones. El fabricante recibe un lote de 40 microprocesadores. Su plan para aceptar el lote consiste en seleccionar 8, de manera aleatoria y someterlos a prueba. Si encuentra que ninguno de los microprocesadores presenta serios defectos, el fabricante acepta el lote; de otra forma lo rechaza. Suponiendo que el lote contenga dos microprocesadores con serios defectos, cul es la probabilidad de que sea aceptado? Solucin: X: "nmero de microprocesadores defectuosos en la muestra".
20 1 19 " X ! H# 40;8, $ p = q = 40 % 20 20 " &2 $" & 38$ # 0% # 8 % P( X = 0) = = 0, 6359 " & 40$ # 8%
Si la persona que vende sabe que le controlarn el producto, procurar que la empresa efecte un control de calidad antes de iniciar las ventas. Aumentar la calidad del producto.
170
EJEMPLO 3.23: Una compaa dedicada a la produccin de artculos electrnicos, utiliza un esquema para la aceptacin de artculos, para su ensamblaje, antes de ser embarcados, que consiste en lo siguiente: Los artculos estn embalados en cajas de 25 unidades y un tcnico de la compaa selecciona aleatoriamente tres artculos, de tal manera que si no encuentra ningn artculo defectuoso, la caja se embarca. a) Cul es la probabilidad de que se embarque una caja que contiene tres artculos defectuosos'?. b) Cul es la probabilidad de que una caja que contiene slo un artculo defectuoso regrese para su verificacin?. Solucin: X: "nmero de artculos defectuosos en la muestra". a) Si la caja contiene tres artculos defectuosos, la distribucin es:
3 22 q= 25 25 ! # Np$ ! # Nq $ ! # 3$ ! # 22 $ " xi % " n & x i % " 0% " 3 & 0% P( X = 0 ) = = = 0, 6696 ! ! # N$ # 25$ "n% " 3% N = 25 N1 = 3 N2 = 22 p=
Hay una probabilidad del 67% de que se embarque la caja. b) La caja slo contiene un articulo defectuoso. 1 24 N = 25 p= q= 25 25 1 $! 24 $ ! 25 25 # & # 25 25 & " 0 %" 3 % P( X = 0 ) = = 0, 88 25 ! $ # "3% Lgicamente la probabilidad de que no embarque es: 1-0,88 = 0,12 Lo ms probable es que las cajas que tengan un artculo defectuoso sean embarcadas.
171
EJEMPLO 3.24: Supongamos que una compaa hace el estudio de la calidad conforme a otro esquema. Se toma un artculo, se inspecciona y se devuelve a la caja; lo mismo ocurre con un 2 y un 3er artculo. La caja no se embarca si cualquiera de los tres artculos es defectuoso. Solucin:
! 3 a) B 3, # " 25 $
! 1 b) B 3, # " 25 $
EJEMPLO 3.25: Considrese un fabricante de automviles que compra los motores a una compaa donde se fabrican bajo estrictas especificaciones. El fabricante recibe un lote de 40 motores. Su plan para aceptar el lote consiste en seleccionar 8, de manera aleatoria, y someterlos a prueba. Si encuentra que ninguno de los motores presenta serios defectos, el fabricante acepta el lote; contiene dos motores con serios defectos, cul es la probabilidad de que sea aceptado?. Solucin: X: "nmero de motores defectuosos en la muestra".
172
N = 40
2 1 ! H" 40;8, # 40 20 $ ! % 2# ! % 38# " 0$ " 8 $ P(X = 0) = = 0, 6359 ! % 40# " 8$ n=8 p=
173
174
175
El nombre de distribucin normal se debe al hecho de que una mayora de las variables aleatorias de la Naturaleza siguen esta distribucin, lo que hizo pensar que todas las variables continuas de la Naturaleza eran normales, llamando a las dems distribuciones "anormales". No obstante, hoy en da, ya no se piensa de la misma manera, ya que ningn estadstico dice que una distribucin que no sea normal, es anormal. No obstante, la distribucin normal es la ms importante por sus propiedades sencillas, porque aparece frecuentemente en la Naturaleza, (fenmenos relacionados con psicologa, biologa, etc. ), y por una propiedad de algunos fenmenos que se aproximan asintticamente a la distribucin normal (Teorema Central del Lmite).
3.2.1.2 Definicin
De modo riguroso, se dice que una variable aleatoria sigue una distribucin normal de media , y desviacin tpica !, y se designar por N(, !), si se cumplen las siguientes condiciones: La variable recorre toda la recta real, y la funcin de densidad es de la forma:
f(x) =
1 # 1 ( x# ) 2 e 2 ! ! 2"
donde e = 2.71828; != 3.14159; es la media de la distribucin y ! es la desviacin tpica. Esta funcin de densidad que parece en principio con una expresin matemtica aparentemente complicada, tiene la siguiente representacin (figura 3.3):
0
Figura 3.3: Representacin grfica da la campana de Gauss conocida como campana de Gauss, y con las siguientes propiedades:
176
1.- La curva tiene forma campaniforme y es simtrica respecto a la recta vertical x = . ya que el valor de la densidad es idntico en + c y en - c, para todo valor de c, pues:
# ( +c #2) #c2 1 1 f( + c) = e 2! = e 2! ! 2" ! 2" # 1 f( # c) = e ! 2"
( #c # ) 2 2 !2 2 # c2 1 2! = e ! 2" 2 2
(x# ) 2 2! 2
(x # )
) ! (x! 2 2"
=! 3 e " 2#
como se verifica que :
f( ) =
1 ! 2"
177
3.- El rea del recinto encerrado bajo la campana y el eje x es igual a la unidad. Por tratarse de una funcin de densidad. Y al ser simtrica, deja igual rea, 0,5, a la izquierda y a la derecha de la recta x = . Esto se verifica porque:
+"
+"
(x !) 2 2$ 2
dx =
+$
2 ! , ya que:
#!"
+" ! y 2 2
dy = 2
#0
+" ! y 2 2
dy = 2I1
y al multiplicar I1 por s misma, y mediante mtodos de integracin doble, resulta su cuadrado igual a !/2.
4.- Presenta puntos de inflexin en los puntos de abscisas + ! y - !, donde cambia de concavidad (lo que determina que cunto mayor sea ! , ms achatada sea la curva). El punto de inflexin se obtiene al igualar a cero la derivada segunda, por lo tanto:
(x " )2 x" = 0! = 1 ! x = # 2 # #
As, pues, presenta puntos de inflexin en los puntos x = + ! y en x = - !, donde las coordenadas de los puntos son: en x = + !
# 1 f( + !) = e ! 2"
( +! # )2 2! 2
y en el punto x = - !
178
! 1 f( ! ") = e " 2#
( !" ! )2 2" 2
5.- Es asinttica al eje de abscisas. Pues como ex tiende a 0 cuando x tiende a infinito, entonces:
% 1 lim f(x) = lim e x !+" x !+" # 2$
(x% ) 2 2# 2
=0
En la figura 3.4 puede observarse que para ! fijo, el variar tiene el efecto de desplazar la curva hacia la derecha o la izquierda; manteniendo constante, el cambio de ! tiene por efecto acercar o alargar del valor medio los puntos de inflexin, es decir, un apuntamiento o aplastamiento de la curva (ver figura 3.5).
-a
+a
179
F( x) = P( ! " x) = 1
2#
$%
&
e$
x2
dx
180
1,2 1 ,8 ,6 ,4 ,2 0 -,2 -4 -3 -2 -1 0 1 2 3 4
1 2!
La funcin de distribucin de la ley normal estndar proporciona el rea del recinto que encierra la funcin de densidad, hasta el punto x, y con el fin de facilitar el clculo de sta superficie, y no tener que utilizar en todo momento el clculo integral, se han elaborado unas tablas de fcil uso, entre las que se encuentran las que aparecen a continuacin:
x
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9
0.00 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981
0.01 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8655 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982
0.02 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982
0.03 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983
0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984
0.05 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984
0.06 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8870 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985
0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985
0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986
0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986
181
y se encuentra directamente en la tabla sin ms que buscar 1.3 en la primera columna, y 0.07 en la primera fila; su interseccin nos da la probabilidad:
Es decir: P(Z # 1.37) = 0.9147 que quiere decir que el 91.47% de las observaciones se encuentran distribuidas entre -" y 1.37.
182
Existen adems de las tablas anteriores otros tipos de tablas publicadas de la distribucin normal estndar. Quiz las ms importantes sean las siguientes:
1.- Tabla de dos colas : Esta tabla da las reas de las dos colas de la distribucin, es decir, da la siguiente probabilidad P( |Z| $ a ) = P( -" < Z # -a ) + P( a # Z < +" )
-a
2.- Tabla de una cola : Nos da el rea de la cola derecha de la distribucin, es decir, la siguiente probabilidad P( Z $ a )
3.- Tabla de valores : Que contiene todos los valores entre 0 e infinito.
183
4.- Tabla de reas acumuladas : Nos da la probabilidad de que un valor est comprendido entre -" y a, es decir, la siguiente probabilidad P( -" < Z # -a ) Este ltimo tipo de tablas es el que hemos utilizado anteriormente, pues nos proporciona la funcin de distribucin de la variable.
Z=
X! "
184
-2 ! -2
-! -1
+! 1
Valores de X
+2!
Valores de Z
0 2
TEOREMA DE DE MOIVRE Si X es una variable binomial de parmetros n y p; entonces si n es grande y p, ni pequeo ni grande, (o sea, ni p ni q prximos a cero) podemos considerar que esa variable X sigue una ley normal de media np y varianza npq, y por lo tanto, la variable
Z=
X ! np npq
sigue una distribucin normal N(0,1). En este caso hemos de tener en cuenta que X era una variable aleatoria discreta y queremos tratarle cmo continua, por lo que es preciso hacer una correccin para continuidad. As se verifica que: P(X = 3) = P(2.5 < X # 3.5) P(X # 3) = P(X # 3.5) P(X < 3) = P(X # 2.5)
185
Obviamente stas no son igualdades ciertas, pero permiten tratar la variable discreta como continua. Si en lugar de trabajar con una variable aleatoria binomial partisemos de una variable de Poisson o una Hipergeomtrica, la aproximacin sera absolutamente similar.
TEOREMA CENTRAL DEL LMITE Si X es una variable aleatoria (no importa como se distribuya) con media y varianza !2, y tomamos una muestra de n elementos, entonces la distribucin muestral de la media aritmtica de la muestra es aproximadamente normal con media y varianza !2/n, siendo mejor la aproximacin a medida que aumenta el tamao de la muestra. Lgicamente, si X es una variable que se distribuye normalmente, la media muestral se distribuye exactamente como una distribucin normal. Este teorema es importante en posteriores unidades, ya que nos dar pie a resultados fundamentales de la Inferencia Estadstica.
186
siendo cada Zi una variable normal N(0,1), e independientes. Esta variable depende, pues, del nmero de sumandos que la forman, llamado "grados de libertad", y el rango es el semieje real positivo (ya que es una suma de cuadrados). La funcin de densidad de una variable # 2 n es la siguiente:
x# 0* x<0
Para cada valor de n se tiene una curva distinta, como representacin de su funcin de densidad. La figura 3.9 representa las funciones de densidad de variables Chi-cuadrado para diferentes valores de n.
187
Figura 3.9: Comparacin entre las funciones de densidad de la variable chi-cuadrado para distintos valores de n.
7.- En una variable aleatoria normal N(, !), si tomamos una muestra de tamao n se verifica que
188
2 (n ! 1)s "
2
es aproximadamente #2n-1
189
g.l \%
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
0.9950 0.0000393 0.0100 0.0717 0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886 10.520 11.160 11.808 12.461 13.121 13.787
0.9750 0.000982 0.0506 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791
0.950 0.00393 0.103 0.352 0.711 1.]45 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.897 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493
0.900 0.0158 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.047 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.769 20.599
0.200 1.642 3.219 4.642 5.989 7.289 8.558 9.803 11.030 17.242 13.442 14.631 15.812 16.985 18.151 19.311 20.465 21.615 22.760 23.900 25.038 26.171 27.301 28.429 29.553 30.675 31.795 32.912 34.027 35.139 36.250
0.10 2.706 4.605 6.251 7.779 9.236 10.645 17.017 13.362 14.684 15.987 17.275 18.549 19.812 21.064 22.307 23.452 24.769 25.989 27.204 28.412 29.615 30.813 32.007 33.196 34.382 35.563 36.741 37.916 39.087 40.256
0.050 3.841 5.g91 7.851 9.488 11.070 17.592 14.067 15.507 16.919 18.307 19.675 21.026 22.362 23.685 24.996 26.296 27.587 28.869 30.144 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 43.773
0.025 5.024 2.378 9.348 11.143 12.833 14.449 16.013 17.535 19.023 20.483 21.920 23.337 24.736 26.119 27.488 28.845 30.191 31.526 32.857 34.170 35.479 36.781 38.076 39.364 40.646 41.923 43.195 44.461 45.722 46.979
0.010 6.631 9.210 11.345 13.277 15.086 16.812 18.475 20.090 21.666 23.209 24.725 26.217 27.588 29.141 30.578 32.000 33.409 34.805 36.191 37.566 38.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 49.588 50.892
0.001 10.828 13.816 16.266 18.467 20.515 22.458 74.327 26.124 77.877 29.588 31.264 32.909 34.528 36.173 37.697 39.752 40.790 42.312 43.820 45.315 46.797 48.268 49.728 51.179 57.620 54.052 55.476 56.892 58.301 59.703
EJEMPLO 3.26: Si X sigue una distribucin Chi-cuadrado con 12 grados de libertad. Cul es el valor de la variable que deja a su derecha un rea de 0.05? Solucin: Buscando en la tabla: 21.026
190
(x ! ) s n
como una variable normal. En su definicin matemtica, sean (&, &1, &2, ....., &n) n+1 variables aleatorias normales N(0,1) e independientes
tn =
!
2 2 !1 + !2 2 +!+! n
Tambin puede definirse a travs de una variable Z normal estndar N(0,1), y una variable #2 que siga una distribucin Chi-cuadrado con n grados de libertad; se define entonces la variable "t" de STUDENT con n grados de libertad como
tn =
Z
!2 n n
191
Distr. Normal
Distr. t de Student
0
Figura 3.10: Funcin de densidad de la distribucin normal y de la "t".
6.- En el muestreo de una poblacin normal N(, !), si tomamos una muestra de tamao n de media x y varianza S2, la variable
(x ! ) t n!1 = s n !1
sigue una distribucin "t" de STUDENT con n-1 grados de libertad. Esta propiedad es muy utilizada en la estimacin y el contraste de hiptesis sobre la media de la poblacin.
192
0.50
1.000 0.816 0.765 0.741 1.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.683 0.683 0.682 0.681 0.680 0.679 0.679 0.678 0.677 0.674
0.40
1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.865 0.863 0.862 0.861 0.860 0.859 0.858 0.858 0.857 0.856 0.856 0.855 0.855 0.854 0.854 0.852 0.851 0.850 0.849 0.848 0.846 0.845 0.842
0.30
1.963 1.386 1.250 1.190 1.156 1.134 1.119 1.108 1.100 1.093 1.088 1.083 1.07~ 1.076 1.074 1.071 1.069 1.067 1.066 1.064 1.063 1.061 1.060 1.059 1.058 1.058 1.057 1.056 1.055 1.055 1.052 1.050 1.049 1.047 1.046 1.043 1.042 1.036
0.20
3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.306 1.303 1.301 1.299 1.296 1.292 1.290 1.282
0.10
6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.690 1.684 1.679 1.676 1.671 1.664 1.660 1.645
0.05
12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.030 2.021 2.014 2.009 2.000 1.990 1.984 1.960
0.02
31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.438 2.423 2.412 2.403 2.390 2.374 2.364 2.326
0.01
63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.724 2.705 2.690 2.678 2.660 2.639 2.626 2.576
0.001
636.619 31.598 12.929 8.610 6.869 5.959 5.408 5.041 4.781 4.587 4.437 4.318 4.221 4.140 4.073 4.015 3.965 3.922 3.883 3.850 3.819 3.792 3.767 3.745 3.725 3.707 3.690 3.674 3.659 3.646 3.592 3.551 3.521 3.497 3.461 3.417 3.391 3.291
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60 80 100 !
en ellas aparece el valor de la variable que para los grados de libertad indicados en la primera columna, deja un rea en las dos colas de valor % indicado en la primera fila. EJEMPLO 3.27: Si X es una distribucin que sigue una distribucin "t" con 10 grados de libertad, calcular el valor de la variable, tal que a la izquierda de -2.228 y a la derecha de 2.228 deja un rea total de 0.05.
193
Solucin:
194
X=
!
i=1
X2 i
Y=
! Yj2
j=1
siendo las variables Xi e Yj que siguen distribuciones normal estndar. Se define la variable F de Snedecor (o de Fisher-Snedecor), la definida por
X F= Yn m
denominada distribucin F de Fisher-Snedecor con n y m grados de libertad. Su funcin de densidad est definida por la funcin: n %! ( n + m )( n ) n 2 x 2 #1 ' 2 m " si x > 0 fn,m (x) = & !( n )! ( m ) (1 + n x)(n+ m) 2 2 2 m ' 0 si x $ 0 ( Su representacin grfica es de la siguiente forma:
195
"2
sigue una distribucin Chi-cuadrado con n1-1 grados de libertad, y anlogamente, la variable
"2 sigue una distribucin Chi-cuadrado con n2-1 grados de libertad. Entonces, el cociente
2 s1 ( n1 ! 1) (n1 ! 1)" 2 2 ( n2 ! 1)s 2 n ! 1 " ( 2 ) 2
s2 (n 2 ! 1) 2
sigue una distribucin F de Snedecor con n1-1 y n2-1 grados de libertad, y si las varianzas poblacionales son iguales, se verifica entonces el resultado indicado.
196
5.- La distribucin F juega un papel importante en el anlisis de la varianza (ANOVA) y en el anlisis de la regresin.
EJEMPLO 3.28: Calcular F! para !=0.05, y n=5; m=15 grados de libertad. Solucin: Se busca en la tabla correspondiente al nivel del 5%, en la primera fila, los grados de libertad del numerador (5), y en la primera columna los grados de libertad del denominador (15), apareciendo el valor de F% en la confluencia de dicha fila y columna:
197
EJEMPLO 3.29: Calcular F! para !=0.95, y n=15; m=5 grados de libertad. Solucin: Teniendo en cuenta la siguiente propiedad
F ! ;n,m =
1 F1"!;m,n
se verifica que
F0.95;15,5 = 1 F1! 0.95;5,15 = 1 F0.05;5,15 = 1 = 0.345 2.90
198
"DISTRIBUCIN NORMAL"
3.3 Ampliacin
199
Obviamente al profesor le bastara con tener en cuenta que la representacin grfica de la funcin de densidad es una curva simtrica y que el rea bajo la curva es la unidad, pero entendemos que puede resultarle cmodo disponer de un juego de ejercicios que contemplen distintos casos de uso frecuente. El siguiente apartado est redactado de acuerdo a esta idea.
PRIMER CASO Supondremos como primer caso, el ms trivial: calcular la probabilidad de que la variable aleatoria Z, que sigue una distribucin normal estndar, sea menor o igual que un valor positivo a. Basta con buscar en la tabla directamente el valor de a, teniendo en cuenta que en la primera columna de la tabla aparecen las unidades y las dcimas del valor a y en la primera fila el valor de las centsimas. Como interseccin de la fila y la columna correspondiente aparece el valor
P( Z ! a )
200
Figura 3.12: Representacin grfica de la informacin que nos suministra de manera directa la tabla de la normal con la que vamos a trabajar: P ( Z ! a )
N(0,1)
calcular
P( Z ! "a ) .
Como segundo caso consideraremos, por ejemplo, calcular la probabilidad de que la variable aleatoria Z tome valores menores o iguales que una cierta cantidad a negativa, o sea P( Z ! "a ) La tabla no distingue entre desviaciones positivas y negativas; es decir, en la tabla slo aparecen valores positivos. Analicemos, pues, geomtricamente la situacin.
P (Z ! " a )
P (Z ! a )
La probabilidad pedida se corresponde con el rea rayada en la figura 3.13a. El rea rayada en la figura de la izquierda (figura 3.13a) es igual al rea rayada en la figura de la derecha (figura 3.13b). A su vez, ese rea es igual al rea total, que vale 1, menos el rea no rayada. El rea de la superficie no rayada en la grfica de la derecha es la que viene en la tabla. Por tanto:
201
P( Z ! "a ) = 1 " P( Z ! a )
EJEMPLO 3.30: Calcular P(Z!-2) Solucin:
N( , !) ,
calcular
P( Z ! a )
Como tercer caso consideraremos la misma situacin que en el caso primero pero suponiendo ahora, que la variable aleatoria sigue una distribucin normal no estndar, de parmetros , !.
En este caso, hemos de cambiar previamente de escala de medida; es decir, es x! preciso tipificar primero la variable. El cambio adecuado es z = y por tanto: "
202
N( , !) ,
obtener
P( Z ! "a ) .
Se trata, lo mismo que en el caso anterior de dar solucin a uno de los supuestos ya vistos, en concreto al supuesto segundo, pero considerando ahora que trabajamos con una normal no estndar. Lo primero que tenemos que hacer es tipificar ya que si no, la igualdad anterior no se verifica, por tanto:
a " & a " & $ x " "a " & $ $ P( X ! "a ) = P% ! = P z ! " = 1 " P z < % % # # ' # ' # '
13 13 # x " 5 "8 " 5% # # P ( X ! "8) = P $ ! = P$ z ! " % = 1 " P$ z < % = & & 3 3 3 3&
N (0,1)
calcular
P( Z ! a )
203
N( , !)
Obtener
P( X ! a ) :
Observando el grfico de la figura 3.15 y teniendo en cuenta las propiedades de la Normal, tenemos:
OCTAVO CASO: En una N( , !) obtener P(a ! X ! b) Si en lugar de trabajar con una N(0,1) trabajsemos con una N( , !) sera preciso, como en casos anteriores, tipificar. Es decir:
b " & a " & $a " x " b " & $ $ P(a ! X ! b) = P% ! ! = P z ! " P z < % % # # # ' # ' # '
204
P(1 ! X ! 1.85) = P(X ! 1.85) " P( X < 1) = 0.9678 " 0.8413 = 0.1265
calcular
P( Z ! "b) " P(Z < "a ) = 1 " P( Z < b) " [1 " P(Z ! a )] = = 1 " P (Z < b ) " 1 + P (Z ! a ) = P ( Z ! a ) " P (Z < b )
EJEMPLO 3.34: En una N(0,1) calcular P( !2.3 " Z " !1.8) Solucin:
P( !2.3 " Z " !1.8) = P(Z " !1.8) ! P(Z < !2.3) = = 1 ! P( Z < 1.8) ! 1 + P( Z " 2.3) = P( Z " 2.3) ! P( Z < 1.8) = = 0.9893 ! 0.9641 = 0.0252
205
Si en lugar de estar en una N(0,1) estuvisemos en una N( , !) , hubisemos seguido el mismo razonamiento pero despus de tipificar.
DCIMO CASO: Clculo del percentil correspondiente a una probabilidad dada. Puede ocurrir que conocida la probabilidad p, se nos pregunte qu valor de a verifica que P( X ! a ) = p Podemos distinguir dos casos: a) La variable aleatoria sigue una N(0,1): En este caso, basta buscar en el interior de la tabla el valor ms aproximado a p y anotar cual es el correspondiente valor de a (en las filas y columnas exteriores de la tabla)
EJEMPLO 3.35: Cul es el valor de a para el que P( Z ! a ) = 0.9251 ? Solucin: Buscamos dentro de la tabla el valor 0.9251 y vemos que el correspondiente valor de a es 1.44. b) La variable aleatoria sigue una normal de parmetros N( , !) En este caso, hemos de tipificar previamente; es decir, expresar a en la escala correspondiente a una N(0,1)
EJEMPLO 3.36: Obtener el valor de a que verifica que P( X ! a ) = 0.8413 en una distribucin N(5,3)
206
Solucin:
a!5 = 1" a = 3 + 5 = 8 3
207
"DISTRIBUCIN NORMAL"
208
209
0 6.5
7.5 M=?
8.5
9.5
10
Figura 3.17. Representacin grfica de la distribucin del dimetro de los hemates en individuos sanos y en individuos cirrticos. M ser el punto de corte a partir del cual el individuo ser clasificado en una o en otra categora.
La cantidad M se calcula de forma que se verifique que P (X ! M ) = 0. 95 teniendo en cuenta que la variable X sigue una ley Normal de media 7.5 y desviacin tpica 0.2. El clculo es inmediato: M / P(X<M) = 0.95 en una N(7.5 , 0.2)
P(X<M) = P(Z < (M-7.5)/0.2) = 0.95 (M-7.5)/0.2= 1.645 M = 7.5 + 1.645 . 0.2 = 7.829 Por tanto: Declararemos enfermo (cirrtico) a todo individuo con dimetro de los hemates superior a 7.829
210
Debemos tener en cuenta que, segn este convenio de clasificacin, el 5% de los individuos sanos sern declarados patolgicos errneamente, es decir, el procedimiento propuesto proporciona un 5% de "falsos positivos". Llamaremos a este error, por ejemplo error
! .
Teniendo en cuenta que el dimetro de los hemates en individuos cirrticos se ajusta a una ley Normal de media 8.5 y desviacin 0.6 es evidente que, con este criterio, algn individuo enfermo puede ser declarado errneamente normal. Llamaremos a este error " , que nos indica el porcentaje de "falsos negativos." Hemos de determinar qu error " cometemos cuando fijamos un riesgo sanos o en patolgicos es de 7.829. Para obtener el porcentaje de personas que declararemos como sanas cuando en realidad son cirrticas basta con determinar en una N (8.5, 0.6) (la de los individuos cirrticos) la probabilidad de que la variable aleatoria tome valores menores al valor prefijado como cota. Es decir: P(X < 7.829) en una normal N(8.5, 0.6)
P(X < 7.829) = P(Z < (7.829 - 8.5)/0.6) = P(Z < -1.12) = P(Z> 1.12) = 1 - P(Z<1.12) = 1 - 0.8686 = 0.1314 Observamos como siguiendo el criterio de partida, de prefijar el porcentaje de falsos positivos en un 5%, obtenemos un 13.14% de malas clasificaciones en individuos enfermos: El 13.14% de los cirrticos sern declarados normales. La regla: DECLARAR CIRRTICO a un individuo con dimetro de hemates superior a 7.829 y NORMAL en caso contrario, da lugar a que: Un 5% de los normales sern declarados cirrticos (falsos positivos) y un 13.14% de los cirrticos sern declarados sanos (falsos negativos) Grficamente la situacin sera (figura 3.18):
211
" = 0.1314
0 6.5
7.5
8 M = 7.8 29
8.5
9.5
10
Figura 3.18: Representacin grfica de la distribucin del dimetro de hemates en las dos poblaciones. Prefijado # queda delimitado el valor de M y el valor de "
Al observar esta situacin podramos pensar en ser ms restrictivos y prefijar un error # ms pequeo, por qu no un 1% por ejemplo. Por qu habramos de arriesgarnos en declarar enfermos a un 5% de los sanos, lo que socialmente podra tener connotaciones negativas (declaramos cirrticos a individuos que no lo son), si podemos prefijar este error tan pequeo como queramos.? Desafortunadamente disminuir el # trae consigo aumentar el ".
Observemos qu ocurrira si quisiramos disminuir cualquiera de los errores, por ejemplo qu ocurrira si disminuysemos #?: Si # disminuye, " aumenta En efecto: Si
Veamos como esta afirmacin es cierta. Realizar este clculo es idntico al caso anterior slo que ahora la regla de decisin es distinta:
212
Buscamos un M' (dimetro de las hemates) que slo lo superan un 1% de individuos normales. Se trata de localizar en una N(7.5, 0.2) un valor de la variable que verifique que el 1% es mayor que l, o lo que es lo mismo un 99% de los individuos tenga el dimetro de los hemates menor que dicho valor. Sea M / P(X<M)=0.99 en una N(7.5 , 0.2)
P(X<M) = P(Z < (M-7.5)/0.2) = 0.99 (M-7.5)/0.2 = 2.33 M = 7.5 + 2.33 x 0.2 = 7.966 Observamos que segn este criterio el valor de corte es ahora mayor M> M Hemos conseguido disminuir el porcentaje de falsos positivos pero cmo saber cmo se ha modificado el ! . Se trata de buscar en la normal de los cirrticos la probabilidad de encontrarnos valores menores que 7.966 P(X < 7.966) = P(Z < (7.966-8.5)/0.6) = 0.1867 El 18.67% de los cirrticos sern declarados normales. Luego: Si el porcentaje de falsos positivos disminuye hasta el 1%, el porcentaje de falsos negativos sobrepasa el 18%. Nos interesa prefijar los errores pequeos, obviamente a nadie le gusta asumir riesgos grandes, pero hay que tener cuidado al prefijar los riesgos ya que ambos tipos de errores estn claramente relacionados y disminuir uno de ellos trae consigo aumentar el otro considerablemente.