Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin
Los valores de una variable sirven para describir o clasificar individuos o distinguir entre ellos.
La mayora de nosotros hacemos algo ms que simplemente describir, clasificar o distinguir,
porque tenemos ideas respecto a las frecuencias relativas de los valores de una variable. En
estadstica decimos que la variable tiene una funcin de probabilidad, una funcin de densidad
de probabilidad o simplemente una funcin de distribucin (Badii & Castillo, 2007).
Las distribuciones de probabilidad estn relacionadas con la distribucin de frecuencias. De
hecho, podemos pensar en la distribucin de probabilidad como una distribucin de
frecuencias terica. Una distribucin de frecuencias terica es una distribucin de
probabilidades que describe la forma en que se espera que varen los resultados. Debido a que
estas distribuciones tratan sobre expectativas de que algo suceda, resultan ser modelos tiles
para hacer inferencias y tomar decisiones de incertidumbre (Badii et al., 2007a, 2007b).
Los objetivos de distribuciones de probabilidad son:
a) Introducir las distribuciones de probabilidad que ms se utilizan en la toma de
decisiones.
b) Utilizar el concepto de valor esperado para tomar decisiones.
c) Mostrar qu distribucin de probabilidad utilizar, y cmo encontrar sus valores.
d) Entender las limitaciones de cada una de las distribuciones de probabilidad que utilice.
Distribuciones muestrales
Consideremos todas las posibles muestras de tamao n en una poblacin dada (con o sin
reposicin). Para cada muestra, podemos calcular un estadstico (tal como la media o la
www.daenajournal.org
149
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
desviacin estndar o tpica), dicho estadstico vara de una muestra a otra. De esta manera
obtenemos una distribucin de la estadstica que se llama distribucin de muestreo. Si, por
ejemplo, la estadstica utilizada es la media muestral, entonces la distribucin se llama la
distribucin de muestreo de medias, o distribucin de muestreo de la media. Anlogamente,
podramos tener distribucin de muestreo de la desviacin tpica, de la varianza, de la
mediana, de las proporciones, etctera. Supongamos que se toman todas las posibles muestras
de tamao n, sin reposicin, de una poblacin finita de tamao N>n. Si denotamos la media y
N n
N 1
(1)
Donde:
x =
n
75
5
N n
N 1
20 5
= 29.8
20 1
En casos en los que la poblacin es muy grande en relacin con el tamao de la muestra, este
multiplicador de poblacin finita adquiere un valor cercano a 1 y tiene poco efecto sobre el
www.daenajournal.org
150
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
clculo del error estndar. Este ltimo pone de manifiesto que cuando muestreamos una
pequea fraccin de la poblacin entera, la fraccin n/N se define como la fraccin de
muestreo.
Cuando la fraccin de muestreo es pequea, el error estndar de la media para poblaciones
finitas es tan cercano a la media para poblaciones infinitas que bien podramos utilizar la
misma frmula para ambas desviaciones. Si la fraccin de muestreo es menor a 0.05, no se
necesita usar el multiplicador de poblacin finita. Si la poblacin es infinita los resultados
anteriores se reducen a:
(2)
p = p
p =
pq
=
n
p(1 p )
n
(3)
donde:
p = media de muestreo de proporciones.
P = media de la poblacin de proporciones.
p = probabilidad de xito.
q = probabilidad de fracaso.
Para muestras grandes (n30), la distribucin de muestreo est, muy aproximadamente,
normalmente distribuida. Ntese que la poblacin est binomialmente distribuida. La ecuacin
(3) es vlida tambin para una poblacin finita en la que se hace muestreo con reposicin. Para
poblaciones finitas en que se haga muestreo sin reposicin, la ecuacin (3) queda sustituida
por la ecuacin:
www.daenajournal.org
151
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
= p y = pq
Distribucin de muestreo con diferencias y sumas
Sean dadas dos poblaciones. Para cada muestra de tamao n1 de la primera, calculamos una
estadstica S1; eso da una distribucin de muestreo para S1, cuya media y desviacin tpica
denotaremos por 1 y 1. Del mismo modo, para la segunda muestra de tamao n2 de la
segunda poblacin, calcula una estadstica S2. De todas las posibles combinaciones de estas
muestras de las dos poblaciones podemos obtener una distribucin de las diferencias, S1 - S2,
que se llama distribucin de muestreo de las diferencias de los estadsticos. La media y la
desviacin tpica de esta distribucin de muestreo, denotadas respectivamente por las
siguientes: s1-s2 y s1-s2 vienen dadas por:
s1 s 2 = s1 s 2
s1 s 2 = s21 + s22
(4)
en lo que:
s1 s2 = media de muestreo de las diferencias de los estadsticos.
2 s = la varianza de la estadstica 1.
2 s = la varianza de la estadstica 2.
1
Si S1 y S2 son las medias muestrales de ambas poblaciones, cuyas medias denotaremos por x1 y
x2, respectivamente, entonces la distribucin de muestreo de las diferencias de medias viene
dada para poblaciones infinitas como:
1 2 = 1 2 = 1 2
y
12
x1 x 2 = 2x 1 + 2x 2 =
n1
22
n2
(5)
donde:
x1 x2 = la media de la diferencia muestral.
152
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
p1 p 2 = p1 p 2 = p1 p2
y
p1 p 2 = p21 + 2p 2 =
p1 q1 p 2 q 2
+
n
n2
(6)
s1+ s 2 = s1 + s 2
(7)
www.daenajournal.org
153
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Posibles
solicitudes
10
11
12
13
Total
0.15
0.20
0.40
0.25
1.00
$0
6.00
24.00
22.50
52.50
Las prdidas esperadas se resumen en las Tablas 4 a 6 que resulta de tomar la decisin de
tener en existencia 11, 12 y 13 cajas de fresas, respectivamente. La accin de almacenamiento
ptima es aquella que minimiza las prdidas esperadas. Esta accin corresponde al hecho de
tener en existencia 12 cajas diarias, en cuyo caso las prdidas esperadas toman el valor
mnimo de $17.50. Con la misma facilidad pudimos haber resuelto este problema tomando un
camino alternativo, es decir, maximizando la ganancia esperada ($50-20 del costo de cada
caja), en lugar de minimizar la prdida esperada.
En el clculo de prdidas esperadas hemos supuesto que la demanda del producto puede tomar
nicamente cuatro valores y que las fresas ya no valen nada al da siguiente. Estas dos
suposiciones reducen el valor de la respuesta que hemos obtenido.
www.daenajournal.org
154
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Prdida ($)
20
0
30
60
Probabilidad
0.15
0.20
0.40
0.25
1.00
Esperada
$3.0
0
12.00
15.50
30.00
Prdida condicional
10
60
11
12
13
40
20
0
Total
Probabilidad de que se
tengan estas solicitudes
Prdida esperada
9.00
0.15
0.20
0.40
0.25
8.00
8.00
0.00
1.00
25.00
El valor esperado en una situacin de toma de decisiones es un valor terico que puede no
presentarse nunca. En la mejor solucin para la situacin ptima de existencias que tenemos
en las tablas anteriores, la menor prdida esperada es de $17.50, pero la prdida real que puede
sufrir el vendedor en cualquier da puede ser de $0, $20, $30 $40. Recuerde que el valor
esperado es un promedio de todos los resultados posibles, pesados con la probabilidad de que
cada resultado se presente.
La distribucin binomial
Una distribucin de probabilidad de una variable aleatoria discreta utilizada ampliamente es la
distribucin binomial. Esta distribucin es apropiada par una variedad de procesos que
describe datos discretos, que son resultado de un experimento (Badii et al., 2007d) conocido
como proceso de Bernoulli en honor al matemtico Suizo Jacob Bernoulli (1654-1705), el cual
nos llevar a uno de slo dos resultados posibles que son mutuamente exclusivos, tales como
muerto o vivo, enfermo o saludable, etc., en donde la obtencin del resultado deseado se
considera como xito "p" y el resultado no deseado como fracaso "q", donde, q = 1 p (Badii
et al., 2007c).
www.daenajournal.org
155
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
(8)
Donde,
n = nmero de ensayos realizados.
p = probabilidad de xito.
q = (1-p) = probabilidad de fracaso.
n - x = nmero de fracasos deseados.
px = probabilidad favorable.
Recordando la frmula de combinaciones, la ecuacin 8 se transformar a la siguiente:
P( x) =
n!
px qn-x
x!(n x )!
(9)
Aunque esta frmula pueda parecer un tanto complicada, se le puede utilizar con bastante
facilidad. El smbolo ! significa factorial. Por ejemplo factorial cinco (5! = 5 * 4 * 3 * 2 *1 =
120), 0! = 1. Utilizando la frmula binomial para resolver nuestro problema descubrimos que
la ecuacin 9 puede desarrollarse como:
(q + p )n
n
n
= q n + q n 1 p + q n 2 p 2 + K + p n
1
2
(10)
n n
Donde: 1, 1 , 2 .... , son coeficientes binomiales; x = nmero de xitos deseados.
www.daenajournal.org
156
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Ejemplo 2. Se lanza una moneda corriente 6 veces, donde llamamos cara a un xito. Por
consiguiente n = 6 y p = q = 1/2. Solo pueden ocurrir dos cosas (p q) por lo tanto la
probabilidad de que ocurra 1 de ellas es la mitad, es decir .
La probabilidad de que suceda 2 caras exactamente (o sea x = 2) es:
a)
6! 1 1
6! 1 1
6 x5 x 4 x3 x 2 x1 1 1 30 1 15
P ( 2) =
=
=
=
=
(2 x1)(4 x3x 2 x1) 4 6 2 64 64
2!(6 2 )! 2 2
2!4! 2 2
b)
6! 1 1 6! 1 1 6! 1 6 x5 x 4 1 6 * 5! 1 1 15 6
1 22 11
+
+
=
=
+ =
+
+ =
+
4!2! 16 4 5!4! 32 2 6! 64 4!2 x1 64 5!*4 64 64 64 64 64 64 32
q p
npq
= npq =
(100 ) 1 1 = 5
2 2
www.daenajournal.org
157
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
P ( x) =
C xr C NNxr
C nN
(11)
Donde:
N = nmero de elementos en la poblacin.
r = nmero de elementos que tienen una caracterstica especifica, por ejemplo el nmero de
personas a favor un producto particular.
n = nmero de elementos en el muestra.
En base a la ecuacin 11 podemos realizar las operaciones factoriales siguientes:
C xr =
C nNxr =
r!
x!(r x)!
( N r )!
(n x)!{( N r ) (n x)}!
C nN =
N!
n!( N n)!
Media aritmtica
nr
N
(12)
En la que:
n = nmero de muestras.
r = nmero de elementos de la muestra con ciertas caractersticas.
N = tamao de la poblacin.
Y podemos calcular la variancia y la desviacin estndar de una distribucin
hipergeomtrica haciendo uso de la frmula:
Variancia:
2 =
r ( N r ) n( N n)
N 2 ( N 1)
www.daenajournal.org
(13)
158
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
=
Desviacin estndar:
r ( N r ) n( N n)
N 2 ( N 1)
(14)
En la que:
2 = la variancia.
= la desviacin estndar.
Ejemplo 4. Un furgn contena 20 computadoras electrnicas grandes, 2 de las cuales
estaban defectuosas. Si se seleccionan al azar tres computadoras del furgn cul ser la
probabilidad de que dos de ellas tengan desperfectos?
Solucin:
N = 20
n=3
r = 2(computadoras defectuosas)
x = nmero de computadoras con averas en la muestra
Entonces,
P ( x) =
C xr C nNxr
C nN
C 22 C 320 2 2
P(2) =
C 320
Donde,
C 320 2 2
1
= 0 . 02
50
18!
= C118 =
= 18
1!17!
C 320 =
20!
= 1140
3!17!
(1)(8)
= 0.016
1140
www.daenajournal.org
159
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
x = 1,2,,8
(15)
Donde,
x = nmero de pruebas independientes hasta la ocurrencia del primer xito.
p = probabilidad de xito en una sola prueba, q = 1 p.
Media:
Variancia:
Desviacin estndar:
1
p
(16)
1 p
p2
(17)
2 =
1 p
p2
(18)
www.daenajournal.org
160
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
minuto es idntica e independiente del resultado durante cualquier otro minuto y que x se
mide en minutos enteros, es decir, x = 1, 2, 3.
Ejemplo 5. Los registros indican que una cierta vendedora tiene xito en formular venta en
30% de sus entrevistas. Supngase que una venta en una entrevista es independiente de una
venta cualquier otro momento.
a) Cul es la probabilidad de que esta vendedora tenga que tratar con 10 personas
antes de hacer su primera venta?
b) Cul es la probabilidad que la primera venta se realice antes o en la dcima
oportunidad?
Solucin:
a) La probabilidad de realizar una venta en un solo contacto o entrevista es p = 0.3
Entonces la probabilidad de que necesita exactamente x = 10 contactos antes de hacer
su primera venta es:
p(x) = pqx-1
o bien
P( x = 10) = 1 p( x f 10) = 1
pq10
= 1 q 10 = 1 (0.7)10 = 0.972
1 q
Por lo tanto existe una alta probabilidad (0.972) de que la vendedora realice primera venta
antes de o en el dcimo contacto.
La distribucin de probabilidad normal
www.daenajournal.org
161
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Hasta ahora hemos presentado diversas variables aleatorias discretas y sus distribuciones de
probabilidad. Ahora fijaremos nuestra atencin a los casos en que la variable puede tomar
cualquier valor que est en un intervalo de valores dado, y en los cuales la distribucin de
probabilidad es continua. El objetivo de la distribucin de probabilidad normal es conducir
la variable aleatoria normal, una de las variables aleatorias continuas ms importantes y que
se utiliza con mayor frecuencia. Se da su distribucin de probabilidad y se muestra cmo
puede emplearse la distribucin de probabilidad (Badii et al., 2007a).
Varios matemticos han contribuido al desarrollo de la distribucin normal, entre los que
podemos contar al astrnomo-matemtico del siglo XIX, Karl Gauss. En honor a su trabajo, la
distribucin de probabilidad normal a menudo tambin se le llama distribucin Gaussiana.
Existen dos razones bsicas por las cuales la distribucin normal ocupa un lugar tan
prominente en la estadstica. Primero, tiene algunas propiedades que la hacen aplicable a un
gran nmero de situaciones en las que es necesario hacer inferencias mediante la toma de
muestras. Segundo, la distribucin normal casi se ajusta a las distribuciones de frecuencias
reales observadas en muchos fenmenos, incluyendo caractersticas humanas (peso, altura,
IQ), resultados de procesos fsicos y muchas otras medidas de inters para los
investigadores, tanto en el sector pblico como en el privado.
Variables aleatorias continuas
Una variable aleatoria continua es la que puede tomar un nmero infinitamente grande de
valores que corresponden a los puntos en un intervalo de una recta. Las estaturas y los
pesos de las personas, el tiempo entre dos eventos o la vida til de un equipo de oficina, son
ejemplos tpicos de variables aleatorias continuas.
El modelo probabilstico para la distribucin de frecuencias de una variable aleatoria
continua implica la seleccin de una curva, generalmente regular o aislada, a la que se
llama distribucin de probabilidad o funcin de densidad de probabilidad de una variable
aleatoria. Si la ecuacin de esta distribucin de probabilidad continua es f(x), entonces la
probabilidad de que x est en el intervalo a < x < b es el rea bajo la curva de distribucin
para f(x) entre los dos puntos a y b (Figura 1).
Esto concuerda con la interaccin de un histograma de frecuencias relativas, donde las
reas sobre un intervalo, bajo el histograma, correspondieron a la proporcin de
observacin que cae en dicho intervalo. Ya que el nmero de valores que puede tomar x es
infinitamente grande y no se puede contar, la probabilidad de que x sea igual a un valor
especfico, por ejemplo a, es 0.
Entonces las afirmaciones probabilsticas acerca de las variables aleatorias continuas
siempre corresponden a reas bajo la distribucin de probabilidad sobre un intervalo por
ejemplo, de a a b, y se expresan como P(a < x< b ). Ntese que la probabilidad en a < x <b
es igual a la probabilidad de que a < x = b, pues P(x = a) = P (x = b) = 0. Hay muchas
distribuciones de probabilidad continuas y cada una se representa mediante una ecuacin
www.daenajournal.org
162
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
f(x), que se escoge de la manera que el rea total bajo la curva de distribucin de
probabilidad sea igual a 1.
Figura 1. Distribucin de probabilidad para una variable aleatoria continua.
Una vez que conocemos la ecuacin f(x) de una distribucin de probabilidad particular se
pueden encontrar probabilidades especficas, por ejemplo, la probabilidad de que x est en
el intervalo a < x <b, de dos maneras. Podemos graficar la ecuacin y utilizar mtodos
numricos para aproximar el rea sobre el intervalo a < x < b. Este clculo puede realizarse
utilizando mtodos muy aproximados o una computadora para obtener cualquier grado de
precisin. O bien, si f(x) tiene una forma particular, podemos usar el clculo integral para
encontrar P(a < x< b). Afortunadamente, no hay que utilizar en la prctica, ninguno de
estos mtodos, porque se han calculado y tabulado las reas bajo la mayora de las
distribuciones de probabilidades continuas ms empleadas.
Estudiaremos en las secciones siguientes, una de las distribuciones de probabilidad
continuas de mayor uso la distribucin de probabilidad normal (de campana). La
distribucin de probabilidad normal se trata de ensear a encontrar la probabilidad de un
suceso por medio de la curva normal y la tabla de las reas bajo la curva normal. La
distribucin normal se utiliza cuando existe una variable aleatoria continua, donde dicha
variable puede asumir cualquier valor de una gama de ellos y por tanto la distribucin de
probabilidad es continua. La distribucin normal representa las siguientes propiedades:
1. La curva es simtrica, tiene un solo pico, por consiguiente es unimodal, presenta una
forma de campana.
2. La media de una poblacin distribuida normalmente se encuentra en el centro de su
curva normal.
3. A causa de la simetra de la distribucin normal de probabilidad, la media, la moda y
la mediana de la distribucin se encuentran tambin en el centro; en consecuencia,
para una curva normal, la media, la mediana y la moda tienen el mismo valor.
4. Tericamente, la curva se extiende en ambas direcciones, y tiende gradualmente a
unirse con el eje horizontal. Sin embargo, se extiende al infinito, sin tocar nunca el eje
de la abscisa.
www.daenajournal.org
163
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Y=
( X )2 / 2
1
e 2
2
(19)
Donde:
= la media.
= la varianza.
= la desviacin tpica.
= constante (3.14159).
e (exponencial) = 2.71828.
La ecuacin de una distribucin normal con = 0 y = 1 (una distribucin normal
estandarizada) es igual a:
Y=
1
z2
2
(20)
Figura 2. a) Una distribucin normal, b) Una distribucin normal con varianzas iguales y medias aritmticas
desiguales.
www.daenajournal.org
164
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
[z = ( X ) / ]
(21)
www.daenajournal.org
165
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Ntese que hay una correspondencia de uno a uno entre z y x, en particular, cuando x = , z
= 0,. El valor de z ser positivo cuando x est por arriba de la media, y negativo cuando x
sea menor que dicha media. La distribucin de probabilidad de z muchas veces se designa
por distribucin normal estandarizada pues su media es igual a cero y su desviacin
www.daenajournal.org
166
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
estndar es igual a uno. El valor bajo la curva normal entre la media z = 0 y un valor
especificado de z>o, por ejemplo zo es la probabilidad P(o z z0). Esta rea se registra en
la Tabla Z y se identifica como el rea sombreada en la Figura 6.
Figura 6. Distribucin normal estandarizada.
Ejemplo 6. Obtenga p(0 z 1.63). Esta probabilidad corresponde al rea entre la media
(z = 0) y un punto z = 1.63 desviaciones estndares a la derecha de la media.
Solucin: De la tabla de z de las reas bajo la curva normal a la derecha de la media,
solamente necesita encontrar el valor tabulado correspondiente a z = 1.63. Se baja por la
columna de la izquierda de la tabla hasta el rengln correspondiente a z = 1.6 y se va luego
por el rengln superior hasta la columna marcada con 0.03. La interseccin de esta
combinacin de rengln da el rea A = 0.4484. Por lo tanto, P (0 < z < 1.63) = 0.4484.
Ejemplo 7. Calcular P (-0.5 z 1.0), que corresponde al rea entre z = -0.5 y z = 1.0.
Solucin: El rea requerida es igual a la suma de A1 y A2 mostrada en la Figura 7. De la
Tabla obtenemos A2 = 0.3413. El rea A1 es igual al rea correspondiente entre z = 0 y z =
0.5 o bien A1 = 0.1915. Por lo tanto: A = A1 + A2 = 0.1915 + 0.3413 = 0.5328.
Tabla 7. rea bajo la curva para ejemplo 7.
www.daenajournal.org
167
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Ejemplo 8. Hallar los valores de z, por ejemplo zo tales que exactamente (hasta cuatro
cifras decimales) 0.95 del rea quede dentro de + z0 desviaciones estndares de la media.
Solucin: La mitad del rea de 0.95 se encontrara a la izquierda de la media y la otra mitad
a la derecha, porq la simetra de la distribucin normal, por lo tanto, se desea encontrar el
valor zo que corresponde a un rea igual a 0.475. Esta rea esta sombreada en la Figura 8.
Al referirnos a la Tabla Z se ve que el rea 0.475 est en el rengln correspondiente a z =
1.9 y en la columna 0.06. Por lo tanto zo = 1.96. Ntese que este resultado est muy cerca
del valor aproximado z = 2 que se utiliza en la regla emprica.
Figura 8. rea bajo la curva para el ejemplo 8.
Ejemplo 9. Sea x una variable aleatoria distribuida normalmente con una media igual a 10
y una desviacin estndar igual a 2. Encuentre la probabilidad de que x est entre 11 y 13.6.
Solucin: Como primer paso, tiene que calcular los valores de z, correspondientes a x = 11
y x = 13.6. Por lo tanto:
168
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
medio de 30.5 millas por galn (mpg) y una desviacin estndar de 4.5 mpg. Si un
fabricante desea disear un coche compacto ms econmico que el 95 % de los automviles
compactos vendidos en Estados Unidos, cul debe ser el rendimiento mnimo del coche
nuevo?
Solucin: Sea x una variables aleatoria distribuida normalmente con una media de 30.5 y
una desviacin estndar de 4.5. Se desea encontrar el valor de xo tal que
P (x< xo) = 0.95
Solucin: Como un primer paso encuentra el valor de zo tal que el rea a la izquierda sea
igual a 0.95. Puesto que el rea a la izquierda de z = 0 es 0.5, z0 ser el valor de z en la
Tabla que corresponde a una rea igual a 0.45. Este valor es z0 = 1.645. El paso final es
encontrar el valor x0 correspondiente a z0 = 1.645. Se obtiene utilizando la ecuacin que
relaciona x y z a saber:
z=
1.645 =
x0 30.5
4.5
Cul es la proporcin de reclutas que tienen un C.I. entre 100 y 105.7? Sea = 100
y = 10.
z = (x -)/ = (105.7 100) / 10 = 0.57
www.daenajournal.org
169
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
b)
10
10
= P (0.3 z 0.57) = 0.3821 0.2843 = 0.0978.
Con la tabla normal de reas, se deduce que la proporcin del rea a partir del extremo es
0.3821. Se conoce que la proporcin que corresponde a 105.7 es 0.2483, entonces el rea
rayada que se busca ser: 0.3821 - 0.2843 = 0.0978.
c)
www.daenajournal.org
170
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Aunque la distribucin normal es continua, resulta interesante hacer notar que algunas veces
puede utilizarse para aproximar la distribucin binomial, suponga que nos gustara saber la
probabilidad de obtener 5, 6, 7 u 8 caras en diez lanzamientos de una moneda no alterada:
P(5, 6, 7 u 8) = P(5) + P(6) + P(7) + P(8)
= 0.2461 + 0.2051 + 0.1172 + 0.0439 = 0.6123
Para n = 10 y p = se puede calcular la media ( = np = 10 () = 5) y desviacin estndar =
( = npq = 10 x1 / 2 x1 / 2 = 1.58) .
Observe el rea bajo la curva normal entre 5 . Nos damos cuenta de que esta rea es de
aproximadamente el mismo tamao que el rea de la barra que representa la probabilidad
binomial de obtener 5 caras. Los dos que agregamos y restamos a cinco se conocen como
factores de correccin de continuidad y se utilizan para mejorar la precisin de la
aproximacin.
Al usar los factores de correccin de continuidad, vemos que la probabilidad binomial de
obtener 5, 6, 7 u 8 caras puede ser aproximada por el rea bajo la curva normal entre 4.5 y 8.5.
Determine esta probabilidad mediante el clculo de los valores de z correspondientes a 4.5 y
8.5.
x 4 .5 5
=
= 0.32
z1 =
1.581
desviacin estndar
z2 =
8 .5 5
= 2.21
1.581
desviacin estndar
171
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
e
P(x) = f ( x ) =
x!
(22)
Donde:
P(x) = probabilidad de tener exactamente x presentaciones.
www.daenajournal.org
172
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
f (x) =
e 3 30 0.050 * 1
=
= 0.05
1
0!
Para los casos en que se desea obtener la probabilidad de ocurrencia de x o menos frecuencias
del evento en cuestin que tiene el nmero promedio de ocurrencias igual a se debe utilizar
la tabla de distribucin de Poisson hecha exclusivamente para estos casos.
Ejemplo 13. En el estudio de cierto organismo acutico se tomaron gran nmero de muestras
de un estanque y se cont el nmero promedio de organismos igual a dos. Encuentre la
probabilidad de que:
a) La siguiente muestra que se tome contenga uno o ms organismos.
www.daenajournal.org
173
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Solucin: La sumaria de todas las posibles situaciones que se puedan presentar es igual a uno;
por lo tanto si se desea obtener la probabilidad de que la muestra tenga uno ms organismos,
solo necesito restarle a uno la probabilidad de que obtenga 0 organismos. Es decir, P(x 1) =
1 - P(x = 0). En la tabla de distribucin acumulada de Poisson se ve que cuando = 2 la
probabilidad de que x = 0 es 0.135, por lo tanto P(x 1) = 1 - 0.135 = 0.865.
b) La siguiente muestra que se tome contenga exactamente 3 organismos. Este caso se puede
resolver la probabilidad de la otra manera [con p(x = 3)], pero para explicar el uso de esta
tabla lo resolveremos de la siguiente manera:
P(x = 3) = P(x 3) P(x 2) = 0.857 0.677 = 0.180
Si la probabilidad de que ocurra 3 es igual a la probabilidad de x 3 menos la probabilidad de
que ocurra x 2.
c) La siguiente muestra que se tome contenga menos de cinco organismos. Ya que el conjunto
de menos de cinco organismos no incluye a 5 se est pidiendo la probabilidad acumulada
desde 0 hasta 4, llegando a: P(x 4) = 0.947
Ntese que x es normalmente pequeo en la prctica; tericamente podra ser muy grande,
sin lmite. Por lo tanto, la variable aleatoria de Poisson es un ejemplo de variable aleatoria
discreta que puede tomar un nmero infinito (pero contable) de valores.
La distribucin de probabilidad binomial, cuando n es grande y p es pequeo, y cuando la
media = np de la distribucin de probabilidad binomial es aproximadamente menor que 7.
Esta aproximacin elimina el clculo tedioso necesario para determinar las probabilidades
binomiales cuando n es grande.
Ilustramos estos dos tipos de aplicaciones en los ejemplos siguientes.
Ejemplo 14. Las lesiones laborales graves que ocurren en una planta siderrgica, tienen
una media anual de 2.7. Dado que las condiciones de seguridad sern iguales en la planta
durante el prximo ao, cul es la probabilidad de que el nmero de lesiones graves sea
menor que dos?
Solucin: El evento de que ocurrirn menos de dos lesiones graves, es el evento que x = 0
o bien x =1, por lo tanto,
( ) 2.7
P(x<2) = p(1) en donde, p (x) = 2.7 e
x
x
www.daenajournal.org
= 0.249
174
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Recurdese que 0! = 1, por lo tanto, la probabilidad de que haya menos de dos lesiones
laborales graves el prximo ao en la planta fabril de acero, es 0.249.
Por conveniencia se proporciona en la tabla de Poisson, las sumas parciales, para la
distribucin de probabilidad de Poisson segn valores de desde 0.25, hasta 5.0, con
incrementos de 0.25. El ejemplo siguiente ilustrara el uso de la distribucin de Poisson para
aproximar la distribucin de probabilidad binomial.
Ejemplo 15. Supngase que se tiene un experimento binomial con n = 25 y p = 0.1. Hallar
el valor exacto de P(x = 3), utilizando la una tabla de Poisson, de las sumas parciales para
la distribucin de probabilidad de Poisson. Compare el valor aproximado con el valor
exacto para P(x =3).
Solucin: De la Tabla de Poisson, el valor exacto P(x = 3) es la suma de P(x) = 0.764. El
valor correspondiente con parcial de Poisson donde = np = (25)(0.1) = 2.5 se da en la
Tabla Poisson: P(x = 3) = P(x) = 0.758. Al comparar ambos resultados, vemos que la
aproximacin es bastante buena. Solamente difiere en 0.006 del valor exacto.
Bsqueda de probabilidades de Poisson utilizando la tabla de Poisson
En la tabla de Poisson se tienen los mismos resultados que si hiciramos los clculos, pero nos
evitamos el trabajo tedioso. Por ejemplo, los registros indican el nmero promedio de
accidentes en un crucero es igual a 5 accidentes mensuales. Si deseamos calcular la
probabilidad de que cualquier mes ocurran 4 accidentes. Podemos utilizar la tabla de Poisson
para evitar el tener que calcular e elevadas a potencias negativas. Aplicando la frmula:
P ( x) =
P(4) =
x * e
x!
(5) 4 e 5
= 0.17552
4!
Para utilizar esta tabla, todo lo que necesitamos saber son los valores de x y de (lamda), en
este ejemplo 4 y 5, respectivamente. Ahora busque en la tabla, primero encuentre la columna
cuyo encabezado es 5; luego recrrala hacia abajo hasta que est a la altura del 4 y lea la
respuesta directamente, 0.1755.
Relaciones entre la distribucin normal, binomial y Poisson
Si el tamao de la muestra es grande y si ni p ni q son muy prximos a cero, la distribucin
binomial puede aproximarse estrechamente por una distribucin normal con variable cannica
dada por:
www.daenajournal.org
175
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
z=
x np
(23)
npq
= np
2 = npq
=
2 =
= npq
Coeficiente de sesgo
3 = 0
3 = (q p ) / npq
3 =
Coeficiente de curtosis
4 = 3
Desviacin media
2 / = 0.7979
4 = 3 + [(!6 pq ) / npq
4 = 3+ 1
Algunas veces si se desea evitar el tedioso trabajo de calcular las distribuciones binomiales, se
puede usar en cambio la de Poisson. Esta ltima es una aproximacin razonable de la
distribucin binomial, pero slo en determinadas circunstancias. Estas condiciones se cumplen
cuando n es grande y p es pequea; es decir, cuando el nmero de ensayos es extenso y la
probabilidad binomial es pequea. La regla de mayor uso entre los estadsticos establece que
una distribucin de Poisson es una buena aproximacin de la distribucin binomial cuando n
es igual o mayor que 20 y cuando p es igual o menor que 0.05.
En los casos en que se satisfacen tales condiciones, podemos sustituir la media de la
distribucin binomial np en lugar de la media de la distribucin de Poisson de modo que la
formula ser:
www.daenajournal.org
176
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
(24)
Ejemplo 19. Supongamos que tenemos un hospital con 20 mquinas de dilisis renal y que la
probabilidad de que una de ellas no funcione bien durante un da cualquiera es de 0.02 Cul
es la probabilidad de que exactamente 3 queden fuera de servicio en un mismo da?
En la Tabla 8, se muestra las respuestas a esta pregunta. Como se aprecia en ella, la diferencia
entre las dos distribuciones de probabilidad es ligera (apenas cerca de 10% de error en el
ejemplo):
n = 20
P = 0.02
x=3
q = 1 - p = 0.98
Enfoque binomial
P(x) = [(n!)/ (n - x)!] (px qn - x)
P(x) = [(20!)/ (20 - 3)!] (0.023 * 0.98(20-3))
P(x) = 0.0065
Conclusiones
La estadstica es la ciencia que se trata de cuantificar la probabilidad de la ocurrencia o el
efecto de cualquier evento, sujeto, proceso, fenmeno o interacciones resultantes. Hay que
recalcar que la estadstica es solamente un medio y no el fin. Sin embargo, algunos
investigadores se involucran tanto en los detalles de la estadstica que parece que hasta se
trata de ajustar la realidad a los mtodos estadsticos, es decir, para estos investigadores, si
la estadstica no define una realidad, uno debe deshacerse de la realidad. En otras palabras,
hemos sido testigo de abuso, mal uso y sobre uso de esta herramienta en las investigaciones
en diferentes disciplinas de la bsqueda de patrones repetitivas, que forman el propsito de
una franquicia muy sera denominada la ciencia (Badii & Castillo, 2007). Los ejemplos de
este mal uso de la estadstica abundan en las mejores revistar cientficas del mundo. Es con
este objetivo que debemos utilizar de forma adecuada las diferentes distribuciones
probabilsticas de uso actual en nuestras investigaciones.
Referencias
Anscombe, F.J. & W.W. Glynn, 1983. Distributions of the kurtosis statistic for normal statistics. Biometrika:
70: 227-234.
Badii, M.H. & J. Castillo (eds.). 2007. Tcnicas Cuantitativas en la Investigacin. 348 pp. UANL, Monterrey.
ISBN: 970-694-377-3.
Badii, M.H., J. Castillo, J. Landeros & K. Cortez. 2007a. Papel de la estadstica en la investigacin cientfica.
Innovaciones de Negocios. 4(1): 107-145.
Badii, M.H., J. Castillo, A. Wong & J. Landeros. 2007b. Precisin de los ndices estadsticos: tcnicas de
jacknife & bootstrap. Innovaciones de Negocios. 4(1): 63-78.
Badii, M.H., J. Castillos, R. Foroughbakhch & K. Cortez. 2007c. Probability and scientific research. Daena,
2(2): 358-369.
Badii, M.H., J. Castillo, K. Cortez, A. Guillen & P. Villalpando. 2007d. Diseos experimentales e
investigacin cientfica. Innovaciones de Negocios, 4(2): 283-330.
www.daenajournal.org
177
Daena: International Journal of Good Conscience. 4(1): 149-178. Marzo 2009. ISSN 1870-557X.
Best, D.J. 1975. The difference between two Poisson expectations. Austral. J. Statatist.
Burstein, H. 1981. Binomial test for independent samples with independent proportions. Comimnic. Statist.Theor , Meth.10:11-29.
Dale, A.I. 1989. An early occurrence of the Poisson distribution. Statist. Prob. Lett. 7:21-22.
Groeneveld, R.A. & G.Meeden, 1984. Measuring skewness and kurtosis. Statistician, 33:391-399.
Little, R.J.A. 1989. Testing the equality of two independent binomial proportions. J. Amer. Statist.
Moors, J.J.A., 1986. The meaning of kurtosis: Darlington revisted. Amer. Statist. 40:283-284.
Moors, J.J.A., 1988. A quantile alternative for kurtosis. Statistician 37:25-32.
www.daenajournal.org
178