Está en la página 1de 96

ESTADISTICA Y

PROBABILIDADES
2

INTRODUCCIN

El trmino Estadstica tiene diversos significados, dependiendo del modo en que se


emplee; as pues, para un poltico, estar relacionado con algn tipo de rcord
nacional o regional; un cientfico lo relacionar con alguna tcnica ms o menos
sofisticada de prueba de hiptesis; para un matemtico, este trmino estar
relacionado con alguna frmula empleada para estimar algn parmetro de una
variable aleatoria. Todos estos significados se agrupan para formar esta ciencia,
rama de las matemticas, la cual se fundamenta bsicamente en la teora de
probabilidades.
Antes de tratar de discutir este tema, ser conveniente revisar algunas definiciones:
Steel y Torrie dicen que la estadstica "es la ciencia, pura y aplicada, que se
encarga de crear, desarrollar y aplicar tcnicas, de tal manera que la incertidumbre
de las inferencias inductivas pueda ser evaluada".
Segn Lewis, "ciencia y tcnica que se ocupa de reunir, analizar y resumir datos y
de estimar la probabilidad de la inferencia que se haga con dichos datos".
Toro, define a la estadstica como "ciencia que tiene por objeto agrupar
metdicamente todos los hechos que se presten a una valuacin numrica".
Toro , define a la bioestadstica como "parte de la biologa que aplica a los seres
vivientes los mtodos estadsticos y el clculo de probabilidades".
La Estadstica, particularmente desde el punto de vista aplicado al mtodo
cientfico, es una ciencia joven pudindose estudiar desde dos aspectos: el
descriptivo y el inferencial:
3

La Estadstica Descriptiva. se ocupa de la representacin objetiva de la


informacin (datos) colectada; para esto se requiere al menos de un
mnimo de conocimientos tericos, as como de bastante habilidad para
comunicar en forma clara un mensaje deseado, haciendo uso de figuras,
grficas, tablas, dibujos, etc.
La Estadstica Inferencial. trata de lo concerniente a la obtencin de
deducciones de una parte al todo, desarrollando para esto las tcnicas de
muestreo, las tcnicas de estimacin y las tcnicas de prueba de hiptesis.
Para llegar a la parte aplicada, y principalmente para conocer las bases sobre las
que descansa esto, se necesita tener al menos un concepto somero acerca de
mediciones, lgebra de conjuntos, probabilidades, variables, funciones, densidades,
distribuciones y de lmites de confianza en la estimacin de parmetros o
constantes poblacionales.
Los objetivos que expone Genter para un curso de este estilo, parecen muy
apropiados para finalizar este captulo de introduccin:
Introducir a los estudiantes en el lenguaje y filosofa de la estadstica.
relacionarlos con los tipos de problemas que pueden ser conducidos a
soluciones estadsticas.
Presentar suficiente tcnica estadstica para que los estudiantes puedan
trabajar algunos tipos estndar de problemas.
Habilitar a los estudiantes para que puedan leer y comprender los
resultados sumarizados de experimentos estadsticos llevados a cabo por
otros investigadores. puede ser que algunos nunca tengan que llevar a
cabo un experimento por s mismos, pero puede ser que tengan que leer
acerca del trabajo de otros en "Journals".
4

PERMUTACIONES

Permutacin: Conjunto ordenado de n elementos.


Notacin: Pn ; Pn,n ; An, n
Permutacin de 5 elementos
P5 = 5! Por lo que:
Pn = n!
P5 = 5! = 5 x 4 x 3 x 2 x 1 = 120
Ejemplo 1:
Para el conjunto {a, b, c} existen las siguientes permutaciones:
Solucin:
Abc, acb, bca, bac, cab, cba = 6
P3 = 3! = 6
Ejemplo 2:
En una asamblea de accionistas, hay 6 personas que han solicitado hacer uso de la
palabra En cuntas rdenes diferentes pueden hablar, si es que no se ha
establecido un orden de prioridades?
Solucin:
P6 = 6! = 720 formas distintas

Ejemplo 3:
En un proceso de manufactura hay seis operaciones distintas, que se indican con A,
B, C, D, E y F. En general no existe una secuencia fija para las operaciones, con la
salvedad de que A debe efectuarse al principio y F al final. Cuntas secuencias
diferentes pueden ocurrir?
5

Solucin:
A B C D E F
P4 = 4! = 24 formas diferentes
Cuando se toman parte de los elementos del conjunto se tiene:
n!
Pn,r =
(n r )!

Ejemplo 4:
Si : n = 5 y r=3
5! 5! 120
P5,3 = 60
(5 3)! 2! 2

Ejemplo 5:
Hay 7 candidatos para desempear 3 tareas, si todos los candidatos son igualmente
eficientes, De cuntas maneras se puede efectuar la asignacin?
Solucin:
7! 7! 7.6.5.4!
P7,3 = 210
(7 3)! 4! 4!

Ejemplo 6:
De cuntas maneras 3 fresadoras, 4 tornos, 4 taladros y 2 cepillos pueden ordenarse
en fila en un taller, de modo que el mismo tipo de mquina queden juntas.
3F 4T 4T 2C
6

P3 = 3! P4 = 4! P4 = 4! P2 = 2!

P4 = 4!

3! x 4! x 4! x 2! x 4! = 165,888 maneras diferentes

Combinaciones :
Una combinacin de n elementos tomados de r en r es un subconjunto no
ordenado de r elementos con r n.
2 combinaciones formadas por r elementos son distintas, si difieren al menos en un
elemento.
Ejemplo 1:
Sea el conjunto {a, b, c} de cuntas maneras podemos seleccionar:
a) un elemento
b) dos elementos
c) tres elementos
Solucin:

a) Existen 3 formas de seleccionar un elementos: a; b; c.


b) Existen 3 formas de seleccionar dos elementos: ab, ac, bc
c) Existe 1 forma de seleccionar 3 elementos: abc
7

n
Notacin: nCr;
r
Para determinar el nmero de combinaciones de n elementos tomando de r en r:
n!
C rn
r!(n r )!

Ejemplo :
Si n = 10 r=7
10! 10! 10 .9.8.7! 720
C710 120
7!(10 7)! 7!.3! 7!.3! 6

Ejemplo 2:
El congreso anglomexicano de administracin pblica, debe elegir el futuro comit
ejecutivo que regir a esa institucin durante el prximo ao.
La comisin directiva se forma con 6 integrantes y este ao han sido propuestos 7
representantes mexicanos y 4 ingleses para ser electos. Se pide determinar de
cuntas maneras se puede integrar la comisin en los siguientes casos:

a) Si en la comisin debe haber 4 mexicanos y 2 ingleses.


b) Si en la comisin debe haber como mnimo 2 ingleses y 2 mexicanos.
Solucin:
7!
a) Los mexicanos se pueden escoger de: C47 35
4!.3!
Los ingleses se pueden escoger de:
4!
C24 6
2!.2!
8

Conjuntamente : C 47 . C 24 = 35 x 6 = 210

b) Se pueden presentar los casos:

1) 2 ingleses y 4 mexicanos: C 24 C 47 = 6 x 35 = 210

2) 3 ingleses y 3 mexicanos: C 34 C 37 = 140

3) 4 ingleses y 2 mexicanos: C 44 C 37 = 21
210 + 140 + 21 = 371
Ejemplo 3:
En los laboratorios ELKO hay 3 plazas vacantes de un total de 33 solicitudes de
empleo, slo 14 se han considerado aceptables, en bases en las entrevistas
practicadas por el departamento de personal. De cuntas maneras pueden
asignarse las 3 plazas?
a) Si todos los empleos son de la misma categora

b) Si un empleo es de gerente de ventas, uno es de agente visitador para las


ciudades de Puebla y Tlaxcala y otro de agente visitador para las ciudades de
Tampico y Cd. Madero.
Solucin:
C314 364
a)

14!
b) 14 P3 2184
11!
9

Problemas y Ejercicios Propuestos:


1. De 7 candidatos Cuntas ternos se pueden escoger?
2. 4 alumnos deciden el horario en el cual harn sus prcticas pre profesionales ,
sabiendo que existen 6 turnos disponible distintos y en cada turno debe asistir uno
de ellos. Entonces cuntas formas pueden practicar
3. En la distribucin de material para mdico para 5 hospitales se tom en cuenta lo
siguiente :
A uno de ellos se debe entregar el material a las 8:30 al otro a las 9:00 y al
siguiente a las 9:30 y as sucesivamente hasta el ltimo . Si existe la posibilidad
de variar el orden de entrega de material a cada hospital, entonces de cuantas
formas distintas se entrega el material.

4. Cuntos objetos distintos deben existir para que el nmero de combinacin que
se puede formar , tomndolos de 2 en 2 sea igual a 6 veces el nmero de
objetos

5. Calcular :

35!*28!
a) K
27!*36!
29!
b) K
27!28!
36!37!
c) K
37!36!
10

COMBINACIONES
Anlisis Combinatorio

Principio Fundamental del Conteo:


Suponga que una persona tiene 2 formas de ir de una ciudad A a otra ciudad B; y
una vez llegada a B, tiene 3 maneras de llegar a otra ciudad C, De cuntas
maneras podr realizar el viaje de A a C pasando por B?

Si empez a pie, podr tomar luego avin, carro o trasatlntico, y si empez en


bicicleta, tambin podr tomar avin, carro o trasatlntico.
La persona tuvo 6 formas diferentes de realizar el viaje que son:
(iniciales) pa, pc, pt, ba, bc, bt. (2 x 3 = 6)
Se puede representar en un diagrama de rbol
11

Por lo que el principio fundamental del anlisis combinatorio, puede expresarse


as:
Si una primera decisin, operacin o accin puede efectuarse de a formas
diferentes, una segunda accin puede efectuarse de b formas diferentes, una tercera
accin puede efectuarse de c formas diferentes y as sucesivamente hasta la
ensima accin que puede efectuarse de z formas diferentes, entonces el nmero
total de formas diferentes que pueden efectuarse estas n acciones es igual con:
a x b x c x ... x z
Este principio tambin se llama principio del anlisis combinatorio principio
multiplicativo.
Ejemplo 1: De cuntas maneras diferentes podr vestirse un joven que tiene 3
camisas diferentes, 4 pantalones y 2 pares de calzado?
Solucin:
3 x 4 x 2 = 24 maneras diferentes
12

Ejemplo 2: En una ciudad los nmeros de telfono constan de 5 dgitos, cada uno
de los cuales se llama con alguno de los 10 dgitos (0 al 9). Cuntos nmeros
diferentes pueden formularse?
Solucin:
10 x 10 x 10 x 10 x 10 = 100,000 nmeros diferentes

Ejemplo 3:
La agencia de Publicidad PIPSA, ha obtenido la exclusividad respecto a una lnea
de polvos para preparar postres. A estos efectos la agencia ha decidido organizar
un concurso nacional destinado a adivinar el nombre futuro de esa lnea de
productos.
Las condiciones son:
a) Los nombres que se propongan deben ser de 4 letras.
b) Ninguna letra debe repetirse.
c) La primera y tercera letras deben ser consonantes.
d) La segunda y cuarta letras deben ser vocales.
e) Si una persona propone 2 veces el mismo nombre queda descalificada.
Cuntos nombres debe proponer una persona para estar seguro que participa en el
sorteo pblico?
Considerar 28 letras del alfabeto
Solucin:
23 x 5 x 22 x 4 = 10,120 nombres diferentes
Por qu esos nmeros?
Porque hay 28 letras del alfabeto, 23 consonantes y 5 vocales, pero se disminuy
de 23 a 22 en la primera y tercera cifra porque una de las condiciones es que las
13

letras no se repitan. As como 5 y 4 en la segunda y cuarta cifras, que son las


vocales.

Notacin Factorial
En algunos problemas de matemticas se nos presentan multiplicaciones de
nmeros naturales sucesivos tal como:
4 x 3 x 2 x 1 = 24 ; 3x2x1=6 ; 2 x 1 = 2.
Para abreviar estas expresiones, se usa una notacin especial llamada notacin
factorial y nos denota las multiplicaciones sucesivas de n hasta l y se define como:
4 x 3 x 2 x 1 = 4! Se lee: cuatro factorial o factorial de cuatro
3 x 2 x 1 = 3! Se lee: tres factorial o factorial de tres

En trminos generales:
n(n-1)(n-2)...x 2 x 1 = n! Se lee n factorial o factorial de n

Propiedades:
a) para n natural
n! = n(n-1)!

Ejemplo: 7! = 7 x 6! = 7 x 6 x 5 x 4!
b) 0! = 1
Ejemplos:
1) 5! = 5 x 4 x 3 x 2 x 1 = 120
2) 4! 3! = (24)(6) = 144

3)
14

4)

5)

Cuando n es demasiado grande se suele utilizar la frmula de Stirling:

Ejemplo:
Determinar 50! por Stirling:
15

VARIACIONES

Calcula el nmero de subgrupos de 1, 2, 3, etc. elementos que


se pueden establecer con los "n" elementos de una muestra.
Cada subgrupo se diferencia del resto en los elementos que lo
componen o en el orden de dichos elementos (es lo que le
diferencia de las combinaciones).
Por ejemplo, calcular las posibles variaciones de
2 elementos que se pueden establecer con los
nmeros 1, 2 y 3.
Ahora tendramos 6 posibles parejas: (1,2), (1,3),
(2,1), (2,3), (3,1) y (3,3). En este caso los
subgrupos (1,2) y (2,1) se consideran distintos.

INTRODUCCIN A LA PROBABILIDAD

Azar y Desconocimiento.
El azar est relacionado con el desconocimiento. Un ejemplo nos puede ayudar;
piense en un proceso industrial que produce grandes cantidades de un artculo
determinado. No todos los artculos producidos son idnticos, cada artculo puede
calificarse como ``bueno'' o ``defectuoso''. Si de toda la produccin se escoge un
artculo ``a ciegas'', ese artculo puede resultar bueno o defectuoso. Esta es una
situacin azarosa (o aleatoria) y la parte esencial de este azar es que no sabemos si
el artculo seleccionado es defectuoso. Claro que con experiencia en el proceso es
16

posible cuantificar de una manera numrica qu tan factible es que el artculo sea
defectuoso o no.

Azar e incertidumbre.
Hay otro concepto asociado al azar y es el de incertidumbre. Veamos un ejemplo.
Respecto a una inversin, podemos estar contemplando invertir una cantidad de
dinero. El retorno sobre la inversin puede ser fijo, como en el caso de una cuenta
en un banco con inters fijo; pero pensemos en una empresa. El negocio puede
resultar desde un gran xito hasta un fracaso, es decir, la ganancia no es fija, sino
que depende del xito a obtener. Si no podemos evaluar qu tan factible es cada
monto posible de la ganancia, tenemos una situacin de incertidumbre. Por el
contrario, si

podemos tener una idea de qu tan probables son los diferentes resultados y
entonces tendremos una situacin de riesgo. Esta ltima es la que llamamos
aleatoria o azarosa.
Espacio Muestral y Probabilidad.
El prrafo anterior se resume diciendo que en las situaciones o experimentos
aleatorios tenemos dos elementos esenciales:
1. Una lista de posibilidades a futuro: espacio muestral
2. Una cuantificacin de la incertidumbre sobre esa lista de posibilidades:
asignacin de probabilidades.
Cualquier problema o situacin en la probabilidad, parte de esos dos elementos:
Espacio Muestral y Probabilidades.

ESPACIO MUESTRAL.
17

El espacio muestral es el conjunto de todos los posibles resultados de un


experimento o situacin aleatoria.
Si en una caja hay 10 manzanas y 2 estn echadas a perder (al menos en este
momento!), al extraer tres manzanas y ver cuantas son buenas podemos obtener 1,
2 o 3 buenas (0 buenas es imposible!). De modo que en este ejemplo el espacio
muestral es: { 1, 2, 3 }.
Si un juego consiste en tirar todos los volados que hagan falta hasta obtener tres
guilas seguidas o hasta que sean 15 volados, si nos fijamos en el nmero de
volados requeridos, el espacio muestral es: { 3, 4, 5, . . . , 15 }. Pero si nos
fijramos en el nmero de soles que resultan, entonces el espacio muestral es: { 0,
1, 2, . . . , 15 }.
Es claro que para determinar el espacio muestral en un experimento aleatorio es
necesario entender perfectamente:
Qu se va a hacer.
Qu se va a observar o contar.

SUCESOS O EVENTOS.
Cuando se tiene un espacio muestral llamamos, formalmente evento a cualquier
subconjunto del espacio muestral.
Decimos que un evento se realiza, cuando el resultado del experimento aleatorio es
un elemento del evento.
Las dos definiciones anteriores son muy abstractas. Veamos un par de ejemplos.
En el caso de contar cuantos volados hacen falta para conseguir tres guilas
seguidas o tirar 15 volados; el espacio muestral son los nmeros: 3, 4, 5, . . . , 15.
Un evento podra ser { 3, 5, 7, . . . , 15}.
18

Este evento corresponde a que el nmero de tiros necesario sea n n. Si al hacer


los volados los resultados fueran:
AASAASSSAAA (aqu nos detenemos porque han cado ya, tres guilas
seguidas), el evento si se realiz porque el nmero necesario fue 11 y es n
n.
SSSAAA (aqu paramos porque ya hay tres guilas), el evento no se
realiz.
Podemos pensar que cada experimento al azar es un juego y que un evento es una
lista de los resultados que hacen que YO gane.
Otro ejemplo ms. Al comprar llantas para mi auto, puede ser que manifiesten un
defecto de fabricacin dentro del perodo de garanta total y que el fabricante deba
reponerlas. Tambin puede pasar que el defecto se manifieste en el perodo de
garanta parcial y que el fabricante bonifique slo un porcentaje o que el defecto se
manifieste despus de vencido el perodo de garanta en cuyo caso el fabricante no
paga nada. Tambin puede pasar que las llantas no tengan defecto de fabricacin
aparente y que no haya garanta que reclamar. Como se puede considerar que las
llantas que me vendieron se escogieron al azar de entre toda la produccin,
tenemos un experimento aleatorio.
El espacio muestral en este experimento es: S = { T, P1, P2, P3, N, OK }. Con la
siguiente notacin T: pago total, P1 pago del 50%, P2: pago del 30%, P3: pago del
10%, N: nada de pago, OK: llantas sin defecto. El evento { OK } slo se realiza
cuando las llantas no tienen defecto.
En este ltimo ejemplo se tiene un evento simple porque consta de un solo punto
del espacio muestral. Ser compuesto cuando tiene varios puntos del espacio
muestral. Se llama evento imposible al que no puede ocurrir; ste evento
19

corresponde al conjunto vaco. Otro evento extremo es el espacio muestral mismo


que, puesto que siempre ocurre, se llama evento seguro.

Problemas Propuestos:
1. En una caja hay 8 focos de los cuales 3 estn fundidos. Se van a sacar los
focos de uno en uno, hasta encontrar los tres fundidos. Si nos fijamos en
el nmero de focos que se quedan en la caja cul es el espacio muestral?
2. En el experimento de los volados mencionado arriba. Si nos fijamos en el
nmero de soles que salieron, describa en sus propias palabras, cul es el
evento { 0, 1, 2 }. Si los resultados fueron AASAASAAA Por qu se
detuvo el experimento? Se realiz el evento?
3. Jntese con un compaero de este curso y entre los dos discutan y
encuentren un ejemplo de un experimento aleatorio relacionado con las
personas que estn en la biblioteca despus de las 10 de la noche.
Expliquen cul es el espacio muestral. Expliquen qu informacin
necesitaran para asignar probabilidades.
4. Con su mismo compaero, encuentren un ejemplo de un experimento
aleatorio referente a las inscripciones. Detallen el espacio muestral.
Propongan un evento. Den un ejemplo de un resultado que implique que
el evento no se realiz y otro resultado donde el evento s se haya
realizado.
20

PROBABILIDAD

Aparte del espacio muestral, en cada experimento aleatorio hay una asignacin
primaria de probabilidades. Basados en la experiencia o en razonamientos de
simetra, a cada elemento del espacio muestral le asignamos una evaluacin de qu
tan factible es. Esta evaluacin se refleja en un porcentaje (nmero entre 0 y 1).
Entre ms factible sea el resultado, mayor es el porcentaje que se le asigna. Los
casos extremos son:
Un evento que no puede suceder, tiene probabilidad cero. Muchas veces
estos eventos con probabilidad cero son imposibles por alguna
contradiccin lgica en su definicin. Por ejemplo: ``que la suma de dos
dados sea n n y los dos dados tengan el mismo nmero''.
En el otro extremo hay eventos que siempre suceden y estos tienen
probabilidad uno. Por ejemplo: ``que el nmero de guilas en dos volados
sea menor o igual a 7.8'', aunque el evento pueda resultar extrao en su
definicin, siempre sucede y tiene probabilidad igual a 1.
La asignacin toma la forma matemtica de una funcin y se llama funcin de
probabilidad.
El dominio de esta funcin es el espacio muestral y su codominio es el intervalo
real [ 0, 1 ].
Esta funcin nos da las probabilidades de los eventos simples. Para un evento
compuesto, simplemente sumamos las probabilidades de los elementos que lo
componen.
21

EJEMPLOS.
La probabilidad es un concepto muy viejo en las matemticas. Actualmente lo
aplicamos en prcticamente todos los campos de la actividad humana. La variedad
de situaciones en que se aplica va desde la produccin hasta la planeacin a largo
plazo de las empresas.
Aunque esta es la visin moderna, y la razn de que estemos estudiando
probabilidad en este curso, los orgenes del concepto son muy humildes, comenz
aplicndose a los juegos de azar.
Pensemos en un dado perfectamente balanceado de modo que ninguno de los seis
lados es favorecido.
El espacio muestral es { 1, 2, 3, 4, 5, 6 }.
La funcin de probabilidad le asigna a cada uno de los elementos del espacio
muestral el valor de 1 / 6.
Esta asignacin la hacemos porque el dado est balanceado.
Decimos que la probabilidad de un evento es el nmero de resultados favorables al
evento entre el nmero de resultados posibles.

Por ejemplo, la probabilidad de que el resultado sea mayor que 4 es 2 / 6, porque


hay 2 resultados favorables entre los 6 resultados posibles. Formalmente, el evento
es A = { 5, 6 } y P[A] = 2/6.
La probabilidad que resulta de esta manera, tiene una interpretacin emprica; si
hacemos una serie larga de lanzamientos del dado, y observamos la frecuencia de
resultados favorables al evento A, esta frecuencia tiende a ser 2/6.

Otro ejemplo: una urna con 50 papelitos numerados de los cuales se escoge uno
para que tenga un premio. El espacio muestral es { 1, 2, 3, . . . , 50 }. La asignacin
22

de probabilidades es de 1 / 50 para cada resultado. Si yo compr los nmeros 1, 14


y 18; el evento de que yo gane es { 1, 14, 18 } y la probabilidad de que gane es 3 /
50.

PROBABILIDAD DE SUCESOS

Al definir los sucesos hablamos de las diferentes relaciones que


pueden guardar dos sucesos entre s, as como de las posibles
relaciones que se pueden establecer entre los mismos. Vamos a
ver ahora cmo se refleja esto en el clculo de probabilidades.
a) Un suceso puede estar contenido en otro: entonces, la
probabilidad del primer suceso ser menor que la del suceso
que lo contiene.
Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que
salga el nmero 6, y b) que salga un nmero par. Dijimos que el
suceso a) est contenido en el suceso b).
P(A) = 1/6 = 0,166
P(B) = 3 / 6 = 0,50
Por lo tanto, podemos ver que la probabilidad del suceso
contenido, suceso a), es menor que la probabilidad del suceso
que lo contiene, suceso b).
23

b) Dos sucesos pueden ser iguales: en este caso, las


probabilidades de ambos sucesos son las mismas.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos:
a) que salga nmero par, y b) que salga mltiplo de 2. Las
soluciones coinciden en ambos casos.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
c) Interseccin de sucesos: es aquel suceso compuesto por los
elementos comunes de los dos o ms sucesos que se intersectan.
La probabilidad ser igual a la probabilidad de los elemntos
comunes.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos:
a) que salga nmero par, y b) que sea mayor que 3. La
interseccin de estos dos sucesos tiene dos elementos: el 4 y el
6.
Su probabilidad ser por tanto:
P(A B) = 2 / 6 = 0,33
24

PROBABILIDAD DE SUCESOS

d) Unin de dos o ms sucesos: la probabilidad de la unin de


dos sucesos es igual a la suma de las probabilidades
individuales de los dos sucesos que se unen, menos la
probabilidad del suceso interseccin
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos:
a) que salga nmero par, y b) que el resultado sea mayor que 3.
El suceso unin estara formado por los siguientes resultados: el
2, el 4, el 5 y el 6.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P (A B) = 2 / 6 = 0,33
Por lo tanto,
P (A u B) = (0,50 + 0,50) - 0,33 = 0,666
e) Sucesos incompatibles: la probabilidad de la unin de dos
sucesos incompatibles ser igual a la suma de las
probabilidades de cada uno de los sucesos (ya que su
interseccin es el conjunto vacio y por lo tanto no hay que
restarle nada).
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos:
a) que salga un nmero menor que 3, y b) que salga el nmero
6.
25

La probabilidad del suceso unin de estos dos sucesos ser


igual a:
P(A) = 2 / 6 = 0,333
P(B) = 1 / 6 = 0,166
Por lo tanto,
P(A u B) = 0,33 + 0,166 = 0,50
f) Sucesos complementarios: la probabilidad de un suceso
complementario a un suceso (A) es igual a 1 - P(A)
Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga
un nmero par, luego su complementario, suceso (B), es que
salga un nmero impar.
La probabilidad del suceso (A) es igual a :
P(A) = 3 / 6 = 0,50
Luego, la probabilidad del suceso (B) es igual a:
P(B) = 1 - P(A) = 1 - 0,50 = 0,50
Se puede comprobar aplicando la regla de "casos favorables /
casos posibles":
P(B) = 3 / 6 = 0,50
g) Unin de sucesos complementarios: la probabilidad de la unin
de dos sucesos complementarios es igual a 1.

Ejemplo: seguimos con el ejemplo anterior: a)


que salga un nmero par, y b) que salga un
26

nmero impar. La probabilidad del suceso unin


de estos dos sucesos ser igual a:
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
Por lo tanto,
P(A U B) = 0,50 + 0,50 = 1
27

AXIOMAS DE LA PROBABILIDAD

Teniendo en cuenta las operaciones para hacer conjuntos nuevos, hay algunos
hechos fundamentales respecto a la probabilidad que se cumplen siempre:
1. P(A) mayor o igual a 0
2. P(S) = 1
3. P(A B) = P(A) + P(B) si A y B son excluyentes.
De estas tres propiedades, los matemticos deducen un montn de reglas tiles
para calcular probabilidades en situaciones ms complicadas. A este tipo de
proposiciones de las que se deducen otras, se les llama axiomas y los tres de arriba
son los axiomas de la probabilidad. Algunas de las frmulas ms tiles, deducidas
de los axiomas, son las siguientes.
P( vaco ) = 0
P(A') = 1- P(A)
P(A - B) = P(A) - P(A y B)
Si A est contenido en B entonces P(A) menor o igual a P(B)
P(A) menor o igual a 1
P(A B) = P(A) + P(B) - P(A y B).
La deduccin de estas leyes a partir de los tres axiomas es un ejercicio de ingenio
matemtico al que valdra la pena asomarse, pero en el que no tenemos intencin
de meternos de lleno. Ya que desde el punto de vista de este curso, lo interesante es
aplicarlas.
Respecto a la tercera de la reglas, note bien que la resta de conjuntos se define as:
``A - B'' es la coleccin de elementos de A que no estn en B. De tal suerte que
28

P(A - B) debe contemplar slo a elementos de A y por eso es que a P(A) no le


restamos P(B) sino solamente P(A y B).
Otro comentario lo merece la ltima regla:
P(A B) = P(A) + P(B) - P(A y B).
Es preciso restar P(A y B) ya que as no lo hiciramos, se estara tomando en
cuenta dos veces a los elementos comunes a A y a B.

Problemas Propuestos

Resolver los siguientes ejercicios


1. Inventen un juego con dos dados. Como ejemplos,
o tirar dos dados y el resultado no es la suma de los dados sino la
multiplicacin.
o tirar dos dados y el resultado es 1000 si la suma de los dos es par
y 5000 si la suma es n n.
Escriban el espacio muestral y, teniendo en cuenta que las 36 parejas de
posibles resultados con dos dados: { (1,1), (1,2), (1,3), . . . } son
igualmente probables, encuentren la funcin de probabilidad para el juego
que inventaron.

Combinaciones de Sucesos o Eventos.


Definir la unin e interseccin de eventos. Obtener la probabilidad de la unin e
interseccin de eventos. Enunciar y aplicar las leyes de la probabilidad. Definir
eventos mutuamente excluyentes y la particin de un espacio muestral. Establecer
y aplicar la ley de la adicin de la probabilidad para n eventos.
29

De la funcin de Probabilidad al clculo de probabilidades


Toda la informacin matemticamente importante respecto a un experimento
aleatorio se encuentra en:
El espacio muestral.
La funcin de probabilidad.
El clculo de la probabilidad de un evento se simplifica partindolo en eventos ms
sencillos y uniendo los pedazos de acuerdo a la llamada ley de la adicin para
probabilidades.
Un ejemplo nos puede servir. Se van a tirar dos dados y yo gano si
la suma de los dados da siete o
aunque la suma no sea siete, si uno, al menos, de los dados cae en uno.
Los resultados de tirar los dados son 36: S = { (1,1),(1,2),(1,3), . . . ,(6,6) }.
Adems, por la simetra interna de los dados, cada uno de estos 36 resultados es
igualmente probable. Esto establece la funcin de probabilidad.
Pasemos al problema de calcular la probabilidad de ganar. Una manera equivocada
de resolver el problema es as. Yo gano si
el primer dado cae uno o
el segundo dado cae uno o
la suma de los dos es siete.
Como las respectivas probabilidades son: 1 / 6, 1 / 6 y 1 / 6. La probabilidad de que
gane es la suma de estas tres, 1 / 2. Lo que tiene mal este razonamiento es que los
eventos en que hemos partido el resultado de que yo gane no son ajenos, y en estas
circunstancias no se vale sumar las probabilidades y ya.
Para responder correctamente hay que partir el resultado de que yo gane en ms
pedazos:
que el primer dado caiga uno y el otro no o
30

que el segundo caiga uno y el primero no o


que los dos caigan uno o
que la suma sea siete pero no haya ningn uno.
Las respectivas probabilidades son: 5 / 36, 5 / 36, 1 / 36 y 4 / 36. Para una
probabilidad total de ganar de: 15 / 36; esto es menor que 1 / 2 que es la que
habamos calculado mal.
Fjese que para resolver el problema lo partimos en pedazos ms pequeos,
los pedazos son ajenos.
la probabilidad fue la suma de esos pedazos.
En el ejemplo usamos un espacio muestral equiprobable.

Problemas propuestos:
Resuelva estos ejercicios.
1. Se van a tirar 5 monedas y el resultado va a ser el nmero de guilas
menos el nmero de soles. Escriban el espacio muestral equiprobable para
este experimento. (Debe tener 32 resultados).
2. Siguiendo con el ejercicio anterior, me van a dar una cantidad de pesos
igual a la resta: [nmero de guilas] MENOS [nmero de soles]. Si sale
negativo quiere decir que yo pago! Cul es la probabilidad de que gane
ms de dos pesos?
3. Si un dado se construye de modo que un 1 o un 2 ocurran dos veces ms
frecuentemente que un 5, mismo que se presenta tres veces ms seguido
que un 3 o un 4 o un 6. Cul es la probabilidad de que el nmero que se
obtiene sea par? Cul la de que sea un cuadrado perfecto? Cul la de
que sea mayor que 4?
31

4. Cmo haran Uds. para construir un dado como el que se propone en el


ejercicio anterior?

PROBABILIDAD CONDICIONAL

Consideremos la siguiente situacin. Se tienen tres urnas similares; por fuera son
idnticas. Se sabe que
en la urna 1 hay 3 bolas blancas y 19 azules,
en la urna 2 hay 20 bolas blancas y 2 azules,
en la urna 3 hay 11 bolas blancas y 11 azules.
Se va a sacar una bola de una de las urnas. Puede ser azul o blanca. Cul es la
probabilidad de que sea blanca?
Hay cuatro posibles soluciones:
1. La probabilidad de una blanca es 3 / 22. Esto es porque si se escoge la
urna 1, hay 3 de 22 bolas que son blancas. Esta respuesta nos deja
pensando en que es muy arbitrario decir que la urna escogida es la 1. Si la
urna escogida fuese la 1 esta sera la respuesta correcta.
2. De manera similar, podemos pensar que la urna escogida es la 2 y
entonces la probabilidad de una bola blanca es 20 / 22.
3. Claro que, tambin, la urna escogida puede ser la 3 y entonces la
probabilidad de blanca es 11 / 22.
4. Como no se sabe cual es la urna escogida y las tres urnas tienen el mismo
nmero de bolas, la probabilidad se calcula como si fuese una gran urna
con 66 bolas de las cuales 3 + 20 + 11 son blancas y, as, la probabilidad
es 34 / 66
32

Cul es la respuesta correcta? o habr otra que sea la respuesta correcta?


Una cosa es clara; si podemos suponer que la urna escogida es la 1, la respuesta
correcta es la primera. Lo mismo se puede decir de la segunda y la tercera. La
cuarta es un poquito ms atrevida y quiz sea correcta. Por lo pronto vamos a darle
un nombre a las tres primeras: les llamamos probabilidad condicional.
A la primera la llamamos ``probabilidad condicional de blanca dado que
la urna es la 1''.
A la segunda, la llamamos de manera similar condicional de blanca dado
que la urna es la 2.
A la tercera se le da un nombre anlogo [Cul nombre?].
Ms adelante en el curso, veremos lo que se llama frmula de la probabilidad total
y entonces, veremos que la cuarta respuesta dara la ``probabilidad no condicional''.
Por el momento ampliemos nuestras ideas sobre probabilidad condicional con un
poco de matemticas.

Formalmente, definimos en clase la probabilidad condicional de la siguiente


manera:
P( A | B ) = [P( A y B )] / [P( B )]
El smbolo P( A | B ) lo leemos como probabilidad de A dado B. Lo
interpretamos como la probabilidad de que, sabiendo que ya sucedi B,
adems suceda A. En el ejemplo de las urnas A sera el evento ``la bola es
blanca''; B sera la urna correspondiente.
Como lo que est abajo en el quebrado es la probabilidad de lo dado, la
frmula no es simtrica en A y B. Si los intercambiamos, da otro nmero.
Esto se ve en el ejemplo ya que no es lo mismo que nos informen cual es
33

el nmero de la urna escogida a que nos digan que la bola fue blanca y
nos pregunten cul es la urna.
Esta frmula no tiene sentido matemtico si P(B) = 0. En tal caso decimos
que la probabilidad condicional no est definida. Claro que eso est bien
porque no puede haber sucedido algo que es imposible.
Fjese que esta frmula se usar cuando haya una manera fcil de calcular las
probabilidades no condicionales y la condicional sea difcil. Eso no fue el caso con
el color de la bola y las urnas.
Para ejemplificar el tipo de situacin en que nos sirve la frmula descrita,
considere este problema.

Se tiran dos dados y se sabe que el primero no tiene el nmero 5. Cul es la


probabilidad de que la suma de los dados sea 8?
Para resolver, llamemos
B el evento: ``el primer dado no es 5''.
A el evento: ``la suma de los dados es 8''.
Con los datos se ve que:
P(B) = 30 / 36.
Porque de las 36 parejas posibles, 6 tienen 5 en el primer dado.
P(A y B) = 4 / 36.
Porque slo se obtiene 8, con las parejas (2,6), (3,5), (4,4) y (6,2) [La pareja
(5,3) s suma ocho pero tiene un 5 en el primer dado].
y, usando la frmula, P(A|B) = 4 / 30.
Tambin hubiramos podido calcular sin la frmula, pero esa cuenta requiere ms
ingenio. En este ejemplo es fcil calcular las probabilidades no condicionales.
34

Hay muchos problemas, como en el de las urnas, en que lo contrario es lo cierto: es


fcil calcular la condicional y la podemos usar para calcular la conjunta.
Si despejamos a P(A y B), tendremos una frmula para calcular la probabilidad
conjunta cuando sea fcil calcular la condicional.
En clase hacemos un ejemplo simple de clculo de probabilidad condicional con
una tabla de dos clasificaciones cruzadas.
En ese ejemplo se ven tres cosas:
1. La probabilidad condicional nos permite medir la informacin. En los
ejemplos vimos como cambia la probabilidad de A, antes de conocer
nada: P(A) y despus de conocer la ocurrencia de el evento B: P(A | B).
2. En un extremo est el cambio enorme que corresponde a que A y B sean
excluyentes (ajenos). En este caso la probabilidad podra llegar incluso a
ser cero.
3. En el otro extremo estn los eventos en los que sucede que P(A | B) =
P(A). Esto quiere decir que la informacin de que B ocurri no cambia la
probabilidad de A y decimos que A y B son independientes.
Esta ltima caracterstica, la independencia, juega un papel muy importante en la
probabilidad y merece una atencin ms detallada. Por el momento debemos
establecer una definicin:
A y B son eventos independientes si y slo si P(A y B) = P(A)
P(B)
En forma equivalente decimos:
A y B son eventos independientes si y slo si P(A | B) = P(A)
La equivalencia se sigue de una sustitucin algebraica muy sencilla.
La consecuencia de que esta sea una definicin es que:
35

para comprobar la independencia de dos eventos es preciso hacer


ver que P(A y B) = P(A)P(B).
Es importante remarcar la diferencia de concepto entre eventos independientes y
eventos excluyentes o ajenos. En nuestro ejemplo se ve claramente que ambos
conceptos son antitticos. El hecho de que dos eventos se excluyan casi implica
que no son independientes. La excepcin se da en el caso degenerado de que
alguno de ellos (o los dos), sea imposible. En el habla cotidiana, a veces, se
confunden estos conceptos.
Note que si A es imposible; P(A) = 0. Adems ``A y B'' tambin es imposible y se
tiene P(A y B) = P(A)P(B) ya que ambos lados de la igualdad valen cero . Pero ste
es el nico caso en que dos eventos son ajenos e independientes a la vez; en
trminos geomtricos la idea de independencia se asemeja a la perpendicularidad y
la de ``ajenos'' al paralelismo.
Probabilidades de Intersecciones de Sucesos o Eventos.
Establecer y aplicar la ley general multiplicativa de la probabilidad para n eventos.
Definir independencia de n eventos.
Dada una coleccin de eventos, determinar si son o no independientes.
Establecer y aplicar la ley particular multiplicativa de la probabilidad para n
eventos independientes.

Probabilidades conjuntas
Con:
la definicin que hicimos de probabilidad condicional y
36

la definicin de independencia podemos establecer igualdades que nos


auxilien para calcular la probabilidad de la ocurrencia simultnea de dos
eventos.
1. Para dos eventos en general.
P(A y B) = P(A) P(B | A)
o Esta igualdad no es ms que la definicin de probabilidad
condicional volteada al revs.
o Para aplicar esta igualdad es preciso que contemos, de alguna
manera indirecta, con la probabilidad condicional.
o La igualdad se puede escribir tambin, condicionando sobre B,
as.
P(A y B) = P(B) P(A | B)
2. Para dos eventos independientes
P(A y B) = P(A) P(B)
o Para poder usar esta igualdad se necesita saber, de otras fuentes,
que A y B son independientes.
o Esta igualdad no es ms que la versin de la de arriba cuando
P(B | A) = P(B).
Estas igualdades son muy tiles cuando el experimento aleatorio se va a llevar a
cabo en etapas temporales. Por ejemplo, suponga que una empresa recibe materia
prima empaquetada en sobres de 300g. que vienen en cajas de 50 sobres cada una;
suponga, adems que cada sobre puede ser: bueno o deficiente. Para revisar una
caja, se van a tomar, al azar, 3 sobres.
si ms de 2 sobres son deficientes se rechazar la caja completa.
si ningn sobre es deficiente, se aceptar la caja completa.
37

si hay 1 o 2 sobres deficientes, se tomarn otros 3 sobres y si el total de


deficientes de los 6 sobres revisados, se pasa de 2, se rechazar la caja
completa (en caso de ser 2 o menos, se acepta la caja).
Una fuente secreta nos informa que una caja especfica tiene 10 sobres deficientes.
Cul es la probabilidad de que esa caja sea aceptada?
El problema es complejo, trate Ud. de resolverlo, la respuesta involucra pensar en
etapas, de acuerdo a los diferentes resultados de la primera etapa. El problema lo
resolvemos en el saln.
Ms de dos Sucesos o Eventos
Ambas igualdades se pueden llevar a tres o ms eventos, como sigue:
P(A y B y C) = P(A) P(B | A) P(C | A y B)
o cualquier otro orden para el condicionamiento,
por ejemplo:
P(A y B y C) = P(B) P(C | B) P(A | B y C)
Para el caso de eventos independientes la igualdad se simplifica en su escritura:
P(A y B y C) = P(A) P(B) P(C)
La generalizacin de las frmulas anteriores a ms de tres eventos es inmediata.
No olvide que para aplicar cualquiera de estas frmulas es preciso conocer,
previamente los valores de las probabilidades involucradas.
Un ejemplo de uso de estas frmulas es el siguiente:
Si una pistola est cargada con 15 cartuchos, de los cuales 2 son intiles y no
funcionarn, Qu probabilidad hay de que el primer cartucho funcione y los dos
siguientes no?
En este ejemplo, por la especificacin del evento, podemos calcular las
probabilidades condicionales por separado y eso nos lleva aplicar la primera de las
frmulas vistas arriba.
38

La solucin la damos en el pizarrn.


Ms sobre independencia
Respecto a la independencia de dos eventos, hay algunas cosas muy elementales
que agregar a la definicin que hicimos en notas pasadas.
1. La independencia de dos eventos A y B, quiere decir que el saber que A
sucedi no modifica la probabilidad de que B tambin haya sucedido.
Como consecuencia saber que A no sucedi tampoco puede afectar a la
probabilidad de B.
Hacemos una demostracin formal en el pizarrn.
Podemos poner esto diciendo que
Si A y B son independientes, tambin lo son las tres
siguientes pares: A' y B ; A y B' ; A' y B' (estamos
usando el apstrofe ' para denotar complemento)
2. Cuando se tienen tres eventos, se puede presentar una situacin muy
curiosa. Puede pasar que
o A y B sean independientes y
o A y C sean independientes y
o B y C tambin sean independientes.
Pero A, B y C NO sean independientes.
Esta situacin curiosa se describe diciendo que no basta que varios
eventos sean independientes a pares, para que sean independientes.
El ejemplo clsico es el de un experimento aleatorio con cuatro posibles
resultados igualmente probables: 1, 2, 3 y 4 .
o Si el resultado es 1, A gana y nadie ms.
o Si el resultado es 2, B gana y nadie ms.
o Si el resultado es 3, C gana y nadie ms, pero
39

o Si el resultado es 4, los tres A, B y C ganan.


Usted puede calcular las probabilidades para darse cuenta que:
o P(A y B) = P(A) P(B)
o P(A y C) = P(A) P(C)
o P(B y C) = P(B) P(C)
pero P(A y B y C) no es igual a P(A) P(B) P(C).
3. Una nota final de un estilo menos matemtico. La palabra independencia
se utiliza en otros contextos para denotar un sinnmero de conceptos
diferentes.
Los ejemplos ms comunes son en poltica, en historia, en derecho. En la
ciencia se habla de variables independientes y el significado es diferente
que el que usamos aqu. An en otras ramas de la matemtica se usa la
palabra independencia para denotar a otros conceptos. Cuando queremos
distinguir la definicin tcnica que usamos en la probabilidad de otras
nociones le ponemos un apellido a la independencia y decimos
independencia estocstica.
Es conveniente recordar que cuando existe duda si dos eventos son independientes
o n, la nica forma de zanjar la cuestin es viendo si P(A y B) es igual o diferente
al resultado de multiplicar P(A) P(B). Naturalmente que si la independencia de dos
eventos est en duda, el clculo de P(A y B) no se puede hacer simplemente
multiplicando P(A) P(B) sino que se debe justificar de alguna otra manera.
40

TEOREMA DE BAYES

Veamos un problema que nos llevar a una regla interesante de clculo de


probabilidades que se llama: el teorema de Bayes.
En una etapa de la produccin de un artculo se aplica soldadura y para eso se usan
tres diferentes robots. La probabilidad de que la soldadura sea defectuosa vara
para cada uno de los tres, as como la proporcin de artculos que cada uno
procesa, de acuerdo a la siguiente tabla.
robot prob. Defect. prop. Proces.
A 0.002 18%
B 0.005 42%
C 0.001 40%
Tenemos un par de preguntas:
Cul es la proporcin global de defectos producida por las tres mquinas
Si tomo un artculo al azar y resulta con defectos en la soldadura, cul es
la probabilidad de que haya sido soldado por el robot C.
(I) La primera pregunta nos va a llevar a lo que se conoce con el nombre de
frmula de la probabilidad total.
Queremos conocer la proporcin global de defectos delos tres robots. Despus de
reflexionar un momento se ve que si todas las soldaduras las pusiera el robot C,
habra pocos defectos, seran 0.001 o 0.1%. En cambio, si todas las pone el B,
sera un desastre!, tendramos cinco veces ms: 0.005 o 0.5%. De modo que en
nuestra respuesta debemos tener en cuenta las diferentes proporciones de lo
maquinado en cada robot.
41

Nuestra idea es empezar por descomponer el evento ``defectuoso'' en ``viene del


robot A y es defectuoso'' o ``viene del robot B y es defectuoso'' o ``viene del robot
C y es defectuoso''. En smbolos tendremos
P(d) = P(A y d) + P(B y d) + P(C y d)

P(d) = P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)


Antes de ponerle nmeros y resolver nuestro problema fijmonos en la frmula
obtenida.
1. Hay tres eventos A, B y C que
o son ajenos y
o cubren todo el espacio muestral.
2. Conocemos las probabilidades de cada uno de ellos.
3. Adems, conocemos las probabilidades condicionales de otro evento dado
cada uno de ellos.
La frmula de arriba se llama frmula de la probabilidad total.
Llenando con nuestros nmeros, tenemos que
P(d) = (0.18)(0.002) + (0.42)(0.005) + (0.40)(0.001)
o sea que P(d) = 0.00286 casi 3 piezas por cada mil.
Es bueno comparar este resultado con los porcentajes de soldaduras defectuosas de
cada robot por separado. Podemos ver que el resultado se encuentra entre todas
ellas y se encuentra relativamente cerca de los porcentajes de los robots ms
utilizados (el B y el C). Esto es muy razonable.
(II) La segunda pregunta es, a la vez ms simple y ms complicada. Nos va a llevar
a lo que se conoce con el nombre de teorema de Bayes.
La probabilidad que buscamos es una condicional pero al revs de las que tenemos.
Buscamos
42

P( C | d)

para calcularla usamos la definicin de probabilidad condicional:


P( C | d) = [P(C y d)] / [P( d )]

El numerador (lo de arriba) lo calculamos con


P( C y d ) = P(C) P(d|C)

y el denominador lo calculamos con la frmula de probabilidad total


P(d) = P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)

juntando las dos tenemos la frmula de Bayes:


P( C|d) = [P(C) P(d|C)] / [P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)]
Aplicndola a nuestro caso tenemos
P(C|d) = [(0.40)(0.001)]/[(0.18)(0.002) + (0.42)(0.005) + (0.40)(0.001)]

o sea
P(C|d) = [0.0004]/[0.00286] = 0.1399

casi 14%.
O sea que si tomamos una pieza al azar, la probabilidad de que haya sido soldada
por el robot C es alta, 40%. Pero, como ese robot produce slo 1 de cada mil
soldaduras defectuosas, al saber que la pieza seleccionada es defectuosa, la
probabilidad de que provenga del robot C disminuye a solamente 14%. Esto quiere
decir que, en este caso el saber que la soldadura es defectuosa, nos provee con una
gran cantidad de informacin.
43

Si analizramos, usando de nuevo la frmula de Bayes las probabilidades de los


robots A y B, tendramos
P(B|d) = 0.7343 y P(A|d) = 0.1259
Comparadas con las probabilidades de cada mquina sin saber que la pieza es
defectuosa vemos un gran incremento en la probabilidad de B.
Si, por el contrario la pieza no hubiese tenido defectos de soldadura, el mismo
teorema de Bayes nos dara (haga Ud. las cuentas y fjese que no me haya
equivocado yo!):
P(A|no d) = 0.1802 P(B|no d) = 0.4191 y P(C|no d) = 0.4007
Las probabilidades no son idnticas a las probabilidades no condicionales, pero la
diferencia es muy pequea.
Para apreciar mejor el cambio, pongamos en una sola tabla las probabilidades
iniciales y las condicionales obtenidas bajo el conocimiento de la soldadura de la
pieza.
Robot P() P( |d) P( |no d)
A 0.18 0.1259 0.1802
B 0.42 0.7343 0.4191
C 0.40 0.1399 0.4007
Es tan grande el xito de los tres robots en el soldado correcto que el saber que la
pieza no tiene defectos, prcticamente no altera las probabilidades de produccin
en uno u otro.
Por el contrario, el robot C es tan bueno, comparado con el B que, al saber que la
pieza es defectuosa, las probabilidades cambian dramticamente.
En este ejemplo el clculo de probabilidades condicionales nos cuantifica algo que
el sentido comn nos dice de otra forma. Note que la frmula de Bayes nos sirvi
para pasar de las probabilidades no condicionales a las condicionales.
44

Otro ejemplo del uso del teorema de Bayes


Otro ejemplo clsico del uso del teorema de Bayes es un problema de oro y plata.
Hay tres bolsas que tienen, cada una dos monedas. Las de la primera son de oro,
las de la segunda son de plata y las de la tercera son una de plata y otra de oro. Se
escoge una bolsa al azar y de ella una moneda tambin al azar. Si la moneda es de
oro, cul es la probabilidad de que la otra moneda en la bolsa sea de oro tambin?
Primero notemos que la segunda bolsa no pudo haber sido elegida (porque no tiene
monedas de oro), slo pudo haber sido seleccionada la primera o la tercera. Si la
bolsa elegida hubiese sido la tercera, el evento cuya probabilidad nos interesa no se
realiza. De modo que el evento que nos interesa es equivalente a que se haya
elegido la primera bolsa.
Una vez establecido lo anterior, apliquemos el teorema de Bayes para calcular
P(I|Au) = [P(I)P(Au|I)] / [P(I)P(Au|I) + P(II)P(Au|II) + P(III)P(Au|III)]
Las probabilidades que entran al lado derecho de la igualdad las sacamos,
inmediatamente, de las condiciones del problema y despus de hacer cuentas
tenemos:
P(I|Au) = 2 / 3
Este problema es clsico porque existe una ``solucin'' a la que muchas personas
llegan y es falsa. El argumento es el siguiente. Como todas las bolsas son
igualmente posibles, y el hecho de que la primer moneda extrada sea de oro, nos
indica que no se trata de la segunda bolsa. Concluimos que las dos bolsas restantes
tienen igual probabilidad y, por tanto, la probabilidad de que la otra moneda sea de
oro es 1/2.
Si Ud. piensa de acuerdo a este razonamiento (errneo!), es muy difcil que
encuentre en qu se equivoca.
45

Lo que est mal es que lo que averiguamos, al saber que la moneda extrada es de
oro, es algo ms que el rechazo de la segunda bolsa. Si slo nos dijeran que la
bolsa escogida al azar no fue la segunda, sin informarnos del metal de la moneda
sacada, todava tendramos incertidumbre respecto a la primer moneda; todava
podramos apostar a si sta es de oro o de plata. Al decirnos que la moneda fue de
oro, estamos aprendiendo algo ms, y eso echa por tierra el argumento de ``igual
probabilidad para las dos bolsas restantes''.
Lo interesante del problema es que, si nos hubieran dicho que la moneda sacada
fue de plata, aplicando la frmula de Bayes, llegamos a la conclusin de que la
probabilidad de que la otra moneda sea tambin de plata es 2/3 [Haga Ud. las
cuentas!].
Es decir, si vamos a apostar al metal de la otra moneda, nos conviene apostar por el
metal de la primera.
Este ejemplo nos lleva a reflexionar sobre el uso adecuado de la informacin
contenida en ``lo dado'' en el clculo de la probabilidad condicional.

Problemas Propuestos :

1. Una mujer portadora de hemofilia clsica da a luz tres hijos.


a) Cual es la probabilidad de que de los tres hijos, ninguno est afectado
por la enfermedad?
b) Cual es la probabilidad de que exactamente dos de los tres nios est
afectado?
2. El 60% de los individuos de una poblacin estn vacunados contra una cierta
enfermedad. Durante una epidemia se sabe que el 20% la ha contrado y que 2 de
46

cada 100 individuos estn vacunados y son enfermos. Calcular el porcentaje de


vacunados que enferma y el de vacunados entre los que estn enfermos..
3. La proporcin de alcohlicos que existe en la poblacin de Mlaga es,
aproximadamente, un 10%; no obstante, en las bajas que dan los mdicos de la
Seguridad Social difcilmente se encuentra el diagnstico de alcoholismo.
Aparecen sin embargo diagnosticados de hepatopatas, lumbalgias, etc., que
pueden hacer sospechar alcoholismo subyacente. Se realiz un estudio que puso de
manifiesto que el 85% de los individuos alcohlicos y el 7% de los no alcohlicos
sufran tales patologas. Se desea saber cul es la probabilidad de que un individuo
con esas patologas sea realmente alcohlico.
4. Dos tratamientos A y B curan una determinada enfermedad en el 20% y 30% de
los casos, respectivamente. Suponiendo que ambos actan de modo independiente,
cul de las dos siguientes estrategias utilizara para curar a un individuo con tal
enfermedad:
a) Aplicar ambos tratamientos a la vez.
b) Aplicar primero el tratamiento B y, si no surte efecto, aplicar el A.
5. Se eligen al azar 3 deportistas de un equipo de 10 integrantes para realizar un
control antidopaje; Se sabe que 2 de los jugadores del equipo han tomado
sustancias prohibidas. Cul es la probabilidad de elegir para el anlisis a alguno
de los infractores?
6. Estamos interesados en saber cul de dos anlisis A y B es mejor para el
diagnstico de una determinada enfermedad, de la cual sabemos que la presentan
un 10% de individuos de la poblacin. El porcentaje de resultados falsos positivos
del anlisis A es del 15% y el de B es del 22%. El porcentaje de falsos negativos de
A es del 7% y de B es del 3%. Cul es la probabilidad de acertar en el diagnstico
47

VARIABLE ALEATORIA

Frecuentemente el resultado de un experimento aleatorio se denota con un nmero:


el resultado de lanzar un dado,
el nmero de unidades defectuosas entre 10 unidades seleccionadas,
el tiempo que hay que esperar para que se presente una falla en un
circuito,
el nmero de estaciones de una red de computadoras que requieren la
atencin del servidor de la red en un momento dado,
el nmero de personas en una comunidad que requieren atencin mdica
en un da especificado,
el peso sumado de las personas que estn en un elevador en un momento
determinado del da,
la cantidad en dinero de lo transportado en un camin antes de que sufra
una descompostura, etc.
A un nmero tal, le llamamos variable aleatoria. Ponga atencin al hecho de que
una variable aleatoria no es una variable en el sentido usual. Las variables que
estamos acostumbrados a manejar son, por ejemplo: el peso de un cohete que va
quemando el combustible que lo impulsa, la distancia del piso a un objeto que cae
hacia l, la concentracin de una solucin dentro de un tanque conforme pasa el
tiempo, etc. En los ejemplos anteriores el valor de la variable puede cambiar con el
tiempo, pero es predecible a partir de las leyes de la mecnica, la qumica, la
hidrulica o alguna otra ciencia. Con una variable aleatoria la situacin es
enteramente diferente. El valor de una variable aleatoria no se puede conocer con
exactitud de antemano a la realizacin del experimento. Qu otros ejemplos de
variables aleatorias se le ocurren adems de los mencionados arriba? Al contestar
48

esta pregunta tenga en cuenta que el azar debe jugar algn papel en la medicin de
la variable y que su valor no debe ser predecible.
Una variable aleatoria presenta dos caractersticas importantes:
1. Una coleccin (conjunto) de valores posibles al que llamamos imagen de
la variable aleatoria (antes lo llambamos espacio muestral).
2. Una probabilidad asociada a los posibles resultados la cual queda
expresada mediante una funcin de probabilidad.
Las variables aleatorias que tienen un conjunto de posibles valores discreto, se
llaman discretas. Estas variables son el resultado de contar . Cules de las
variables aleatorias mencionadas arriba son discretas? Ciertamente el peso de las
personas en el elevador no es discreto, pero entre las otras cules son discretas?
Por otra parte, las variables aleatorias cuyos valores posibles se encuentran en
cualquier parte de un intervalo, se llaman continuas. Estas variables son el
resultado de medir.
El hecho de que una variable aleatoria nos interesa cuando an no tiene un valor
especfico, nos obliga a utilizar una notacin extraa al referirnos a ella.
Denotamos con letras maysculas a las variables aleatorias y con minsculas a los
valores que contemplamos para ellas.
Si tomamos como variable aleatoria el resultado (suma) de lanzar dos dados, desde
el punto de vista de la probabilidad, el nmero resultante nos interesa antes de que
realicemos el experimento. Conocido el resultado, ya no es interesante (al menos,
no para la probabilidad). La imagen de esta variable aleatoria es S = { 2, 3, 4, 5, 6,
7, 8, 9, 10, 11, 12 }. Llamando X al resultado del experimento, podemos
contemplar el evento de que X sea igual a x, donde x es cualquier elemento de S.
Claro que nos resultar muy interesante saber cosas como P(X = x) para los
diferentes valores de x en S; por ejemplo, P(X = 6) = 5/36 [esto se lee: ``la
49

probabilidad de que X sea igual a seis es un sexto'']. Puede Ud. mostrar que P(X =
8) = 5/36 ?
Siguiendo con el ejemplo de los dos dados, el lanzar dados para ver que nmero
cae no es muy apasionante que digamos, acompaemos los dados con un tablero de
oca o de serpientes y escaleras o de turista o de back gamn o algn otro juego
interesante. Ya puestos a jugar turista o monopolio, es natural que nos interesen
otro tipo de eventos. Podramos estar interesados en saber
si el resultado es menor que 8: P(X < 8) = 21/36 Puede Ud. ver por qu?;
que el resultado sea desde 4 hasta menos que 9: P(3 < X < 9) = 23/36 Por
qu?;
tambin podemos estar interesados en que X sea distinta de 7: P(X
distinto de 7) = 1 - P(X = 7) = 1 - 1/6 = 5/6.
Naturalmente esta notacin se extiende de manera natural a todo tipo de intervalos
y desigualdades.
Regresando a donde estbamos,
A la funcin: f(x) = P(X = x) se le llama funcin de probabilidad
de X.
Esta funcin es una funcin ordinaria de las que estudiamos en los cursos de
matemticas; no tiene nada de aleatorio. Dicho de otra forma, una vez
determinados los valores de las probabilidades, la funcin de probabilidad es una
funcin comn y corriente, tiene su dominio, su codominio, su grfica, puede ser
inyectiva, etc.
Hay algunos hechos importantes respecto a esta funcin:
1. Para una variable aleatoria discreta los valores posibles son los nicos
para los cuales esta probabilidad es diferente de cero. Dicho de otra
forma, no nos hace dao ampliar el dominio de la funcin de probabilidad
50

a todos los reales, pero va a valer cero casi siempre excepto en un


conjunto discreto de puntos.
2. El valor de la funcin de probabilidad depende esencialmente de la
variable aleatoria a la que nos referimos, cuando no sea claro a cul
variable nos referimos, es conveniente poner el smbolo de la variable
como subndice para la funcin: fX(x).
Esta costumbre puede causar estragos en la comprensin de los novatos,
est Ud. prevenido. Qu querr decir fY(w)?
3. La grfica de una funcin como sta se presenta en el pizarrn.
Regresando al ejemplo de los dados, cambiemos el turista por otro juego. En este
juego Ud. gana si el resultado es par y pierde si es n n; la cantidad que pierde o
gana ser el doble del resultado. Aqu, su ganancia (positiva si Ud. gana, negativa
si pierde) es una variable aleatoria Y, su imagen es S = {-22, -18, -14, -10, -6, 4, 8,
12, 16, 20, 24} >Puede Ud. terminar la tabla de la funcin de probabilidad de Y?:
Y -22 -18 -14 -10 -6 4 8 12 16 20 24
f(y)
Una vez que haya llenado la tabla anterior, calcule la probabilidad de que gane Ud.
ms de 8 pesos; la probabilidad de que pierda ms de 10 pesos; la probabilidad de
que su ganancia est entre -10 y +16 inclusive; la probabilidad de que su ganancia
o prdida exceda a 9 pesos.
Una funcin de probabilidad de una variable aleatoria discreta, para ser correcta,
debe satisfacer dos propiedades
f(x) debe ser siempre mayor o igual a 0
la suma de f(x) para todos los valores de x debe dar 1 .
51

Funcin de Distribucin.
Cuando la imagen de una variable aleatoria es un intervalo real decimos, segn
habamos quedado, que la variable es continua. La matemtica que utilizamos para
las variables continuas es diferente a la de las discretas Por eso empezamos nuestro
estudio con las discretas. An no acabamos con las variables discretas, todava nos
faltan por discutir temas muy importantes. Pero antes, hablaremos de una nocin
que es comn a las discretas y a las continuas.
Una funcin muy til en el clculo de probabilidades de una v. a. es la funcin de
distribucin. Esta funcin se define de igual forma para continuas y discretas:
F (x) = P(X <= x)
Vea bien la definicin anterior y aprndasela de memoria. Coja una hoja de papel
en blanco y escrbala.
Para no confundirnos con la notacin, suele escribirse tambin as:
F (t) = P(X <= t)
La funcin de distribucin tiene las siguientes propiedades:
1. F(en menos infinito) = 0 ; F(en ms infinito) = 1
2. F es una funcin no decreciente.
3. F sirve para calcular probabilidades as
P( a < X <= b ) = F(b) - F(a)
Para que esta ltima propiedad nos sea de utilidad deberamos tener la distribucin
ya calculada. Para muchas variables aleatorias de uso comn, las distribuciones ya
estn calculadas y tabuladas (una hoja de clculo, como Excel ya incluye
prcticamente todas las distribuciones que veremos en este curso).
Para las variables aleatorias discretas hay que tener cuidado con el hecho de que la
primera desigualdad es estricta y la segunda no.
52

Por ejemplo si la imagen de X son todos los enteros, P(2 < X <= 5) se puede
calcular haciendo la resta F(5)-F(2). Pero la probabilidad P(2 < X < 5) se obtiene
restando F(5)- F(1) (Por qu?). Cmo calcula Ud. P(2 <= X < 5)?
Las 4 propiedades que se sealaron arriba definen a una funcin de distribucin, de
modo que para saber si una funcin es una distribucin o no, basta ver que las
cumpla.
Considere el siguiente ejemplo.
F (x) = 1 - exp. (- 0.7 x ) para x > 0
Se trata de una variable aleatoria continua, cuya imagen son los nmeros
positivos(Por qu?). Lo que Ud. tiene que hacer es:
Mostrar que es una distribucin y
usarla para calcular P( X >= 1.0), P( 0.7 < X < 1.0), P(X < 0.7), P( X >
1.0 X <= 0.4 ).
En el pizarrn hacemos ejemplos de cmo es la forma matemtica de una funcin
de distribucin y de su grfica.

variables Aleatorias Continuas


Las variables aleatorias que hemos estudiado hasta ahora tienen la propiedad de
que son el resultado de contar; sus valores posibles varan en forma discreta (a
saltos). Hay otro tipo de variables aleatorias, las que son el resultado de un proceso
de medir; sus valores posibles cubren todo un intervalo en los reales.
Cuando la imagen de una variable aleatoria es un intervalo real decimos que la
variable es continua. La matemtica que utilizamos para las variables continuas es
diferente a la de las discretas aunque los conceptos probabilsticos sean los mismos
de manera que en nuestro estudio de las continuas utilizaremos este paralelo con
las discretas.
53

Densidad de una variable aleatoria continua


El primer hecho de importancia es que una v. a. (variable aleatoria) continua tiene
probabilidad cero de tomar un valor especfico, slo tiene valores positivos para
intervalos:
P( X = a ) = 0 para cualquier valor de a

Para calcular la probabilidad de que X est en un intervalo (a,b) o (a,b] o [a,b) o


[a,b] debemos hacer uso de una funcin asociada a la variable aleatoria, la funcin
de densidad de X. Las variables aleatorias discretas tienen la funcin de
probabilidad, las continuas tienen funcin de densidad.
Esta funcin de densidad tiene las siguientes caractersticas:
f(x) >= 0
la integral de f(x) vale 1
La integral a la que nos referimos es la integral definida sobre toda la imagen de la
variable aleatoria.
Note que estas caractersticas son el anlogo continuo de las de la funcin de
probabilidad de una v. a. discreta. Es decir la probabilidad
nunca es negativa y
la suma de todas las probabilidades es uno.
Por este motivo, es frecuente utilizar el nombre de densidad tanto para esta funcin
como para la funcin de probabilidad de una v. a. discreta.
Adems, como en el caso discreto, la funcin de densidad est ligada a la v. a. X de
modo que cuando sea necesario aclarar a cul densidad nos referimos podemos
usar la notacin fX(x), ponindole el subndice X a la f.
54

Clculo de Probabilidades con la densidad.


Para obtener la probabilidad de un intervalo, hacemos la integral de la densidad
sobre el intervalo del que queremos calcular la probabilidad. De nuevo, la integral
a la que nos referimos es una integral definida cuyos extremos son los del
intervalo.
Escriba la integral que da la probabilidad de que X est entre 3 y 44.2
Escriba en forma de integrales las siguientes:
P(a < X < a + h),
P( 2.2 < X <= 5 ),
P( X > 8 ),
P( X <= 15 ),
P( X < 2 X > 3)
Considere un par de ejemplos que le servirn para apreciar las implicaciones de lo
anterior.
Como primer ejemplo tome el siguiente. Sea X una v. a. continua cuya densidad
es:
f(x) = a x para x en [ 3, 7]

a es una constante necesaria para que la integral de f(x) definida de 3 a 7, sea igual
a uno. Muestre que a = 1/20 = 0.05, adems muestre que P( 3 < X <= 5 ) = 0.40
Otro ejemplo ms es el siguiente. La densidad es:

f(x)=
o 0.025x para x en (3,7)
o k x2 si x est en [7,10)
55

o 0 en cualquier otra parte


muestre que k = 1/438 y muestre tambin que P(6 <= X <= 8) = 0.3155

Distribucin de una variable aleatoria continua


Una funcin muy til en el clculo de probabilidades de una v. a. continua es la
funcin de distribucin. Esta funcin se define de igual forma para continuas y
discretas:
F (x) = P(X <= x)
Para no confundir la notacin, suele escribirse tambin as:
F (t) = P(X <= t)
En el caso de una v.a. continua la derivada de la distribucin es la densidad:
f(x) = F '(x)
En los dos ejemplos anteriores calcule las funciones de distribucin
correspondientes.
La funcin de distribucin tiene las siguientes propiedades:
1. F(menos infinito) = 0; F(mas infinito) = 1
2. F es una funcin no decreciente.
3. F sirve para calcular probabilidades as
P( a < X <= b ) = F(b) - F(a)
En esta ltima propiedad, si se trata de una v.a. continua no importa si las
desigualdades son estrictas o no. En el caso de la v.a. discreta es muy importante
que la primera desigualdad sea estricta y la segunda n.
Estas propiedades se deducen de la definicin de la distribucin. Estas propiedades
caracterizan a la distribucin de modo que para saber si una funcin es una
distribucin o n, basta ver que las cumpla.
Considere el siguiente ejemplo.
56

F (x) = 1- exp (- 0.7 x ); para x > 0


muestre que es una distribucin y sela para calcular P( X >= 1.0), P( 0.7 < X <
1.0), P(X < 0.7), P( X > 1.0 X >= 0.4 ).
En el pizarrn hacemos ejemplos de cmo es la forma matemtica de una funcin
de distribucin y de su grfica.

Valores Esperados.
Hay un par de cantidades importantes asociadas con cada variable aleatoria:
el valor esperado, esperanza matemtica o simplemente esperanza o
media.
la varianza y su raz cuadrada, la desviacin estndar.
Ambas cantidades se definen en base a un operador que llamamos el operador
esperanza. Matemticamente la esperanza se define as, para una v.a. discreta
E( g(X) ) = suma { g(i) f(i) }

donde g(i) es cualquier funcin y f(i) es la funcin de probabilidad de la v.a.; f(i) =


P(X = i). Por ejemplo,
Si la funcin g es g(t)=52t,
E(52X) = suma{52i f(i)} = 52 suma{i f(i)} = 52 E(X)

Si la funcin g es g(t)= (t-4)2, su esperanza es


E( [X - 4]2 ) = suma{[i-4]2f(i)} =
2
suma{i f(i)} - suma{8if(i)} + suma{16f(i)} =
2
E(X ) - 8E(X) + 16
57

Y si g es g(t)= t/ 28
E( X/ 28) = suma{i/ 28 f(i)} = 1/28 suma{i f(i)} =
= (1/ 28) E(X) = E(X)/ 28

Utilizando el operador esperanza, definimos para cualquier v.a. discreta X :


1. El valor esperado de X es E(X).
2. La varianza de X es var(X) = E( [X - E(X)]2).

Ejemplo.
Ejemplos: si X es una v.a. continua cuya funcin de probabilidad es
X 1 2 3 4 5 6
f(x) 1/21 2/21 3/21 4/21 5/21 6/21
E(X) = 13 / 3 (detalles en el pizarrn) y var(X) = 20 / 9 as la desv.est.(X) =
1.4907.
Propiedades Aritmticas.
Las definiciones matemticas de valor esperado y varianza, nos dicen cmo
calcular estas cantidades. Como operaciones matemticas, tienen algunas
propiedades que vale la pena resaltar, porque a veces simplifican algunas cuentas
E(c) = c la esperanza de una constante es la misma constante
E(c g(X)) = c E(g(X)) una constante multiplicando se puede sacar de la
esperanza.
E(g(X) + h(X)) = E(g(X)) + E(h(X)) la esperanza de una suma es la
suma de las esperanzas.
Las anteriores propiedades son muy parecidas a las de la integral.
Ahora tenemos algunas propiedades de la varianza.
58

var(X) = E(X2) - [E(X)]2 esta propiedad es muy til para calcular, y


podemos tomarla como definicin de la varianza.
var(aX) = a2var(X) una constante multiplicando se saca de la varianza
elevndola al cuadrado.
var( c ) = 0 la varianza de una constante es cero.
La varianza de una suma en general no es igual a la suma de las varianzas.
Segn veremos despus, la igualdad se cumple slo cuando las variables
son independientes.
Como un ejemplo de estas propiedades, veamos la razn de la frmula var(X) =
E(X2) - [E(X)]2. De acuerdo a la definicin
var(X) = E([X-E(X)]2)
= E[X2 - 2XE(X) + E(X)2] =
2 2
= E( X) - E(2XE(X)) + E(E(X) ) =
2 2
= E( X) - 2E(X) E(X) + E(X) =
2 2
= E( X ) - E(X)
haciendo las operaciones y, juntando los dos extremos, se tiene:
var(X) = E(X2) - [E(X)]2
59

DESIGUALDAD DE TCHEBYSHEV

Si conocemos la distribucin de probabilidad de una variable aleatoria X ( la


funcin de densidad en el caso continuo, la funcin de probabilidad en el caso

discreto ) hemos visto que podemos determinar y 2 (media y varianza) , si


existen. Pero lo reciproco no es cierto es decir, conociendo la media () y la

varianza ( 2)no podemos determinar la distribucin de probabilidad de X. Sin


embargo se puede dar una cota superior (o inferior) para probabilidad del tipo:
P[IX-uI k ], este resultado se conoce con el nombre de la desigualdad de
tchebyshev.

Teorema (De Tchebyshev)


Si la variable aleatoria X tiene media () y varianza(2) finita, entonces para
cualquier K > 1 , se cumple:
1
P[IX-I k ]
k2
La cual indica que la probabilidad que X tome algn valor fuera del intervalo :
1
< k , + k > es a lo ms
k2
Consecuencias:
2
a) Si = k se tiene : P[IX-uI ]
2

b) Puesto que { IX- I k } y { IX- I < k } son eventos


complementarios, entonces se cumple que:
60

1
P[ IX- I k ] 1 -
k2
Indica que la probabilidad de que X tome valores dentro del intervalo < k ,
1
+ k >es por lo menos 1 -
k2

Ejemplo de Aplicacin:
Sea X una variable aleatoria con media 33 y varianza 16 . Hallar una cota inferior
para :
P [ 23 < X < 43 ]
Solucin:
P [ 23 < X < 43 ] = P [ 23 - 33 < X - 33 < 43 - 33 ]
= P [ - 10 < X 33 < 10 ] = P [ IX- I < 10 ]
Observe que: 10 = k y = 4 , entonces k = 5/2 .
1
Luego: P [ 23 < X < 43 ] = P [ IX- I < (5/2) (4) ] 1 -
(5 / 2) 2

21
Por lo tanto: P [ 23 < X < 43 ]
25

Problemas propuestos:
1. Sea X una variable aleatoria con media =2 y varianza 2 = 1. use la
desigualdad de tchebyshev para hallar una cota inferior para :
a) P [ IX- 2 I < 4 ] b) P [ - 3 < X < 7 ]
61

2. Sea X una variable aleatoria con media = 10 y varianza 2 = 4


Hallar : a) P [ IX- 10 I 3 ]

b) P [ IX- 10 I < 3 ]

c) P [ 5 < X < 15 ]
3. Con los datos del problema anterior determine el valor de c tal que:
P [ IX- 10 I c ] 0.04

DISTRIBUCIONES DISCRETAS

Modelos Especiales.
Hay algunas variables aleatorias discretas que se usan muy frecuentemente en una
gran cantidad de aplicaciones. Estos modelos reciben nombres especiales, que se
utilizan en todo el mundo. Los modelos principales que estudiamos son: el
binomial, el hipergeomtrico y el de Poisson. Estudiaremos cada una por turno
DISTRIBUCIN BINOMIAL
Se tiene un nmero fijo de pruebas n. Con las siguientes caractersticas:
Cada prueba tiene slo dos posibles resultados: genricamente los
llamamos xito y fracaso. Los denotamos con 1 (xito) y 0 (fracaso).
El resultado de cada prueba es independiente del resultado de las dems
pruebas.
La probabilidad de xito no cambia de una prueba a otra.
Nos interesa slo el nmero total de xitos X y no el orden en que hayan
ocurrido.
62

Cuando se cumplen las condiciones anteriores X tiene la distribucin binomial con


parmetros n y p, donde n es el nmero de intentos y p la probabilidad de obtener
un xito. Los valores posibles son desde cero hasta ene: { 0, 1, 2, ... , n }. La
funcin de probabilidad es:
f(k) = P(X=k) = nCk pkq(n-k), para k en {0,1,2,...,n}
donde me he visto obligado por la tipografa, a usar el smbolo poco usual nCk
para denotar las combinaciones de k objetos tomados de un total de n:
nCk = [n!] / [k!(n-k)!]
adems, la letra q representa la probabilidad de fracaso q = 1-p.
La media de la binomial es: E(X) = np y la varianza: var(X) = npq.
Dnde se aplica el modelo binomial?:
1. En una familia de tres hijos, cul es la probabilidad de que a lo ms 2
sean nias? La probabilidad de nia es 0.5; el sexo de cada hijo es
independiente del de los dems; n=3 y p=0.5.
P(X <= 2) = P(X=0) + P(X=1) + P(X=2)
= 0.125 + 3(0.125) + 3(0.125)
= 0.875
o bien. P(X <= 2) = 1 - P(X=3) = 1 - 0.125 = 0.875
2. Se extraen 4 canicas CON REEMPLAZO de una urna que tiene 5 blancas
y 3 negras. Cul es la probabilidad de que salgan menos de 2 blancas?
Como la eleccin se hace con reemplazo, se cumplen los requisitos de un
experimento binomial. X es el nmero de canicas blancas, n = 4 y p = 5/8
= 0.625. La probabilidad que necesitamos es P(X < 2) y sta es igual a:
P(X < 2) = P(X=0) + P(X=1)
4
= 0.375 + (4)(0.625)(0.375)3
= 0.1516
63

3. De un lote con 1,000 artculos de los cuales el 10% son defectuosos, se


escogen al azar 10. Cul es la probabilidad de que haya ms de 2
defectuosos? Aunque el muestreo se hace sin reemplazo, por la gran
cantidad de artculos que hay en el lote comparados con los que se
escogen, suponemos que son vlidos los supuestos del modelo binomial.
X es el nmero de artculos defectuosos y la probabilidad que se nos pide
es: P(X > 2).
Como el clculo de las 8 probabilidades necesarias es muy latoso,
notemos que P(X > 2) = 1 - P(X <= 2). An as, hagamos esta cuenta
consultando la tabla de la binomial adecuada: n = 10, p = 0.10. La tabla
dice que P(X <= 2) = 0.9298. Por tanto, la probabilidad buscada es P(X >
2) = 0.0702 [Vea su tabla y descubra este valor]. Claro que tambin
tenemos la posibilidad de calcular P(X <= 2) y restarla de uno.
P(X <= 2) = P(X=0) + P(X=1) + P(X=2)
10 9
= (.9) + (10)(.1)(.9) + (45)(.1)2(.9)8
= 0.9298
Distribucin de Bernoulli.
Este modelo se llama as en honor del probabilista de este apellido. A la binomial
cuando n = 1 se le llama Bernoulli.

Es aquel modelo que sigue un experimento que se realiza una sola vez y que puede
tener dos soluciones: acierto o fracaso:

Cuando es acierto la variable toma el valor 1

Cuando es fracaso la variable toma el valor 0

Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire


(sale cara o no sale); probabilidad de ser admitido en una
64

universidad (o te admiten o no te admiten); probabilidad de


acertar una quiniela (o aciertas o no aciertas)

Al haber nicamente dos soluciones se trata de sucesos complementarios:

A la probabilidad de xito se le denomina "p"

A la probabilidad de fracaso se le denomina "q"

Verificndose que:

p+q=1

Veamos los ejemplos anteriores :

Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al


aire:

Probabilidad de que salga cara: p = 0,5

Probabilidad de que no salga cara: q = 0,5

p + q = 0,5 + 0,5 = 1

Ejemplo 2: Probabilidad de ser admitido en la universidad:

Probabilidad de ser admitido: p = 0,25

Probabilidad de no ser admitido: q = 0,75

p + q = 0,25 + 0,75 = 1

Ejemplo 3: Probabilidad de acertar una quiniela:

Probabilidad de acertar: p = 0,00001

Probabilidad de no acertar: q = 0,99999

p + q = 0,00001 + 0,99999 = 1
65

Distribucin Hipergeomtrica
Se tiene un grupo de N objetos de los cuales k son xitos y el resto,(N-k), son
fracasos. Se seleccionan n de los N, SIN REEMPLAZO. La v.a. X que nos interesa
es el nmero total de xitos entre los n seleccionados y no el orden en que salieron.
En estas condiciones la v.a. X tiene la distribucin hipergeomtrica. Su imagen es
{0,1,...,n}. La funcin de probabilidad est dada por:
P(X=x) = [ kC x (N-k)C(n-x) ] / [ NCn ]; para x en { 0,1,...,n }
La media es: E(X) = nk/N y la varianza: var(X) = [N-n]/[N-1] n (1-k/N) k/N
Dnde se aplica?
1. En situaciones de muestreo sin reemplazo en que la muestra es un
porcentaje considerable de la poblacin. Como ejemplo, de un lote de 40
artculos se seleccionan al azar 4 para probarlos y si fallan la prueba ms
de 2 se rechaza el lote completo. Cul es la probabilidad de rechazar un
lote que tenga 8 defectuosos? Dado que el muestreo se hace sin reemplazo
y la fraccin de muestreo es grande (10%) tenemos una v.a.
hipergeomtrica. Los parmetros son: N=40, k=8, n=4, X es el nmero de
defectuosos en la muestra y queremos la probabilidad
P(X > 2) = P(X=3) + P(X=4) = 1792/91390 + 70/91390 = 0.0204
sta es la probabilidad de rechazar un lote con 25% de defectuosos y es
muy baja. Para mejorar el proceso de seleccin, los ingenieros deciden
rechazar el lote cuando haya 2 o ms defectuosos. Cul es la
probabilidad de rechazar un lote que tenga 8 defectuosos? Los parmetros
permanecen iguales lo que cambia es la probabilidad, ahora es
P(X >= 2) = P(X=2) + P(X>2) = 0.1520 + 0.0204 = 0.1724
66

Con esta nueva poltica de rechazar el lote cuando sean 2 o ms, cul es
la probabilidad de rechazar un lote con 6 defectuosos? Los parmetros
son, ahora, N=40, k=6, n=4 y queremos la probabilidad:
P(X > 10) = 1 - [P(X=0) + P(X=1)]
= 1 - [46376/ 91390 + 35904/ 91390]
= 0.0997
2. En el saln de tercer ao de una escuela hay 35 alumnos, de los cuales 10
son nias y 25 nios. Se nombra un comit de 7 alumnos que represente al
saln. La seleccin se hace al azar. Qu probabilidad hay de que en el
comit haya mayora de nias? En esta situacin se cumplen las hiptesis
de una hipergeomtrica. Los parmetros son: N=35, k=10, n=7, X es el
nmero de nias en el comit. La probabilidad pedida es:
P(X > 3) = P(X=4) + P(X=5) + P(X=6) + P(X=7)
= 0.0839

Problemas Propuestos:
1. La probabilidad que en cierto establecimiento industrial el consumo
de energa elctrica sea normal en 24 horas es igual a . Determinar
la distribucin de probabilidad del nmero de das de consumo
normal de energa elctrica en un lapso de 6 das; represente en un
diagrama esta distribucin . determine adems cul es la probabilidad
que haya 4 das de consumo normal?
2. Se lanza un dado 4 veces cul es la probabilidad que la suma 9
aparezca exactamente 2 veces.
67

3. Una mquina produce cierto tipo de piezas , de las cuales un


promedio de 5% son defectuosas . En una muestra aleatoria de cinco
piezas . cul es la probabilidad de obtener :
a) Exactamente una pieza defectuosa.
b) Por lo menos una pieza defectuosa.
4. La probabilidad de fallar durante el vuelo para cada uno de los 6
motores de un avin es 0.0005 . Suponiendo que los 6 motores
trabajan independientes, determine la probabilidad que en un vuelo
determinado :
a) no ocurra ninguna falla de motor.
b) No ocurra ms de una falla.
c) Ocurra exactamente 2 fallas.
5. Suponga que los motores de un avin de cierta marca que operan
independientemente , tienen una probabilidad de falla de 0.1 .
suponga que un avin efecta un vuelo exitoso , si al menos la mitad
de sus motores operan normalmente , determine cul avin , una con
4 motores y otro con 6 motores , tiene mayor probabilidad de efectuar
un vuelo exitoso.
6. Suponga que la mquina A produce el doble de artculos que la
mquina B . Se sabe que el 6% de los artculos que produce la
mquina A son defectuosos mientras que el 3% de los artculos que
produce la mquina B son defectuosos . Suponga que se junta la
produccin diaria de estas mquinas y se toma una muestra aleatoria
de 10 artculos. Cul es la probabilidad de obtener 3 artculos
defectuosos.
68

7. Un examen consta de 20 preguntas , cada una tiene 5 respuestas, de


las cuales slo una es correcta . Un estudiante que desconoce el curso
responde el examen al azar.
a) Cul es la probabilidad que acierte mas de 10 respuestas
correctas?
b) Cul es la probabilidad que acierte mas de 15 respuestas
correctas?
8. Se sabe que la probabilidad de que germine una sola semilla de cierta
clase es 0.9 . un agricultor quiere vender cultivos de esta planta, para
lo cul asevera que cada uno contiene 100 plantas . Si siembra 110
semillas en cada cultivo ( que se suponen germinarn en forma
independientes ) cuntas plantas se puede esperar que contenga un
cultivo promedio?

DISTRIBUCIN DE POISSON
Este modelo se llama as para honrar la memoria de otro gran probabilista y
matemtico. La v.a. de Poisson se refiere a sucesos en un intervalo de tiempo o en
una rea especfica. El intervalo de tiempo puede ser de cualquier duracin, un
minuto, una hora, un da, un ao. Algunos ejemplos de situaciones modeladas con
el modelo de Poisson son: el nmero de fallas de una mquina en una semana, el
nmero juegos de algn deporte pospuestos por lluvia en una temporada.
Cuando se trata de superficies, los ejemplos son: el nmero de ratas en un terreno,
el nmero de errores de mecanografa por pgina, el nmero de defectos por
centmetro cuadrado.
Para que una v.a. sea de Poisson, se requiere que se satisfagan 3 hiptesis (que
suelen llamarse tambin postulados del proceso de Poisson).
69

En los problemas que resolvemos en este curso, el hecho de que el modelo a


utilizar sea el de Poisson, forma parte del enunciado del problema.
La v.a. de Poisson tiene un solo parmetro que es mu = lambda.t ;donde t es la
longitud del intervalo o la superficie de la regin y lambda es la tasa de ocurrencia
de eventos por unidad de medida.
La imagen de la v.a. de Poisson es {0, 1, 2, . . . } es decir todos los enteros no
negativos. La funcin de probabilidad esta dada por:
P(X = k) = exp(-mu)[mu(k) / k!]; k = 0, 1, 2, . . .
La media es E(X) = mu y la varianza es var(X) = mu.
Dnde de aplica la v.a. de Poisson?
1. Si el promedio de llamadas por da hbil (de ocho horas) que se reciben en
un banco es 96. Cul es la probabilidad de que en una hora se reciban
exactamente 14?
Aqu, mu = 12 y
P(X = 14) = e(-12)[12(14) / 14!] = 0.0905
En la misma situacin Cul es la probabilidad de tener ms de 16
llamadas en una hora? Ahora queremos:
P(X > 16) = 1 - P(X <= 16)
esta ltima probabilidad la leemos en la tabla de Poisson y tenemos:
P(X > 16) = 1 - 0.8987 = 0.1013
2. Una aplicacin muy importante de la probabilidad de Poisson se da para
aproximar la binomial. Esta aproximacin funciona bajo las siguientes
circunstancias.
o La v.a. X cuyas probabilidades se quieren es binomial.
o La n es muy grande (n >= 20) y
o La p es muy pequea (p <= 0.05).
70

o De modo que, aproximadamente np < 5


En estas condiciones:
P(X = k) aproximadamente es exp(-mu)[mu(k) / k!]
donde mu = np
Ejemplo. En una cierta comunidad la probabilidad de que una persona
infectada por neumona muera es 0.002. Cul es la probabilidad de que
mueran a lo ms 5 de las siguientes 2000 personas infectadas? Aqu se
dan las condiciones para la aproximacin: n= 2000 y p = 0.002 de modo
que mu = 4 y la probabilidad pedida se obtiene de la tabla como
P(X >= 5) aproximadamente es 0.7851
3. Un mecangrafo comete, en promedio, 2 errores por pgina. Cul es la
probabilidad de que tenga ms de 20 errores en un documento de 7
pginas? Aqu mu = 14 que es el nmero esperado de errores en el
documento. La probabilidad buscada, usando la tabla es
P(X > 20) = 1 - P(X <= 20) = 0.0479

Geomtrica y Binomial Negativa.


El modelo geomtrico surge con la misma situacin bsica de la binomial: Se tiene
una serie de pruebas. Con las siguientes caractersticas:
Cada prueba tiene slo dos posibles resultados: genricamente los
llamamos xito y fracaso. Los denotamos con 1 (xito) y 0 (fracaso).
El resultado de cada prueba es independiente del resultado de las dems
pruebas.
La probabilidad de xito no cambia de una prueba a otra.
71

Fjese que ahora no tenemos fijo el nmero de pruebas, sino que vamos a realizar
las pruebas hasta obtener el primer xito. La variable aleatoria que vamos a
observar es el nmero total de pruebas realizadas.
Por ejemplo, si tiramos volados hasta que salga la primera guila, el nmero total
de volados necesarios ser la variable aleatoria.
Esta v. a. tiene como posibles valores {1, 2, 3, . . . }.
La funcin de probabilidad es:
P(X = k) = q(k-1)p; para k en {1,2,3, . . . }
La media y la varianza son: E(X) = 1 / p y var(X) = (1-p) / p2.
Dnde se aplica el modelo geomtrico?
1. En un canal de comunicacin, un modem puede equivocar un carcter
enviado con una probabilidad p=0.001. Qu probabilidad hay de que
transmita 300 caracteres sin error?
Se aplica el modelo geomtrico. La probabilidad que buscamos es P(X >
300). Para calcular esta probabilidad hay que encontrar el valor de la serie
suma desde 301 a infinito {q(k-1)p} . Esta serie da q300 = (0.99)300 = 0.049.
En el mismo problema Cul es el promedio de caracteres sin error?
La repuesta es E(X) = 1 / 0.001 = 1,000
2. En un proceso de manufactura se sabe que, en promedio, una de cada cien
piezas es defectuosa. Cul es la probabilidad de que la quinta pieza
seleccionada al azar sea la primera defectuosa?
Aqu aplicamos el modelo geomtrico con p=0.01. La probabilidad que
requerimos es P(X = 5). De acuerdo a la frmula sta es:
(0.99)4(0.01)=0.0096
72

La Binomial Negativa es el modelo que aplicamos cuando, en la misma situacin


que la geomtrica, nos interesa el nmero de intentos necesarios para obtener el k-
simo xito.
La imagen de esta variable aleatoria es: {k, k+1, k+2, . . . }
La funcin de probabilidades es:
(k) (m-k)
P(X = m) = (m-1)C(k-1)p q <B
para m en { k, k+1, k+2, . . . }
Dnde se aplica?
1. Una persona se entretiene lanzando al aire dos monedas, las recoge y las
vuelve a lanzar, siempre lanzando las dos. Cul es la probabilidad de que
las dos monedas caigan guilas ambas por tercera ocasin, en el sexto
lanzamiento.
Este es un problema binomial negativo (tambin parece un problema de
ociosos!) donde xito es que las dos monedas caigan ambas guilas. La
probabilidad de que suceda esto, en un solo intento es p = 0.25. Si X es el
nmero de intento en que ambas sean guilas por tercera vez, X es
binomial negativa con k=3. La probabilidad que se nos pide es P(X = 6)
usando la frmula, tenemos:
3 3
5C2(0.25) (0.75) = 0.0659
73

DISTRIBUCIONES CONTINUAS

Modelos Uniforme y Exponencial.


En las notas anteriores definimos el modelo exponencial (con media beta) y el
modelo uniforme en el intervalo (0, 1).
Slo queda mencionar respecto a ellos sus usos ms frecuentes.
El modelo exponencial se usa para modelar tiempos de espera.
Por ejemplo, el tiempo que un foco dura prendido hasta el momento en que se
funde es una variable aleatoria ya que el foco se puede fundir en cualquier
momento. La experiencia de las personas que se dedican al mantenimiento indica
que este fenmeno se puede modelar bien con la densidad exponencial.
Otro ejemplo es el tiempo entre llegadas de llamadas telefnicas a un conmutador.
En este caso, la experiencia tambin indica que se puede modelar razonablemente
bien este flujo de llamadas con la exponencial; en un rato del da que el
conmutador est muy ocupado (por ejemplo en las horas hbiles de una oficina), el
promedio entre llegadas ser pequeo (beta pequeo) mientras que cuando las
llamadas estn mas espaciadas beta ser grande.
El modelo uniforme se utiliza para modelar loteras. Si busco un nmero real entre
3 y 18 y quiero que la probabilidad se reparta por igual entre todos los nmeros,
utilizo una variable aleatoria uniforme U que sea uniforme en el intervalo (0, 1) y
la multiplico por 15 y al resultado le sumo 3; en frmula: X = U * 15 + 3. Note que
como el valor ms pequeo para U es el 0, el valor ms pequeo para X ser 3. En
el otro extremo, para U = 1, X ser 18.
[Cmo hace un nmero uniforme entre -15 y 45?].
Con la uniforme en el (0, 1) tambin es posible tener nmeros uniformes discretos.
74

Por ejemplo, si quiero un nmero que valga 1 2 3 con igual probabilidad, tomo
un uniforme en el intervalo (0, 1);
Si me toca U menor que 1/ 3, entonces toca el 1
Si U sale entre 1/ 3 y 2/ 3, entonces toca el 2
Si U es mayor que 2/ 3, entonces toca el 3.
Es claro que con este mecanismo los tres valores: 1, 2 y 3 tienen la misma
probabilidad. [Cmo hacemos un nmero que valga 1, 2, 3, . . . , 34 con la misma
probabilidad a partir de un uniforme en el (0, 1)?]
Las tcnicas de simulacin por computadora utilizan mucho los nmeros uniformes
en el intervalo (0, 1) como elementos bsicos para construir modelos de colas en
los bancos, procesos industriales, funcionamiento de redes de computadoras,
procesos de espera, trfico en andenes de ferrocarril, movimiento de mercancas en
aduanas, etc.

LA DISTRIBUCION NORMAL.
La Normal Estndar

El modelo normal estndar es el de una variable aleatoria continua cuya imagen


son todos los nmeros reales.
La densidad de la normal estndar es:

f(z) = (2)-1/2exp(-z2 / 2)
Esta funcin no tiene una integral elemental de modo que se requiere una tabla
especial para conocer los valores de la probabilidad de una variable normal. La
tabla da probabilidades para
F(t) = P(Z < t)
75

La variable aleatoria normal estndar tiene propiedades importantes:


La probabilidad est concentrada cerca de cero. Se puede ver, usando la
tabla, que la probabilidad de un intervalo cercano a cero es mayor que la
de un intervalo del mismo ancho pero alejado de cero. En el saln
hacemos varios ejercicios de clculo de probabilidades que nos convencen
de este hecho.
La probabilidad est simtricamente distribuida alrededor del cero.
Haciendo cuentas con la misma tabla se ve que la F(a) + F(-a) = 1, para
cualquier valor de a. Esto nos lleva a concluir la simetra de la
distribucin.
Para algunos clculos de probabilidad de una normal es conveniente
considerar el eje real partido en cuatro pedazos,
1. antes de -a,
2. entre -a y 0,
3. entre 0 y a,
4. despus de a.
Las probabilidades de (1) y (4) son iguales; las de (2) y (4) son iguales;
las de (1) y (2) sumadas dan 0.5; las de (3) y (4) suman 0.5.
Use la tabla para calcular: P(Z < 1.45), P(Z > -0.92), P(-0.53 < Z < 1.23). En la
tarea tiene Ud. muchos ejercicios ms de clculo de diferentes probabilidades en el
modelo normal.
Esta variable aleatoria, debido a la forma de la densidad, tiene un valor central (el
cero) que ``atrae'' los valores. La unidad de medida de esta variable es el uno.
76

Usos de la normal. La normal no estndar

En los casos en que este modelo se usa, generalmente:


el valor central o promedio vale mu (distinto de cero)
la unidad de medida o desviacin estndar es sigma (distinta de uno).
Para calcular en este caso no estndar, es preciso hacer una transformacin que se
llama estandarizacin. Esta estandarizacin es un codificacin de los valores.
La frmula para estandarizar es:
Z = (X - mu) / sigma
La forma de usar esta codificacin la ejemplificamos en el pizarrn y tiene Ud.
abundantes ejercicios en la tarea.
En esta parte del curso calcularemos probabilidades suponiendo que el promedio y
la desviacin estndar nos son dados. En un problema real, estos valores se tendrn
que obtener mediante observaciones a travs del proceso de estimacin.

Modelos relacionados con la normal

Los distribuciones relacionadas con la normal referidas en el objetivo 5.2 del


temario: t, ji cuadrada y F, sern vistas posteriormente cuando tengamos necesidad
de usarlas. Por el momento es muy importante que haga Ud. abundantes ejercicios
con la normal.
Ejemplo:
Sea X una variable aleatoria N(5, 4) .
a) Cul es la probabilidad de que X tome valores entre 4 y 7?
b) Cul es la probabilidad de que X tome valores mayores que 10.?
Solucin:
77

45 X 75
a) P[ 4 < X < 7 ] = P [ < < ]
2 2
P[ -1/2 < Z < 1 ] = (1) (1 / 2)
= 0.8413 0.3085
= 0.5328
b) P[ X > 10 ] = 1 - P[ X 10 ]
X 10 5
=1-P[ < ]
2
= 1 - P[ Z < 5/2 ] =
= 1 - (2.5)
= 1 0.9938 = 0.0062

Problemas Propuestos.
1. Sea X una variable aleatoria con N( , 25 )
Calcular: P[ X > 3 ]
2. Si X es una variable aleatoria con N( 650, 625 ). Hallar la constante c > 0
tal que:
P[ X 650 < c ] = 0.9544
3. En una distribucin normal se tienen los siguientes datos:
P[ X < 45 ] = 0.31 P[ X > 64 ] = 0.08
Hallar la media y la desviacin estndar de la distribucin.
4. Una pequea ciudad es abastecida de agua cada 2 das ; El consumo en
volumen de agua para esa pequea ciudad tiene una distribucin normal con
media 20000 litros y una desviacin de 1000 litros ( se entiende el consumo
cada 2 das ) . Se trata de hallar la capacidad de su tanque de agua para que
78

sea de solo 0.01 , la probabilidad que en un periodo de dos das el agua no


sea suficiente para toda la demanda.
5. Si la duracin de los periodos de duracin de los postes telefnicos de
madera es tal que el 9.51% tienen un periodo de duracin que exceden los 9
aos, determine la desviacin estndar de los periodos de duracin si se
sabe que la distribucin de dichos periodos es normal.

TEOREMA CENTRAL DEL LMITE

La distribucin de probabilidad de una estadstica

Quiz el resultado mas importante para la estadstica es el Teorema del Lmite


Central. Este resultado nos indica que, para la estadstica promedio de la muestra
el valor esperado es la media de la poblacin.
la varianza es igual a la de la poblacin dividida por el nmero de
elementos de la muestra.
la distribucin de probabilidad es la normal.
Este teorema es muy importante porque permite calcular probabilidades acerca de
dnde se encuentra el valor del promedio muestral. Es slo cuestin de usar la
tabla normal teniendo cuidado al estandarizar de usar la desviacin estndar
adecuada que es la de la poblacin dividida por la raz cuadrada del nmero de
elementos de la muestra.
En el saln hacemos en forma detallada, ejemplos de estos clculos
79

En este applet, vemos nuevamente tiradas de dados. Sea X el numero que muestra
un dado al ser tirado. El valor medio de los valores posibles de X es 3.5, y la
varianza es 35/12 . Si Sn es el la suma de n dados tirados, entonces si n es
``grande'', la variable aleatoria

Puede ser aproximada por una normal, luego Sn puede considerarse una normal de
media 3.5*n y varianza 35n/12. La curva roja es el grafico de la funcin de
densidad de una normal con esos parmetros.

Problemas propuestos:

1. Un examen de tipo test contiene 100 preguntas, cada una con dos posibles
respuestas (verdadera-falsa), de las que slo una es cierta. Hacer uso de la
aproximacin normal para:

a. Calcular la probabilidad de que un alumno consiga acertar 40


preguntas sorteando al azar las 100 respuestas.
80

b. Calcular la probabilidad de que un alumno consiga acertar 70


preguntas cuando sabe la respuesta de 25 preguntas y sortea las
respuestas de las otras 75.

c. Determinar el nmero de preguntas que un alumno debe acertar


para que el profesor asegure que con una probabilidad de 0.9 el
alumno no ha sorteado todas las respuestas.

2. En cierta poblacin de animales, el 30% de los individuos tienen menos


de un ao de edad. Utiliza el Teorema Central del Lmite para calcular la
probabilidad de que en una muestra de 40 animales haya 10 de menos de
un ao

3. La variable aleatoria Yn es igual a la suma de los puntos que salen al


realizar n lanzamientos independientes de un dado equilibrado. Utilizando
el teorema central del lmite, escoger n de modo que

4. Se selecciona una muestra de 10000 votantes. Definimos la variable


aleatoria:

Sea
81

Cul es la probabilidad de que se diferencie de la proporcin p de


votantes afirmativos que hay en la poblacin en menos de 0.01?

5. Un jugador va a jugar a cara o cruz 400 partidas, en cada una de las


cuales, y con idntica probabilidad, puede ganar o perder una peseta.
Cul es la mnima cantidad que debe llevar para que, supuesto que los
pagos o cobros se hacen al final de la serie, tenga una probabilidad de
0.95 de hacer frente a sus posibles prdidas?

6. Se toman 30 nmeros reales elegidos al azar entre 10 y 20; cada uno de


ellos sirve para formar un paraleleppedo de dimensin 30.

Calcular el valor de a para que P(Volumen < a)=0.95

7. Supongamos que extraemos una muestra aleatoria simple de una


poblacin que se distribuye segn una U[0,2]. Encontrar
aproximadamente la probabilidad de que la media muestral es encuentre
entre 0.8 y 1.1, si el tamao de la muestra es 48.

8. Sea variables aleatorias independientes e idnticamente


distribuidas con media 75 y varianza 225.

a. Utilizar la desigualdad de Tchebichev para calcular la


probabilidad de que la media muestral no difiera de la media
poblacional en ms de 6 unidades.

b. Utilizar el Teorema Central de Lmite para calcular la misma


probabilidad.
82

9. Un individuo posee tres monedas idnticas externamente, pero en las que


las probabilidades de obtener cara son diferentes e iguales a 0.8, 0.6 y 0.4.
Las tres monedas son lanzadas simultneamente 100 veces.Cul es la
probabilidad de obtener ms de 175 caras en los 100 lanzamientos?

10. En un cierto juego la probabilidad de ganar es 18/37. Supongamos que en


cada juego se puede ganar 1 pts. o perder 1 pts.Cuntas veces hay que
jugar para ganar al menos 1000 pts. con probabilidad 0.5?

Las ganancias diarias de un jugador (en dlares) se distribuyen


uniformemente en el intervalo (-40,50). Cul es la probabilidad de que el
jugador gane ms de 500 dlares en 60 das?
83

PRUEBAS DE HIPTESIS

Introduccin y Suposiciones
Una hiptesis es una aseveracin sobre algn atributo poblacional. Segn Mndez
(1973), una hiptesis es "Una suposicin terica que se acepta provisionalmente
para explicar ciertos hechos". Aseveraciones sobre parmetros poblacionales
conducen a pruebas paramtricas. Estas pruebas se basan en el anlisis de muestras
con el fin de evaluar algn valor hipottico. Las tcnicas paramtricas se basan
generalmente en una o varias suposiciones sobre los elementos de la poblacin. Por
otra parte, existen hiptesis que se plantean con respecto a un intervalo de valores,
es decir, en este caso el inters no es determinar un valor en particular sino
construir un intervalo de confianza, es decir, con base a una muestra determinar el
valor de P (a< Q < b), la probabilidad de que el parmetro Q se encuentre entre
(a,b) y el grado de confiabilidad en esta aseveracin.
Las suposiciones mas importantes en la mayora de las pruebas de hiptesis son:

1. Normalidad. Los observaciones deben tener una distribucin normal.


Estas observaciones se distribuyen alrededor de una media Mu y una
varianza sigma2. Yij ~ N(Mu, sigma2). Es decir, la distribucin de los
errores es normal. En ciertos casos, la distribucin puede ser otra, por
ejemplo, chi-cuadrada, t-student, exponencial, etc., sin embargo, la
mayora de las pruebas son robustas a la normalidad, es decir,
relativamente insensible al tipo de distribucin, debido al teorema del
limite central (la distribucin de medias es aproximadamente normal para
cualquier distribucin siempre y cuando el tamao de muestra sea
84

grande). Por otra parte, los datos pueden transformarse para cumplir con
esta suposicin.

2. Independencia. Los datos deben ser independientes. En otras palabras,


las observaciones deben ser extradas al azar y no estar correlacionadas.
Cuando los datos estn correlacionados, la validez de la prueba
disminuye. La independencia se logra mediante muestreo aleatorio o
asignacin aleatoria de tratamientos a unidades experimentales. Esta es
una suposicin fundamental en la realizacin de pruebas de hiptesis. La
falta de independencia, debido a la pobre planeacin de un experimento,
generalmente conduce a la invalidez de los resultados. A diferencia de las
otras suposiciones en las cuales es posible realizar transformaciones o
cambiar de anlisis para cumplir con esas suposiciones, en el caso de falta
de independencia lo recomendable es analizar cuidadosamente el
experimento para determinar las causas de la falta de independencia y
corregir estas fallas (Sokal y Rohlf, 1995).

3. Varianzas homogneas. La variabilidad de las observaciones entre dos o


mas conjuntos de datos debe ser similar: Sigma12 = sigma_22 =... =
sigmat2. Esto significa que las fuentes de error experimental deben ser
similares. Cuando las varianzas no son homogneas puede haber
problemas en la deteccin de diferencias entre medias. En este caso
conviene realizar una transformacin para hacer las varianzas homogneas
o bien hacer el anlisis con subgrupos. Otra alternativa es emplear
mtodos no paramtricos.
85

Procedimiento General para Formular y Probar Hiptesis


Estadsticas
La formulacin y prueba de hiptesis estadsticas siguen, en general, los
siguientes pasos (no necesariamente en este orden):

Especificar la poblacin sobre la cual nuestras inferencias son aplicables.

Extraer una muestra de la poblacin sobre la cual se pretende probar


alguna hiptesis. Esta muestra (o muestras) deben extraerse al azar para
que las inferencias tengan validez. El tamao de muestra depende de la
variabilidad de los datos, los costos de procesar la muestra y la
confiabilidad en las estimaciones.

Establecer la hiptesis nula e hiptesis alternativa. La hiptesis nula (Ho)


es la aseveracin de que el parmetro es igual a cierto valor, mientras que
la hiptesis alternativa (Ha) es la negacin de la hiptesis alternativa. Por
ejemplo, para determinar la efectividad de algn insecticida, Ho sera: no
hay efecto del insecticida sobre la poblacin de insectos plaga de inters.
La hiptesis alternativa seria que s existe efecto del plaguicida. El
rechazo de Ho significa la "aceptacin" de la hiptesis alternativa. La
decisin sobre el rechazo o no de la hiptesis nula siempre conlleva un
riesgo de error pues la decisin se basa en una muestra que no contiene
todos los elementos de la poblacin. Cuando no se rechaza Ho no quiere
decir que se acepta Ho. Es decir, la evidencia no significa que la
aseveracin es cierta; simplemente es que los datos se conforman, hasta
ese momento, con Ho.
86

Seleccionar y determinar el valor de la estadstica de prueba. La


estadstica de prueba es la variable que se calcula con base a cierto
modelo probabilstico. La estadstica de prueba es una variable aleatoria
que tiene cierta distribucin conocida cuando Ho es cierta. La idea es
determinar que tan probable es que el valor de la estadstica de prueba
calculada ocurra cuando Ho es cierta. Si esta probabilidad es baja, se
rechaza Ho, con una probabilidad de equivocarse tambin baja.

Determinar el riesgo de equivocarse cuando se rechaza la hiptesis nula


(Error tipo I). Este riesgo generalmente se establece a priori y valores
entre 0.10 y 0.001 son generalmente usados. En una seccin posterior se
discute el empleo de los valores de P (P-vales) asociados a la estadstica
de prueba y empleados para tomar una decisin sobre Ho.

Determinar un valor crtico de la estadstica de prueba acuerdo al modelo


probabilstico que genera dicha estadstica y la probabilidad de cometer
error tipo I. Este valor permite decidir sobre la aceptacin o el rechazo de
Ho. Alternativamente se puede calcular el valor de P.

Establecer un criterio de decisin: Por ejemplo, rechazar Ho si y solo si el


valor calculado de la estadstica de prueba es mayor o igual que el valor
crtico.

Comparar el valor calculado contra el valor crtico y tomar una decisin.


Esta es la parte final de una prueba de hiptesis, sin embargo, en toda
investigacin, este proceso es cclico (Platt, 1964).
87

Alternativamente, el valor de la estadstica de prueba puede emplearse para


calcular la probabilidad de obtener dicho valor cuando la hiptesis nula es cierta. Si
esta probabilidad es reducida, se tienen dos opciones (Mndez, 1973):
a) La hiptesis nula es falsa, o b) La hiptesis nula es cierta pero se obtuvo una
muestra "rara" o poco probable. En este situacin se rechazar la hiptesis nula y
queda la incertidumbre (baja) de cometer un error tipo I.

Distribuciones de Referencia
La mayora de las pruebas estadsticas hacen uso de una distribucin de referencia.
Una distribucin de referencia es un modelo probabilstico de la estadstica de
prueba que ocurre cuando Ho es cierta, es decir, cuyo(s) parmetro(s)
corresponden a los establecidos en la hiptesis nula. Con esta distribucin de
referencia podemos calcular las probabilidades de obtener el valor observado de
dicha estadstica. Por ejemplo, suponga que examinamos una muestra de la cual
obtuvimos una media muestral =8. Podemos suponer que este valor provino de una
distribucin N(5,2), es decir, de una distribucin de medias distribuidas
normalmente, Media ~ N(5, 2). En este caso, estamos suponiendo que la media
poblacional <= 5, i.e., Ho: <= 5, contra Ha: > 5. Adems, tambin
suponemos que la varianza de las medias es 2. La Figura 1 ilustra la distribucin
probabilstica N(5,2).
88

Fig. 1. Distribucin normal N(5, 2).

En la Fig. 1 observamos que el valor de nuestra media muestral (8) se encuentra en


el extremo de la distribucin. En efecto, la probabilidad de obtener valores >= 8
cuando Ho <=5 y varianza = 2 son bajas. Al calcular la probabilidad exacta
obtenemos el siguiente valor:
P(Y media >= 8)= 0.067
Observamos que el valor de la media muestral (mayores o iguales a 8) ocurre con
una probabilidad muy baja. Es decir, si Ho fuese cierta, la probabilidad de obtener
un valor de 8 o mayor es 0.067. Ciertamente, otros valores de > 5 podran
generar muestras con Y media = 8 con una mayor probabilidad. Cuando las
probabilidades de ocurrencia de la estadstica de prueba son bajas (digamos < 0.05)
entonces podemos tomar la decisin de rechazar Ho, corriendo el riesgo de
cometer un error igual a la probabilidad de obtener valores iguales o mayores de
89

dicha estadstica. En este caso, podemos rechazar Ho con un riesgo de error


equivalente a P(Ymedia >= 8) = 0.067. El valor de P(Ymedia >= 8) corresponde al
P-value.
Existen algunas pruebas que hacen uso de una distribucin de referencia, en
particular, las pruebas de aleatorizacin y pruebas basadas en "experimentos
previos" permiten probar hiptesis sin necesidad de contar con una distribucin de
referencia .

Ejemplos de Formulacin de Hiptesis Estadsticas


Para una, dos o mas poblaciones.
Una poblacin
1. Se inspecciona una muestra de pulgones de cierta regin y se mide la
longitud de cornculo. Por datos obtenidos en otra regin, se sabe que la
longitud promedio del cornculo es de 0.10 mm.
La hiptesis nula se expresa como: Ho : mu= 0.10,
la hiptesis alternativa: Ha: mu <> 0.10 mm.
En otras palabras, se prueba si la muestra proviene de una poblacin con
media 0.1 mm, la hiptesis alternativa es que la media es distinta.
2. Se inspecciona una muestra de plantas de frjol, se cuenta el nmero de
picudos del ejote por vaina. Se desea saber que tipo de distribucin
probabilstica representa los conteos de insectos.
90

Dos poblaciones
1. Se realiza el siguiente experimento. Se pretende probar si cierto tipo de
trampa captura adultos de "salivazos" igualmente del lado norte y del lado
sur. Aqui la hiptesis es mu1 = mu2, contra Ha: mu1 <> mu2. mu1 es la
media poblacional (nmero de insectos capturados) en el lado sur, y mu2
es la media poblacional en el lado norte.
2. Se postula que existe una relacin lineal entre el numero de chinches del
sorgo y el rendimiento del sorgo. El modelo estadstico mas simple es que
el rendimiento (Y) es una funcin lineal del nmero de chinches (X): Yi =
B0 + B1X + ei. Si este modelo es cierto, entonces B1 <> 0, de otra
manera no existe relacin entre X y Y y el modelo se colapsa a: Yi = B0 +
ei.
B0 representa la media general y B1 la pendiente de una recta. La
hiptesis que se desea probar es: Ho: B1 = 0 vs B1 <> 0.

Varias poblaciones (> 2 poblaciones)


1. Se evalan cuatro herbicidas A, B, C, D. Los herbicidas A y B son
preemergentes y C, D post-emergentes. Los herbicidas A y C contienen el
mismo ingrediente activo y
la misma formulacin pero son hechos por dos compaas distintas y
tienen costo distinto. El herbicida B es una mezcla del ingrediente activo
del herbicida A y otro componente. Lo mismo ocurre con el herbicida D.
Es decir, el herbicida D es una formulacin del herbicida C (ingrediente
activo) con otro ingrediente activo. Adems de estos herbicidas se tiene
un tratamiento testigo (no hay control de malezas) y otro tratamiento que
91

consiste en control manual (machete). Los herbicidas A y B son


producidos por la compaa Agroqumicos-1, los herbicidas C y D son
producidos por la compaa Agroqumicos-2.

Se formulan las siguientes hiptesis:

a) Existe diferencia en los tratamientos qumicos con respecto al testigo


(no control) ?

b) Existe diferencia entre los herbicidas preemergentes con respecto a los


postemergentes?

Observe que estas hiptesis son propuestas antes del experimento

2. Se disea un experimento para determinar la efectividad de dos


depredadores: Hippodamia y Coccinella. Se evalan ambos depredadores
tanto en estado larval como adultos. Se prueban las siguientes hiptesis:

Existen diferencias en el consumo entre Hippodamia y Coccinella?

Existen diferencias en el consumo de pulgones entre larvas y adultos de


ambos depredadores?

La diferencia en el consumo entre larvas y adultos es el mismo para las


dos especies?

3. Se prueban varias variedades de frijol con respecto al ataque de


Zabrotes. El objetivo es determinar si existen variedades resistentes al
ataque de este insecto, evaluado mediante el efecto de dichas variedades
sobre las tasas de desarrollo. Una hiptesis de interes sera:
92

Cual es la variedad mas resistente con respecto al testigo

PROBLEMAS PROPUESTOS:

1. Un contador cree que los problemas de flujo de efectivo de una


empresa son resultado directo del lento proceso de cobro de las cuentas
por cobrar. Dice que al menos el 70% de las actuales cuentas por cobrar
tienen ms de dos meses. Una muestra de 120 cuentas por cobrar indica
que hay 78 con ms de dos meses. Pruebe la afirmacin del contador, al
nivel de significancia de =0.05.

2. Se tiene la siguiente prueba de hiptesis:


Ho: 1 - 2 0
Ha: 1 - 2 > 0

Los resultados siguientes son para dos muestras independientes tomadas


de dos poblaciones

Muestra 1 Muestra 2
n1 = 40 n2 = 50

= 25.2 = 22.8
S1 = 5.2 S2 = 6.0

a) Cul es su conclusin de la prueba de hiptesis con = 0.05?

b) Cul es el valor p?
93

3. Se tiene la siguiente prueba de hiptesis


Ho: 1 - 2 =0
Ha: 1 - 2 0
Los resultados siguientes son para dos muestras independientes tomadas de dos
poblaciones

Muestra 1 Muestra 2
n1 = 80 n2 = 70

= 104 = 106
S1 = 8.4 S2 = 7.6

a. Cul es su conclusin de la prueba de hiptesis con = 0.05?

b. Cul es el valor p?

RESPUESTA: a) z = -1.53; no rechazar Ho


b) 0.1260

4. Se tiene la siguiente prueba de hiptesis


Ho: 1 - 2 =0
Ha: 1 - 2 0
Los resultados siguientes corresponden a dos muestras independientes de
las dos poblaciones. Cul es su conclusin de la prueba de hiptesis con
a = 0.05?

Muestra 1 Muestra 2

n1 = 8 n2 = 7
94

= 1.4 = 1.0

S1 = 0.4 S2 = 0.6

5. Los siguientes estadsticos corresponden al ejercicio anterior, en el que


con dos muestras independientes de viajeros se calificaron los aeropuertos
de Miami y Los ngeles.

Aeropuerto Tamao de la Media de la Desviacin


muestra muestra estndar de la
muestra
Miami 50 6.34 2.163
Los ngeles 50 6.72 2.374
Es la media de la poblacin de calificaciones del aeropuerto de Los ngeles
mayor que la del de Miami? Apoye su conclusin con una prueba estadstica
que emplee un nivel de significancia de =0.05

RESPUESTA: 0.84, no rechazar Ho

6. El estudio de las tiendas Greyston Department Store de la seccin 10.1


produjo los siguientes datos acerca de las edades de los clientes, con dos
muestras aleatorias independientes tomadas en dos lugares de la ciudad.

Tienda del centro Tienda suburbana

n1 = 36 n2 = 49
95

= 40 aos = 35 aos

S1 = 9 aos S2 = 10 aos

Para a = 0.05, pruebe Ho: 1 - 2 = 0 contra la alternativa Ha: 1 - 2 0. Cul


es su conclusin acerca de las medias de las edades de las poblaciones de los
clientes en las dos tiendas?

7. El Servicio de Evaluacin educativa llev a cabo un estudio para investigar las


diferencias entre las calificaciones de alumnos hombres y mujeres en la Prueba de
Aptitud Escolar (PAE). El estudio identific una muestra aleatoria de 562 alumnos
mujeres y 852 alumnos hombres que alcanzaron la misma alta calificacin en la
parte de matemticas. Esto es, se consider que los alumnos, mujeres y hombres,
tenan aptitudes semejantes y altas en matemticas. Las calificaciones de expresin
oral del PAE, para las dos muestras, se resumen en la tabla siguiente.

Alumnos mujeres Alumnos hombres

= 547 = 525
S1 = 83 S2 = 78

Esos datos, respaldan la conclusin que, dada una poblacin de alumnos mujeres
y una de alumnos hombres con aptitudes matemticas altas, los alumnos mujeres
tienen una aptitud bastante mayor de expresin oral? Haga la prueba con nivel de
significancia de = 0.02. Cul es su conclusin?
RESPUESTA: z = 4.99; rechazar Ho
96

También podría gustarte