Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidades
Glosario
Prof:
Mario Marı́n Sánchez
Índice general
1. Prelininares 2
1.1. Operaciones entre conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Cuantificadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Sección 2 6
2.1. Elementos básicos de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2. Probabilidades mas propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3. Principios de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4. Celdas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5. Principios de distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6. Preparación Parcial: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.7. Distribuciones más usuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.8. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.9. Generadoras de momentos Medias y Varianzas . . . . . . . . . . . . . . . . . . . . . . 22
2.10. Caso continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.11. Parámetros en una Distribución Continua . . . . . . . . . . . . . . . . . . . . . . . . 25
2.12. Desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.13. Teorema de Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1
Capı́tulo 1
Prelininares
A∩∅=∅
A∪∅=A
A∪A=A
A∩A=A
∅⊂A
A⊂A
A∩B ⊂A
A⊂B∧B ⊂C ⇒A⊂C
A⊂A∪B
2
1.1. Operaciones entre conjuntos
Definición 2 Dados los conjuntos A y B se define la operación unión como:
A ∪ B = {x/x ∈ A ∨ x ∈ B}
Definición 6 Una proposición es una aserción que puede ser verdadera o falsa de acuerdo a los
valores que se consideren.
Ejemplo 1 Todo número primo mayor que 5 puede escribirse como la suma de un primo y un par
¿Será verdadera?
Ejemplo 2 La suma de dos números impares siempre da como resultado un número par
Ejemplo 3 En una reunión hay 7 hombres y 4 mujeres, se eliges aleatoriamente dos personas en-
tonces el evento la primer persona es mujer y la segunda es hombre se puede representa por el evento
E ∼ M1 ∧ H2 donde M1 representa la primer persona es mujer y H2 representa el evento la segunda
persona es hombre
Ejemplo 4 En una reunión hay 7 hombres y 4 mujeres, se eliges aleatoriamente dos personas en-
tonces el evento la primer persona es mujer o la segunda es hombre se puede representa por el evento
E ∼ M1 ∨ H2 donde M1 representa la primer persona es mujer y H2 representa el evento la segunda
persona es hombre.
1.2. Cuantificadores
Definición 9 Sea P una proposición:
∀x ∈ A : P (x) (Universal)
∃x ∈ A : P (x) (Existencial)
∀n ∈ Z; ∃p ̸= 1, q ̸= 1 ∈ Z con n2 − 1 = pq
¿Será Verdadera?
Ejemplo 6 La suma de dos números impares siempre da como resultado un número par
Definición 11 Cardinalidad
|A| = n ⇔ f : A → {1, 2, 3, ...} tal que f sea una función biyectiva. En este caso si |A| = n se dice
que A es etiquetable por 1, 2, 3, ..., n.
En general, para contar la cardinalidad de uniones tenemos el principio de inclusión y exclusión cuya
prueba se hizo en clase y es sencilla
|A ∪ B| = |A| + |B| − |A ∩ B|
[
X \
k+1
Ai = (−1) Ai
i=1,2...n k=1,2...n
i1 ,ı2 ...ik ∈{1,2,...,n}
Ejemplo 7 En una asamblea de partidos hay 10 representantes (5M,5H) del partido A, 10 repre-
sentantes del partido B (4M,6H) y 10 representantes del partido C (7M,3H). Para cierta elección se
va a elegir 3 personas al azar.
Explique la aleatoriedad del experimento, enuncie un evento, enuncie una variable aleatoria y trate
de enlazar un valor de la variable aleatoria con el evento, trate de usar un ejemplo que hable de
complementos, otro de inclusión y exclusión.
Claramente es un un evento aleatorio dado sabemos las posibilidades para la elección pero no
podemos predecir cuál de ellas va a ocurrir
Una variable aleatoria puede ser X el número de mujeres electas, y por ejemplo el valor X = 0
es el evento que representa que hay al menos un hombre electo
Un evento aleatorio de uso de complementos puede ser el siguiente. Sea M el evento todos son
del partido A, en ese caso el evento ̸ M corresponde con el evento hay al menos una persona
electa que no es del partido A
Algo mas elaborado puede ser lo siguiente. Sean MA , MB , MC los eventos np hya personas del
partido A, B y C respectivamente. Entonces Le evento
MA ∪ MB ∪ MC
corresponde con que alguno de los partidos quede sin representación. ¿Qué será el complemento
de esta unión?
Capı́tulo 2
Sección 2
Definición 13 Dado en experimento aleatorio al conjunto de todos los posibles resultados lo llama-
mos espacio muestral, y lo denotamos en el contexto de este curso por Ω
Ejemplo 8 Se lanza una moneda al aire las veces que sea necesario hasta obtener un escudo en la
cara superior. Si E representa escudo y C corona
Ω1 = {HH, M H, M H, M M }
donde H representa la elección de un hombre y M la elección de una mujer, este es un espacio de
cardindalidad 4. O bien
Ω1 = {H1 H2 , H1 H3 , H1 H4 , H1 H5 , H1 H6 , H1 H7 , H1 M1 , H1 M2 , H1 M3 , H1 M4 ,
H2 H1 , H2 H3 , H2 H4 , H2 H5 , . . . , H2 M4 . . .
H7 H1 , H7 H2 , H7 H3 , H7 H4 , H7 H5 , H7 H6 , H7 M1 , H7 M2 , H7 M3 , H7 M4 }
6
Un espacio que tiene 110 elementos.
Es importante que vean con este ejemplo que un experimento aleatorio puede tener diferentes formas
de representar un espacio muestral
Ejemplo 10 Se lanza una moneda al aire las veces que sea necesario hasta obtener un escudo en la
cara superior. Un evento puede ser que se deba hacer más de 4 lanzamientos para lograr cumplir la
tarea. En ese caso si Ω = {E, CE, CCE, CCCE . . . } el Evento X lo podrı́amos representar por
0 ≤ P [E] ≤ 1
P [Ω] = 1
k
X
P [M1 ∪ M2 , · · · ∪ Mk ] = P [Mj ],
j=1
Algunas consecuencias:
P (A) + P (Ac ) = 1
P
Si s1 , s2 , . . . sk ∈ Ω =⇒ P ({s1 , s2 , . . . sk }) = i P (si )
A ⊂ B =⇒ P (A) ≤ P (B)
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Un espacio equiprobable
Ejemplo 14 Se lanzan dos monedas al aire y queremos calcular la probabilidad de que ambas
caras sean iguales, entonces dado que Ω = {EE, EC, CE, CC} es equiprobable y el evento
E = {EE, CC} entonces P (E) = 42 = 12
Se lanza una moneda las veces que sera necesario hasta que caiga en escudo. El espcio muestral
puede ser
Ω{E, CE, CCE, CCCE . . . }
este cas para calcular por alguna probabilidad, por ejemplo para el evento {E} que el evento
{CCCCE}, no podemos aplicar la regla de Laplace.
Ejemplo 15 Se tienen 7 Hombres y 4 Mujeres en una sala. Se va a realizar el experimento aleatorio
de elegir 2 personas al azar. Determine la la probabilidad de que se elijan personas de ambos sexos.
Usamos el espacio muestral equiprobable es:
Ω1 = {H1 H2 , H1 H3 , H1 H4 , H1 H5 , H1 H6 , H1 H7 , H1 M1 , H1 M2 , H1 M3 , H1 M4 ,
H2 H1 , H2 H3 , H2 H4 , H2 H5 , . . . , H2 M4 . . .
H7 H1 , H7 H2 , H7 H3 , H7 H4 , H7 H5 , H7 H6 , H7 M1 , H7 M2 , H7 M3 , H7 M4 }
E = {H1 H2 , H1 H3 , H1 H4 , H1 H5 , H1 H6 , H1 H7 , H2 H1 , H2 H3 , H2 H4 , H2 H5 , . . . , H2 H6 , H2 H7 . . .
M1 M2 , M1 M3 , M1 M4 , M2 M1 , M2 M3 . . . }
54
La probabilidad pedida es 110
Una pregunta interesante que podemos plantearnos es la probabilidad de del evento B dado que
sabemos que ha ocurrido el evento A. ¿Cambia?
Ejemplo 17 Ver ejemplo 16 La probabilidad del evento B dado que sabemos que ha ocurrido el
evento A es
28
P (A ∩ B 28
P (B|A) = ) = 110
70 =
P (A) 110
70
Note que el valor de la probabilidad de B ente la ocurrencia de A aumenta
Definición 19 Dado en experimento aleatorio los eventos A y B se dicen A es independiente de B
si P (A|B) = P (A)
Al lanzar una moneda dos veces la probabilidad de corona en la segunda moneda es independiente
de la cara que haya caı́do en la primera.
Si tengo 3 bolas azules y dos blancas en una bolsa y extraigo sin reponer dos de ellas entonces
la probabilidad de que la segunda sea azul no es independiente de que la primera sea azul.
Muchas veces no es tan simple verlo por eso recurrimos la definición o a una equivalencia sencilla.
P (A ∩ B) = P (A)P (B)
S
Definición 20 Suponga A1 , A2 . . . An son conjuntos dos a dos disjuntos tales que i=1...n Ai = Ω en
ese caso la secuencia A1 , A2 . . . An
Ejemplo 19 En una elección hay tres partidos con represenantes Mujeres Hombres. Hay 10 repre-
sentantes (5M,5H) del partido A, 15 representantes del partido B (4M,11H) y 20 representantes del
partido C (13M,7H). Para cierta elección se va a elegir un candidato de manera aleatoria.
La probabilidad de que sea mujer del partido A es P (M ∩ A) = P (A)P (M |A) = (10/45)(1/2) =
1/9, esto pudimos verlo desde el inicio pero sirve de ejemplo Se elije un candidato cual es la
probabilidad de que sea mujer. Una manera, a ejemplo, de hacerlo es viendo que A, B, C es una
partición del espacio muestral y
10 1 15 4 20 13 22
P (M ) = P (A)P (M |A)+P (B)P (M |B)+P (C)P (M |C) = ( )( )+( )( )+( )( ) =
45 2 45 15 45 20 45
Note que esto lo sabı́amos de inicio dado que hay 22 mujeres y un total de 45 personas.
Una pregunta más es si sabemos que la persona elegida fue mujer cual es la probabilidad de que
venga del partido C. Recurrimos a la definición de condicional.
20 13
P (C ∩ M ) P (C)P (M |C) 45 20 13
P (C|M ) = = = 22 =
P (M ) P (M ) 45
22
Este tipo de problemas suele asociarse con lo que se llama en los textos reglas de Bayes.
Algunos retos por si desean entretenerse un rato con probabilidades totales e independencia (No es
obligatorio de ninguna manera)
La urna de Polya. En una urna se tienen r bolas rojas y b bolas blancas. Un experimento
consiste en tomar una bola al azar y regresarla a la urna junto con k bolas del mismo color.
Demuetre que sin importar cuantas veces se repita el experimento la probabilidad de sacar una
bola roja siempre es la misma
En un grupo hay m mujeres y n hombres. Se seleccionan al azar a k personas, una por una
y sin reemplazo. Suponga que k ≤ m, n. Encuentre la probabilidad de que la última persona
escogida sea mujer.
Axioma 6 Si una tarea consiste de realizar una secuencia de procesos A1 , . . . An , y para cada Ai
hay ni formas de hacerlo entonces el total de formas de hacer la tare es ni=1 ai
Q
Esos principios resuelven distintos tipos de problemas. Muchas veces se usan juntos.
Ejemplo 20 Para su fiesta de navidad Mario puede elegir un regalo que puede ser una prenda
de vestir o un litro de bebidas. Para las prendas tiene 4 opciones y para la bebida tiene 5
opciones. ¿De cuántas formas puede Mario elegir su regalo?
Para su fiesta de navidad Mario recibe un regalo que consiste en una prenda de vestir y un litro
de bebidas. Para las prendas tiene 4 opciones y para la bebida tiene 5 opciones. ¿De cuántas
formas puede Mario elegir su regalo?
Para su presentación artı́stica Mario 9 invitó a sus mejores 10 amigos (5H,5M). Mario los va
a colocar en 10 espacios enumerados. De cúantas formas puede Mario ubicar a a sus amigos
sin Alguno entre Andrea Juan debe quedar en el primer asiento.
El problema de las premutaciones con repetición es algo distinto, y es mejor recurrir a los principios
básicos antes que aprender fórmulas irrelevantes.
Une las primeras 10 letras distintas de tu nombre, si es necesario incluye algunas de tus ape-
llidos, ¿De cuántas formas puedes ordenar estas 10 si debe haber al menos dos vocales juntas?
Cuántos números pares de 5 dı́gitos se pueden construir usando una varias veces los dı́gitos
0,1,2, 3 y 4.
2.4. Celdas
LLamamos con ese mombre a una técnica general para resolver problemas que se basa en principios
de conteo elementales.
Imgagina que usted desea distribuir n objetos idénticos en dos recipientes. ¿De cuántas maneras
podrı̀a hacerlo?
¿Cómo lo harı́a de manera concreta?
Reto:
No hay restricciones
Al menos un libro por persona
Mario recibe a lo sumo dos libros
No hay restricciones
Al menos un libro por persona
Mario recibe a lo sumo dos libros
Ejemplo 22 Se lanzan 10 dados, sea X el total de caras que caen en un valor superior a 4
Se lanza un dado hasta que salga la cara de 6 puntos, sea X el total de lanzamientos realizados
Una empresa de reparaciones recibe trabajos de tres tipos A, B y C con probabilidades .5, .3 y
.2 respectivamente. Los costos que la empresa cobra por esos trabanos son 5000, 10000 y 20000
colones. Si un dı̀a en particular llegan 4 trabajos considere X el monto de ingresos que recibe
la empresa
Ejercicio 1 Determine el espacio muestral y el rango para cada una de las variables definidas
en 23
Determine las probabilidades de los valores en los rangos de cada uno de los casos en 23
Definición 25 Dada una variable aleatoria discreta X se llama distribución de probabilidad a una
función fX (x) que cumple
fX (x) ≥ 0 para todo x en su dominio (rango de X) (P (X = x))
P
x∈RX fX (x) = 1
En el caso de variables aleatorias discretas la función de probabilidad se puede describir con una
tabla o con una fórmula
Ejemplo 23 Se lanza un dado hasta que salga la cara de 6 puntos, sea X el total de lanza-
mientos realizados
Definición 26 Dada una variable aleatoria discreta X con distribución de probabilidad fX (x) se
llama función de probabilidad acumulada FX (x) a la función dada por
FX (x) = P (X ≤ x)
Definición 27 Dada una variable aleatoria X con distribución de probabilidad fX (x) se llama es-
peranza o media de X al valor X
µX = xfX (x)
x∈RX
Definición 28 Dada una variable aleatoria discreta X con distribución de probabilidad fX (x) se
llama varianza de X al valor X
2
σX = (x − µX )2 fX (x)
x∈RX
Para una actividad de eligen 8 personas, si todas las configuraciones son igualmente probables
determine la probabilidad de que los tres grupos estén representados (10 puntos)
Solución La suposición de que todas las configuraciones son igualmente probables es solo eso
una suposición que depende de la representación. Por ejemplo si etiquetamos las personas por
x1 , x2 . . . x20 , uno puede decir
El valor buscado es
13 15 15
8
+ 8
+ 12
−1
1− 20
8
Se colocan las 20 personas en una fila, de cuántas formas los equipos A y B quedan unidos
entre sı́ pero separados uno del otro(15 puntos)
Solución No es tan sencillo lo mas fácil es colocar las personas de C , luego elegir dos espacios
entre los 9 que se generan para colocar los otros bloques, en total
9
8!2!7!5!
2
Se elije un persona al azar, si es del grupo A entonces se elije una segunda persona de las 20
personas si no es del grupo A se elije una persona de los 19 restantes. Si la segunda persona es
del equipo A ¿qué tan probable es que la primer persona haya sido del grupo A?(15 puntos)
Solución Para calcular la probabilidad S de que la segunda persona sea del grupo A se usa
7 7 13 7
probabilidad total P (S) = 20 20
+ 20 19
y por Bayes la probabilidad pedida es
7 7
20 20
7 7 13 7
20 20
+ 20 19
Se elijen sin reposición tres personas, determine la probabilidad de que sean del mismo equi-
po.(10 puntos)
Solución Se hace por casos o por inclusión y exclusión. Por casos son tres eventos exclusivos:
todos de A, de B o de C.
7×6×5+5×4×3+8×7×6
20 × 19 × 18
La empresa tiene un esquema de pagos de 2000, 3000 y 4000 dólares según la persona sea
del equipo A B o C respectivamente. Determine la distribución de probabilidad para el salario
acumulado de tres personas elegidas al azar con reposición, determine además el salario esperado
para los grupos aleatorios de tres empleados(20 puntos)
Solución Esta pregunta es un poco larga, vemos su generalidad. Si X es la variable que
corresponde con el salario acumulado de las tres personas en rango de X toma los valores
6000, 7000, 8000, 9000, 10000, 11000, 12000 y la tabla de distribución de probabilidad tiene la
forma
X FX (x)
6000 73 /203
7000 (3 × 72 × 5)/203
8000 (3 × 72 × 8 + 3 × 52 × 7)/203
9000 (53 + 6 × 7 × 5 × 8)/203
10000 (3 × 82 × 7 + 3 × 52 × 8)/203
11000 3 × 82 × 5/203
12000 83 /203
Un cálculo de ejemplo:
Para obtener 10 000 por ejemplo, tiene que darse uno de cada tipo ABC o bien BBC esto
equivale a (3 × 82 × 7 + 3 × 52 × 8)/203
El valor de la media se calcula de forma directa por
73 72 × 5
µX = 6000 × 3 + 7000 × + · · · = 9150
20 203
Se rifan 100 acciones entre los 10 empleados. Determine la probabilidad de que mas de 50
acciones queden en personas del grupo A (20 puntos)
Solución Cada acción puede ser ganada o no por alguien del equipo A y de forma indepen-
diente, entonces el total de veces X que gana alguien del equipo A cumple X ∼ b(x : 100, 7/20)
y P (X ≥ 51) se obtiene de la aplicación o de una calculadora.
Proponga un problema sobre distribución de objetos en celdas usando este contexto(10 puntos)
Solución Hay demasiadas opciones, por ejemplo:
Estas 20 personas van a ubicarse en 20 oficinas, una oficina por persona. ¿De cuántas
maneras pueden ubicarse?
Estas 30 personas van a ubicarse en 10 oficinas, sin restricción ¿de cuántas maneras pueden
ubicarse?
Se desea saber de cuántas distribuciones hay de estas 20 personas en 8 oficinas de manera
que cada oficina tenga al menos 3 personas. No interesa las personas solo la cantidad de
personas por oficina.
2.7. Distribuciones más usuales
Definición 29 Un experimento se llama ensayo de Bernoulli si solo tiene dos resultados digamos
que éxito y fracaso
P (Exito) = p
P (F racaso = 1 − p
Si asociamos el experimento con los valores 0,1 para fracaso y éxito respectivamente.
µX = 0(1 − p) + 1(p) = p
2
σX = (0 − p)2 (1 − p) + (1 − p)2 (p) = p(1 − p)
Algunas veces realizamos un proceso éxito fracaso una cantidad fija de veces y nos interesa por
ejemplo calcular el total de veces que acertamos en éxito. Si logramos identificar que cada ensayo es
independiente de los demás entonces llamamos a este proceso un proceso binomial.
n repeticiones
Independientes
RX = {0, 1, 2 . . . , n}
n x
fX (x) = b(x; n, p) = p (1 − p)n−x
x
Ejemplo 25 Mario debe hacer un examen de selección única que consta de 20 itemes cada uno
con 4 opciones de las cuales solo una es correcta
Se sabe que la probabilidad de que una persona use reloj de pulsera es de 0.1. Interesa saber el
total de personas en 100 usan reloj de pulsera.
Se lanza un dado 1000 veces y se toma como variable aleatoria la cantidad de veces que cae
una cara con 5 o más puntos.
Repeticiones indefinidas
Independientes
RX = {1, 2, . . . , ∞}
fX (x) = g(x; p) = (1 − p)n p
Ejemplo 26 Mario debe responder ı́temes cada uno con 4 opciones de las cuales solo una es
correcta, decide responderlos aleatoriamente hasta tener un correcto. El total de itemes que
responde es una variable aleatoria geométrica
Se sabe que la probabilidad de que una persona use reloj de pulsera es de 0.1. Se realiza una
encuesta por teléfono hasta que una persona responda afirmativamente ala pregunto sobre si
usa o no el reloj de pulsera. X es el total de personas entrevistadas
Se lanza un dado 1000 hasta que cae una cara con 5 o más puntos.
RX = {máx{0, n − N }, . . . , mı́n{n, M }}
N
N
x n−x
fX (x) = h(x; M, N, n) = M +N
n
Ejemplo 27 Mario tiene una urna con 20 bolitas negras 15 verdes, elije aleatoriamente 17
bolitas. Sea X el total de bolitas negras elegidas en la muestra
Un estanque tiene 20 peces marcados y 200 sin marcar. Se capturan 30 pescados, sea X el total
de pescados marcados.
RX = {máx{0, n − N }, . . . , mı́n{n, M }}
N
N
x n−x
fX (x) = h(x; M, N, n) = M +N
n
Ejemplo 28 Mario tiene una urna con 20 bolitas negras 15 verdes, elije aleatoriamente 17
bolitas. Sea X el total de bolitas negras elegidas en la muestra
Un estanque tiene 20 peces marcados y 200 sin marcar. Se capturan 30 pescados, sea X el total
de pescados marcados.
Ejercicio 2 Pedro y Juan juegan en una mesa de casino. Pedro empieza y juegan de manera
alternada. En cada turno la ganancia g del jugador de turno es una variable aleatoria G con
distribución de probabilidad según la tabla adjunta. Usaré − para representar cualquier otro
caso
G(g)
g G(g)
1
-2 3
1
1 2
1
3 6
- 0
Ellos continúan jugando hasta que una perdida de Juan siga de manera inmediata a una
pérdida de Pedro. Encuentre la distribución de probabilidad para el total de rondas jugadas
(un ronda equivale a una jugada de cada uno). Se pierde al obtener un -2.
Encuentre la distribución de probabilidad para el turno en que Juan llega a su tercera
pérdida.
Si n es el número de turnos hasta que cada uno de ellos ha ganado al menos una vez,
estime la esperanza para n.
RX = {0, 1, . . . , ∞}
λx e−λ
fX (x) =
x!
Ejercicio 3 Para cruzar un puente ancho sobre un rı́o los carros llegan al puente según un Proceso
de Poisson de tasa λ = 3 por hora.
Si llega un carro en la hora 0, calcule la probabilidad de que no haya carros las horas 1, 2 y 3.
Calcule la probabilidad de que el próximo carro que llegue después del primer carro a la hora 0
requiera más de 3 horas para llegar.
Calcule la probabilidad de que no lleguen carros en las primeras 2 horas, pero que lleguen 4
carros la 4. hora.
Calcule la probabilidad de que el quinto carro tarde más de 2 horas en llegar al puente.
n
n
X n
(a + b) = an−i bi
i=0
i
Las funciones generadoras de probabilidad son herramientas útiles en diversos problemas de proba-
bilidades. Uno de ellos es poder encontrar la distribución de una suma de distribuciones que es un
problema complejo si usamos los enfoques tradicionales.
Empezamos con un repaso simple.
Si X es una variable aleatoria cualquiera con rango RX y distribución de probabilidad fX (x) la media
de X se define por
X
µX = fX (x)
x∈RX
y la varianza por
X
2
σX = (x − µX )2 fX (x)
x∈RX
Teorema 4 µc = c
µcX = cµX
Definición 34 Si X es una variable aleatoria y h es una función cuyo dominio incluye el rango de
X entonces h(X) es también una variable aleatoria y se define la esperanza de h(X) por
X
µh(X) = h(x)fX (x)
x∈RX
Ejercicio 4 Suponga que se tiene 7 monedas de 500 colones y 4 monedas de 100 colones en una
celda, se extraen sin reponer monedas hasta tener monedas de de ambas denominaciones. Si X es la
variable aleatoria que representa la cantidad de monedas de 500 en la muestra calcule
La varianza de X
la esperanza de la variable 3x + 5
La esperanza de X 2
MX (t) = µetX
2
σX = µX 2 − µ2X
Teorema 5 Dada una variable aleatoria X cuya generadora de momentos es MX (t) se cumple que
∂ nM
(0) = mn
∂tn
En la bibliografı́a se encuentra definiciones equivalentes para la función generadora de momentos por
lo que si busca referencias en internet debe verlas con cuidado
Ejercicio 6 Binomial
Poisson
Geométrica
Ejemplo 30
Se mide la distancia entre dos puntos tomados al azar dentro de una circunferencia
Se mide el ángulo que forma una recta aleatoria por el origen con el eje y
A diferencia de las distribuciones discretas que se suelen trabaja con sumatorias para las continuas
trabajamos con integrales.
Recordemos que una de las posibles interpretaciones de la integral, solo una entre muchas, es que si
tenemos una función positiva en un intervalo [a, b] la integral nos permite calcular el área que queda
comprendida entre la gráfica de la función,el eje x, y las rectas x = a y x = b. Con a, b reales incluson
podrı́an ser ∞
Esa aplicación nos resulta bastante ilustrativa en probabilidades al momento de definir distribuciones
continua.
Si tenemos una variable aleatoria continua X entonces con esta variable aleatoria está asociada una
densidad de probabilidad (función). El área bajo la curva de densidad entre dos puntos corresponde
a la probabilidad de que la variable se encuentre entre esos dos valores. En otras palabras, el área
bajo la curva de densidad entre los puntos a y b es igual a P (a ≤ x ≤ b).
Z
f (x)dx = 1
Rx
Z b
P (a ≤ X ≤ b) = fX (x) dx
a
Ejercicio 7 Los estudiantes han registrado datos que revelan que el profesor nunca inicia la clase
después de 10 minutos de la hora de inicio. Han graficado algunas las frecuencias de los tiempos y
creen que la función de densidad de probabilidad tiene la forma
(
k
2+t
si 0 ≤ t ≤ 10
fX (t) =
0 en otros casos
kx si 0 ≤ x ≤ 1
k
fX (x) = x3
si 1 < x ≤ 5
0 en otros casos
1
Determine probabilidad de que X esté entre 2
y2
Las definiciones y teoremas son prácticamente los mismos que los vistos para variables discretas con
la distinción de que esta sección se usa integrales en lugar de sumas.
Y se define por
Z ∞
µX = xfX (x) dx, (2.1)
−∞
Ejemplo 31 Determine la esperanza de una variable aleatoria continua X con distribución de pro-
babilidad de la forma
−λx
λe : Para x > 0
fX (x; λ) = ,
0 : En cualquier otro caso
Definición 38 Si h(x) es una función real y X es una variable aleatoria continua se tiene que
Z ∞
E(h(X)) = µh(X) = h(x)fX (x) dx, (2.2)
−∞
2
σX o bien V AR(X)
Teorema 6 Si X es una variable aleatoria continua cuya media y varianza existen se tiene que
V AR(X) = E (X 2 ) − [E (X)]2 .
Ejemplo 32 Sea X una variable aleatoria continua con distribución de probabilidad dada por
k
si 1 ≤ x ≤ 15
f (x) = x2
0 en otro caso.
1. Determine el valor de k.
3. Calcule V AR(X).
Solución
∞
−k 15 −k −k
Z
k 14k
1. Dado que 2
dx = |1 = − = , k debe ser 15
14
.
−∞ x x 15 1 15
Z 5
15 15 1 6
2. P ([−2 < X ≤ 5]) = 2
dx = − +1 = .
1 14x 4 5 7
Z 15 Z 15
15 15 15 15
3. E (X) = x 2
dx = dx = (ln(15) − ln(1)) = ln(15),
1 14x 1 14x 14 14
Z 15 Z 15
2 2 15 15
E (X ) = x 2
dx = dx = 15,
1 14x 1 14
2
2 2 15
V AR(X) = E (X ) − (E (X)) = 15 − ln(15) .
14
Las propiedades fundamentales de la esperanza y variancia son las mismas que las vistas para variables
discretas.
µc = c.
2. El valor esperado de una variable aleatoria multiplicada por una constante es la constante por
el valor esperado de la variable.
µ(cX) = cµX .
3. El valor esperado de una suma de dos variables aleatorias es la suma de los valores esperados
de las variables.
µX+Y = µX + µY .
V AR(c) = 0.
2. La varianza de una variable aleatoria multiplicada por una constante es la constante al cuadrado
por la varianza de la variable.
V AR (cX) = c V AR(X).
3. La varianza de una suma de dos variables aleatorias es la suma de las varianzas de las variables.
V AR (X + Y ) = V AR(X) + V AR(Y ).
Z ∞
tX
mX (t) = E (e ) = etx · fX (x) dx. (2.4)
−∞
Teorema 9 Si X es una variable aleatoria con función generadora de momentos mX (t) se tiene que
(n)
mX (0) = E (X n ). (2.5)
Ejemplo 33
e−x
si 0 < x < 5
f (x) = 1 − e−5
0 sino
Solución
1. Cálculo de la generadora
5 Z 5
e−x ext
Z
xt 1
e(t−1)x dx
Mx (t) = E e = −5
dx = −5
0 1 − e 1 − e 0
(t−1)x 5
5(t−1)
1 e 1 e −1
= =
1 − e−5 t − 1 1 − e−50 t−1
3. Determine E (e−3x ).
e5(−3−1) − 1 e−20 − 1
−3x
1
E e = mx (−3) = = ≈ 0.251 696
1 − e−5 −3 − 1 4 (e−5 − 1)
Normal Una de las distribuciones mas conocidas y útiles es la normal. Algunas menciones de
orı́genes esta distribución se asocial con Abraham DeMoivre (1967-1754) en el contexto de juegos de
azar.La importancia de esta distribución es absoluta y sustenta la mayor parte de muchos trabajos
en investigación estadı́stica, especialmente cuando se liga con el terema del limite central.
Su mayor particularidad radica en su forma de campana, simétrica y con la particularidad de permitir
describir el comportamiento de variados modelos aleatorios.
La forma teórica de la distribución es en principio sencilla, pero su manejo matemático no necesa-
riamente es simple.
Una variable aleatoria X se dice normal si su función de densidad de potabilidad es de la forma
1 (x−µ)2
fX (x) = N (µ, σ 2 ) = √ e− 2σ2 ∀ − ∞ < x < ∞
2πσ
En general los cálculos relacionados con la distribución normal son complejos y en la mayorı́a de los
casos requieren del uso de funciones no elementales o bien el uso de algoritmos numéricos.
Y es fácil, haciendo un cambio de variable comprobar una forma de estandarizar los cálculos asociados
con las normales.
Si X ∼ N (µ, σ 2 )
ω
ω−µ
Z
1 −
(x−µ)2
P (X < ω) = √ e 2σ 2 dx = Φ
2πσ −∞ σ
Ejemplo 34 Se asume que el peso de una población de mamı́feros es una variable aleatoria continua
con media 300 kilogramos y varianza 100 kilogramos2
Un intervalo de peso, centrado en la media, tal que la probabilidad de que un sujeto elegido al
azar quede en ese intervalo sea superior 0.95
Ejemplo 35 Estudios realizados permiten saber que el procesamiento de un tipo de tarea requiere
un tiempo normal con media 500 milisengundos y desviación estándar 400 milisegundos Cada lote
de procesamiento incluye 100 tareas que se ejecutan de manera secuencial.
Ejemplo 36 El peso de un artı́culo es una variable aleatoria, en kilogramos, que es continua, normal
de media y varianza desconocidos. Se sabe que el 70 % de los artı́culos pesan menos de 80 kiloa y
que el 10 % pesan más de 90 kiloa. Determine la probabilidad de que un artı́culo peso menos de 70
kilogramos.
Solución
El problema se reduce a resolver el sistema
70−µ
Φ σ
= 0.7
90−µ
Φ σ
= 0.9
70−µ
σ
= 0.5244
90−µ
σ
= 1.28155
Ejemplo 37 Suponga que un tipo de caramelo tiene un peso que es una variable aleatoria normal
con pero promedio 10 gramos y varianza 16 gramos2 . Se desea determinar el máximo de caramelos a
colocar en una caja de manera que el peso acumulado de los caramelos en la caja sea inferior a 508
gramos con un probabilidad del 90 % o más.
Determine el total de caramelos a colocar en la caja.
Solución:
El problema se resume en encontrar un n que es el total de caramelos en la caja. El peso de cada
caramelo es una variable aleatoria xi ∼ N (10, 16) el peso total de los n caramelos en la caja W =
x1 + x2 + · · · + xn es normal W ∼ N (10n, 16n), (suma de normales es normal).
El problema se reduce a resolver la ecuación
508 − 10n
P (W < 508) = Φ √ = 0.9
4 n
Es decir
508 − 10n
√ = 1.28155 =⇒ −10n − 5.1262 + 508 = 0
4 n
√
Esta ecuación, vista como cuadrática en n tiene dos posibles soluciones, en esto hay que tener
√ √
cuidado. n = 6.8757 y n = −7.388328 El valor n = 48 nos da una probabilidad de 0, 84 de que el
peso acumulado no sobrepase los 508 gramos,si usamos 47 caramelos la probabilidad 0.917
1 x
α−1 − β
fX (x) == x e ∀0 ≤ x < ∞
β α Γ(α)
Note que en esta definición se recurre a una función llamada la función gamma definida por
Z ∞
Γ(x) = xα−1 e−x dx
0
No es complejo demostrar el siguinte teorema
Teorema 12 Γ(n) = (n − 1)! para n entero positivo
Al igual que en el caso normal los cálculos relacionados con la esta distribución son complejos y en
la mayorı́a de los casos requieren del uso de funciones no elementales o bien el uso de algoritmos
numéricos.
Si X es gamma de parámetros α, β
Z ω
1 x
P (X < ω) = α xα−1 e− β dx
β Γ(α) 0
Y es fácil, haciendo un cambio de variable comprobar una forma de estandarizar los cálculos asociados
con las normales.
Si X es gamma de parámetros α, β
ω
Z ω Z
1 −
(x−µ)2 β ω
P (X < ω) = √ e 2σ 2 dx = xα−1 e−x dx = F ( , α)
2πσ −∞ 0 β
Esta función F se llama gamma incompleta y suele estar tabulada en muchos textos de proba
Ejemplo 38 Suponga que el tiempo para encontrar un error en un programa de computación extenso
es una variable en horas X gamma con valores α = 2, β = 1
Cuál es el percentil del 90 % es decir el tiempo tal que el 90 % de las veces se gasta menos que
ese tiempo.
µx = αβ
2
σX = αβ 2
Ejemplo 39 X es gamma como medio 9 y varianza 36.
• Obtenga el valor exacto de esta integral y compárelo con el valor que da la aplicación Probability-
Distributions
• Use la gamma incompleta y una tabla de gamma incompleta obtenida en Internet para aproximar
este valor
2.12. Desigualdades
Markov En matemática es común tener desigualdades que nos permiten valorar de manera apro-
ximada ciertas probabilidades. De hecho se usan para muchas más cosas que probabilidades. Una de
ellas y base para un par de deducciones muy importantes en la desigualdad de Marvov
El planteamiento es sencillo, se presenta con el caso continuo pero es caso discreto es básicamente
igual. Suponga que X es una variable aleatoria continua en [0, ∞[ con media µX y c un valor positivo
cualquiera entonces
Z ∞
µX = xfX (x) dx (Definición)
0
Z c Z ∞
= xfX (x) dx + xfX (x) dx (Propiedades de Integral)
0 c
Z ∞
≥ xfX (x) dx (Propiedades de suma de positivos)
c
Z ∞
≥ cfX (x) dx dado que c < x
c
Z ∞
= c fX (x) dx (Propiedades de Integral)
c
= cP (X ≤ c) (Definición)
µx
P (X ≥ c) ≤
c
Es decir la probabilidad de que X tome valores por encima de un valor c arbitrario es inversamente
proporcional con el valor c, a mayor valor menos probabilidades de que X exceda ese valor, siempre
ligado el valor de la media.
Si bien es una desigualdad algo trivial a partir de ella se pueden lograr no solo acotaciones simples
en casos muy abiertos sino que se pueden lograr otras desigualdades mejores.
Ejemplo 40
Si X ∼ b(x; n, p) encontrar una cota superior para P (X ≥ nα),donde p < α < 1. Aplı́quelo al caso
p = 21 , α = 34
Solución: µX = np y X es no negativa entonces
np p
P (X ≥ nα) ≤ =
nα α
para p = 12 , α = 3
4
3n 2
P (X ≥ )≤
4 3
Si X es una variable aleatoria con media 350 encontrar una cota para la probabilidad P (X ≥ 1000)
2
σX
P (|X − µx | ≥ b) ≤ 2
b
σ2
P (|X − µx | ≤ b) ≥ 1 − X
b2
Este acomodo simple permite una desigualdad que en conocimiento de media y varianza permite
cotas mucho mejores.
Ejemplo 41 Si X ∼ b(x; n, p) encontrar una cota superior para P (X ≥ nα),donde p < α < 1.
Aplı́quelo al caso p = 12 , α = 34
2
Solución: µX = np y σX = np(1 − p) X es no negativa entonces
P (X ≥ nα) = P (X − np ≥ nα − np) Resta en ambos lados
≤ P (|X − np| ≥ nα − np) Incluye más probabilidad
2
σX
≤ Chebishev
(nα − np)2
n(1 − p)
=
(nα − np)2
(1 − p)
=
n(α − p)2
3n 4
P (X ≥ )≤
4 n
Si X es una variable aleatoria simétrica con media 350 y varianza 400 encontrar una cota para
la probabilidad P (X ≥ 1000)
Ley de Grandes números En las etapas iniciales del curso hablamos de dos maneras de asignar
probabilidad a un evento una de ellas es a través del conocimiento matemático de la estructura propia
del experimento aleatorio, es decir analizando el espacio maestral y los condicionantes asociados
podemos asignar la probabilidad a un evento, por ejemplo si lanzamos una pareja de dados lasa
veces que sea necesario hasta obtener una suma de sus caras superior a 10, entonces podemos darnos
cuenta que la probabilidad de que se deban ejecutar 5 lanzamiento es (Cuanto es). En este caso
estamos asumiendo que las distintas repeticiones son independientes y que además los dados no
están cargados.
Qué pasarı́a si tengo un experimento aleatorio en el que los lanzamientos no sean independientes y
tampoco tengo información sobre si los dados están o no cargados. En claro que el evento de ejecutar
5 lanzamiento es tiene una probabilidad p pero no puedo obtenerla. Es aquı́ donde entra otra forma
de asignar probabilidad; la frecuencial.
Suponga entonces que se tiene un evento A que claramente tiene una probabilidad p que no cono-
cemos. Suponga que repetimos el experimento n veces y que consideramos la variable aleatoria que
corresponde con el total de veces que ocurrió el experimento entre el total de veces que se repitió.
X
Se entonces X el total de veces que ocurre el evento si se repite el experimento n veces y sea Y = n
.
Hechos
X es binomial x ∼ b(x; n, p)
2
µX = np y σX = np(1 − p)
Por propiedades estudiadas
1
µY = µ( 1 X) = np = p
n n
1 p(1 − p)
σY2 = σ(21 X) = 2 np(1 − p) =
n n n
Si aplicamos desigualdad de Chebyshev a Y entonces para cualquier valor ϵ obtenemos
p(1 − p)
P (|Y − p| ≥ ϵ) ≤
nϵ
X
Dado que Y = n
razón entre el total de veces que ocurrió en evento en n repeticiones dividido entre
n
X p(1 − p)
P (| − p| ≥ ϵ) ≤
n nϵ
o bien
X p(1 − p)
P (| − p| ≤ ϵ) ≤ 1 −
n nϵ
Dado que el p es fijo entre 0 y 1, ϵ es un número fijo entonces si consideramos
X
lı́m P (| − p| ≤ ϵ) = 1
n−→∞ n
Es decir si repetimos el evento infinitas veces la probabilidad de que el valor que obtenemos para la
probabilidad a través de este procedimiento converge al valor desconocido p con una probabilidad de
1.
A esto le llamaremos Forma débil de la ley de los grandes números
Un resultado cercano con estos comentarios el el teorema de lı́mite central. Este teorema dice que
la suma o el promedio de muchas copias independientes de una variable aleatoria, tomadas de una
población cualquiera, es aproximadamente una variable aleatoria normal.
Empecemos por la terminologı́a. Si X1 , X2 , . . . , Xn son variables aleatorias independientes, provenien-
tes de la misma distribución X, decimos que las Xi son independientes e idénticamente distribuidas.
2
En particular si la media y varianza de de X son µX y σX también lo son para Xi .
Contexto: Por ejemplo, piense que una empresa de servicios brinda tres tipos de servicios, que estos
tipos de servicio llegan de manera aleatoria e independiente. La información se resume en esta tabla:
Datos
Servicio Probabilidad Ingreso
A .45 20 000
B 30 25 000
C .25 40 000
Los servicios que la empresa recibe siguen una distribución de probabilidad X dada en la tabla previa.
2
Es fácil darse cuenta que µX = 26500 y que σX = 65250000
En este contexto podemos darnos cuenta que si llegan 4 trabajos independientes entonces el ingreso
por cada trabajo, digamos Xi para i ∈ {1, 2, 3, 4}, cada uno de ellos, es una variable aleatoria que
es una copia de X. Y claramente el ingreso por estos 4 trabajos X1 + X2 + X2 + X4 también es
una variable aleatoria; su media y varianza no son necesariamente los mismas que las de X como
veremos.
2
Definición 41 Dada una variable aleatoria X con media y varianza µX y σX definimos la estanda-
rización de X por:
X −µ
Z=
σ
Esto ya lo hemos comentado antes para normales, un ejercicio fácil de demostrar es que esta nueva
variable tiene media o y varianza 1
E(Sn ) = nµ y V ar(Sn ) = nσ 2
σ2
E(X) = µ y V ar(X) =
n
Para valores de n grandes
σ2
Sn ≈ N (nµ, nσ 2 ) y X ≈ N (µ, )
n
La prueba del teorema del lı́mite central es algo técnica, requiere algunas herramientas razonables
de cálculo diferencial e integral y no es nuestro interés desarrollarla aquı́.
Ejemplo 42 Se Lanza una moneda 100 veces. Primero estime, usando TLC, la probabilidad
de 55 o más escudos. Luego haga el cálculo de manera directa usando la aplicación y compare
los valores.
Se una moneda 400 veces. Primero estime, usando TLC, la probabilidad de 220 o más escudos.
Luego haga el cálculo de manera directa usando la aplicación y compare los valores.
Puedes analizar ambos casos, en cuál de ellos la estimación representa una mejor aproximación del
valor obtenido directamente con la aplicación y porqué.
Un ejemplo mas complejo. En encuestas de tipo polı́tico los resultados de l de opinión suelen presen-
tarse como valores con de un margen de error. Por ejemplo se dice que un candidato tiene a su favor
un 35 % ± 5 % de votos. es decir se admite un porcentaje de error del 5 %. Hay una regla de oro que
si se hace una encuesta aleatoria con n personas el margen de error es √1n . Usaremos el TLC para
sustentarla.
Vamos a trabajar en una versión simplificada. Idealmente, al correr una encuesta seleccionamos de
manera aleatoria (todo un tema a estudiar) n personas y les preguntamos: apoya usted en esta
elección al candidato .A”, y cada persona responde afirmativamente o bien cualquier otra opción que
catalogaremos como un no.
Si p0 es el valor real de la probabiliad de que una persona apoya al candidato entonces, cada item, con
2
cada una de estas n personas, es una variable X que es una Bernoulli. Con µX = p0 y σX = p0 (1 − p0 )
La variable R que recoge el resultado de la encuesta, quienes apoyan al candidato A, es justamente el
promedio de n variables independientes idénticamente distribuidas, todas Bernoulli con valor 1 para
el si y 0 para el no
Usando el teorema del lı́mite central
X1 + X2 + · · · + X n p0 (1 − p0 )
R= ≈N p0 ,
n n
Unas palabras de precaución. Un error bastante común en estudiantes principiantes es pensar que
hay una probabilidad de 95 % de que el valor de p0 esté en ese intervalo. La interpretación es distinta,
el 95 % de veces que se jaga la encuesta en esta condiciones el valor promedio obtenido estará en este
intervalo
En un sistema de comunicación se transmiten grupos de 1000 bits. Debido al ruido cada bit
puede ser recibido con error con una probabilidad de 0.1. Si los errores ocurren de manera
independiente determine la probabilidad de tener más de 120 errores en transmisión de un
grupo.