Está en la página 1de 106

Escuela de Educación Técnica Henry Ford

2019

Cuadernillo de Actividades

MATEMÁTICA APLICADA 6° ET

Prof. Martín Chacón


Escuela de Educación Técnica Henry Ford – 2019 Pautas de Trabajo –Matemática Aplicada 6º ET

Pautas de trabajo
Uso de la Carpeta
• Carátula: Materia, Alumno, Curso, Profesor, Horario, Año. Un separador: Evaluaciones.
• Debe estar completa todas las clases en el aula. Al comienzo de cada día de clases debe figurar la fecha.
• Encabezado de las hojas
Apellido, Nombre Nro de hoja
2019 Unidad – Matemática Aplicada 6° ET
• Se numerarán las hojas en forma correlativa comenzando por la primera luego de la carátula.
• Es sumamente importante cuidar la prolijidad y el orden en el uso de la carpeta.
• Las definiciones, teoremas, propiedades, figurarán entre medio de la ejercitación (o actividad) y serán enmarcadas con color
verde.
• Si hubiera errores en las resoluciones, tanto en las actividades de aula como en las de tarea, el alumno debe marcar el error con
color rojo (DE NINGUNA MANERA BORRAR) e intentar dar alguna descripción acerca de la naturaleza del error. Esto se
realizará junto con el docente.
• Las preguntas que puedan surgir en el alumno cuando realiza alguna actividad deberán estar escritas en la carpeta en el ejercicio
correspondiente.
• La carpeta es un documento que permite reconstruir en parte lo que haya sucedido en el aula. El alumno debe anotar en ella sus
resoluciones, sus cálculos auxiliares, sus procedimientos, sus justificaciones, sus conclusiones y lo realizado por otros (compa-
ñeros y docente) y expuesto en la puesta en común. Además, debe tomar nota de lo que se escribe en el pizarrón. Se recomienda
que el alumno en algún momento luego de terminada la clase (y no mucho después – por ejemplo cuando llega a su casa, duran-
te las horas de estudio en el colegio, etc) revise la carpeta, agregue todo lo que considera pertinente que debería estar relaciona-
do con la clase, y aquellas dudas o consultas que le surjan. La carpeta servirá para ir estudiando lo trabajado.

Uso del cuadernillo


• Se entregará a cada alumno un cuadernillo de actividades. En éste figuran las actividades a realizar en clase y de tarea. En nin-
gún caso se debe trabajar sobre él. Si se trata de completar un cuadro se transcribirá el cuadro en la carpeta, si hubiera que
completar espacios, se transcribirá el ejercicio en la carpeta y allí se completa. Si hubiera que realizar agregados a una figura de
análisis, se realizará una copia en la carpeta y allí se agregará lo que se considere necesario. Se recomienda no avanzar con las
actividades no pedidas.

Forma de trabajo
• Se requiere un fuerte trabajo del alumno en clases. Nuestras clases están pensadas en función de estudiantes activos. El aprendi-
zaje requiere de un trabajo constante y sostenido en el tiempo que permita ir reflexionando y ajustando sobre lo ya realizado, de
modo que se dé un avance gradual y progresivo.
• Generalmente los alumnos comenzarán con alguna actividad (que pudo haber estado dada de tarea) y luego vendrá un momento
de puesta en común, explicación y/o teoría.
• Es importante que el alumno se proponga resolver cada actividad pedida. No necesariamente el alumno sentirá que sabe cómo
se hace. Sin embargo la actividad tiene cierta cercanía con lo que sí sabe hacer. Es importante también que en cada resolución
figuren los procedimientos empleados, las justificaciones necesarias y la respuesta claramente enunciada.
• Una actividad en blanco es una actividad no hecha. Si frente a una actividad el bloqueo es tal que no le permite ni siquiera em-
pezar, debe intentar anotar alguna pregunta o algún pensamiento relacionado con la actividad.
• El hecho de que una actividad esté hecha, no significa que esté bien, y el hecho de que esté bien, no significa que se haya
aprendido algo. Por tal motivo es necesario que el alumno participe activamente durante los momentos de puesta en común.
• Participar en clase no significa hablar sin haber pensado lo que se quiere decir. Sino que significa: solicitar participación para
responder alguna pregunta, para hacerla o para realizar un comentario oportuno; decir aquello que primero se haya pensado o
resuelto por escrito; escuchar atentamente las preguntas del profesor y los compañeros, escuchar atentamente las intervenciones
de los compañeros para poder estar de acuerdo o no con lo que se menciona. Agregar en la carpeta aquello que se haya discuti-
do en la clase y/o aquello que el profesor sugiera.
• Si los padres quieren ayudar en casa con la realización de la tarea, no deben resolver las actividades por sus hijos. No hay
aprendizaje en ese caso y el profesor no se entera qué tipo de dificultades enfrentan los alumnos. Pueden realizar sugerencias,
pedir que sus hijos expliquen qué se realizó en clases, o ayudar a formular las preguntas que luego harán los alumnos durante la
clase siguiente, etc.
• Cada alumno debe contar con su propio material. La falta entorpece su propio trabajo y la solicitud en préstamo a un compañero
entorpece la de éste. En actividades de evaluación, ante la falta del materiales como calculadora, elementos de geometría, tablas
periódicas, tabla de datos, lapicera, correctores, hojas, etc. no se permitirá solicitar dichos elementos una vez comenzada la
evaluación.
• Se fomenta la colaboración entre pares. Los alumnos no son meros receptores de lo que otro (profesor o alumno) diga sobre al-
gún conocimiento. Es importante que se escuchen los argumentos, se analicen, se discuta, se concluya.
• El profesor entiende que la ausencia del alumno es siempre justificada (Es decir, no se concibe la ausencia por irresponsabili-
dad). La justificación de la ausencia no exime al alumno de reemplazar la clase. En tal sentido, ante ausencia del alumno a cla-

Prof. Martín Chacón 3


Escuela de Educación Técnica Henry Ford – 2019 Pautas de Trabajo –Matemática Aplicada 6º ET

se, éste es responsable por tomar conocimiento de las actividades realizadas en clase y dadas de tareas, las conclusiones arriba-
das, etc. y todo aquello que deba figurar en la carpeta; así como también, de anotar las fechas de evaluaciones, entregas, etc.

Evaluación y calificación
• Periódicamente se realizará una actividad de evaluación que involucrará los contenidos trabajados hasta la clase anterior. Esta
evaluación no será avisada previamente. Podrá ser oral o escrita; a todo el grupo o a algunos alumnos. Podrá incluir el visado de
carpeta y/o de los materiales de trabajo. La calificación de esta evaluación conformará una nota de desempeño global.
• Se avisará con al menos una semana de anticipación la fecha de toma de cada Examen Escrito y los temas y ejercicios que abar-
ca.
• Es posible que antes de finalizar cada trimestre se tome una evaluación (evaluación trimestral), según lo disponga cada docente,
con todos los temas que se hayan trabajado durante el mismo (Si los temas lo ameritan puede tener carácter de integrador) (Pue-
de incluir algún tema que sí haya sido trabajado y no haya sido evaluado con anterioridad).
• Existen materias para las que oficialmente debe tomarse un examen final integrador. Se informará oportunamente cuáles son ta-
les materias.
• La ausencia a una evaluación acordada con anterioridad será calificada con un 1 (uno).
• La ausencia justificada deberá ser notificada al docente (previamente a la ausencia si fuera posible)
• Las ausencias por enfermedad deben ser debidamente justificadas y deberá presentarse en la clase siguiente.
• El examen trimestral será considerado como recuperatorio según quien lo necesite.
• Como se especificó más arriba nuestras clases están pensadas para estudiantes activos. Entendemos por estudiante activo aquel
que de manera sostenida muestra el cumplimiento de las actividades dentro y fuera del aula. Esta pro-actividad es la que se debe
observar clases a clase para que sea tenida en cuenta en la nota del desempeño global. Esta nota podrá ser de 1 a 10 y es la que
permitirá subir o bajar el promedio de las demás notas.
• La calificación del trimestre se obtiene del promedio de las notas.
• El ciclo lectivo comienza en marzo y finaliza en febrero del año siguiente. Las instancias de examen de diciembre y febrero no
son un castigo. Es importante que los alumnos puedan mostrar cierto dominio de lo trabajado. Y algunas veces es necesario que
se vuelvan a preparar los temas. Es preferible que el alumno dedique un poco más de tiempo para terminar de aprender que se-
guir avanzando con los conocimientos adquiridos en forma inconclusa.
• Es requisito presentar la carpeta completa, trabajos prácticos e informes de laboratorio en las condiciones indicadas anterior-
mente para rendir examen en cualquier instancia.

Apellido y nombre del alumno Firma del padre, madre o tutor Firma del profesor

Prof. Martín Chacón 4


Escuela de Educación Técnica Henry Ford – 2019 Programa – Matemática Aplicada 6º ET

Programa

Expectativas de logro

Se espera que al finalizar el año los año las/los estudiantes


• Analicen funciones estudiando su dominio (discreto o continuo), su imagen, puntos extremos, puntos
de inflexión, concavidad, etc. utilizando la función derivada como herramienta.
• Calculen integrales indefinidas.
• Realicen pasaje de distintos formatos algebraicos, cuando sea posible.
• Construyan la fórmula de la función a partir de datos dados, cuando sea posible.
• Analicen situaciones a partir del cálculo de medidas de tendencia central y de dispersión.
• Adviertan las limitaciones de las medidas de tendencia central.
• Apliquen técnicas de conteo para el cálculo de probabilidades.
• Resuelvan problemas a partir de modelos binomiales y normales.

Contenidos

Bloque 1: Análisis
Unidad 1.0: Cálculo de integrales. Indefinidas. Métodos de integración: Sustitución, partes. Definidas.
Impropias.
Unidad 1.1: Análisis de funciones. Dominio natural. Ceros de una función. Límite y continuidad.
Asíntotas horizontales, verticales y oblicuas. Crecimiento, decrecimiento, extremos locales y globales,
concavidad, puntos de inflexión a través de criterios de la derivada primera y segunda. Regla de
L’Hopital. Gráfica de una función y su derivada. Modelización de fenómenos del mundo real y de otras
áreas usando funciones.

Bloque 2: Estadística
Unidad 2.1: Conceptos básicos. Población. Muestra. Variable: cualitativa, cuantitativa, discreta, con-
tinua. Datos. Experimento. Parámetro. Estadístico. Distribución. Medidas de tendencia central: media,
mediana, moda, rango medio. Medidas de dispersión: rango, desviación desde la media, varianza mues-
tral, desviación muestral estándar, calificación estándar. Regla empírica. Teorema de Chebyshev.
Unidad 2.2: Probabilidad. Probabilidad empírica y teórica. Espacio muestral. Evento. Probabilidad
condicional. Independencia de eventos. Eventos mutuamente excluyentes.
Unidad 2.3: Distribuciones de probabilidad (variables discretas). Variable aleatoria discreta. Dis-
tribuciones de probabilidad de variable aleatoria discreta. Función de probabilidad. Propiedades. Dis-
tribución de probabilidad binomial. Números combinatorios. Función de probabilidad binomial.
Unidad 2.4: Distribuciones de probabilidad (variables continuas). Distribución normal. Función de
densidad. Distribución normal estándar.

Bibliografía

Para la confección de actividades


Albione, M; Gregoret, A; Nuñez, A; Vitale, B. (2006). Análisis Matemático 1. Módulo II. Cs. Básicas. U. D. B.
Matemática. Universidad Tecnológica Nacional. Facultad Regional Buenos Aires: CEIT.
Altman, S; Comparatore, C y Kurzrok, L. (2005). Matemática 5: Análisis 1. 1a ed. Buenos Aires: Longseller.
Altman, S; Comparatore, C y Kurzrok, L. (2005). Matemática 6: Análisis 2. 1a ed. Buenos Aires: Longseller.

Prof. Martín Chacón 5


Escuela de Educación Técnica Henry Ford – 2019 Programa – Matemática Aplicada 6º ET

Aragón, A; Pinasco, J; Schifini, C; Varela, A. (2004). Introducción a la matemática para el Primer Ciclo Univer-
sitario. 1ª ed. Buenos Aires Universidad Nacional de General Sarmiento.
Johnson, R; Kuby, P. (2008). Estadística elemental: Lo esencial. (Traducción de Romo Muñoz, J) 10ma ed.
CENGAGE Learning. México.

Recomendada para los estudiantes


Cualquiera de los textos citados anteriormente.

Cronograma
MAR ABR MAY JUN JUL AGO SEP OCT NOV

Unidad 1.0

Unidad 1.1

Receso Invernal
Unidad 2.1

Unidad 2.2

Unidad 2.3

Unidad 2.4

El cronograma es simplemente estimativo e incluye las actividades de evaluación.

Prof. Martín Chacón 6


Escuela de Educación Técnica Henry Ford – 2019 Análisis – Matemática Aplicada 6º ET

Bloque 1: Análisis

Unidad 1.0: Cálculo de integrales indefinidas

1) Definición: Llamaremos integral indefinida de una función f al conjunto de todas las primitivas de
f. Para simbolizarlo, escribimos ∫ 𝑓(𝑥)𝑑𝑥.

2) Calculá las siguientes integrales por sustitución. n y m son números reales.


cos(ln (x )) g)  e5 x dx 1
a)  dx m)  2 dx
x m + x2
h)  e dx
( )
m x+ n

sin x − 10 n) 
1
b)  dx dx
x i)  x x + 3dx
2
m − x2
2

c)  tan (x )dx x2 o) 
(ln (x ))
3

j)  3 dx dx
d)  cos(mx + n )dx 2 x + 3 x
k)  3xe − x dx x
2

p) 
e)  sin (mx + n )dx 1 + x4
dx
1
ln (x ) l)  dx q)  sin 2 (x )cos(x )dx
f)  dx 9 + x2
x

3) Calculá las siguientes integrales por partes.


a)  x 2 cos(x )dx e)  (5 x + 2 ) cos(x )dx i)  arctan(x )dx
 x sin (x )dx  xe dx  x e dx
2 − x +5 2 x
b) f) j)

 e sin (x )dx  x ln (x )dx  x ln (x )dx


x 3
c) g) k)

 ln (x )dx  x sin (x )dx  sin (x )dx


2
d) h) l)

1
𝑠𝑖 1 ≤ 𝑥 ≤ 4 +∞
4) Sea 𝑓: ℝ → [0, +∞): 𝑓(𝑥) = { 3 , calculá ∫−∞ 𝑓(𝑥)𝑑𝑥.
0 𝑠𝑖 𝑥 < 1 𝑜 𝑥 > 4

5) Definí una función 𝑓 en ℝ tal que para todo 𝑥 < 2 y para todo 𝑥 > 7, resulte 𝑓(𝑥) = 0 y para el
+∞
resto de los valores 𝑥, valga 𝑓(𝑥) = 𝑘 con 𝑘 constante. Además, ∫−∞ 𝑓(𝑥)𝑑𝑥 = 1.
𝑥
a) Da la expresión de 𝐹: ℝ → [0,1]: 𝐹(𝑥) = ∫−∞ 𝑓(𝑡)𝑑𝑡

1 𝜋 𝜋
cos(𝑥) 𝑠𝑖 − ≤ 𝑥 ≤
2 2 2
6) Sea la función 𝑓: ℝ → [0, +∞): 𝑓(𝑥) = { 𝜋 𝜋 .
0 𝑠𝑖 𝑥 < − 2 𝑜 𝑥 > 2
+∞
a) Calculá ∫−∞ 𝑓(𝑥)𝑑𝑥
𝑥
b) Da la expresión de 𝐹: ℝ → ℝ: 𝐹(𝑥) = ∫−∞ 𝑓(𝑡)𝑑𝑡
𝜋
c) Calculá ∫04 𝑓(𝑥)𝑑𝑥

Prof. Martín Chacón 7


Escuela de Educación Técnica Henry Ford – 2019 Análisis – Matemática Aplicada 6º ET

Unidad 1.1: Análisis de funciones

7) A continuación, se presentan seis gráficas de funciones y seis expresiones. Relacioná cada gráfico
con la expresión correspondiente. Justificá.

a) d)

b) e)

c) f)
(x + 1) si x  1
2
(x + 1)2 si x  1
i) f: R–{1} → R; f(x) =  iv) f: R–{1} → R; f(x) = 
− x + 3 si x  1 − x + 5 si x  1
(x + 1)2 si x  1 (x + 1)2 si x  1
ii) f: R → R; f(x) =  v) f: R→ R; f(x) = 
− x + 5 si x  1 − x + 3 si x  1
(x + 1)2 si x  1 (x + 1)2 si x  1
 vi) f: R→ R; f(x) = 
iii) f: R → R; f(x) = 2 si x = 1 − x + 3 si x  1
− x + 5 si x  1

8) Para cada una de las funciones del ejercicio 7) calculá, si es posible, lo siguiente:
a) f(1) b) lim+ f (x ) c) lim− f (x ) d) lim f ( x )
x →1 x →1 x →1

9) ¿Cuáles de las funciones del ejercicio 7) son continuas en x = 1?

Prof. Martín Chacón 8


Escuela de Educación Técnica Henry Ford – 2019 Análisis – Matemática Aplicada 6º ET

10) ¿Qué relación podés encontrar entre la continuidad de una función en un punto y lo realizado en los
ejercicios 7), 8) y 9)?

11) Definición: Diremos que una función f es continua en x0 si se cumplen (a la vez) las siguientes con-
diciones:
a) Existe 𝑓(𝑥0 ).
b) Existe lim 𝑓(𝑥) = 𝑙, con 𝑙 ∈ ℝ.
𝑥→𝑥0
c) 𝑓(𝑥0 ) = 𝑙.
Si una función no cumple con alguna de las tres condiciones anteriores diremos que es discontinua
en 𝑥0 .

12) Definición: Diremos que una función f es continua en (a; b) si es continua en todo x  (a; b).

13) Definí una función por tramos, cuyo dominio sea ℝ, que sea discontinua en los valores de x que
pertenezcan al borde de cada tramo.

14) Definí una función por tramos, cuyo dominio sea ℝ, que sea continua en los valores de x que perte-
nezcan al borde de cada tramo.

15) Para cada una de las siguientes funciones 𝑓: ℝ → ℝ, determiná si son continuas en los valores de x0
y x1 indicados. Hacelo analíticamente.
𝑥 − 2, 𝑥 < −2 1
a) 𝑓(𝑥) = { 2  si x  0
𝑥 + 1, 𝑥 ≥ −2 e) f (x ) =  x
Para x0 = –4; x1 = –2 1 si x = 0
3𝑥 + 4, 𝑥 < 2
b) 𝑓(𝑥) = { Para x0 = 0; x1 = 1
2𝑥 − 1, 𝑥 ≥ 2
Para x0 = –3; x1 = 2 0, 𝑥 = 0
2 f) 𝑓(𝑥) = { 1
, 𝑥<1 sin ( ) , 𝑥 ≠ 0
c) 𝑓(𝑥) = { 𝑥−1 𝑥
2𝑥 − 1, 𝑥 ≥ 1 Para x0 = 0; x1 = 1
Para x0 = 0; x1 = 1 𝑥 2 −2𝑥−3
, 𝑥 ≠1𝑦𝑥 ≠3
2 − 3𝑥, 𝑥 ≤ 3 g) 𝑓(𝑥) = {𝑥 2 −4𝑥+3
d) 𝑓(𝑥) = {−𝑥 2 −𝑥+12 0, 𝑥 = 1 𝑜 𝑥 = 3
𝑥−3
, 𝑥 > 3 Para x0 = 1; x1 = 3
Para x0 = 3; x1 = 5 1
1 , 𝑥 ≠ 0 𝑦 𝑥 ≠ −1
h) 𝑓(𝑥) = {𝑒−𝑒 𝑥+1
0, 𝑥 = 0 𝑜 𝑥 = −1
Para x0 = 0; x1 = –1

16) Teniendo presente las funciones definidas en el ejercicio 15), para los casos en los que f resulte dis-
continua en x0 y/o en x1, redefiní f(x0) y f(x1) para que f resulte continua, si fuera posible. En caso de
no ser posible tal redefinición, explicá por qué.

17) Teniendo en cuenta la definición de continuidad en un punto dada en el ítem 11) y observando lo
realizado en el ejercicio 16) ¿cuál o cuáles de las condiciones se deben cumplir para que sea posible
redefinir una función (en una cantidad finita de valores del dominio) y que resulte continua?

Prof. Martín Chacón 9


Escuela de Educación Técnica Henry Ford – 2019 Análisis – Matemática Aplicada 6º ET

18) Definición: Sea una función f discontinua en x0. Diremos que f tiene una discontinuidad evitable en
x0 si existe lim f (x ) y es un número real. En caso contrario diremos que f tiene una discontinuidad
x → x0

esencial. (Es decir, si no existe lim f (x ) o existe pero es ∞).


x → x0

19) Para las funciones del ejercicio 15), y en los casos en los que exista discontinuidad en x0, decidí si
se trata de una discontinuidad evitable o esencial.

20) Si es posible, hallá todos los valores de 𝑘 ∈ ℝ para que las siguientes funciones de ℝ en ℝ resulten
continuas en todo su dominio.
2 x + 1 si x  2 
a) f ( x ) =  5(x + k ) si x  0
k  x si x  2
2

2 x + 1 si x  k e) f ( x ) =  k  x si 0  x  8
  x 2 − 32
b) f ( x ) =  2 5 
x+ si x  k si x  8

3 3  x−4
 − x 3 + 9 x 2 − 18 x + 10  x2 − 9
 si x  3  x + 3 si x  k
c) f ( x ) =  x−3 f) f ( x ) = 
k si x = 3  7 x + 1 si x  k

 3
 x + 1 si x  1
d) f (x ) =  
3 − k  x si x  1
2
 x 2 + k si x  0

g) f (x ) =  k  x + 4 si 0  x  4
 x 2 − 16
 si x  4
 x−4

21) Proposición: Regla de L’Hôpital.


a) Si f y g son funciones derivables en un entorno de x0, g’(x) ≠ 0 para todo x ≠ x0 en dicho en-
𝑓′(𝑥) 𝑓(𝑥)
torno, lim 𝑓(𝑥) = lim 𝑔(𝑥) = 0 y existe y es finito lim 𝑔′(𝑥) entonces vale que lim 𝑔(𝑥) =
𝑥→𝑥0 𝑥→𝑥0 𝑥→𝑥0 𝑥→𝑥0
𝑓′(𝑥)
lim .
𝑥→𝑥0 𝑔′(𝑥)
b) Si f y g son funciones derivables en un entorno de x0, g’(x) ≠ 0 para todo x ≠ x0 en dicho en-
𝑓′(𝑥) 𝑓(𝑥)
torno, lim 𝑓(𝑥) = lim 𝑔(𝑥) = ∞ y existe y es finito lim 𝑔′(𝑥) entonces vale que lim 𝑔(𝑥) =
𝑥→𝑥0 𝑥→𝑥0 𝑥→𝑥0 𝑥→𝑥0
𝑓′(𝑥)
lim .
𝑥→𝑥0 𝑔′(𝑥)
c) Estas reglas también se cumplen cuando x tiende a infinito.

22) Calculá los siguientes límites.


𝑒 𝑥 −𝑒 −𝑥 𝑒 𝑥 +1 c) lim 𝑥 −2 ln(𝑥)
a) lim b) lim 𝑥→+∞
𝑥→+∞ 𝑒 𝑥 +𝑒 −𝑥 𝑥→+∞ 2𝑒 𝑥 −5

23) Definición: Decimos que la recta y = a es asíntota horizontal de una función f si lim 𝑓(𝑥) = 𝑎
𝑥→±∞
Observación: Una función podría tener dos asíntotas horizontales diferentes según si se calcula el
límite con 𝑥 → +∞ o 𝑥 → −∞. Por ejemplo, 𝑓: ℝ → ℝ; 𝑓(𝑥) = atan(𝑥). ¿Cuáles son las ecuacio-
nes de las asíntotas horizontales para esta función?

Prof. Martín Chacón 10


Escuela de Educación Técnica Henry Ford – 2019 Análisis – Matemática Aplicada 6º ET

24) Definición: Decimos que la recta x = b es asíntota vertical de una función f si lim 𝑓(𝑥) = ∞.
𝑥→𝑏
Observación: Posibles valores b para los cuáles la función f puede tener una asíntota vertical son
aquellos tales que f no es continua en b.

25) Hallá, si existen, las asíntotas horizontales y verticales de las siguientes funciones de A en R. Da el
dominio natural A de cada una.
3𝑥+2 4
a) 𝑓1 (𝑥) = d) 𝑓4 (𝑥) = 3𝑥 2 −9𝑥−30 g) 𝑓7 (𝑥) = ln[(𝑥 − 1)2 ]
𝑥+1 √𝑥 2 +2
√𝑥 2 +1 7𝑥+5 h) 𝑓 (𝑥) =
b) 𝑓2 (𝑥) = 𝑥+1 e) 𝑓5 (𝑥) = 8 𝑥+3
3𝑥 2 −9𝑥+30
𝑥 2 +𝑥−6 2𝑥 2
c) 𝑓3 (𝑥) = f) 𝑓6 (𝑥) =
𝑥+3 𝑥−5

26) Para cada ítem, da lo que se pide, si es posible. Mostrá que lo dado cumple con lo pedido o explicá
por qué no es posible.
a) Da la fórmula de dos funciones distintas que tengan simultáneamente asíntotas en y = 2 e y = ˗2
b) Da la fórmula de dos funciones distintas que tengan simultáneamente asíntotas en x = 2 e y = ˗2
c) Da la fórmula de una función f que tenga asíntota en y = 3 y tal que no haya intersecciones entre
el gráfico de f y la asíntota.
d) Da la fórmula de una función f que tenga asíntota en y = 3 y tal que haya intersecciones entre el
gráfico de f y la asíntota.

27) Definición: Decimos que la recta y = a x + b es asíntota oblicua de una función f si lim [𝑓(𝑥) −
𝑥→±∞
(𝑎𝑥 + 𝑏)] = 0

𝑓(𝑥)
28) Proposición: Si la recta y = a x + b es asíntota oblicua de una función f entonces, 𝑎 = lim y
𝑥→∞ 𝑥
𝑏 = lim [𝑓(𝑥) − 𝑎𝑥].
𝑥→∞
Esto da una forma de hallar las asíntotas oblicuas de una función si las tuviera. Veamos una demos-
tración de esta proposición. Dado que y = a x + b es asíntota oblicua de f entonces, por la definición
𝑓(𝑥)−(𝑎𝑥+𝑏)
dada en 27), vale que lim [𝑓(𝑥) − (𝑎𝑥 + 𝑏)] = 0. Pero también vale que lim [ ] = 0.
𝑥→±∞ 𝑥→±∞ 𝑥
𝑓(𝑥) 𝑏 𝑓(𝑥)
(¿Por qué?). Usando álgebra de los límites tenemos 0 = lim [ 𝑥
− 𝑎 − 𝑥 ] = lim −
𝑥→±∞ 𝑥→±∞ 𝑥
𝑏 𝑏 𝑓(𝑥)
lim 𝑎 − lim . Y como lim 𝑎 = 𝑎 y lim = 0, entonces tenemos que lim − 𝑎 = 0. Y
𝑥→±∞ 𝑥→±∞ 𝑥 𝑥→±∞ 𝑥→±∞ 𝑥 𝑥→±∞ 𝑥
𝑓(𝑥)
por lo tanto, lim = 𝑎. Por otro lado, nuevamente por la definición dada en 27), vale que
𝑥→±∞ 𝑥
lim [𝑓(𝑥) − (𝑎𝑥 + 𝑏)] = 0. Entonces, usando álgebra de límites tenemos que lim (𝑓(𝑥) − 𝑎𝑥) −
𝑥→±∞ 𝑥→±∞
lim 𝑏 = 0. Entonces, lim (𝑓(𝑥) − 𝑎𝑥) − 𝑏 = 0. Y por lo tanto, lim (𝑓(𝑥) − 𝑎𝑥) = 𝑏.//
𝑥→±∞ 𝑥→±∞ 𝑥→±∞

29) Para cada una de las siguientes funciones de A en R, calculá, si es posible, las asíntotas verticales,
horizontales y oblicuas. Da el dominio natural A de cada una.
a) 𝑓 (𝑥) =
𝑥2
e) 𝑓 (𝑥) =
𝑥 4 −3 i) 𝑓9 (𝑥) = −4 ∙ 2𝑥 + 5
1 𝑥−3 5 𝑥 1
4𝑥+2
b) 𝑓2 (𝑥) = 𝑥 2 −2𝑥+2 𝑥 2 +3𝑥 j) 𝑓10 (𝑥) = 𝑒 𝑥
f) 𝑓6 (𝑥) =
𝑥−3 k) 𝑓11 (𝑥) = log 3 (𝑥) + 4
𝑥 2 +4 𝑥 2 +1
c) 𝑓3 (𝑥) =
𝑥−5 g) 𝑓7 (𝑥) = l) 𝑓12 (𝑥) = ln(𝑥 2 + 1)
√𝑥−1
𝑥 3 +3𝑥+5 𝑥
d) 𝑓4 (𝑥) = 2𝑥 2 +3𝑥+2 h) 𝑓8 (𝑥) =
√𝑥+3

Prof. Martín Chacón 11


Escuela de Educación Técnica Henry Ford – 2019 Análisis – Matemática Aplicada 6º ET

30) Definiciones: Intervalos de crecimiento y decrecimiento.


a) Decimos que un intervalo abierto I es un intervalo de crecimiento de la función f si
I  Dom( f ) y, además, para cualquier par de valores 𝑎, 𝑏 ∈ 𝐼, con a < b, se verifica que
f(a) < f(b).
b) Decimos que un intervalo abierto I es un intervalo de decrecimiento de la función f si
I  Dom( f ) y, además, para cualquier par de valores 𝑎, 𝑏 ∈ 𝐼, con a < b, se verifica que
f(a) > f(b).

31) Definiciones: Extremos, máximos y mínimos.


a) Decimos que la función f alcanza un máximo relativo en x = c si existe un intervalo I con
c  I  Dom( f ) tal que para todo 𝑥 ∈ 𝐼, 𝑥 ≠ 𝑐 se verifica que f(x) < f(c).
b) Decimos que la función f alcanza un mínimo relativo en x = c si existe un intervalo I con
c  I  Dom( f ) tal que para todo 𝑥 ∈ 𝐼, 𝑥 ≠ 𝑐 se verifica que f(x) > f(c).
c) Decimos que la función f alcanza un máximo absoluto en x = c si c Dom( f ) y para todo 𝑥 ∈
𝐷𝑜𝑚(𝑓), 𝑥 ≠ 𝑐 se verifica que f(x) < f(c).
d) Decimos que la función f alcanza un mínimo absoluto en x = c si c Dom( f ) y para todo 𝑥 ∈
𝐷𝑜𝑚(𝑓), 𝑥 ≠ 𝑐 se verifica que f(x) > f(c).
e) Decimos que c es un extremo relativo/absoluto si c es un máximo o mínimo relativo/absoluto.

32) Usá GeoGebra.


a) Ingresá la función cuya fórmula es 𝑓(𝑥) = 𝑥 3 + 8𝑥 2 + 11𝑥 − 20.
b) Dibujá un punto A sobre la gráfica usando el botón punto sobre objeto.
c) Graficá la recta tangente a la gráfica de f que contiene al punto A usando el botón tangentes.
d) Mové el punto sobre la gráfica de f y observa qué sucede con la recta tangente en los intervalos
de crecimiento y decrecimiento de la función. Relaciona lo que observaste con la proposición
del siguiente ítem.

33) Proposiciones sobre el crecimiento de una función. Sea f una función derivable en un intervalo 𝐼 ∈
𝐷𝑜𝑚(𝑓) y sea 𝑐 ∈ 𝐼.
a) I es un intervalo de crecimiento de f si y solo si para todo c se cumple que 𝑓 ′ (𝑐) ≥ 0.
b) I es un intervalo de decrecimiento de f si y solo si para todo c se cumple que 𝑓 ′ (𝑐) ≤ 0.
c) Si c es un extremo de la función f entonces se verifica que 𝑓 ′ (𝑐) = 0. Observá que no es cierto
que si 𝑓 ′ (𝑐) = 0 entonces f alcanza un extremo en c. Probá con 𝑓(𝑥) = 𝑥 3 en x = 0.

34) Definición: Llamaremos punto crítico de una función f a cada valor del dominio para los cuales la
función f posiblemente tiene un extremo.
Los puntos críticos de una función f son aquellos valores k del dominio para los cuales se cumple
que 𝑓 ′ (𝑘) = 0 o aquellos valores k para los cuales f no es derivable.

35) Da los puntos críticos y hallá los intervalos de crecimiento, de decrecimiento y extremos de cada
una de las siguientes funciones de A en R.
1
a) 𝑓1 (𝑥) = 4 𝑥 4 − 3𝑥 3 + 12𝑥 2 − 16𝑥 c) 𝑓3 (𝑥) =
𝑥3
𝑥3 , 𝑥>1
b) 𝑓2 (𝑥) = 𝑥 2 −1 {1 𝑥 2 −1

4
𝑥 4 − 3𝑥 3 + 12𝑥 2 − 16𝑥, 𝑥 ≤ 1
d) 𝑓4 (𝑥) = 𝑒 𝑥 (2𝑥 2 + 𝑥 + 1)
Prof. Martín Chacón 12
Escuela de Educación Técnica Henry Ford – 2019 Análisis – Matemática Aplicada 6º ET

𝑥2 𝑥2
e) 𝑓5 (𝑥) = 𝑥+1 h) 𝑓8 (𝑥) =
√𝑥+1
2 +4𝑥+3 𝑥
f) 𝑓6 (𝑥) = 5𝑒 −𝑥 i) 𝑓9 (𝑥) = ln(𝑥)
𝑥 2 +3
, 𝑥 < −1
g) 𝑓7 (𝑥) = { 𝑥+1
−𝑥
𝑥𝑒 , 𝑥 ≥ −1

36) Definiciones: Concavidad. Sea f una función derivable en 𝑐 ∈ 𝐷𝑜𝑚(𝑓). Sea 𝑦 = 𝑎𝑥 + 𝑏 la ecua-
ción de la recta tangente a la gráfica de f en el punto (𝑐; 𝑓(𝑐)).
a) Diremos que una función es cóncava o de curvatura positiva en c si existe un intervalo I alre-
dedor de c tal que para todo 𝑥 ∈ 𝐼, con 𝑥 ≠ 𝑐, vale que 𝑓(𝑥) − (𝑎𝑥 + 𝑏) > 0.
b) Diremos que una función es convexa o curvatura negativa en c si existe un intervalo I alrededor
de c tal que para todo 𝑥 ∈ 𝐼, con 𝑥 ≠ 𝑐, vale que 𝑓(𝑥) − (𝑎𝑥 + 𝑏) < 0.
c) Diremos que x0 es un punto de inflexión de f si f cambia su curvatura en x0.
d) Muestra con un dibujo qué significado tienen las tres definiciones anteriores.

37) Proposiciones (Sobre la curvatura): Sea f dos veces derivable en 𝐼 ∈ 𝐷𝑜𝑚(𝑓).


a) Si 𝑓′′(𝑥) > 0 para todo 𝑥 ∈ 𝐼, entonces f tiene curvatura positiva en I.
b) Si 𝑓′′(𝑥) < 0 para todo 𝑥 ∈ 𝐼, entonces f tiene curvatura negativa en I.

38) Estudiá la curvatura de las funciones dadas en el ejercicio 35).

39) Nos referiremos al estudio completo de una función f (o estudio de f) a obtener la siguiente infor-
mación de tal función (no necesariamente en el orden dado):
a) Dominio natural de f.
b) Conjuntos 𝐶+ (𝑓), 𝐶− (𝑓) y 𝐶0 (𝑓).
c) Continuidad de f, calculando y clasificando los puntos de discontinuidad.
d) Derivabilidad de f, incluyendo derivada segunda.
e) Puntos críticos.
f) Intervalos de crecimiento y de decrecimiento de f.
g) Cálculo y clasificación de extremos de f.
h) Curvatura de f.
i) Puntos de inflexión de f.
j) Existencia de asíntotas y, si existieran, cálculo de sus ecuaciones.
k) Toda otra información que pueda ser útil.
l) Representación gráfica en el que se señale todo lo anterior.

40) Realizá un estudio completo de las funciones del ejercicio 35).

41) Considerá el conjunto de todos los rectángulos de perímetro 100m.


a) Definí una función que dé el área de cada rectángulo en función de la base x.
b) Hallá el rectángulo de mayor área (dando la longitud de la base).

42) Se dispone de una cartulina cuadrada de lado a y se quiere hacer una caja sin tapa recortando cuatro
cuadraditos iguales de las esquinas y doblando sus lados. ¿Cuál debe ser la longitud del lado del
cuadradito que se recorta para que el volumen de la caja sea máximo? ¿Cuál es el volumen de la ca-
ja?

Prof. Martín Chacón 13


Escuela de Educación Técnica Henry Ford – 2019 Análisis – Matemática Aplicada 6º ET

43) Considerá el conjunto de todos los triángulos isósceles de perímetro 10cm y base x.
a) Definí una función que da el área de cada triángulo en función de la base x.
b) Hallá el triángulo (dando el valor de la base) que tiene la mayor área.

44) Considerá el conjunto de todos los triángulos en el que dos de sus lados miden 5cm y el tercero
mide x. ¿Cuál es el triángulo que tiene mayor área?

45) Realizá un estudio completo de las funciones de A en R cuyas expresiones son las siguientes.
1
a) 𝑓1 (𝑥) = 𝑥 ln(𝑥) −𝑥 𝑠𝑖 𝑥 ≤ −1
−𝑥
b) 𝑓2 (𝑥) = 𝑥𝑒 4 2
3 h) 𝑓8 (𝑥) = −𝑥 +3𝑥 −2
𝑠𝑖 − 1 < 𝑥 < 1
c) 𝑓3 (𝑥) = 𝑥 3 + 𝑥 2 −1
𝑥 1
2 𝑥≥1
d) 𝑓4 (𝑥) = 𝑒 −𝑥 { 𝑥2
𝑥 3 −6𝑥 2 +12𝑥−8 𝑥 2 −3𝑥−4
e) 𝑓5 (𝑥) = i) 𝑓9 (𝑥) = { 𝑠𝑖 𝑥 ≠ −2
𝑥 2 −1 𝑥+2
𝑥 2 −3𝑥−4 0 𝑠𝑖 𝑥 = −2
f) 𝑓6 (𝑥) = −𝑥 3 −5𝑥 2 −8𝑥−4
5𝑥+25 , 𝑠𝑖 𝑥 < −1
0 𝑠𝑖 𝑥 = −4 j) 𝑓10 (𝑥) = { 𝑥+1
g) 𝑓7 (𝑥) = {𝑥 4 −27𝑥 2 −14𝑥+120 𝑥𝑒 −𝑥−1
, 𝑠𝑖 𝑥 ≥ −1
𝑠𝑖 𝑥 ≠ −4 𝑥
𝑥+4 k) 𝑓11 (𝑥) = √𝑥 2
+1

Prof. Martín Chacón 14


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

Bloque 2: Estadística

Unidad 2.1: Conceptos básicos

46) Estadística: Es la ciencia que se encarga de obtener, describir e interpretar los datos.
No nos encargaremos de las fases de la obtención de datos, sino que trataremos temas de la estadís-
tica descriptiva y de la inferencial.

47) Términos básicos:


a) Población: es la colección, o conjunto, de individuos, objetos o eventos cuyas propiedades serán
analizadas. Tenemos dos tipos de poblaciones: finitas e infinitas.
b) Muestra: es un subconjunto de una población.
c) Variable (o variable de respuesta): es una característica de interés relacionada con cada elemen-
to individual de una población o muestra.
d) Dato: es el valor de la variable asociada a un elemento de una población o muestra. Este valor
puede ser un número, una palabra o un símbolo.
e) Datos: son el conjunto de valores que se obtienen de la variable a partir de cada uno de los ele-
mentos que pertenecen a la muestra o población.
f) Experimento: es una actividad planeada cuyos resultados producen un conjunto de datos.
g) Parámetro: es un valor numérico que resume todos los datos de una población completa.
h) Estadístico: es un valor numérico que resume los datos de la muestra.

48) Dada la siguiente situación, identificá cada uno de los ocho términos anteriores. El intendente de un
partido del conurbano de la provincia de Buenos Aires está interesado en conocer algo relacionado
con el ingreso promedio de los ciudadanos de su municipio. Para ello, contrata una empresa encues-
tadora que seleccionará 1000 habitantes.

49) Más conceptos


a) Variable cualitativa, de atributos o categórica: es una variable que clasifica o describe a un ele-
mento de una población.
i) Variable nominal: es una variable cualitativa que caracteriza (describe o identifica) a un
elemento de una población.
ii) Variable ordinal: es una variable que presenta una posición, o clasificación ordenada.
b) Variable cuantitativa o numérica: es aquella que cuantifica una propiedad de un elemento de
una población.
i) Variable discreta: es una variable cuantitativa que puede asumir una cantidad contable (o fi-
nita) de valores.
ii) Variable continua: es una variable cuantitativa que puede asumir una cantidad incontable de
valores.

50) Da varios ejemplos de cada uno de los cuatro tipos de variables dados.

51) Más conceptos:


a) Distribución: es el patrón de variabilidad que presentan los datos de una variable. La distribu-
ción exhibe la frecuencia de cada valor de la variable.

52) Realizá una presentación gráfica de la distribución de las notas obtenidas por el curso en el último
examen de esta materia. (Frecuencia vs. Calificación)

Prof. Martín Chacón 15


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

53) Medidas de tendencia central: son valores numéricos que localizan, en algún sentido, el centro de
un conjunto de datos.
a) Media (media aritmética): es el promedio de los valores. La media 𝑥̅ se encuentra al sumar to-
dos los valores de la variable 𝑥 y dividir la suma por la cantidad de valores.
𝑛

𝑥̅ = (∑ 𝑥𝑖 ) /𝑛
𝑖=1
b) Mediana: es el valor de los datos que ocupa la posición media cuando los datos están clasifica-
dos en orden de acuerdo con su tamaño. Usaremos como notación 𝑥̃. La profundidad es la posi-
ción que ocupa el valor de la mediana desde cualquiera de los extremos. Si la cantidad de valo-
res es par, entonces la mediana es igual al promedio de los dos valores centrales.
c) Moda: es el valor 𝑥 que se presenta con mayor frecuencia. Si dos o más valores presentan la
misma frecuencia más alta, decimos que no hay moda.
d) Rango medio: es el número que está exactamente a la mitad entre el dato de valor menor y el
dato de valor mayor.

54) Calculá las cuatro medidas de tendencia central de las notas obtenidas por el curso en el último
examen de esta materia. Da una interpretación de cada una. ¿Qué representan en la situación cada
una de ellas?

55) Medidas de dispersión: describen la dispersión, o variabilidad, que tienen los datos.
a) Rango: es la diferencia en valor entre los datos de valor más alto y los datos de valor más bajo.
b) Desviación desde la media (de un valor 𝑥𝑖 ): es la diferencia entre el valor 𝑥𝑖 y la media 𝑥̅ .
𝑥𝑖 − 𝑥̅ .
c) Desviación media absoluta: es la media de los valores absolutos de las desviaciones desde la
media.
𝑛

(∑|𝑥𝑖 − 𝑥̅ |) /𝑛
𝑖=1
d) Varianza muestral:
𝑛

𝑠 2 = (∑(𝑥𝑖 − 𝑥̅ )2 ) /(𝑛 − 1)
𝑖=1
e) Desviación muestral estándar:
𝑠 = √𝑠 2

56) Calculá el rango, la variación media absoluta y la desviación estándar de las notas obtenidas por el
curso en el último examen de esta materia.

57) Calificación estándar o calificación 𝑧: es la posición que un valor particular de la variable tiene res-
pecto de la media, medido en desviaciones estándar.
𝑥𝑖 − 𝑥̅
𝑧=
𝑠

58) Calculá la calificación estándar de tu nota obtenida en el último examen de esta materia.
Observación: la calificación estándar sirve para comparar, por ejemplo, dos notas obtenidas de dos
poblaciones diferentes.

Prof. Martín Chacón 16


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

59) Interpretación de la desviación estándar:


a) Regla empírica: Si una variable está normalmente distribuida, entonces:
i) Dentro de una (1) desviación estándar de la media habrá aproximadamente 68% de los da-
tos;
ii) Dentro de dos (2) desviaciones estándar de la media, habrá aproximadamente 95% de los
datos;
iii) Dentro de tres (3) desviaciones estándar de la media, habrá aproximadamente 99,7% de los
datos.
b) Teorema de Chebyshev: la proporción de cualquier distribución que se encuentre dentro de 𝑘
1
desviaciones estándar de la media es al menos 1 − 2 ; con 𝑘 > 1.
𝑘

60) Verificá si se cumple la regla empírica en la distribución de las notas del último examen de este
curso en esta materia. Además, verificá el teorema de Chebyshev.

61) Para las notas de otros dos exámenes calculá las medidas de tendencia central, de dispersión, verifi-
cá si se cumple la regla empírica y verificá el teorema de Chebyshev para k = 1, 2, 3.

62) Explicá por qué sucede que la calificación z para un valor que pertenece a una distribución normal
por lo general está entre –3 y +3.

63) La duración media de cierto neumático es de 30000 km y la desviación estándar es de 2500 km. Si
suponemos que las distancias están normalmente distribuidas, ¿aproximadamente qué porcentaje de
estos neumáticos durará entre 22500 y 37500 km?

64) El tiempo promedio de limpieza para el personal de una empresa de tamaño medio es 84,0 horas y
la desviación estándar es 6,8 horas. Suponé que la regla empírica es apropiada en este caso. ¿Qué
proporción de las veces se tardará 97,6 horas o más en limpiar la planta?

Unidad 2.2: Probabilidad

65) Definiciones.
a) Probabilidad de que ocurra un evento: es la frecuencia con la que puede esperarse que el evento
ocurra.
𝑛(𝐴)
b) Probabilidad empírica: P’(A) = 𝑛 ; donde n(A) es el número de veces que A ocurrió y n es la
cantidad de intentos.
𝑛(𝐴)
c) Probabilidad teórica: P(A) = 𝑛(𝑆) ; donde n(A) es el número de veces que A ocurre en el espacio
muestral y n(S) es la cantidad de elementos del espacio muestral. Un espacio muestral es una
lista de todos los posibles resultados del experimento bajo consideración.

66) Considerá el caso de tirar un dado. Definimos el evento A como la obtención de un número mayor
de 4. Calcula P(A).

67) Se tiran dos dados. Definimos el evento Ai como la suma de ambos dados es i (con i desde 2 a 12).
Calculá P(Ai) para cada i.

Prof. Martín Chacón 17


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

68) ¿Cuál es la probabilidad de que al menos uno de los tres hijos de una familia sea varón?

69) Observación:
a) 0 ≤ P(A) ≤ 1
b) P(A) = 0 si A no puede ocurrir.
c) P(A) = 1 si A ocurre siempre.
d) ∑𝑛𝑖=1 𝑃(𝐴𝑖 ) = 1 siempre que los eventos sean mutuamente excluyentes.

70) Una caja contiene bolitas de cinco colores diferentes: rojo, verde, azul, amarillo y negro. Asigná
probabilidades a cada color en el espacio muestral en cada caso:
a) Si hubiera un número igual de cada color.
b) Si hubiera el doble de rojo que de verde, el doble de verde que de azul, el doble de azul que de
amarillo, el doble de amarillo que de negro.
c) Si hubiera la misma cantidad de bolitas rojas, verdes y azules, el doble de amarillo y el triple de
negro.

71) Se tiran dos monedas al aire. Da el espacio muestral y la probabilidad de que suceda cada evento:
a) A = “Sale dos caras”.
b) B = “Sale al menos una cara”.
c) C = “No sale cara”.

72) Un club ofrece varios niveles de lecciones de natación todo el año. La cantidad de participantes de
cada nivel del turno matutino se muestra en la siguiente tabla:
Nivel Cantidad de participantes
Bebés 15
Bebés muy pequeños 12
Renacuajos 12
Nivel 2 15
Nivel 3 10
Nivel 4 6
Nivel 5 2
Nivel 6 1
Adultos 4
Se selecciona al azar un participante, encontrá la probabilidad de lo siguiente:
a) El participante está en bebés muy pequeños.
b) El participante está en la lección para adultos.
c) El participante está en una lección de nivel 2 a nivel 6.

73) Consideremos una urna que contiene 4 bolillas rojas y 5 blancas. De las 4 bolillas rojas, 2 son lisas
y 2 rayadas y de las 5 bolillas blancas, 4 son lisas y una sola es rayada. Se extrae una bolilla y, sin
que la hayamos mirado, alguien nos dice que la bolilla es roja, ¿cuál es la probabilidad de que la
bolilla sea rayada?

74) En general, dado un experimento y su espacio muestral asociado, queremos determinar cómo afecta
a la probabilidad de A el hecho de saber que ha ocurrido otro evento B. Definición: Sean A y B
eventos tales que P(B) > 0, la probabilidad del evento A condicional a la ocurrencia del evento B es
𝑃(𝐴∩𝐵)
𝑃(𝐴/𝐵) = 𝑃(𝐵) .

Prof. Martín Chacón 18


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

75) Propiedades:
a) P(no A) = 1 – P(A)
b) P(A o B) = P(A) + P(B) – P(A y B)

76) ¿Cuál es la probabilidad de sacar tres caras al lanzar tres monedas sabiendo que una de ellas es ca-
ra?

77) En la generala se tiran 5 dados y se ganan puntos de acuerdo a los que salga. Una de las tiradas con
puntaje es el full, es decir tres dados con el mismo número y los otros dos dados con igual números
entre sí pero distintos a los anteriores. Da las probabilidades de los siguientes eventos.
a) Sacar full en la primera mano.
b) Sacar full dado que se tienen exactamente tres dados iguales.
c) Sacar full dado que se tienen exactamente dos dados iguales.

78) Al lanzar tres dados, ¿cuál es la probabilidad de que la suma sea 12 sabiendo que uno de los dados
es 3?

79) Propiedades: (Sean A y B dos eventos no vacíos definidos en un mismo espacio muestral):
En el caso de que los eventos A y B sean mutuamente excluyentes (esto es, si ocurre A, entonces no
puede ocurrir B, y viceversa, lo que significa que P(A y B) = 0), la propiedad de P(A o B) es la siguien-
te:
a) P(A o B) = P(A) + P(B) – P(A y B) = P(A) + P(B)
En el caso de que los eventos A y B sean independientes (es decir, el hecho de que ocurra o no ocurra A
no afecta al suceso B, y por consiguiente 𝑃(𝐴/𝐵) = 𝑃(𝐴/𝑛𝑜 𝐵) = 𝑃(𝐴)), la propiedad de P(A y B) es:
b) P(A y B) = 𝑃(𝐴/𝐵) ∙ 𝑃(𝐵) = 𝑃(𝐴) ∙ 𝑃(𝐵)

80) Da un ejemplo de eventos mutuamente excluyentes y un ejemplo de eventos independientes.

Unidad 2.3: Distribuciones de probabilidad (variables discretas)

81) Consideremos lanzar cinco monedas al aire y llamemos x a la cantidad de secas que salen. Observar
que x puede tomar los valores 0, 1, 2, 3, 4 o 5. Sea y el número de llamadas telefónicas por día que
recibe una empresa. Los posibles valores para y van desde 0 a algún número natural muy grande. Si
z es el tiempo en segundos de la última conversación telefónica que tuvieron los empleados de una
empresa, notemos que z puede tomar valores de 0 en adelante. En las situaciones anteriores x, y, z
son variables aleatorias, x e y discretas, y z continua.
a) Variable aleatoria: es una variable que toma un valor numérico único para cada uno de los re-
sultados del espacio muestral de un experimento de probabilidad.
i) Variable discreta aleatoria: es una variable cuantitativa aleatoria que puede tomar una canti-
dad contable de valores.
ii) Variable continua aleatoria: es una variable cuantitativa aleatoria que puede tomar una can-
tidad incontable de valores.

82) Consideremos el experimento de lanzar cinco monedas y sea x a la cantidad de secas que salen.
Calculá la probabilidad de que x = 0, x = 1, x = 2, x = 3, x = 4 y x = 5.

Prof. Martín Chacón 19


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

83) Definición. Distribución de probabilidad: en una distribución de probabilidades asociamos una pro-
babilidad a cada uno de los valores de una variable aleatoria. La distribución de probabilidades es
una distribución teórica que se usa para representar poblaciones.

84) Propiedades de las funciones de probabilidad: Sea P una función de probabilidad cuyo dominio es
un conjunto A. Se cumplen las dos siguientes propiedades.
a) 0 ≤ 𝑃(𝑥) ≤ 1 Para todo x de A.
b) ∑𝑥∈𝐴 𝑃(𝑥) = 1

85) Retomemos el ejercicio en el que se lanzan dos dados, sea la variable aleatoria x la suma de los nú-
meros de dos dados.
a) ¿Qué valores toma x? ¿qué tipo de variable aleatoria es?
b) Da la distribución de probabilidades de x.

86) Observa que en el ejercicio anterior es posible definir una función en la que el dominio está forma-
do por los valores que toma la variable x, y la regla de asignación está dada por la probabilidad de
que ocurra x. A funciones cómo esta se las denomina funciones de probabilidad.
a) Función de probabilidad: Dada una variable aleatoria x, una función de probabilidad es una co-
rrespondencia en la que a cada valor de la variable x se le asigna la probabilidad de que ocurra.
b) Tené presente que a veces es posible encontrar una fórmula que describa esa asignación y otra
no.

87) Supongamos que se modifica un dado de modo que tiene una cara con un punto, dos caras con dos
puntos y tres caras con tres puntos. Sea x la cantidad de puntos observados cuando se tira el dado.
Da la función (domino y fórmula) de probabilidad de x.

88) Media de una variable aleatoria discreta (valor esperado): Sea 𝑃: 𝐴 → 𝑅 una función de probabili-
dad, definimos 𝐸[𝑥] = ∑𝑥∈𝐴 𝑥 ∙ 𝑃(𝑥).

89) Para cada 𝜃 ∈ ℝ, con 0 < 𝜃 < 1, considerá la función 𝑓𝜃 : {0,1,2,3} → (0,1) cuya ley de correspon-
dencia está dada en la siguiente tabla.
𝑋 0 1 2 3
3 2 2 (1 − 𝜃)3
𝑓𝜃 (𝑋) 𝜃 3𝜃 (1 − 𝜃 ) 3𝜃(1 − 𝜃)
a) Decidí si 𝑓𝜃 puede o no ser la función de probabilidad de una variable aleatoria discreta 𝑋.
b) En caso de que la respuesta al ítem anterior sea afirmativa, da la expresión simplificada de la
esperanza de 𝑋, 𝐸[𝑋].

90) Varianza de una variable aleatoria discreta: Sea 𝑃: 𝐴 → 𝑅 una función de probabilidad y 𝜇, la media
de la variable aleatoria x, definimos 𝑉𝑎𝑟[𝑥] = ∑𝑥∈𝐴[(𝑥 − 𝜇)2 ∙ 𝑃(𝑥)]. También puede usarse
𝑉𝑎𝑟[𝑥] = ∑𝑥∈𝐴[𝑥 2 ∙ 𝑃(𝑥)] − {∑𝑥∈𝐴[𝑥 ∙ 𝑃(𝑥)]}2 o 𝑉𝑎𝑟[𝑥] = ∑𝑥∈𝐴[𝑥 2 ∙ 𝑃(𝑥)] − 𝜇 2.

91) Desviación estándar de una variable aleatoria discreta: 𝜎 = √𝑉𝑎𝑟[𝑥]

Prof. Martín Chacón 20


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

92) Distribución de probabilidad binomial. Considerar el siguiente experimento de probabilidad. Un


profesor toma al grupo una prueba sorpresa de cuatro preguntas de opción múltiple (3 opciones).
Los estudiantes no han estudiado y deciden contestar las cuatro preguntas adivinando al azar las
respuestas sin leer las preguntas ni las posibles respuestas. Intentaremos responder las siguientes
preguntas:
a) De las cuatro preguntas, ¿cuántas de ellas es más probable que haya contestado correctamente?
b) ¿Cuál es la probabilidad de que haya contestado correctamente más de la mitad de ellas?
c) ¿Cuál es la probabilidad de que usted haya seleccionado las respuestas correctas a las cuatro
preguntas?
d) ¿Cuál es la probabilidad de que usted haya seleccionado las respuestas equivocadas a las cuatro
preguntas?
e) Si todo el grupo contesta la prueba al azar, ¿cuál será el promedio de respuestas correctas del
grupo?
Guiaremos el ejercicio.
1. Construí un diagrama de árbol para mostrar las posibles formas de contestar la prueba de cuatro
preguntas, teniendo presente que cada pregunta puede ser contestada correctamente (C) o inco-
rrectamente (M).
2. ¿Cuál es la probabilidad de que la respuesta sea correcta para cada pregunta?
3. ¿Cuál es la probabilidad de que la respuesta sea incorrecta para cada respuesta?
4. Observá que hay independencia entre las respuestas para cada pregunta. Si definimos la variable
aleatoria x como la cantidad de respuestas correctas y los eventos A: pregunta 1 contestada co-
rrectamente, B: pregunta 2 contestada correctamente, C: pregunta 3 contestada correctamente y
D: pregunta 4 contestada correctamente; observá que P(x = 0) = P(noA) ∙ P(noB) ∙ P(noC) ∙
P(noD). ¿Por qué? Calculá P(x = 0).
5. Observá que los eventos Q: responder solo la primera pregunta correctamente, R: responder so-
lo la segunda pregunta correctamente, S: responder solo la tercera pregunta correctamente y T:
responder solo la cuarta pregunta correctamente son eventos mutuamente excluyentes. Observá
que P(x = 1) = P(Q) + P(R) + P(S) + P(T), ¿por qué? Observá que por ejemplo P(Q)= P(A) ∙
P(noB) ∙ P(noC) ∙ P(noD). ¿Por qué? Calculá P(x = 1).
6. Calculá P(x = 2), P(x = 3), P(x = 4).
7. Respondé las preguntas a, b, c, d y e.

93) Números combinatorios. Tomemos el ejemplo anterior.


a) ¿Cuántas son las posibilidades para tener tres preguntas respondidas correctamente?
b) Otra forma de preguntarse la pregunta anterior es la siguientes: Si tenemos un conjunto con 4
elementos: pregunta 1 contestada correctamente, pregunta 2 contestada correctamente, pregunta
3 contestada correctamente, pregunta cuatro contestada correctamente; ¿De cuantas maneras
posibles se pueden combinar 3 de estos 4 elementos? o ¿cuántos subconjuntos de 3 elementos
se puede armar de un conjunto con 4 elementos?

94) El número que responde la pregunta anterior se llama número combinatorio. Número combinatorio
𝑛 𝑛!
n k, 𝐶(𝑛, 𝑘) = ( ) = 𝑘!∙(𝑛−𝑘)!, donde x! es igual al producto de todos los números naturales meno-
𝑘
res o iguales a x. Por ejemplo, 5! = 1 ∙ 2 ∙ 3 ∙ 4 ∙ 5. Se define 0! = 1.

Prof. Martín Chacón 21


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

4 4 4 4 4
95) Calculá ( ), ( ), ( ), ( ) y ( ) ¿Qué relación encontrás entre cada número combinatorio y la
0 1 2 3 4
cantidad de preguntas respondidas correctamente?

96) Llamaremos experimento de probabilidad binomial al experimento formado por intentos repetidos
que posee las siguientes propiedades:
a) Hay n intentos independientes idénticos repetidos.
b) Cada intento tiene dos posibles resultados (éxito o fracaso).
c) P(éxito) = p, P(fracaso) = q, y p + q = 1.
d) La variable aleatoria binomial x es la cuenta del número de intentos con éxito que sucedieron; x
toma cualquier entero de 0 a n.

97) Verificá que el experimento de la prueba de múltiple opción cumple con cada una de las cuatro
propiedades anteriores y por lo tanto es un experimento de probabilidad binomial.

98) Definición. Función de probabilidad binomial.


a) Para un experimento binomial, representamos con p la probabilidad de un éxito y q representa
la probabilidad de un fracaso en un solo intento. Entonces P(x), la probabilidad de que habrá
exactamente x éxitos en n intentos, es
𝑛
𝑃(𝑥) = ( ) ∙ 𝑝 𝑥 ∙ 𝑞 𝑛−𝑥 , para x = 0; 1; 2; 3; …; n.
𝑥
b) Se puede demostrar que para la distribución binomial la media es 𝜇 = 𝑛 ∙ 𝑝, y la desviación es-
tándar es 𝜎 = √𝑛 ∙ 𝑝 ∙ 𝑞

99) Calculá 𝜇 y 𝜎 para el experimento inicial de las pruebas. Realizá un histograma y ubicá estos valo-
res. ¿Qué significado tendrían estos parámetros?

100) Se arroja una moneda al aire 3 veces seguidas. Sea la variable aleatoria x: cantidad de caras en
los tres tiros. Muestra que es un experimento binomial. Da la función de probabilidad. ¿Cuál es el
domino? Calculá 𝜇 y 𝜎.

101) El gerente de un mercado de alimentos garantiza que ninguna de sus cajas de una docena de
huevos contendrá más de un huevo podrido. Propone como promoción que si una caja contiene más
de un huevo podrido, el cliente se queda con esa caja y se le regala otra. Si la probabilidad de que
un huevo sea malo es 0,05, ¿cuál es la probabilidad de que el gerente tenga que regalar una caja de
huevos? ¿Se trata de un experimento binomial? ¿Qué supuestos habría que hacer?

102) Demostrá las siguientes propiedades de los números combinatorios.


𝑛 𝑛 𝑛 𝑛
a) ( ) = 1 c) ( ) = 𝑛 e) ( ) = ( )
0 1 𝑘 𝑛−𝑘
𝑛 𝑛
b) ( ) = 1 d) ( )=𝑛
𝑛 𝑛−1

103) Entre todos los compañeros del curso pidan a 100 personas (que no conozcan de qué se trata el
experimento) que les digan un número cualquiera. A partir de esto calculen la probabilidad p de que
una persona te diga un número entre 1 y 10. Supongamos ahora otro experimento teórico pedir a
una persona que nos diga 4 números cualesquiera. Sea la variable aleatoria x: cantidad de números
entre 1 y 10 dados por la persona. ¿Cuáles de las propiedades de un experimento binomial se cum-
plen en este caso? ¿Qué suposiciones hay que hacer para que se cumplan todas? Da la función de
probabilidad P(x) suponiendo que sea una distribución binomial. Calculá 𝜇 y 𝜎.

Prof. Martín Chacón 22


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

Unidad 2.4: Distribuciones de probabilidad (variables continuas)

104) Una variable aleatoria 𝑋 se distribuye en forma uniforme en el intervalo (1,4), es decir, su fun-
1
𝑠𝑖 1 ≤ 𝑥 ≤ 4
ción de densidad es 𝑓: ℝ → [0, +∞): 𝑓(𝑥) = { 3
0 𝑠𝑖 𝑥 < 1 𝑜 𝑥 > 4
a) Calculá
i) 𝑃(𝑋 < 2,5).
ii) 𝑃(1,7 < 𝑋 < 2).
iii) 𝑃(𝑋 < 6).
iv) 𝑃(𝑋 > 3).
b) Calculá 𝑎 tal que 𝑃(𝑋 < 𝑎) = 0,75
c) Da la función 𝐹 de distribución acumulada de 𝑋. (𝐹: ℝ → [0, +∞): 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) =
𝑥
∫−∞ 𝑓(𝑡)𝑑𝑡)

3 3
− 𝑥 2 + 4 𝑠𝑖 − 1 ≤ 𝑥 ≤ 1
105) Sea 𝑓: ℝ → [0, +∞): 𝑓(𝑥) = { 4 la función de densidad de la varia-
0 𝑠𝑖 𝑥 < −1 𝑜 𝑥 > 1
ble aleatoria continua 𝑋.
a) Calculá
i) 𝑃(𝑋 < 2,5).
ii) 𝑃(−0,5 < 𝑋 < 0,4).
iii) 𝑃(𝑋 < 0,6).
iv) 𝑃(𝑋 > −0,1).
b) Calculá 𝑎 tal que 𝑃(𝑋 < 𝑎) = 0,75
c) Da la función 𝐹 de distribución acumulada de 𝑋. (𝐹: ℝ → [0, +∞): 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) =
𝑥
∫−∞ 𝑓(𝑡)𝑑𝑡)

1 𝜋 𝜋
2
cos(𝑥) 𝑠𝑖 − 2 ≤ 𝑥 ≤
2
106) Considerá la función 𝑓: ℝ → [0, +∞): 𝑓(𝑥) = { 𝜋 𝜋 .
0 𝑠𝑖 𝑥 < − 2 𝑜 𝑥 > 2
a) Decidí si 𝑓 puede o no ser la función de densidad de una variable aleatoria 𝑋. Justificá.
b) En caso de que la respuesta al ítem anterior sea afirmativa,
i) Da la función de distribución acumulada.
𝜋
ii) Calculá la probabilidad de que 0 ≤ 𝑋 ≤ 4 .

107) Distribuciones de probabilidad normal. La distribución de probabilidad normal es considerada


como la más importante distribución de probabilidad. Una gran cantidad de variables aleatorias
continuas tienen una distribución ya sea normal o aproximadamente normal.
La distribución de probabilidad normal es de variable continua. Se definen dos funciones. Una, para
determinar las ordenadas de la gráfica que representa la distribución y una segunda para determinar
las probabilidades.
Fórmula de la función de distribución de probabilidad normal.
1 𝑥−𝜇 2
𝑒 2 𝜎 )
− (
𝑓(𝑥) =
𝜎√2𝜋
Donde 𝜇 es la media y 𝜎 es la desviación estándar.
Para el caso de una variable continua, la probabilidad de que x = a es 0, ¿por qué?

Prof. Martín Chacón 23


Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

El gráfico de la función anterior para 𝜇 = 0 y 𝜎 = 1 es,

Es posible obtener la probabilidad de que x se encuentre dentro del intervalo [a; b]. Para ello defi-
nimos,
𝑏
𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎
Para calcular probabilidades no usaremos las fórmulas anteriores, sino que usaremos los datos que
ya están tabulados. Los valores de la tabla se dan para 𝜇 = 0 y 𝜎 = 1. Y veremos cómo extender la
𝑥−𝜇
información de la tabla para cualquier caso teniendo presente que 𝑧 = 𝜎 .

108) Ejercicio (para aprender a usar la tabla): Calculá.


a) P(0 ≤ z ≤ 1,52) f) P(-1,5 ≤ z ≤ 2,1)
b) P(z > 1,52) g) P(0,7 ≤ z ≤ 2,2)
c) P(z < 1,52) h) a tal que P(0 ≤ z ≤ a) = 0,25
d) P(-2,1 ≤ z ≤ 0) i) a tal que P(z ≤ a) = 0,5
e) P(z ≤ -1,35) j) a tal que P(z ≤ a) = 0,75

109) Considerá las puntuaciones de IQ. Están distribuidas con una media de 100 y una desviación
estándar de 16.
a) Si al azar se selecciona una persona, ¿Cuál es la probabilidad de que su IQ sea entre 100 y 115?
b) ¿Cuál es la probabilidad de que una persona seleccionada al azar tenga un IQ mayor a 90?
c) ¿Cuál es la probabilidad de que una persona seleccionada al azar tenga un IQ inferior a 80?
d) Si tomamos el 95% de la población con IQ más bajo ¿cuál es el IQ máximo de esa población?

110) Según las estadísticas de carreteras para el año 2003 de la Federal Highway Administration, la
distribución de las edades para conductores con licencia tiene una media de 44,5 años y una desvia-
ción estándar de 17,1 años. Suponiendo que la distribución de edades está normalmente distribuida,
¿qué porcentaje de los conductores...
a) …están entre las edades de 17 y 22?
b) …son menores de 25?
c) …son mayores de 21?
d) …están entre 45 y 65 años?
e) …son mayores de 75 años?

111) En un grupo de estudiantes muy grande, el profesor dice que para que usted obtenga un sobresa-
liente en un examen particular debe alcanzar un puntaje que se encuentre en el 10% superior del
grupo; si se encuentra dentro del siguiente 20% recibirá un muy bueno; si está dentro del siguiente
40% recibirá un satisfactorio; si se encuentra dentro del siguiente 18% recibirá un regular; y si está
en dentro del 12% final recibirá un insuficiente. La media y desviación estándar para ese examen es
de 72 y 12,5, respectivamente. Suponiendo que las puntuaciones están normalmente distribuidas,
respondé:
a) ¿Cuál es la puntuación mínima necesaria para obtener un sobresaliente?
Prof. Martín Chacón 24
Escuela de Educación Técnica Henry Ford – 2019 Estadística – Matemática Aplicada 6º ET

b) ¿Qué puntuación deberás obtener como mínimo para obtener por lo menos un satisfactorio?
c) ¿Qué puntuación deberás obtener para no sacar insuficiente?

112) Según un sitio de internet, el salario promedio nacional estadounidense en octubre del 2003 para
un empleado de recursos humanos fue de $29932. Si suponemos que los salarios anuales para em-
pleados están normalmente distribuidos con una desviación estándar de $1850, encontrá lo siguien-
te.
a) El porcentaje que gana menos de $27000
b) El porcentaje que gana más de $32000

113) Los pesos de las sandías maduras producidas en la granja del Sr. Pérez están normalmente dis-
tribuidos con una desviación estándar de 1,3 kg. Encontrá el peso medio de las sandías maduras del
Sr. Pérez si solo 3% pesan menos de 6,8 kg.

114) Una máquina llena recipientes con un peso medio de 453,6 g por recipiente. Si no más del 5%
de los recipientes deben pesar menos de 447,9 g, ¿a qué debe ser igual la desviación estándar de los
pesos? (suponer normalidad).

115) Una persona que desea encontrar trabajo se presenta a dos entrevistas en las empresas A y B. En
la entrevista de la empresa A obtiene una puntuación de 9 puntos. En esta empresa, la media de las
puntuaciones obtenidas por todos los aspirantes es de 7 puntos y la desviación estándar es de 4 pun-
tos. En la entrevista de la empresa B obtiene una puntuación de 8 puntos, con una media de las pun-
tuaciones de todos los candidatos de 6 puntos y una desviación estándar de 1,5 puntos. Suponiendo
que la distribución de las puntuaciones en ambas empresas es normal ¿En cuál empresa tiene más
posibilidades de trabajar? Explicá y justificá adecuadamente tu respuesta.

116) Las puntuaciones de un examen se distribuyen normalmente con una media de 15 puntos. La
puntuación A ha sido superada por un 23% de los examinados. La puntuación B está situada a 5
puntos por debajo de la media. Entre B y la media se encuentra el 30% de los alumnos. Calcular:
a) La desviación estándar de las notas.
b) La puntuación A.

117) El gerente de un mercado de alimentos garantiza que ninguna de sus cajas de una docena de
huevos contendrá más de un huevo podrido. Propone como promoción que si una caja contiene más
de un huevo podrido, el cliente se queda con esa caja y se le regala otra. Si la probabilidad de que
un huevo sea malo es 0,05, ¿cuál es la probabilidad de que el gerente tenga que regalar una caja de
huevos? Mostrá claramente los planteos y justificaciones que avalan tu respuesta.

Prof. Martín Chacón 25


Escuela de Educación Técnica Henry Ford – 2019 Anexo I – Matemática Aplicada 6º ET

Prof. Martín Chacón 27


Escuela de Educación Técnica Henry Ford – 2019 Anexo II – Matemática Aplicada 6º ET

Complemento Teórico

Prof. Martín Chacón 29


Escuela de Educación Técnica Henry Ford – 2019 Anexo II – Matemática Aplicada 6º ET

Prof. Martín Chacón 30


Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Probabilidades y Estadística
Cs. de la Computación

Introducción
Breve reseña histórica:

La teoría de Probabilidades comienza a partir de una disputa entre jugadores en 1654.


Los dos matemáticos que participaron de tales discusiones fueron Blaise Pascal y Pierre
de Fermat, y su intercambio de correspondencia sentó las bases de la teoría de
Probabilidades. Un matemático holandés, Christian Huygens tomó contacto con esa
correspondencia y escribió el primer libro sobre Probabilidades en 1657, el cual trataba
fundamentalmente sobre problemas relacionados con los juegos de azar.
Durante el siglo XVIII la teoría se desarrolló y se enriqueció con los aportes de Jacob
Bernoulli y Abraham de Moivre. En 1812 Pierre de Laplace introdujo una serie de nuevas
ideas y técnicas matemáticas en su libro Theorie Analytique des Probabilités y
fundamentalmente sacó a la teoría del marco exclusivo de los juegos de azar y aplicó las
ideas a muchos problemas científicos y prácticos. Algunas de las importantes aplicaciones
desarrolladas en el siglo XIX fueron: teoría de errores, matemática actuarial y mecánica
estadística.

Una de las dificultades para el desarrollo de la teoría matemática de las probabilidades


fue llegar a una definición de probabilidad matemáticamente rigurosa, pero al mismo
tiempo amplia para permitir su aplicación a un amplio rango de fenómenos. En el siglo XX
se llegó a una definición axiomática de las Probabilidades (Kolmogorov, 1933).

¿Porqué estudiar Probabilidades y Estadística en Ciencias de la Computación?:

Posibles preguntas que queremos responder:


• ¿Cuál es el máximo número de terminales que pueden estar conectadas en un
servidor antes de que el tiempo medio de espera se haga inaceptable?
• En una base de datos, ¿Cómo deberían ser guardados los datos para minimizar el
tiempo medio de acceso?

Los sistemas de computación no son determinísticos. Pensemos, por ejemplo, en el delay


en el envío de paquetes, comunicaciones en una red, equilibrio de “carga” en servidores,
requerimientos de memoria, etc.

¿Para qué sirven las Probabilidades? Si bien estamos frente a procesos aleatorios, no
son necesariamente “caóticos”, en el sentido que podemos descubrir un patrón de
comportamiento que pueda ser modelado.

Veamos un ejemplo de uso frecuente.

1
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Compresión de archivos: El código ASCII contiene 256 caracteres, cada uno de los
cuáles se representa con un número consistente en 8 dígitos binarios, por ejemplo, á se
representa por 160 ≡ 10100000.
Para simplificar el problema, supongamos que contamos con sólo 4 caracteres: A, B, C y
D. Para representarlos necesitamos 2 bits. Por ejemplo, podríamos representarlos así:

A → 00
B → 01
C → 10
D → 11

Si un texto constara de n caracteres necesitaríamos 2n bits para guardarlo. Esta cantidad


de bits es determinística.
Supongamos que sabemos que ciertas letras aparecen con más frecuencia que otras,
por ejemplo, supongamos que sabemos que las frecuencias con que aparecen las 4 letras
en un texto son:

A 0.70 (70%)
B 0.12 (12%)
C 0.10 (10%)
D 0.08 ( 8%)

El método de codificación de Huffman utiliza la información disponible sobre la


frecuencias de aparición de los caracteres y asigna códigos de longitud variable. Por
ejemplo, podríamos asignar a los 4 caracteres de nuestro ejemplo los siguientes códigos:

A→1
B → 00
C → 011
D → 010

¿Cuánto espacio (en bits) ocuparía ahora un texto de n caracteres? No lo sabemos, pero
podemos suponer que tendremos en promedio:

0.70 n veces A’s


0.12 n veces B’s
0.10 n veces C’s
0.08 n veces D’s

y el número de bits requerido sería:

0.70 n * (1) + 0.12 n *(2) + 0.10 n * (3) + 0.08 n * (3) = 1.48 n.

Como se observa, el método produce una disminución del espacio promedio requerido
para almacenar un texto.

2
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Probabilidad

El término Probabilidad se refiere al estudio del azar y la incertidumbre. En aquellas


situaciones en las cuáles se puede producir uno de varios resultados posibles, la Teoría
de la Probabilidad provee métodos para cuantificar la chance de ocurrencia de cada uno
de ellos.

Ejemplos:

• Se arroja un dado dos veces y se registra la suma de puntos. ¿Cuál es la probabilidad


de que se obtenga una suma mayor que 10?

• En un juego de ruleta, ¿cuál es la probabilidad de ganar apostando a primera


columna?

• En un juego de ruleta, ¿cuál es la ganancia esperada apostando repetidamente a


primera columna?

• ¿Cuál es la probabilidad de que un servidor que atiende a 20 terminales se sature en


un determinado momento?

• Dada la información disponible, ¿cuál es la probabilidad de que llueva el próximo fin


de semana?

Definiciones:

Experimento: Es cualquier proceso o acción que genera observaciones y que puede ser
repetible. Por ejemplo, arrojar un dado, seleccionar un individuo y registrar su peso y su
altura, seleccionar una muestra de productos elaborados por una empresa para hacer un
control de calidad, seleccionar un día al azar y registrar el número de veces que se satura
un servidor.

Espacio muestral asociado a un experimento: Es el conjunto de todos los resultados


posibles del experimento. Lo notaremos S.

Ejemplos:

1) Se arroja una moneda una vez.


S={cara,ceca} ó S={1,0} ó S={éxito,fracaso}

2) Se arroja una moneda dos veces.


S={(1,1),(1,0),(0,1),(0,0)}

3) Se arroja una moneda hasta que aparece por primera vez una cara.
S={(1),(0,1),(0,0,1),(0,0,0,1),....} = {(x1,x2,...xn) / n∈N, xi=0 si i < n , xn=1}

4) Se registra el tiempo transcurrido desde que se intenta la conexión a un servidor hasta


que la conexión se efectiviza.

3
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

S=ℜ+=(0,∞)
Si el sistema tiene un time-out en el tiempo to , tendríamos S=(0, to).

Como se observa, un espacio muestral puede ser finito, como en los ejemplos 1) y 2),
infinito numerable, como en el ejemplo 3) o infinito no numerable, como en el ejemplo 4).

Sucesos o eventos: No sólo estamos interesados en resultados individuales de un


experimento sino que pueden interesarnos colecciones o conjuntos de ellos. Se denomina
suceso o evento a cualquier subconjunto del espacio muestral. Si S es finito o infinito
numerable, cualquier subconjunto es un evento. Si S es infinito “casi todo” subconjunto de
S es un evento. Los eventos los designaremos en general con las primeras letras del
abecedario en mayúscula: A, B, C,...

Evento elemental o simple: consiste de un único resultado individual.

Evento compuesto: consiste de más de un evento elemental.

Ejemplos: En los ejemplos anteriores, posibles eventos son

1) A = ”sale cara” = {cara}={1}.

2) A = “número de caras es menor o igual que 1” ={(1,0),(0,1),(0,0)}.

3) A = “número de tiros requeridos es menor o igual que 5” = {(x1,x2,...xn)∈S / n≤5 }.

B = “número de tiros requeridos es par” = {(x1,x2,...xn) ∈S / n=2k, k ∈N}.

4) A = “el tiempo es mayor de 10 minutos” = (10,∞) (en el caso de un sistema sin time-
out)

Relación con Teoría de conjuntos: Como un evento o suceso es un conjunto, valen las
mismas relaciones que en teoría de conjuntos.

S es un subconjunto de S denominado suceso cierto o seguro .

∅ es un subconjunto de S denominado suceso imposible.

A ∪ B es el suceso unión. Ocurre cuando A ocurre ó B ocurre.

A ∩ B es el suceso intersección. Ocurre cuando ocurre A y ocurre B.

Ac ó A es el opuesto o complemento de A. Ocurre cuando no ocurre A.

4
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

A − B = A ∩ B c es el suceso diferencia. Ocurre cuando ocurre A y no ocurre B.


Se dice que A está contenido en B o que A implica B y se denota A ⊆ B si la realización
de A conduce a la realización de B, es decir si todo elemento de A pertenece a B.

Dos sucesos A y B se dicen mutuamente excluyentes o disjuntos si A ∩ B = ∅.

Recordemos algunas propiedades:

Asociatividad: A ∪ B ∪ C = (A ∪ B) ∪ C = A ∪ (B ∪ C)
A ∩ B ∩ C = (A ∩ B) ∩ C = A ∩ (B ∩ C)

Conmutatividad: A ∪ B = B ∪ A
A∩B= B∩A

Distributividad: (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C)
(A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)

c c
⎛∞ ⎞ ∞
⎛∞ ⎞ ∞
Leyes de De Morgan: ⎜⎜ U Ai ⎟⎟ = I Aic y ⎜⎜ I Ai ⎟⎟ = U Aic
⎝ i =1 ⎠ i =1 ⎝ i =1 ⎠ i =1

Interpretación intuitiva de la Probabilidad: Supongamos que se repite n veces un mismo


experimento aleatorio en forma independiente y bajo las mismas condiciones. Sea nA el
número de veces que ocurre el suceso A en las n repeticiones. Se denomina frecuencia
relativa de A en la secuencia de n repeticiones a

nA
fr ( A) =
n

La evidencia empírica muestra que cuando n crece, fr ( A) tiende a estabilizarse


alrededor de un número que llamaremos P(A).

¿Qué propiedades tiene la frecuencia relativa?

nA
1) fr ( A) = ≥0
n

nS n
2) fr ( S ) = = =1
n n

5
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

n A∪ B n A + n B n A n B
3) Si A ∩ B = ∅ ⇒ fr ( A ∪ B) = = = + = fr ( A) + fr ( B)
n n n n

La definición axiomática de Probabilidad, que daremos a continuación, es consistente con


la idea intuitiva que se tiene de ella.

Axiomas de Probabilidad: Dado un experimento aleatorio y un espacio muestral


asociado S, a cada evento A se le asociará un número que notaremos P(A) y que
llamaremos probabilidad del evento A. Esta asignación debe satisfacer los siguientes
axiomas:

A1. P(A) ≥ 0 para todo evento A.

A2. P(S) = 1

A3a. Si A1 , A2 ,..., An es una colección finita de sucesos mutuamente excluyentes, es


decir que Ai ∩ A j = ∅ ∀ i ≠ j , entonces

⎛ n ⎞ n
P⎜⎜ U Ai ⎟⎟ = ∑ P( Ai )
⎝ i =1 ⎠ i =1

A3b. Si A1 , A2 ,..., An ,... es una colección infinita numerable de sucesos mutuamente


excluyentes, es decir si Ai ∩ A j = ∅ ∀ i ≠ j , entonces

⎛∞ ⎞ ∞
P⎜⎜ U Ai ⎟⎟ = ∑ P( Ai )
⎝ i =1 ⎠ i =1

Ejemplo: Consideremos el ejemplo en que se arroja una moneda una vez, para el cual el
espacio muestral es S={cara,ceca}. Si denominamos E1 = {cara} y E2 ={ceca} a los dos
eventos elementales, como P(S) = 1 = P(E1)+P(E2), entonces P(E2) = 1- P(E1). Por lo
tanto, cualquier asignación de probabilidades de la forma: P(E1) = p y P(E2)=1-p con
0 ≤ p ≤ 1, satisface los axiomas.

Propiedades de la Probabilidad:

1) P( A c ) = 1 − P( A) para todo suceso A

Dem: 1 = P ( S ) = P ( A U A c ) = P ( A) + P ( A c ) ⇒ P( A c ) = 1 − P ( A)
A2 A3 a

6
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

En la tercera igualdad usamos el axioma 3 pues A ∩ A c = ∅.

2) P(∅) = 0

Dem: P( ∅ ) = 1 − P( ∅ c ) = 1 − P ( S ) = 1 − 1 = 0
P1 A2

3) Si A ⊆ B ⇒ P( A) ≤ P ( B) y P ( B − A) = P( B ) − P ( A)

Dem: Si A ⊆ B ⇒ B = A ∪ ( B − A) y éstos dos eventos son excluyentes. Por el


axioma A3a

P ( B) = P( A) + P( B − A)

Dado que, por el axioma A1, P(B-A) ≥ 0 , resulta P(B) ≥ P(A) y, despejando, se obtiene la
segunda afirmación.

4) Dados dos sucesos cualesquiera A y B, P( A ∪ B ) = P ( A) + P( B ) − P ( A ∩ B ).

Dem: A ∪ B = A ∪ ( B − A) = A ∪ ( B ∩ A c ) y estos dos eventos son excluyentes,


entonces, por el axioma A3a,

P( A ∪ B) = P(A ∪ ( B ∩ A c ) ) = P( A) + P( B ∩ A c ) (1)

Por otra parte, B = ( B ∩ A) ∪ ( B ∩ A c ) y estos dos eventos son disjuntos, entonces

P( B) = P( B ∩ A) + P( B ∩ A c ) ⇒ P( B ∩ A c ) = P( B) − P( B ∩ A) (2)

De (1) y (2) resulta que P ( A ∪ B ) = P ( A) + P( B ) − P ( B ∩ A) como queríamos demostrar.

5) Dados dos sucesos cualesquiera A y B, P ( A ∪ B) ≤ P( A) + P( B).

Dem: Esta propiedad se deduce inmediatamente de la propiedad anterior y del axioma


A1.

Ejercicios: a) Demostrar, usando la propiedad 4) que, dados tres sucesos cualesquiera,


A1 , A2 y A3 ,

P( A1 ∪ A2 ∪ A3 ) = P( A1 ) + P( A2 ) + P( A3 ) − P( A1 ∩ A2 ) − P( A1 ∩ A3 )
− P( A2 ∩ A3 ) + P( A1 ∩ A2 ∩ A3 )

7
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

b) Probar, usando inducción que, dados A1 , A2 ,..., An sucesos cualesquiera,


⎛ n ⎞ n
P⎜⎜ U Ai ⎟⎟ ≤ ∑ P( Ai )
⎝ i =1 ⎠ i =1

Asignación de probabilidades: Supongamos que el espacio muestral S asociado con


cierto experimento es finito o infinito numerable. En este caso, una manera simple de
trabajar es asignar probabilidades a los sucesos elementales, ya que cualquier suceso A
será unión de sucesos elementales y éstos son obviamente mutuamente excluyentes.

Designando Ei a los sucesos elementales de S, S = UE
i =1
i (la unión podría ser finita si el

espacio muestral fuese finito). Si conocemos p i = P( E i ) ≥ 0 ∀ i , de manera que


∑p
i =1
i = 1 , entonces dado cualquier suceso A, su probabilidad se puede obtener sumando

las probabilidades de los elementales que lo componen, es decir:

P ( A) = ∑p
Ei ⊂ A
i

Ejemplos: 1) Se arroja un dado equilibrado. En este caso, S={1,2,3,4,5,6} y, por


suponerlo equilibrado, los sucesos elementales Ei = {i} para i=1,..,6 tienen probabilidad
pi = 1/6. Si deseamos calcular la probabilidad del suceso A = “el resultado es par”, usando
que

A= E2 ∪ E4 ∪ E6 se obtiene P(A) = P(E2)+ P(E4)+ P(E6)=1/2

2) Supongamos ahora que se arroja un dado en el cual la probabilidad de las caras pares
es el doble que la probabilidad de las caras impares, o sea que, si llamamos p a la
probabilidad de cada cara impar,

P(E1) = P(E3) = P(E5) = p y P(E2) = P(E4) = P(E6) = 2 p

Como la suma de las probabilidades debe ser igual a 1,

6
1
∑ P( E ) = 3 p + 6 p = 9 p = 1
i =1
i ⇒ p=
9

2 2
y, en este caso, P(A) = P(E2)+ P(E4)+ P(E6) = 3 = .
9 3

3) Arrojamos una moneda equilibrada hasta obtener cara. ¿Cuál es la probabilidad de


que la cara sea obtenida en un número par de lanzamientos?

Si representamos el espacio muestral tal como lo hicimos más arriba, tendríamos

8
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

A={(0,1),(0,0,0,1),(0,0,0,0,0,1),.....}

Veremos más adelante que en las condiciones de este experimento es razonable


asumir que
k
⎛1⎞
P(obtener cara en el k - ésimo lanzamiento) = ⎜ ⎟
⎝2⎠

Por lo tanto:
∞ 2k ∞ k
⎛1⎞ ⎛1⎞ 1 4 1
P ( A) = ∑ ⎜ ⎟ = ∑⎜ ⎟ = −1 = −1 =
k =1 ⎝ 2 ⎠ k =1 ⎝ 4 ⎠ 1 3 3
1−
4

ya que si 0<p<1, entonces


1
∑p k =0
k
=
1− p

Espacios de equiprobabilidad: Sea un experimento aleatorio cuyo espacio muestral


asociado S es finito y sea n = # S (el símbolo # representa el cardinal del conjunto).
Diremos que el espacio es de equiprobabilidad si los n sucesos elementales tienen igual
probabilidad, es decir si

P( Ei ) = p ∀i

n n
1 1
Como 1 =P( S ) = ∑ P( Ei ) = ∑ p = np
i =1 i =1
⇒ p= =
n #S
.

1 #A
Dado cualquier suceso A, P ( A) = ∑ P( E ) = ∑
Ei ⊂ A
i
Ei ⊂ A
=
n #S
.

Ejemplos: 1) De una urna que contiene 2 bolillas blancas y 3 rojas se extraen 2 bolillas
con reposición.

a) ¿Cuál es la probabilidad de que se extraiga al menos una bolilla roja?


b) ¿Cuál es la probabilidad de que la primera bolilla extraída sea roja y la segunda
blanca?

Supondremos que las bolillas están numeradas, de manera de poder considerar que se
trata de un espacio de equiprobabilidad, entonces S = {( x1 , x 2 ) / x i ∈{R1 , R 2 , R3 , B1 , B2 }} y
su cardinal es #S = 5 ⋅ 5 = 25

9
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

a) P( A) = 1 − P( A c ) siendo A c = {( x1 , x 2 ) ∈ S / x i ∈{B1 , B2 }} . Como # A c = 2 ⋅ 2 = 4 ,


4 4 21
resulta P ( A c ) = ⇒ P( A) = 1 − = .
25 25 25

B = {( x1 , x 2 ) ∈ S / x1 ∈{R1 , R 2 , R3 }, x 2 ∈{B1 , B2 }}. Como # B = 3 ⋅ 2 = 6 ⇒ P( B) =


6
b) .
25

2) Consideremos el ejemplo 1) pero suponiendo ahora que las extracciones se realizan


sin reposición.

En este caso, S = {( x1 , x 2 ) / x i ∈{R1 , R 2 , R3 , B1 , B2 }, x1 ≠ x 2 } ⇒ # S = 5 ⋅ 4 = 20.

a) P ( A) = 1 − P( A c ) A c = {( x1 , x 2 ) ∈ S / x i ∈{B1 , B2 }} . Como # A c = 2 ⋅ 1 = 2 ,
siendo
2 1 1 9
resulta P ( A c ) = = ⇒ P( A) = 1 − = .
20 10 10 10

b) B = {( x1 , x 2 ) ∈ S / x1 ∈{R1 , R 2 , R3 }, x 2 ∈{B1 , B2 }}. Como # B = 3 ⋅ 2 = 6 ⇒ P( B) =


6
.
20

Observación: ¿Qué pasaría si en los ejemplos anteriores eligiésemos como espacio


muestral S = {( B, B ), ( B, R ), ( R, B), ( R, R )} , denotando B: bolilla blanca y R: bolilla roja?
¿Sería razonable suponer equiprobabilidad?.

10
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Probabilidad condicional

Consideremos una urna que contiene 4 bolillas rojas y 5 blancas. De las 4 bolillas rojas, 2
son lisas y 2 rayadas y de las 5 bolillas blancas, 4 son lisas y una sola es rayada.
Supongamos que se extrae una bolilla y, sin que la hayamos mirado, alguien nos dice que
la bolilla es roja, ¿cuál es la probabilidad de que la bolilla sea rayada?

Sean los sucesos A: “la bolilla es rayada” y B: “la bolilla es roja”. Obviamente, sin ninguna
información previa, P(A)= 3/9=1/3 y P(B)=4/9.

Sin embargo, como sabemos que la bolilla es roja, la probabilidad de que sea rayada es
½, ya que, de las rojas la mitad es lisa y la mitad rayada. Observemos, que al ocurrir B, el
espacio muestral se reduce.

En general, dado un experimento y su espacio muestral asociado, queremos determinar


cómo afecta a la probabilidad de A el hecho de saber que ha ocurrido otro evento B.

Definición: Sean A y B eventos tales que P(B) > 0, la probabilidad del evento A
condicional a la ocurrencia del evento B es

P( A ∩ B)
P( A | B) =
P( B)

Ejemplos: 1) En el ejemplo anterior, P(B)=4/9 y

P( A ∩ B) 2 / 9 2 1
P( A | B) = = = = .
P( B) 4/9 4 2

2) Consideremos una población en la que cada individuo es clasificado según dos


criterios: es o no portador de HIV y pertenece o no a cierto grupo de riesgo que
denominaremos R. La correspondiente tabla de probabilidades es:

Portador (A) No portador (Ac)


Pertenece a R (B) 0.003 0.017 0.020
No pertenece a R (Bc) 0.003 0.977 0.980
0.006 0.994 1.000

En esta población, la probabilidad de que un individuo sea portador es P(A)=0.006 y la


probabilidad de que sea portador y pertenezca al grupo de riesgo R es P(A ∩ B)=0.003.

Dado que una persona seleccionada al azar pertenece al grupo de riesgo R, ¿cuál es la
probabilidad de que sea portador?

P( A ∩ B) 0.003
P( A | B) = = = 0.150
P( B) 0.020

11
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

es decir que 150 de cada 1000 individuos del grupo de riesgo R, son “probablemente”
portadores de HIV.

Calculemos ahora la probabilidad de que una persona sea portadora de HIV, dado que no
pertenece al grupo de riesgo R.

P( A ∩ B c ) 0.003
P( A | B c ) = = = 0.00306
P( B c ) 0.980

es decir que sólo 3 de cada 1000 individuos no pertenecientes al grupo de riesgo R, son
“posibles” portadores de HIV.

Propiedades de la Probabilidad condicional: Dado un suceso B fijo tal que P(B) > 0, P(•|B)
es una probabilidad, en el sentido que satisface los axiomas de probabilidad y por lo tanto
todas las propiedades que se deducen a partir de ellos. Por ejemplo:

A1. P(A|B) ≥ 0 para todo suceso A.

A2. P(S|B) = 1.

P( S ∩ B) P( B)
Dem: P ( S | B) = = = 1.
P( B) P( B)

Ejercicios: 1) Verificar que P(•|B) satisface el axioma A3a.

2) Verificar que P((A1 ∪ A2) | B) = P(A1 | B) + P(A2 | B) – P((A1 ∩ A2) | B)

Regla del producto: Dados dos sucesos A y B, tales que P(B) > 0,

P(A ∩ B) = P(A|B) P(B)

Si además, P(A) > 0,

P(A ∩ B) = P(B | A) P(A)

Ejemplo: En el ejemplo presentado al comienzo, supongamos ahora que se extraen dos


bolillas sin reposición . ¿Cuál es la probabilidad de extraer una bolilla roja y una blanca,
en ese orden?

Sean C: “la primera bolilla es roja” y D: “la segunda bolilla es blanca”. debemos calcular
P(C ∩ D). Aplicando la regla del producto

12
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

4 5 20 5
P(C ∩ D) = P(C ) P( D | C ) = = = .
9 8 72 18

La regla del producto es especialmente útil cuando el experimento consta de varias


etapas ya que se puede generalizar. Así, por ejemplo, si P ( A1 ) > 0 y P ( A1 ∩ A2 ) > 0 , se
tiene

P( A1 ∩ A2 ∩ A3 ) = P( A1 ) P( A2 | A1 ) P( A3 | ( A1 ∩ A2 ))

y se extiende a n sucesos.

Ejemplo: En el mismo ejemplo, ¿cómo podemos obtener la probabilidad de que la


segunda bolilla extraída sea blanca (suceso D)?. Sabemos calcular, usando la regla del
producto la probabilidad de que la segunda sea blanca y la primera sea roja. Hemos visto
que esta probabilidad es P (C ∩ D ) = 5 18 . Del mismo modo podemos obtener la
probabilidad de que ambas bolillas sean blancas (suceso (D ∩ C c)). Esta probabilidad es

5 4 20 5
P(C c ∩ D) = P (C c ) P( D | C c ) = = = .
9 8 72 18

Si ahora observamos que el suceso D puede escribirse como

D = (D ∩ C) ∪ (D ∩ C c )

se obtiene

5 5 5
P( D) = P( D ∩ C ) + P( D ∩ C c ) = + = . (1)
18 18 9

¿Cómo podemos obtener ahora la probabilidad de que la primera bolilla haya sido roja
(suceso C) sabiendo que la segunda fue blanca (suceso D)? La probabilidad requerida es

P (C ∩ D) 5 18 1
P (C | D) = = = . (2)
P( D) 59 2

Los resultados (1) y (2) son ejemplos de aplicación de los dos Teoremas que veremos a
continuación: el Teorema de la Probabilidad Total y el Teorema de Bayes,
respectivamente.

Definición: Una colección de eventos A1 , A2 ,..., Ak constituye una partición del espacio
muestral S si

13
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

1. Ai ∩ A j = ∅ ∀ i ≠ j

2. P( Ai ) > 0 ∀i

k
3. UA i =S
i =1

Teorema de la probabilidad total: Sea A1 , A2 ,..., Ak una partición del espacio muestral S y
sea B un suceso cualquiera,

k
P ( B) = ∑ P( B | Ai ) P ( Ai )
i =1

Dem:

⎛ k ⎞ k
B = B ∩ S = B ∩ ⎜⎜ U Ai ⎟⎟ = U (B ∩ Ai )
⎝ i =1 ⎠ i =1

Como ( B ∩ Ai ) ∩ ( B ∩ A j ) = ∅ ∀ i ≠ j , entonces

⎛ k ⎞ k k
P ( B) = P⎜⎜ U ( B ∩ Ai ) ⎟⎟ = ∑ P( B ∩ Ai ) = ∑ P( B | Ai ) P( Ai ).
⎝ i =1 ⎠ i =1 i =1

Teorema de Bayes: Sea A1 , A2 ,..., Ak una partición del espacio muestral S y sea B un
suceso cualquiera tal que P(B) > 0,

P( B | A j ) P( A j )
P( A j | B) = k

∑ P( B | A ) P( A )
i =1
i i

Dem:

P( A j ∩ B) P( B | A j ) P( A j )
P( A j | B) = = k
P( B)
∑ P( B | A ) P( A )
i =1
i i

En el numerador se aplicó la regla del producto y en el denominador el Teorema de la


probabilidad total.

14
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

El Teorema de Bayes describe cómo es posible “revisar” la probabilidad inicial de un


evento o probabilidad a priori (P(Ai)) para reflejar la información adicional que nos provee
la ocurrencia de un evento relacionado. La probabilidad revisada se denomina
probabilidad a posteriori.

Ejemplo: Supongamos que cierta prueba para detectar la presencia de una enfermedad
en un individuo, da resultado positivo (detecta la presencia de la enfermedad) en un
individuo enfermo con probabilidad 0.99 y en un individuo sano con probabilidad 0.02
(falso positivo). Por lo tanto, dicha prueba no detecta la enfermedad en un individuo sano
con probabilidad 0.98 y no la detecta en un individuo enfermo con probabilidad 0.01 (falso
negativo). Es decir que si denotamos A: “la persona padece esa enfermedad” y B: “la
prueba es positiva”,

P( B | A) = 0.99 P( B | A c ) = 0.02

P( B c | A) = 0.01 P(B c | A c ) = 0.98

Se supone, en base a estudios previos, que la incidencia de esa enfermedad en cierta


población es 0.001, es decir que la probabilidad a priori de A es 0.001. Se selecciona al
azar un individuo de esa población, se le aplica la prueba y el resultado es positivo, ¿cuál
es la probabilidad de que en efecto padezca la enfermedad?

Debemos calcular la probabilidad a posteriori de A, P(A|B):

P( B | A) P ( A) 0.99 ⋅ 0.001
P( A | B) = = = 0.0472
P( B | A) P( A) + P( B | A ) P( A ) 0.99 ⋅ 0.001 + 0.02 ⋅ 0.999
c c

Por lo tanto, la probabilidad de que esté enfermo, habiendo sido positivo el resultado de la
prueba es aproximadamente 0.05.

Las probabilidades a posteriori dependen fuertemente de las probabilidades a priori. Si se


aplica la prueba a individuos de una población en la cual la incidencia de la enfermedad
es mucho mayor, también aumentará la probabilidad a posteriori.

Verifique ésto, suponiendo ahora que P(A) = 0.01.

Más adelante, desarrollaremos otro ejemplo de aplicación de estos Teoremas.

Independencia
La definición de probabilidad condicional nos permite “revisar” la probabilidad P(A)
asignada a un suceso, cuando se sabe que otro suceso B ha ocurrido. Hay casos en los
que P(A | B) ≠ P(A), mientras que en otros P(A | B) = P(A), es decir que la ocurrencia del
suceso B no altera la probabilidad de ocurrencia de A.

15
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Ejemplo: De una urna que contiene 4 bolillas negras y 6 blancas se extraen dos bolillas
sin reposición , ¿cuál es la probabilidad de que la segunda bolilla sea blanca, sabiendo
que la primera es negra?

Denominando A: “la segunda bolilla es blanca” y B: ”la primera bolilla es negra”,

6 2
P( A | B) = = .
9 3

Por otra parte,


6 4 5 6 54 6 3
P ( A) = P( A | B) P ( B) + P( A | B c ) P( B c ) = + = = =
9 10 9 10 90 10 5

y, por lo tanto, P ( A | B ) ≠ P ( A), es decir que la ocurrencia del suceso B modifica la


probabilidad del suceso A.

Observemos que la probabilidad de que la segunda bolilla sea blanca coincide con la
probabilidad de que la primera lo sea.

Ejercicio: Verificar que, en cambio, si las extracciones se realizan con reposición, P(A) =
P(A|B).

Diremos que los eventos A y B son independientes si la información acerca de la


ocurrencia o no de uno de ellos no afecta la probabilidad de ocurrencia del otro,

Definición: Los eventos A y B son independientes si

P( A ∩ B) = P( A) P( B)

Si la igualdad no se cumple, decimos que A y B son dependientes.

Proposición: Supongamos P(B) > 0, A y B son independientes si y sólo si P(A|B)=P(A).

P( A ∩ B)
Dem: (⇒) Si P ( B ) > 0 ⇒ P ( A | B ) = está bien definida, pero por ser A y B
P( B)
independientes, P ( A ∩ B ) = P ( A) P ( B ) , entonces

P( A) P( B)
P( A | B) = = P( A)
P( B)

(⇐) Aplicando la regla del producto, si P(B)>0, P ( A ∩ B ) = P ( A | B ) P ( B) = P ( A) P ( B) .

Observación: Si P(B) = 0, como A ∩ B ⊆ B , P( A ∩ B) = 0, y por lo tanto la igualdad


P( A ∩ B) = P( A) P( B) siempre se satisface.

16
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Ejemplo: De un mazo de 40 cartas españolas, se extrae una carta al azar. Consideremos


los siguientes sucesos:

A: ”la carta es copa o espada”


B: “ la carta no es copa”
C: “la carta es copa u oro”

20 1 30 3 20 1
P( A) = = P( B) = = P(C ) = =
40 2 40 4 40 2

1
P( A ∩ B) 1
P( A | B) = = 4 = ≠ P( A) , entonces A y B no son independientes.
P( B) 3 3
4
1
P( A ∩ C ) 1
P( A | C ) = = 4 = = P( A) , entonces A y C son independientes.
P(C ) 1 2
2

Propiedades: 1) Si los sucesos A y B son excluyentes, es decir si A ∩ B = ∅ y si P(A)>0,


P(B) > 0, entonces A y B no son independientes.

Dem: En efecto, en este caso, 0 = P ( A ∩ B ) ≠ P ( A) P ( B ).

2) Si P(B) = 0, entonces B es independiente de cualquier suceso A tal que P(A) > 0.

Dem: Como A ∩ B ⊆ B, P(A ∩ B) = 0 y por lo tanto P(A ∩ B) = P(A) P(B), es decir que A y
B son independientes.

3) Si A ⊆ B , P ( A) > 0 y P ( B) < 1, A y B no son independientes.

Dem: Como A ⊆ B ⇒ A ∩ B = A ⇒ P( A ∩ B) = P( A) ≠ P( A) P( B) . Luego, A y B no son


independientes.

4) Si A y B son sucesos independientes, A y Bc también lo son.

Dem:

P ( A) = P( A ∩ B) + P ( A ∩ B c ) ⇒ P( A ∩ B c ) = P( A) − P ( A ∩ B) = P( A) − P( A) P( B) =

P( A) (1 − P( B) ) = P( A) P( B c ) .

Ejercicio: Demostrar que si A y B son sucesos independientes, Ac y Bc también lo son.

17
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Independencia de más de dos eventos: La definición de independencia de dos eventos


puede extenderse a más de dos.

Definición: Los eventos A1 , A2 ,..., An son independientes si para todo k = 2,..., n y para
todo conjunto de índices {i1 , i2 ,..., ik } tales que 1 ≤ i1 < i2 < ... < ik ≤ n , se verifica
P( Ai1 ∩ Ai2 .... ∩ Aik ) = P( Ai1 ) ⋅ P( Ai2 )....P( Aik )

⎛n⎞ ⎛n⎞ ⎛n⎞


Es decir que es necesario verificar ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ + ...⎜⎜ ⎟⎟ = 2 n − n − 1 condiciones.
2 ⎝ ⎠ ⎝ ⎠
3 n ⎝ ⎠

Observación: Si los sucesos A1 , A2 ,..., An son independientes, entonces son


independientes de a pares pero la recíproca no es cierta.

Ejemplos: 1) Sea S = {w1 , w2 , w3 , w4 } un espacio de equiprobabilidad y consideremos n =


3 y los sucesos

A = {w1 , w4 } B = {w2 , w4 } C = {w3 , w4 }

1
P( A) = P( B ) = P(C ) = .
2
Además,
1
P( A ∩ B) = = P( A) P( B)
4
1
P( A ∩ C ) = = P( A) P(C )
4
1
P( B ∩ C ) = = P( B) P(C )
4

es decir, que los sucesos son independientes de a pares. Sin embargo,

1
P( A ∩ B ∩ C ) = ≠ P( A) P( B) P(C )
4

y, por lo tanto, los sucesos A, B y C no son independientes.

2) Veamos un ejemplo también para el caso n = 3, en el cual se satisface la factorización


de P( A ∩ B ∩ C ) y no se cumple para alguna de las intersecciones dobles. Sea
S = {w1 , w2 , w3 , w4 , w5 , w6 , w7 , w8 } un espacio de equiprobabilidad y consideremos los
sucesos

A = {w1 , w2 , w3 , w4 } B = {w1 , w2 , w7 , w8 } C = {w1 , w5 , w6 , w7 }

18
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

1
Como antes, P ( A) = P ( B ) = P (C ) = . Además,
2

1
P( A ∩ B) = = P( A) P( B)
4
1
P( B ∩ C ) = = P( B) P(C )
4
1
P( A ∩ C ) = ≠ P( A) P(C )
8

Se observa que no se satisface una de las igualdades, pero sí se satisface

1
P( A ∩ B ∩ C ) = = P( A) P( B) P(C ).
8

Finalmente, veremos un ejemplo en el que utilizamos los diferentes conceptos y


propiedades estudiadas en esta Sección.

Ejemplo: Muchos sistemas de computación trabajan con enormes bases de datos, como
por ejemplo, sistemas de tarjetas de crédito o sistemas de reservas de pasajes aéreos.
Debido al volumen de datos involucrado, la velocidad de acceso al sistema depende de
las características de las unidades de almacenamiento utilizadas, como así también de las
redes de comunicación conectadas a la base de datos. Nos concentraremos en el primer
aspecto, es decir en el problema del almacenamiento.

Consideremos unidades de almacenamiento consistentes en discos planos, cada uno de


los cuáles está compuesto por un conjunto de anillos concéntricos denominados “pistas”.
Cada pista está a su vez subdivida en áreas de almacenamiento denominadas “sectores”.
El acceso al disco se realiza mediante una cabeza lectora/grabadora que se puede mover
hacia adelante o hacia atrás a lo largo de un brazo fijo. El disco rota bajo ese brazo y la
cabeza lee o modifica un dato cuando el correspondiente sector pasa bajo ella.
Consideremos un disco que consiste de 76 pistas, numeradas de 0 a 75, con 8 sectores
cada una, numerados de 0 a 7.

Supongamos que, en el momento en que se debe acceder a un dato que se encuentra en


el sector 2 de la pista 51, la cabeza se encuentra sobre la pista 22. Entonces, debe
moverse en primer lugar hasta la pista 51 (este movimiento se llama búsqueda o seek) y
luego debe esperar hasta que el sector 2 pase bajo ella (este período de tiempo se
denomina retardo rotacional o rotational delay).

Si el cabezal se mueve por ejemplo a una velocidad de 3.2 milisegundos (ms) por pista, la
búsqueda del ejemplo demandaría (3.2) (51-22) = (3.2)(29) = 92.8 ms. Si además
suponemos que el disco realiza una rotación completa en 30 ms, el retardo rotacional

19
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

puede demorar entre 0 y 30 ms, con un promedio de 15 ms. Por último, supongamos que
el acceso concreto al dato demora 1.2 milisegundos.

Este sistema es de naturaleza probabilística o aleatoria. Las demandas de acceso arriban


en tiempos aleatorios y se demandan datos aleatorios, en el sentido de que no sabemos
con anticipación qué dato se va a requerir.

Analicemos el siguiente ejemplo. Supongamos que las probabilidades de que una


demanda de acceso corresponda a cada una de las 76 pistas son iguales y que accesos
sucesivos son independientes. Supongamos también que la cabeza lectora/grabadora se
encuentra sobre la pista 20, ¿cuál es la probabilidad de que el tiempo total de búsqueda
(seek) para las dos siguientes demandas de acceso sea a lo sumo 50 ms?

Sea A el suceso ” la búsqueda combinada demora a lo sumo 50 ms” y definamos, para


cada i = 0,1,..., 75, los sucesos

Ti: “el primero de los dos accesos siguientes corresponderá a un dato que está sobre la
pista i”

Entonces

75 75
P( A) = ∑ P( A ∩ Ti ) =∑ P( A | Ti ) P(Ti ) (3)
i =0 i =0

Como se observa, debemos calcular P ( A | Ti ) , es decir debemos calcular la probabilidad


de que la búsqueda combinada demore a lo sumo 50 ms dado que el primer acceso es a
la pista i, para i = 0,1,..,75. Por ejemplo, ¿cómo calcularíamos P( A | T26 ) ?

Si la primera búsqueda nos lleva a la pista 26, demandará (26-20) (3.2) ms = 19.2 ms, por
lo tanto la búsqueda total llevará a lo sumo 50 ms si la segunda búsqueda demora a lo
sumo 30.8 ms. Como en 30.8 ms se pueden recorrer a lo sumo 9 pistas (30.8/3.2), no
podemos ir más allá de la pista 26-9=17 o de la pista 26+9=35. En otras palabras
P( A | T26 ) será la probabilidad de que el segundo pedido de acceso se refiera a un dato
que está entre las pistas 17 y 35 inclusive. Dado que suponemos que todas las pistas son
equiprobables,

19 1
P( A | T26 ) = = .
76 4

Del mismo modo, se calculan todas las probabilidades condicionales requeridas en (3) y
se obtiene el valor de P(A) pedido.

20
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Variables aleatorias discretas

Al realizar un experimento generalmente estamos interesados en alguna función del


resultado más que en el resultado en sí mismo. Así, por ejemplo, al arrojar un dado dos
veces podríamos estar interesados sólo en la suma de los puntos obtenidos y no en el par
de valores que dio origen a ese valor de la suma. Esa cantidad de interés, o más
formalmente esa función a valores reales definida sobre el espacio muestral se denomina
variable aleatoria. Variable porque toma distintos valores y aleatoria porque el valor
observado no puede ser predicho antes de la realización del experimento, aunque sí se
sabe cuáles son sus posibles valores.

Dado que el valor de una variable aleatoria (en adelante lo abreviaremos v.a.) es
determinado por el resultado de un experimento, podremos asignar probabilidades a los
posibles valores o conjuntos de valores de la variable.

Ejemplo: Se arroja dos veces un dado equilibrado. Un espacio muestral asociado es:

S = {( x1 , x 2 ) / x i ∈{1,2,3,4,5,6}}

Posibles v.a. asociadas con este experimento son:

X: ”número de caras pares”


Y: “máximo puntaje”
Z: “suma de puntos”

Definición: Sea S un espacio muestral asociado con un experimento aleatorio. Una


variable aleatoria X es una función que asocia a cada elemento w ∈ S un número real
X(w)=x, es decir

X :S →ℜ

Como se observa, en general representaremos a las v.a. con letras mayúsculas: X, Y, Z,


etc. y sus valores con letras minúsculas, es decir X(w)=x significa que x es el número real
asociado al resultado w ∈ S a través de X.

Ejemplos: 1) Volviendo al ejemplo anterior,

X((2,5)) = 1 Y((2,5)) = 5 Z((2,5)) = 7


X((1,3)) = 0 Y((1,3)) = 3 Z((1,3)) = 4
X((2,2)) = 2 Y((2,2)) = 2 Z((2,2)) = 4

2) Se arroja una moneda equilibrada 3 veces,

⎧1 si el número de caras es impar


X =⎨
⎩0 en caso contrario

21
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

3) Se arroja una moneda equilibrada hasta que se obtiene la primera cara,

X: “número de tiros necesarios”

4) A partir del instante en que se intenta la conexión a un servidor, se registra el tiempo


que demora en concretarse la misma,

X: “tiempo requerido para la conexión”.

En los ejemplos 1), 2) y 3) las v.a. toman un número finito o infinito numerable de valores,
mientras que en el ejemplo 4) la v.a. X toma valores en un conjunto infinito no numerable,
el intervalo (0, ∞) o un intervalo (0, M) si existe un tiempo máximo (“time out”).

Notación: Indicaremos con RX el rango de la v.a. X, es decir el conjunto de valores


posibles de la v.a. X.

Ejemplos: En los ejemplos anteriores,

1) RX = {0,1,2}
RY = {1,2,3,4,5,6}
RZ = {2,3,4,5,6,7,8,9,10,11,12}

2) RX = {0,1}
 
3) RX = {1,2,3,...} = N

4) RX = (0,∞) ó (0,M) si existe un “time out”

Definición: Una v.a. es discreta si toma un número finito o infinito numerable de valores.

Ejemplo: En el caso del ejemplo 1), ¿cómo calcularíamos la probabilidad de que la v.a. Z
tome el valor 7, suponiendo que los lanzamientos son independientes?

P ( Z = 7) = P({( x1 , x 2 ) ∈ S / Z (( x1 , x 2 ) ) = 7}) = P({(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}) =


6 1
= .
36 6

Definición: La función de probabilidad puntual o de masa de la v.a. discreta X, se


define para todo x como

p X ( x) = P( X = x) = P({w ∈ S / X ( w) = x})

Se cumplen las siguientes propiedades:

22
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

p X ( x) ≥ 0 ∀x

∑p
x∈R X
X ( x) = 1

La función de probabilidad puntual de una v.a. X nos dice cómo se distribuye la


probabilidad total entre los distintos valores de X, y se determina a partir de la
probabilidad de los sucesos asociados a cada valor de X.

Ejemplos: 1) Hallemos la función de probabilidad puntual de la v.a. X : “número de caras


pares al arrojar dos veces un dado equilibrado”. Recordemos que RX = {0,1,2}.

p X (0) = P( X = 0) = P({( x1 , x 2 ) ∈ S / x1 , x 2 ∈ {1,3,5}}) =


9 1
=
36 4
p X (1) = P( X = 1) =

= P({( x1 , x 2 ) ∈ S / x1 ∈ {1,3,5}, x 2 ∈ {2,4,6}} ∪ {( x1 , x 2 ) ∈ S / x1 ∈ {2,4,6}, x 2 ∈ {1,3,5}}) =


18 1
=
36 2
p X (2) = P( X = 2) = P{( x1 , x 2 ) ∈ S / x1 , x 2 ∈ {2,4,6}} =
9 1
=
36 4

Podemos resumir esta información en una tabla de la forma:

x 0 1 2
pX(x) 1/4 1/2 1/4

o mediante un gráfico en el cual, para cada valor de x se construye una barra o un


rectángulo centrado en x, cuya altura es proporcional a pX(x)

Diagrama de Barras Histograma

23
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Definición: La función de distribución acumulada de una v.a. discreta X con función de


probabilidad puntual pX(x) se define para todo x ∈ ℜ , como

FX ( x) = P( X ≤ x) = ∑p
y ≤ x , y∈R X
X ( y)

Es decir que FX (x) es la probabilidad de que la v.a. X tome valores menores o iguales
que x.

Ejemplo: Volviendo al ejemplo 1), hallemos la función de distribución acumulada de la v.a.


X, cuya función de probabilidad puntual es

x 0 1 2
pX(x) 1/4 1/2 1/4

Si x < 0 FX ( x ) = P ( X ≤ x ) = 0
x=0 F X ( 0) = P ( X ≤ 0) = p X ( 0) = 1
4
0 < x <1 F X ( x ) = P ( X ≤ x ) = p X ( 0) = 1
4
x =1 FX (1) = P( X ≤ 1) = p X (0) + p X (1) = 1 + 1 = 3
4 2 4
1< x < 2 FX ( x) = P( X ≤ x) = p X (0) + p X (1) = 3
4
x=2 FX (2) = P( X ≤ 2) = p X (0) + p X (1) + p X (2) = 1 + 1 + 1 =1
4 2 4
x>2 FX ( x) = P( X ≤ 2) = p X (0) + p X (1) + p X (2) = 1 + 1 + 1 =1
4 2 4

Resumiendo:

⎧0 si x < 0
⎪1 si 0 ≤ x < 1

FX ( x) = ⎨ 4
3
⎪ 4 si 1 ≤ x < 2
⎪1 si x ≥ 2

¿Cómo es FX (x)?

Observamos que se trata de una función escalera, no decreciente que toma valores entre
0 y 1.

24
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Propiedades de la función de distribución acumulada:

i) ∀x ∈ ℜ, FX ( x) ∈ [0,1] .
ii) FX (x) es monótona no decreciente, es decir que si x1 < x 2 ⇒ FX ( x1 ) ≤ FX ( x 2 ).

iii) FX (x) es continua a derecha, es decir lim+ FX ( x + h) = FX ( x).


h→o

iv) lim FX ( x) = 1 y lim FX ( x) = 0


x →∞ x →-∞

v) En cada punto x, el valor del salto es la probabilidad puntual, es decir

p X ( x) = FX ( x ) − F X ( x − )

donde x − = lim+ ( x − h) (límite por la izquierda). En particular si X toma valores


h →0

x1 < x 2 < ... , entonces p X ( xi ) = FX ( xi ) − FX ( xi −1 ) para todo i ≥ 2 y p X ( x1 ) = FX ( x1 ) .

Dem: Daremos sólo demostraciones heurísticas de estas propiedades. Demostraciones


rigurosas pueden encontrarse, por ejemplo, en S. Ross (1988) o B. James (1981).

i) Obvio, ya que FX ( x) = P ( X ≤ x) = P ({w ∈ S / X ( s ) ≤ x}) y toda probabilidad toma


valores entre 0 y 1.

ii) Consideremos el suceso

A = {w / X ( w) ≤ x 2 } = {w / X ( w) ≤ x1 } ∪ {w / x1 < X ( w) ≤ x 2 } = A1 ∪ A2

Como A1 ∩ A2 = ∅, P ( A) = P( A1 ) + P( A2 ) , es decir

P ( X ≤ x 2 ) = P( X ≤ x1 ) + P ( x1 < X ≤ x 2 ) ≥ P( X ≤ x1 )
y, por lo tanto,

25
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

FX ( x 2 ) ≥ FX ( x1 )

iii) Recordemos que una función g (x) es continua a derecha en x si lim+ g ( x + h) = g ( x) .


h →0

Por lo tanto, la continuidad a derecha de FX (x) en todo x resulta de su definición:


FX ( x) = P( X ≤ x) .

iv) lim FX ( x) = lim P( X ≤ x) = lim P{w / X ( w) ≤ x} = P( S ) = 1


x →∞ x →∞ x →∞

lim FX ( x) = lim P( X ≤ x) = lim P( w / X ( w) ≤ x) = P (∅)=0


x →- ∞ x →- ∞ x →- ∞

v) p X ( x) = P( X = x) = P( X ≤ x) − P( X < x) = FX ( x) − FX ( x − )

Proposición: Sean a y b tales que a ≤ b , entonces

P(a < X ≤ b) = FX (b) − FX (a)


P(a ≤ X ≤ b) = FX (b) − FX (a − )
P(a < X < b) = FX (b − ) − FX (a )
P(a ≤ X < b) = FX (b − ) − FX (a − )

Dem: Demostremos la primera igualdad

P (a < X ≤ b) = P( X ∈ (a, b]) = P( X ∈ (− ∞, b]) − P( X ∈ (− ∞, a ])


= P( X ≤ b) − P( X ≤ a ) = FX (b)-FX (a )

Ejercicio: Demostrar las siguientes 3 igualdades, usando por ejemplo que

P ( a ≤ X ≤ b) = P ( a < X ≤ b) + P ( X = a )

y aplicando la propiedad v) de las funciones de distribución acumuladas.

Ejemplo: Volviendo al ejemplo 1), y usando la función de distribución calculada antes,


calculemos P( 1 ≤ X ≤ 2 ) y P( X = 1 ) .

1 3
P(1 ≤ X ≤ 2) = FX (2) − FX (1− ) = 1 −
=
4 4
3 1 1
P( X = 1) = FX (1) − FX (1− ) = − = .
4 4 2

26
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Ejemplo: Un experimento tiene sólo dos resultados posibles, que denominaremos Éxito y
Fracaso. El experimento se repite en forma independiente hasta que se obtiene el primer
éxito. Sea p = P(Éxito), 0 < p < 1, y definamos la v.a. X = “número de repeticiones hasta
obtener el primer éxito”. Como ya hemos visto, RX = N.

Hallemos la función de probabilidad puntual de la v.a. X.

p X (1) = p
p X (2) = (1 − p) p
p X (3) = (1 − p ) 2 p
..........................
p X (k ) = (1 − p) k −1 p
.........................

Entonces,

p X (k ) = (1 − p ) k −1 p ∀k ∈ N .

Verifiquemos que en efecto esta función satisface las dos propiedades

p X ( x) ≥ 0 ∀x

∑p
x∈R X
X ( x) = 1

Dado que 0 < p < 1 , la primer propiedad obviamente se satisface. Respecto a la segunda,

∞ ∞ ∞
1
∑p
k =1
X (k ) =∑ (1 − p )
k =1
k −1
p = p ∑ (1 − p ) j = p
j =0 1 − (1 − p )
=1


1
donde hemos usado que la suma de la serie geométrica ∑q
i =0
i
=
1− q
, si q < 1.

Hallemos la función de distribución acumulada de la v.a. X.

27
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

x <1 FX ( x ) = 0
1≤ x < 2 FX (x) = p
2≤ x<3 FX (x) = p + p( 1-p)
3≤ x<4 FX (x) = p + p( 1-p) + p( 1-p) 2
..............................................................
k k −1
1 − (1 − p) k
k ≤ x < k +1 F X ( x) = p ∑ (1 − p) j −1 = p ∑ (1 − p) i = p = 1 − (1 − p ) k
j =1 i =0 1 − (1 − p )
..............................................................

1 − q n +1 n
Hemos usado que la suma parcial de una serie geométrica es ∑ q = . i

i =0 1− q

Recordemos que la función de distribución debe estar definida para todo x ∈ ℜ , entonces

⎧0 si x < 1
FX ( x) = ⎨ [x ]
⎩1 − (1 − p) si x ≥ 1

donde [a ] denota la parte entera de a .

Ejercicio: Verificar que esta función de distribución satisface las propiedades enunciadas
antes.

Parámetro de una función de probabilidad: En el ejemplo anterior la probabilidad de Éxito


la designamos p donde 0 < p < 1. Variando este valor obtenemos diferentes funciones de
probabilidad que constituyen lo que se denomina una familia de distribuciones. El valor p
se denomina parámetro de la distribución.

En el caso del ejemplo, la familia obtenida se denomina Geométrica de parámetro p y


diremos que X ~ G(p). Por ejemplo, si el experimento hubiese consistido en arrojar un
dado equilibrado hasta obtener el primer as, X ~ G(1/6) y si hubiese consistido en arrojar
una moneda equilibrada hasta obtener la primera cara, X ~ G(1/2).

Esperanza o valor esperado de una v.a. discreta:

Una empresa proveedora de servicio de Televisión Satelital tiene 20000 clientes en cierta
zona, cada uno de los cuáles puede optar por contratar de 1 a 5 paquetes de señales (el
abono básico consiste en un solo paquete y cada uno de los otros paquetes incluye
grupos de señales temáticas o premium). Supongamos que, entre los 20000 clientes, la
distribución del número de paquetes X contratados es la siguiente:

28
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

x 1 2 3 4 5
número de clientes 7500 5500 3500 2000 1500
proporción 37.5% 27.5% 17.5% 10.0% 7.5%

Si interesa el número promedio de paquetes contratados, o sea el valor promedio de X en


la población, deberíamos calcular:

1 ⋅ 7500 + 2 ⋅ 5500 + 3 ⋅ 3500 + 4 ⋅ 2000 + 5 ⋅ 1500 44500


= = 2.225
20000 20000

Observemos que, si no hubiésemos conocido los números de clientes que contratan cada
número de paquetes ni el total de la población, sino sólo las proporciones de cada número
(o su probabilidad) hubiésemos podido obtener el valor promedio, ya que dicho número
puede escribirse en la forma:

7500 5500 3500 2000 1500


1⋅ + 2⋅ + 3⋅ + 4⋅ + 5⋅ =
20000 20000 20000 20000 20000

= 1 ⋅ 0.375 + 2 ⋅ 0.275 + 3 ⋅ 0.175 + 4 ⋅ 0.10 + 5 ⋅ 0.075

Ésto motiva la siguiente definición.

Definición: Sea X una v.a. discreta que toma valores en RX con función de probabilidad
puntual pX(x), la esperanza o valor esperado de X se define como

E( X ) = μ X = ∑x p
x∈R X
X ( x)

siempre que ∑x p X ( x) < ∞ . Si la serie de los valores absolutos diverge, la esperanza


x∈R X

no puede definirse y decimos que no existe.

Ejemplos: 1) Sea X: “número de caras pares al arrojar dos veces un dado equilibrado”.
Como

x 0 1 2
pX(x) 1/4 1/2 1/4

1 1 1
entonces, E( X ) = 0 +1 + 2 =1.
4 2 4

29
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

2) Sea X una v.a. que toma sólo dos valores que designaremos 1 y 0 (Éxito y Fracaso)
con la siguiente función de probabilidad puntual

x 1 0
pX(x) α 1-α

siendo 0 < α < 1. Una v.a. de este tipo se dice que es una v.a. de tipo Bernoulli y su
esperanza es:

E (X ) = 1 ⋅ α + 0 ⋅ (1 − α ) = α

3) Veamos un ejemplo en que no existe E(X). Sea X una v.a. con la siguiente función de
probabilidad puntual

⎧ 6 1
⎪ si x ∈ N
p X ( x ) = ⎨π 2 x 2
⎪⎩ 0 en otro caso

En primer lugar, observemos que pX(x) es una función de probabilidad puntual, ya que


1 π2

x =1 x
2
=
6

y, por lo tanto la suma de las probabilidades es 1. Calculemos la esperanza de X,

∞ ∞
6 1 6 1
E( X ) = ∑ x = 2 ∑ =∞
x =1 π x
2 2
π x =1 x

4) Consideremos nuevamente un experimento que tiene sólo dos resultados posibles y


que se repite en forma independiente hasta que se obtiene el primer éxito. Si p = P(Éxito),
0 < p < 1, y si definimos la v.a. X = “número de repeticiones hasta obtener el primer éxito”,
hemos demostrado que su función de probabilidad puntual está dada por

p X (k ) = (1 − p) k −1 p ∀k ∈ N

Calculemos la esperanza de X.

∞ ∞ ∞

E ( X ) = ∑ k p (1 − p ) k −1 = p ∑ k (1 − p ) k −1 = − p ∑ (1 − p ) k
k =1 k =1 k =1 ∂p

30
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Como la serie de potencias involucrada en la última igualdad es convergente, la derivada


de la suma es la suma de las derivadas, entonces

∂ ⎛ ∞ ⎞ ∂ ⎛ 1 ⎞ ∂ ⎛1 ⎞ ⎛ 1 ⎞ 1
E( X ) = − p ⎜ ∑ (1 − p ) k ⎟ = − p ⎜⎜ − 1⎟⎟ = − p ⎜⎜ − 1⎟⎟ = − p⎜⎜ − 2 ⎟⎟ = .
∂p ⎝ k =1 ⎠ ∂p ⎝ 1 − (1 − p ) ⎠ ∂p ⎝ p ⎠ ⎝ p ⎠ p

1
y por lo tanto hemos demostrado que E ( X ) = .
p

Interpretación de la esperanza: E(X) es el centro de gravedad de la función de


probabilidad puntual. Es decir que si imaginamos que sobre cada valor posible de X, xi,
colocamos una masa pX(xi), el punto de equilibrio del sistema es E(X). En este sentido,
podemos decir que E(X) es una medida del “centro” de la distribución.

Otra interpretación de E(X) está relacionada con un resultado que estudiaremos más
adelante, denominado “ley de los grandes números”. Imaginemos que se repite
indefinidamente un experimento aleatorio y que en cada repetición nuestra v.a. X toma
diferentes valores. Se ha demostrado que el promedio de los resultados obtenidos tiende
a estabilizarse en un número que es E(X), si es que ésta existe.

Esperanza de una función de una v.a. discreta: Volvamos al ejemplo considerado al


comienzo del parágrafo dedicado a la esperanza. Sea la v.a. X: número de paquetes de
programas contratado por un cliente seleccionado al azar y consideremos su función de
probabilidad puntual:

x 1 2 3 4 5
pX(x) 0.375 0.275 0.175 0.100 0.075

Supongamos que el costo del servicio (Y) es función del número de paquetes contratado,
según la siguiente fórmula:

Y = 30 ( X + 1)

¿Cuál es el valor esperado del costo pagado por cliente? Es decir, ¿cuál es E(Y)?.

A partir de la función de probabilidad puntual de X, podemos obtener la de función de


probabilidad de Y ya que, por un lado RY = {60,90,120,150,180} y, por ejemplo,
P(Y=120)=P(X=3)=0.175. Entonces,

y 60 90 120 150 180


pY(y) 0.375 0.275 0.175 0.100 0.075

y, E (Y ) = 60 ⋅ 0.375 + 90 ⋅ 0.275 + 120 ⋅ 0.175 + 150 ⋅ 0.10 + 180 ⋅ 0.075 = 96.75.

31
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

5
Observemos que, E( Y ) = ∑ h( x ) p
x =1
X ( x ), siendo h( x) = 30( x + 1).

Proposición: Si X es discreta y toma valores x1, x2, ....., entonces h(X) es discreta con
valores y1, y2, ...., siendo yj = h(xi) para al menos un valor de i.

Proposición: Si la v.a. X tiene función de probabilidad puntual pX(x) para todo x ∈ RX,
entonces la esperanza de cualquier función real h(X), está dada por

E (h( X )) = ∑ h( x ) p
x∈R X
X ( x)

si la serie es absolutamente convergente, o sea si ∑ h( x )


x∈R X
p X ( x) < ∞ .

Dem: Sea Y = h( X ), entonces

⎡ ⎤
E (Y ) = ∑ y j pY ( y j ) =∑ y j ⎢ ∑ p X ( x i )⎥ =∑ ∑ y j p X ( x i ) = ∑ h( x i ) p X ( xi ) .
j j ⎢⎣i / h ( xi ) = y j ⎥⎦ j i / h ( xi ) = y j i

Propiedades de la esperanza:

1) (Linealidad) Si a y b son constantes reales, E (aX + b) = aE ( X ) + b .

Dem: Sea h( X ) = aX + b, entonces

E (h( X )) = E (aX + b) = ∑ (ax + b) p


x∈R X
X ( x) = a ∑ x p X ( x) + b ∑ p X ( x) =aE ( X ) + b.
x∈R X x∈R X

2) Si X es una v.a. tal que P(X=c)=1, entonces E(X)=c.

Dem: E ( X ) = cp X (c) = c.

Varianza de una v.a. discreta:

Consideremos las siguientes funciones de probabilidad:

x 2 3 4
pX(x) 1/3 1/3 1/3

y 1 2 3 4 5
pY(y) 1/12 5/12 2/12 1/12 3/12

32
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

z 3
pZ(z) 1

Estas tres v.a. tienen la misma esperanza, sin embargo la forma de su distribución es muy
diferente.

Ejercicio: Graficar las tres funciones de probabilidad puntual y verificar que


E(X)=E(Y)=E(Z)=3.

Definiremos una medida de la variabilidad de una variable aleatoria alrededor de su


esperanza.

Definición: Sea X una v.a. discreta con función de probabilidad puntual pX(x) y esperanza
μX, la varianza de X, que se denotará V(X), σ X2 ó σ 2 , es

V ( X ) = σ X2 = ∑ (x − μ X ) 2 p X ( x) = E [( X − μ X ) 2 ].
x∈R X

y el desvío standard de X, es σ X = + V ( X ) .

Ejemplos: 1) Calculemos la varianza y el desvío standard de las tres v.a. que acabamos
de presentar, cuya esperanza es igual a 3.

1 1 1 2
V ( X ) = σ X2 = ( 2 − 3 ) 2 + ( 3 − 3 )2 + ( 4 − 3 )2 =
3 3 3 3
1 5 2 1 3 22 11
V ( Y ) = σ Y2 = ( 1 − 3 ) 2 + ( 2 − 3 )2 + ( 3 − 3 )2 + ( 4 − 3 )2 + ( 5 − 3 )2 = =
12 12 12 12 12 12 6
V ( Z ) = σ Z2 = ( 3 − 3 ) 2 ⋅ 1 = 0

2) Consideremos X: “número de caras pares al arrojar dos veces un dado equilibrado”


cuya función de probabilidad puntual es

x 0 1 2
pX(x) 1/4 1/2 1/4

y su esperanza es E ( X ) = 1 , entonces

1 1 1 1
V ( X ) = (0 − 1) 2 + (1 − 1) 2 + (2 − 1) 2 = .
4 2 4 2

33
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

3) Sea X una v.a. Bernoulli con función de probabilidad puntual

x 1 0
pX(x) α 1-α

con 0 < α < 1. Recordemos que E ( X ) = α , entonces

V ( X ) = (1 − α ) 2 α + (0 − α ) 2 (1 − α ) = α (1 − α ) [(1 − α ) + α ] = α (1 − α ).

Proposición: V ( X ) = E ( X 2 ) − (E ( X ) ) .
2

Dem:

(
V (X ) = E (X − μ X )2 = ) ∑ (x − μ X ) 2 p X ( x) = ∑ (x 2
)
− 2 μ X x + μ X2 p X ( x) =
x∈R X x∈R X

= ∑x
x∈R X
2
p X ( x) − 2μ X ∑xp
x∈R X
X ( x) + μ X2 ∑p
x∈R X
X ( x) = E ( X 2 ) − 2 μ X E ( X ) + μ X2 =

= E ( X 2 ) − 2μ X2 + μ X2 = E ( X 2 ) − μ X2 = E ( X 2 ) − (E ( X ) ) .
2

Ejemplo: Consideremos nuevamente un experimento que tiene sólo dos resultados


posibles y que se repite en forma independiente hasta que se obtiene el primer éxito. Si p
= P(Éxito), 0 < p < 1, hemos definido la v.a. X = “número de repeticiones hasta obtener el
primer éxito”, cuya función de probabilidad puntual está dada por:

p X (k ) = (1 − p) k −1 p ∀k ∈ N

1 1− p
Hemos demostrado que E ( X ) = . Demostraremos ahora que V ( X ) = .
p p2

Calculemos E ( X 2 ).

∞ ∞
E ( X ) = ∑ k p (1 − p )
2 2 k −1
=∑ [(k + 1)k − k ] p(1 − p) k −1 =
k =1 k =1

∞ ∞ ∞
= ∑ (k + 1)kp(1 − p) k −1 − ∑ k p (1 − p ) k −1 =∑ (k + 1)kp(1 − p) k −1 − E ( X ) =
k =1 k =1 k =1

⎡∞ ⎤ 1 ⎡ ∞ ∂2 ⎤ 1
= p ⎢∑ (k + 1)k (1 − p ) k −1 ⎥ − = p ⎢∑ 2 (1 − p ) k +1 ⎥ − =
⎣ k =1 ⎦ p ⎣ k =1 ∂p ⎦ p

34
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

∂2 ⎡ ∞ k +1 ⎤ 1 ∂2 ⎡ ∞ ⎤ 1
=p 2 ⎢ ∑
∂p ⎣ k =1
(1 − p ) ⎥ −
⎦ p
= p 2 ⎢∑
∂p ⎣ j = 2
(1 − p ) j ⎥ − =
⎦ p

∂2 ⎡ 1 ⎤ 1 ∂2 ⎡1 ⎤ 1
=p ⎢ − 1 − (1 − p ) −
⎥ p = p ⎢p −2+ p⎥ − =
∂p 2 ⎣1 − (1 − p ) ⎦ ∂p 2 ⎣ ⎦ p

∂ ⎡ 1 ⎤ 1 2 1 2 1
=p ⎢− 2 + 1⎥ − = p 3 − = 2 −
∂p ⎣ p ⎦ p p p p p

Entonces,

1 (1 − p )
V ( X ) = E ( X 2 ) − (E ( X ) ) =
2 1 1 1
− − 2 = 2 − =
2
2
p p p p p p2

como queríamos demostrar.

Propiedades de la varianza y del desvío standard:

1) V (aX + b) = a 2V ( X ) y σ aX +b = a σ X .

Dem: Observemos que, en general,

V (h( X )) = ∑ (h( x) − E (h( X )))


2
p X ( x).
x∈R X

Entonces,

V (aX + b) = ∑ (ax + b − E (aX + b)) p X ( x) = ∑ (ax + b − aE ( X ) − b)) p X ( x) =


2 2

x∈R X x∈R X

∑ (ax − aE ( X )) ∑ (x − E ( X ) )
2
= p X ( x) =a p X ( x) = a 2V ( X )
2 2

x∈R X x∈R X

y, por lo tanto, σ aX + b = a σ X .

35
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

En particular, observemos que σ aX


2
= a 2 σ X2 y σ X2 +b = σ X2 , y por lo tanto un cambio de
escala afecta la varianza pero una traslación no la afecta.

2) Si X es una v.a. tal que P(X=c) = 1, entonces V(X) = 0.

Dem: Ejercicio.

36
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Variables aleatorias discretas

Distribución Binomial:

Muchos experimentos aleatorios satisfacen las siguientes condiciones:

• El experimento consiste de n pruebas, siendo n fijo.


• Las pruebas son idénticas y en cada prueba hay sólo dos resultados posibles, que
denominaremos Éxito (E) y Fracaso (F). Una prueba de este tipo se denomina ensayo
de Bernoulli.
• Las pruebas son independientes, es decir que el resultado de una prueba no influye
sobre el de las otras.
• La probabilidad de Éxito (P(E)=p) se mantiene constante en todas las pruebas.

Definición: Un experimento que satisface estos cuatro requerimientos se denomina


experimento Binomial.

Ejemplos: 1) Se arroja una moneda n veces y se llama Éxito al suceso “sale cara”.

2) Se arroja un dado equilibrado n veces y se llama Éxito al suceso “se obtiene un as”.

3) Se arroja n veces un dardo a un blanco circular de radio R, el cuál contiene en el centro


un círculo de radio R/4 y se denomina Éxito al suceso “el dardo impacta en el círculo
central”.

4) Se extraen 4 bolillas con reposición de una urna que contiene 5 bolillas blancas y 3
negras y se denomina Éxito al suceso “las 4 bolillas son blancas”.

5) ¿Es el que sigue un experimento Binomial? Se extraen 2 bolillas sin reposición de una
urna que contiene 5 bolillas blancas y 3 negras y se denomina Éxito al suceso “la bolilla
extraída es blanca”.

NO, no lo es ya que si denominamos Bi al suceso “la i-ésima bolilla extraída es blanca”,

4 5
P ( B2 | B1 ) = ≠ P ( B2 ) =
7 8

y, por lo tanto no se verifica la tercera condición. En realidad tampoco se verifica la


segunda ya que las pruebas no son idénticas (la composición de la urna varía).
Observemos que, sin embargo la cuarta condición se satisface.

Variable aleatoria binomial: Consideremos un experimento binomial que consiste de n


repeticiones y en el cual P(E) = p. Denominaremos v.a. binomial a la variable

X: número de éxitos en las n repeticiones.

Notación: X ~ Bi (n,p).

37
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Calculemos su función de probabilidad puntual. Para ello, observemos en primer lugar


que RX = {0,1,2,...,n}.

Sea k ∈ RX, una secuencia posible con k éxitos y n-k fracasos es:

E2
1...3
E1F2
...3
F
k n−k

y su probabilidad, dada la independencia de las repeticiones, es p k (1 − p ) n − k . Pero, hay


⎛n⎞
⎜⎜ ⎟⎟ secuencias posibles conteniendo k éxitos, entonces
⎝k ⎠
⎛n⎞
P ( X = k ) = p X (k ) = ⎜⎜ ⎟⎟ p k (1 − p) n − k ∀ k ∈{0,1,..., n}
⎝k ⎠
n
Verifiquemos que ∑p
k =0
X (k ) = 1. En efecto,

n n
⎛n⎞
∑p (k ) = ∑ ⎜⎜ ⎟⎟ p k (1 − p ) n − k = ( p + (1 − p ) ) = 1n = 1.
n
X
k =0 k =0 ⎝ ⎠
k

n
⎛n⎞
Hemos usado la fórmula del Binomio de Newton: (a + b) n = ∑ ⎜⎜ k ⎟⎟a k
b n−k .
k =0 ⎝ ⎠

Función de distribución: Si X ~ Bi (n,p),

⎧0 si x < 0
⎪⎪ [ x ] ⎛ n ⎞
FX ( x) = ⎨∑ ⎜⎜ ⎟⎟ p k (1 − p) n − k si 0 ≤ x ≤ n
⎪ k =0 ⎝ k ⎠
⎪⎩ 1 si x > n

donde [x] denota la parte entera de x.

Ejemplo: Supongamos que se arroja un dado equilibrado 10 veces y se llama Éxito al


suceso “se obtiene un as”. La v.a.

X: número de ases en los 10 tiros

tiene distribución Binomial de parámetros 10 y 1/6, o sea X ~ Bi (10,1/6), entonces


⎛10 ⎞⎛ 1 ⎞ ⎛ 5 ⎞
4 6

P ( X = 4) = ⎜⎜ ⎟⎟⎜ ⎟ ⎜ ⎟ = 0.054
⎝ 4 ⎠⎝ 6 ⎠ ⎝ 6 ⎠
10 − k
⎛10 ⎞⎛ 1 ⎞ ⎛ 5 ⎞
5 k

P (3 ≤ X ≤ 5) = ∑ ⎜⎜ ⎟⎟⎜ ⎟ ⎜ ⎟ = FX (5) − FX (2) =0.22


k = 3 ⎝ k ⎠⎝ 6 ⎠ ⎝ 6 ⎠

38
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Esperanza y varianza de una variable aleatoria binomial: Sea X ~ Bi (n,p),

E ( X ) = np y V ( X ) = np(1 − p)

Dem: En el caso n=1, X es una v.a. Bernoulli y ya hemos demostrado que en este caso,
E(X)=p y V(X) = p(1-p). Sea ahora n>1,

n
⎛n⎞ n
⎛n⎞ n
n!
E ( X ) = ∑ k ⎜⎜ ⎟⎟ p k (1 − p ) n − k =∑ k ⎜⎜ ⎟⎟ p k (1 − p ) n − k =∑ k p k (1 − p) n − k =
k =0 ⎝k ⎠ k =1 ⎝k ⎠ k =1 k!(n - k)!

n
n! n
(n − 1)!

k =1 ( k − 1)! ( n − k )!
p k
(1 − p ) n−k
= np ∑
k =1 ( k − 1)! ( n − k )!
p k −1 (1 − p ) n − k =

n
⎛ n − 1⎞ k −1 n −1 n − 1
⎛ ⎞ j
np ∑ ⎜⎜ ⎟⎟ p (1 − p ) (n −1)−(k −1) = np ∑ ⎜⎜ ⎟⎟ p (1 − p ) n −1− j = np ( p + (1 − p) ) = np.
n −1

k =1 ⎝ k − 1 ⎠ ( k −1) = j
j =0 ⎝ j ⎠

( )
Recordemos que V ( X ) = E X 2 − (E ( X ) ) = E X 2 − n 2 p 2 .
2
( )
n
⎛n⎞ n
⎛n⎞
E ( X 2 ) = ∑ k 2 ⎜⎜ ⎟⎟ p k (1 − p) n − k = ∑ (k (k − 1) + k ) ⎜⎜ ⎟⎟ p k (1 − p) n − k
k =0 ⎝k ⎠ k =0 ⎝k ⎠

n
⎛n⎞ n
⎛n⎞ n
⎛n⎞
= ∑ k (k − 1) ⎜⎜ ⎟⎟ p k (1 − p) n − k + ∑ k ⎜⎜ ⎟⎟ p k (1 − p) n − k = ∑ k (k − 1) ⎜⎜ ⎟⎟ p k (1 − p ) n − k + E ( X )
k =0 ⎝k ⎠ k =0 ⎝k ⎠ k =2 ⎝k ⎠

n n
n! n!
= ∑ k (k − 1) p k (1 − p ) n − k + np = ∑ p k (1 − p ) n − k + np
k =2 k!(n − k )! k =2 ( k − 2)! ( n − k )!

n
(n − 2)!
= n(n − 1) p 2 ∑ p k − 2 (1 − p ) n − k + np
k =2 (k − 2)!(n − k )!

n−2
⎛ n − 2⎞ j
= n(n − 1) p 2 ∑ ⎜⎜ ⎟⎟ p (1 − p ) n − 2 − j + np = n(n − 1) p 2 ( p + (1 − p ) )n − 2 + np
( k −2)= j
j =0 ⎝ j ⎠

= n(n − 1) p 2 + np

39
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

En realidad, para que la demostración anterior sea válida debe ser n ≥ 2, pero es
inmediato verificar que, si n=1, E ( X 2 ) = p y por lo tanto la expresión hallada es válida
para todo n.
Finalmente,

V ( X ) = E ( X 2 ) − (E ( X ) ) = n(n − 1) p 2 + np − n 2 p 2 = −np 2 + np = np (1 − p )
2

En el siguiente gráfico se muestra la función de probabilidad puntual correspondiente a la


distribución Binomial para distintos valores de p y n=10. Puede observarse cómo la
distribución se simetriza a medida que p tiende a 0.5.
¿Cómo serían los gráficos para valores de p>0.5?

Bi(10, 0.1 ) Bi(10, 0.15 ) Bi(10, 0.2 )


0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0
0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10

x x x

Bi(10, 0.25 ) Bi(10, 0.3 ) Bi(10, 0.35 )


0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0

0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10

x x x

Bi(10, 0.4 ) Bi(10, 0.45 ) Bi(10, 0.5 )


0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0

0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10

x x x

40
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

En el siguiente gráfico se muestra la función de probabilidad puntual correspondiente a la


distribución Binomial para distintos valores de p y n.

Bi( 5 , 0.1 ) Bi( 10 , 0.1 ) Bi( 25 , 0.1 )


0.6

0.6

0.6
0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0
0 1 2 3 4 5 0 2 4 6 8 10 0 5 10 15 20 25

x x x

Bi( 5 , 0.5 ) Bi( 10 , 0.5 ) Bi( 25 , 0.5 )


0.6

0.6

0.6
0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0
0 1 2 3 4 5 0 2 4 6 8 10 0 5 10 15 20 25

x x x

Bi( 5 , 0.9 ) Bi( 10 , 0.9 ) Bi( 25 , 0.9 )


0.6

0.6

0.6
0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0

0 1 2 3 4 5 0 2 4 6 8 10 0 5 10 15 20 25

x x x

41
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Variable aleatoria Geométrica: Supongamos que se repite en forma independiente un


ensayo de Bernoulli con probabilidad de Éxito (P(E)=p) constante en todas las pruebas.
Se define la v.a.

X: número de repeticiones hasta obtener el primer Éxito.

Notación: X ~ G (p).

Al estudiar en general las v.a. discretas, hemos probado que la función de probabilidad
puntual de X está dada por

p X (k ) = (1 − p ) k −1 p ∀k ∈ N .

y su función de distribución acumulada por

⎧0 si x < 1
FX ( x) = ⎨ [x ]
⎩1 − (1 − p ) si x ≥ 1

donde [x ] denota la parte entera de x .

Esperanza y varianza de una variable aleatoria geométrica: Sea X ~ G (p),

1 (1 − p )
E( X ) = y V (X ) =
p p2

Dem: Lo hemos demostrado al estudiar en general la esperanza y la varianza de una v.a.


discreta.

Proposición (Propiedad de Falta de Memoria): Sea X ~ G (p) y sean n y m números


naturales cualesquiera,

P ( X > n + m | X > n ) = P ( X > m)

Dem: Ejercicio.
(Sugerencia: Demostrar que si X ~ G (p), P ( X > k ) = (1 − p ) k ).

Ejemplo: Sea X: “número de tiros hasta obtener el primer as en una sucesión de tiros de
un dado equilibrado”, entonces X ~ G (1/6).

42
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

6
1⎛5⎞
P ( X = 7) = ⎜ ⎟ = 0.06
6⎝6⎠

5
⎛5⎞
P ( X ≥ 6) = P( X > 5) = ⎜ ⎟ = 0.40
⎝6⎠

1 5/6
E( X ) = =6 V (X ) = = 30
1/ 6 (1 / 6)2

En el siguiente gráfico se muestra la función de probabilidad puntual correspondiente a la


distribución Geométrica para distintos valores de p.

G( 0.1 ) G( 0.15 ) G( 0.2 )


0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0

0 5 10 15 20 25 30 0 5 10 15 20 25 30 0 5 10 15 20 25 30

x x x

G( 0.25 ) G( 0.3 ) G( 0.35 )


0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0

0 5 10 15 20 25 30 0 5 10 15 20 25 30 0 5 10 15 20 25 30

x x x

G( 0.4 ) G( 0.45 ) G( 0.5 )


0.4

0.4

0.4
p(x)

p(x)

p(x)
0.2

0.2

0.2
0.0

0.0

0.0

0 5 10 15 20 25 30 0 5 10 15 20 25 30 0 5 10 15 20 25 30

x x x

43
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Variable aleatoria Binomial Negativa: Supongamos que se repite en forma


independiente un ensayo de Bernoulli con probabilidad de Éxito (P(E)=p) constante en
todas las pruebas. Se define la v.a.

X: número de repeticiones hasta obtener el r-ésimo Éxito (r ≥1).

Notación: X ~ BN (r,p).

Esta v.a. es una generalización de la v.a. Geométrica, la cual corresponde al caso r = 1.

Observemos que RX = {r, r+1, r+2, ....} y hallemos su función de probabilidad puntual.

Sea k un número natural, k ≥ r. Para que sean necesarias k repeticiones para obtener el
primer Éxito, el r-ésimo Éxito debe ocurrir en la repetición k y en las (k-1) repeticiones
previas debe haber exactamente (r -1) Éxitos. Como las repeticiones son independientes
la probabilidad de una configuración de ese tipo es p r (1 − p ) k − r , pero hay varias
configuraciones de esta forma. ¿Cuántas? Tantas como formas de elegir entre las (k-1)
⎛ k − 1⎞
primeras repeticiones, aquellas donde ocurrirán los (r-1) Éxitos, o sea ⎜⎜ ⎟⎟ .
⎝ r − 1⎠

Por lo tanto la función de probabilidad puntual será:

⎛ k − 1⎞ r
P ( X = k ) = ⎜⎜ ⎟⎟ p (1 − p ) k − r ∀ k ∈ {r , r + 1, r + 2,....}
⎝ r − 1⎠

Función de distribución: Si X ~ BN (r,p),


⎪0 si x < r
⎪⎪
FX ( x) = ⎨
⎪ [ x ] ⎛ k − 1⎞ r
⎪∑ ⎜⎜ ⎟⎟ p (1 − p ) k − r si x ≥ r
⎩⎪ k = r ⎝ r − 1 ⎠

donde [x] denota la parte entera de x.

Ejemplo: Se extraen con reposición bolillas de una urna que contiene 3 bolillas blancas y
7 rojas. Se define X: número de extracciones hasta obtener la cuarta bolilla roja.

X ~ BN (4,7/10)

⎛ 5 − 1⎞⎛ 7 ⎞ ⎛ 3 ⎞
4

P ( X = 5) = ⎜⎜ ⎟⎟⎜ ⎟ ⎜ ⎟ = 0.29
⎝ 4 − 1⎠⎝ 10 ⎠ ⎝ 10 ⎠

44
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

k −4
⎛ k − 1⎞⎛ 7 ⎞ ⎛ 3 ⎞
7 4

P (5 ≤ X ≤ 7) = ∑ ⎜⎜ ⎟⎟⎜ ⎟ ⎜ ⎟ = 0.49
k = 5 ⎝ 3 ⎠⎝ 10 ⎠ ⎝ 10 ⎠

Proposición: Sea X ~ BN (r,p),

r r (1 − p)
E( X ) = V (X ) =
p p2

Dem: Lo demostraremos más adelante usando que una v.a. Binomial Negativa puede
expresarse como suma de v.a. Geométricas independientes.

Observación: Esta v.a. suele también definirse como el número de Fracasos antes de
obtener el r-ésimo Éxito. Si la denotamos X, entonces su rango será

RX* = {0,1,2,...} = N ∪ {0}

⎛ r + x − 1⎞ r
y su función de probabilidad puntual: p X * ( x) = ⎜⎜ ⎟⎟ p (1 − p) x
⎝ x ⎠

En este caso,

r (1 − p) r (1 − p)
E( X * ) = y V (X * ) =
p p2

Variable aleatoria Hipergeométrica: Supongamos que

• La población a ser muestreada consiste de N elementos o individuos (población finita)

• Cada elemento o individuo puede ser clasificado como Éxito o Fracaso y hay D Éxitos
en la población.

• Se extrae de la población una muestra de n elementos o individuos, de forma tal que


cualquier subconjunto de tamaño n tiene la misma probabilidad de ser elegido.

Sea X : número de éxitos en la muestra de tamaño n. Se dice que X tiene distribución


Hipergeométrica de parámetros n, N y D y se denota

X ~ H (n,N,D)

Ejemplo: De una urna que contiene 3 bolillas blancas y 7 negras se extraen 4 bolillas sin
reposición y se define X: número de bolillas blancas extraídas.

45
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

¿Cómo calcularíamos la probabilidad de que se extraigan 2 bolillas blancas (X = 2)?

Como todos los conjuntos de 4 bolillas tienen la misma probabilidad de ser extraídos, la
1 ⎛ 3 ⎞⎛ 7 ⎞
probabilidad de uno cualquiera de ellos será . Por otro lado hay ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ conjuntos
⎛10 ⎞ ⎝ 2 ⎠⎝ 2 ⎠
⎜⎜ ⎟⎟
⎝4⎠
que contienen 2 bolillas blancas y 2 negras y, por lo tanto la probabilidad pedida será:

⎛ 3 ⎞⎛ 7 ⎞
⎜⎜ ⎟⎟⎜⎜ ⎟⎟
3 ⋅ 21 3
P ( X = 2) = ⎝ ⎠⎝ ⎠ =
2 2
= .
⎛10 ⎞ 210 10
⎜⎜ ⎟⎟
⎝4⎠

Proposición: Si X ~ H (n,N,D),

⎛ D ⎞⎛ N − D ⎞
⎜⎜ ⎟⎟⎜⎜ ⎟
⎝ k ⎠⎝ n − k ⎟⎠
p X (k ) = max(0, n − ( N − D) ) ≤ k ≤ min (n, D )
⎛N⎞
⎜⎜ ⎟⎟
⎝n⎠

Dem: El número de subconjuntos distintos de tamaño n que se pueden extraer de una


⎛N⎞ ⎛ D ⎞⎛ N − D ⎞
población de tamaño N es ⎜⎜ ⎟⎟ . De esos conjuntos, hay ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ que contienen k
⎝n⎠ ⎝ k ⎠⎝ n − k ⎠
Éxitos y (n-k) Fracasos y se obtiene la función de probabilidad. El rango de valores
posibles de k resulta de observar que se deben satisfacer tres condiciones:

0≤k ≤n k≤D n-k≤N-D

De las dos primeras se obtiene: k ≤ n, k ≤ D ⇔ k ≤ min(n, D)

De la primera y la tercera se obtiene: k ≥ 0, k ≥ n − ( N − D) ⇔ k ≥ max(0, n − ( N − D ) ) .

Proposición: Si X ~ H (n,N,D),

D ⎛ N −n⎞ D ⎛ D⎞
E( X ) = n V (X ) = ⎜ ⎟ n ⎜1 − ⎟
N ⎝ N −1 ⎠ N ⎝ N⎠

Dem: Ejercicio opcional.

46
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

⎛ N −n⎞
Observaciones: 1) El factor ⎜ ⎟ que aparece en la expresión de la varianza se
⎝ N −1 ⎠
denomina factor de corrección por población finita.

2) Si n es pequeño en relación a N, la hipergeométrica puede ser aproximada por la


distribución Binomial de parámetros n y p=D/N. Observemos que, en este caso el factor
de corrección finita es aproximadamente 1.

Límite de la función de probabilidad puntual de una v.a. Binomial:

Proposición: Sea X ~ Bi(n,p) y supongamos que n → ∞ y p → 0 , de manera que n ⋅ p = λ


(fijo), entonces:

⎛n⎞ e −λ λk
p X (k ) = ⎜⎜ ⎟⎟ p k (1 − p ) n.k ⎯
⎯→ ∀k ∈ N o = N ∪ {0}
⎝k ⎠ k!

Dem:

n−k
⎛n⎞ ⎛λ⎞ ⎛ λ⎞
k
n!
p X (k ) = ⎜⎜ ⎟⎟ p k (1 − p ) n − k = ⎜ ⎟ ⎜1 − ⎟
⎝ ⎠
k k ! (n − k )! ⎝n⎠ ⎝ n⎠

−k
n(n − 1)...(n − k + 1) ⎛ λ ⎞ ⎛ λ ⎞ λk
n

= ⎜1 − ⎟ ⎜1 − ⎟
nk ⎝ n⎠ ⎝ n⎠ k!

−k
⎡ n n − 1 n − k + 1⎤⎛ λ ⎞ ⎛ λ ⎞ λk
n

=⎢ .... ⎥ ⎜1 − n ⎟ ⎜1 − n ⎟ .
⎣n n n ⎦⎝ ⎠ ⎝ ⎠ k!

Observemos que:

n −1 n − k +1
1⋅ .... ⎯n⎯
⎯→1
→∞
n n

⎛ λ⎞
n

⎯→ e −λ
⎜1 − ⎟ ⎯n⎯
→∞
⎝ n⎠

−k
⎛ λ⎞
⎜1 − ⎟ ⎯n⎯
⎯→ 1
→∞
⎝ n⎠

e −λ λk
Entonces, p X (k ) ⎯
⎯→ , como queríamos demostrar.
k!

47
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Esta proposición sugiere que la función de probabilidad puntual podría ser aproximada por
la función de probabilidad límite, pero ¿cuándo se considera que n es grande y p es
pequeño para que la aproximación sea buena?

Algunos autores sugieren n ≥ 100, p ≤ 0.01 y np ≤ 20.

En la siguiente tabla se presentan a modo de ejemplo, algunos valores exactos de la


probabilidad y su aproximación para el caso X ~ Bi (100, 1/36)

k Prob. exacta (Binomial) Aproximación


0 0.0598 0.0622
1 0.1708 0.1727
2 0.2416 0.2399
5 0.0857 0.0857
8 0.0049 0.0055
9 0.0014 0.0017
10 0.0004 0.0005

Como se observa, la aproximación es bastante buena, aún cuando no se cumple la


condición p ≤ 0.01.

Variable aleatoria Poisson: Una v.a. cuya función de probabilidad puntual es la


obtenida en la proposición anterior, se dice que tiene distribución de Poisson de
parámetro λ (λ > 0), y se nota X ~ P(λ).

Es decir, X ~ P(λ) si su función de probabilidad puntual está dada por:

e −λ λk
p X (k ) = ∀ k ∈ N o = N ∪ {0}
k!

Verifiquemos que es, en efecto, una función de probabilidad puntual:

Es obvio que p X (k ) ≥ 0 ∀k .

Por otra parte

∞ ∞
e −λ λk ∞
λk
∑ p X (k ) = ∑
k =0 k =0 k !
= e −λ ∑
k =0 k !
= e − λ e λ = 1,


xk
ya que ∑
k =0 k !
es el desarrollo en serie de e x .

48
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Ejemplo: Sea X: “número de mensajes rechazados por segundo por un servidor”, y


supongamos que X ~ P(5).

a) Calcular la probabilidad de que se rechacen exactamente 2 mensajes en un segundo.

e −5 5 2
P ( X = 2) = = 0.084
2!

b) Calcular la probabilidad de que se rechacen a lo sumo 2 mensajes en un segundo.

2
e −5 5 k ⎛ 52 ⎞
P ( X ≤ 2) = ∑ = e −5 ⎜⎜1 + 5 + ⎟⎟ =0.125
k =0 k! ⎝ 2 ⎠

Proposición: Si X ~ P(λ), entonces

E( X ) = λ y V (X ) = λ

Dem:


e −λ λk ∞ e −λ λk ∞ e −λ λk ∞
e − λ λ k −1 ∞
e −λ λ j
E( X ) = ∑ k =∑ k =∑ =λ ∑ =λ ∑ = λ.
k =0 k! k =1 k! k =1 (k − 1)! k =1 (k − 1)! j =0 j!

Por otra parte,


e −λ λk ∞ e −λ λk ∞ e −λ λk ∞
e −λ λk
E( X 2 ) = ∑ k 2 =∑ (k (k − 1) + k ) =∑ k (k − 1) + ∑k =
k =0 k! k =0 k! k =2 k! k =0 k!


e −λ λk −2 e −λ λ j
= λ2 ∑ + E ( X ) = λ2 ∑ + λ = λ2 + λ.
k =2 (k − 2 )! j =0 j !

Entonces

V ( X ) = E ( X 2 ) − (E ( X ) ) = λ 2 + λ − λ 2 = λ .
2

49
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

En el siguiente gráfico se muestra la función de probabilidad puntual correspondiente a la


distribución de Poisson para distintos valores de λ. En él puede observarse cómo la
distribución se simetriza alrededor de λ a medida que este parámetro crece.

lambda=0.10 Distribucion Poisson lambda =1

0.6
0.8

lambda =0.5

0.3
0.6

0.4

0.2
p(x)

p(x)

p(x)
0.4

0.2

0.1
0.2
0.0

0.0

0.0
0 5 10 15 20 0 5 10 15 20 0 5 10 15 20
x x x
lambda =2 lambda =3 lambda =5
0.20

0.15
0.20

0.10
p(x)

p(x)

p(x)
0.10
0.10

0.05
0.0

0.0

0 5 10 15 20 0 5 10 15 20 0.0 0 5 10 15 20
x x x
lambda =10 lambda =15 lambda =20
0.12

0.08

0.06
0.08
p(x)

p(x)

p(x)
0.04
0.04

0.02
0.0

0.0

0.0

0 5 10 15 20 25 30 0 5 10 15 20 25 30 0 10 20 30 40
x x x

Proceso de Poisson: Una aplicación importante de la distribución de Poisson surge en


relación con la ocurrencia de eventos a lo largo del tiempo, por unidad de área, por unidad
de volumen, etc. En lo que sigue nos referiremos, sin pérdida de generalidad a
ocurrencias de un evento a lo largo del tiempo, que podremos esquematizar en la forma:

50
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

A partir del instante 0 y hasta el momento t1 ocurrieron 5 eventos.

Imaginemos que dividimos el intervalo (0, t1 ) en un número muy grande de pequeños


subintervalos, de manera que se satisfacen las siguientes condiciones:

• La probabilidad de que ocurra un evento en un subintervalo pequeño es


aproximadamente proporcional a la longitud del subintervalo.

• La probabilidad de que ocurra más de un evento en un subintervalo es despreciable


con respecto a la probabilidad de que ocurra uno.

• La ocurrencia de un evento en un subintervalo es independiente de lo que ocurre en


otro subintervalo disjunto.

En particular, si todos los intervalos son de igual longitud t1/n, la v.a. X t1 : “número de
eventos que ocurren en el intervalo (0, t1 )” es “casi” binomial, siendo Éxito la ocurrencia
de un evento en cada uno de los subintervalos y p = P(Éxito)=probabilidad de que ocurra
un evento. Si el número de subintervalos es suficientemente grande y por lo tanto el p
suficientemente pequeño, por el resultado límite que hemos probado, la variable X t1 tiene
distribución de Poisson.

Ejemplos: 1) Mensajes de correo electrónico que llegan a una casilla de correos.

2) Emisión de partículas por una sustancia radioactiva.

3) Accidentes que ocurren en un cruce de ruta.

4) Número de errores en una página de un libro.

5) Número de larvas de cierto insecto en un terreno.

Ejercicio: Para cada uno de estos ejemplos, discutir en que situaciones se verifican las
tres condiciones enunciadas.

Definición: Supongamos que se observa la ocurrencia de un evento a lo largo del tiempo y


que existe una cantidad positiva θ > 0, tal que

1) La probabilidad de que ocurra exactamente un evento en un intervalo pequeño de


longitud Δt es aproximadamente igual a θ Δt , es decir:

P(ocurra un evento en Δt) = θ Δt + o(Δt)

g ( h)
siendo o(h) una función g(h) tal que lim = 0.
h →0 h

51
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

2) La probabilidad de que ocurra más de un evento en un intervalo pequeño de longitud


Δt es despreciable cuando se la compara con la probabilidad de que ocurra un evento,
es decir:
P(ocurra más de un evento en Δt) = o(Δt)

3) El número de eventos que ocurren en un intervalo es independiente del número de


eventos que ocurren en otro intervalo disjunto.

Entonces, el número de ocurrencias del evento en un periodo de longitud t tiene


distribución de Poisson de parámetro (θ t), es decir que la v.a. Xt: “número de ocurrencias
del evento en el intervalo de longitud t” satisface

Xt ~ P(θ t)

Observaciones: 1) ¿Cómo se interpreta la cantidad θ?

Puede interpretarse como la tasa media a la cual ocurren los eventos en la unidad de
tiempo. Se la suele llamar tasa media de ocurrencia o intensidad del Proceso de Poisson.

2) ¿Cuál es la diferencia entre un Proceso de Poisson y una v.a. con distribución


Poisson?

La definición anterior, que en realidad es un teorema, da las condiciones bajo las cuáles
ciertos experimentos aleatorios que producen como resultados eventos en el tiempo (o en
longitud, área, volumen, etc) pueden ser modelados mediante la distribución de Poisson.
Consideremos los ejemplos 1) a 5). Sólo bajo ciertas condiciones, satisfacen las
propiedades de un Proceso de Poisson.

Ejemplo: Supongamos que el número de mensajes de correo electrónico que llegan a una
casilla de correos sigue un proceso de Poisson de intensidad θ = 2 mensajes / minuto.

a) ¿Cuál es la probabilidad de que no se reciba ningún mensaje entre las 12 hs y las


12:03 hs?

Sea X3: “número de mensajes en un periodo de 3 minutos”, X3 ~ P(2 ⋅ 3) = P(6).

Entonces, P(X3 =0) = e-6 = 0.002

b) ¿Cuál es el número esperado de mensajes en media hora?

Sea X30: “número de mensajes en un periodo de 30 minutos”

X30 ~ P(2 ⋅ 30) = P(60) ⇒ E(X30) = 60

c) ¿Cuál es la probabilidad de que no se reciba ningún mensaje entre las 13:30 hs y las
13:33 hs?

La respuesta es la misma del ítem a) porque la distribución depende sólo de la longitud


del intervalo y no de su ubicación.

52
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Variables aleatorias continuas

Ejemplo: Con el fin de realizar un control de calidad en una fábrica de baterías, se mide el
tiempo de duración de baterías elegidas al azar y se define la v.a.

X: tiempo de duración de una batería

La v.a. X es esencialmente continua (“tiempo”), siendo su rango el intervalo real [0,∞).


pero supongamos que medimos la duración de la batería en días, es decir “discretizamos”
el rango de la v.a. y se convierte en No = N ∪ {0}. Por tratarse de una v.a. discreta, su
función de probabilidad puntual puede representarse mediante un histograma con área
total igual a 1. Si medimos la duración en horas, obtenemos un histograma con mayor
número de intervalos de menor longitud cada uno, pero que sigue teniendo área total igual
a 1.

Si continuamos aumentando la precisión de la medición (minutos, segundos, décimas de


segundo, etc), obtenemos como límite de los histogramas una curva suave, y la
probabilidad de que la duración de la batería se encuentre entre dos valores a y b ( a < b)
estará dada por el área bajo la curva entre a y b.

Definición: Una v.a. X es continua si existe una función

f : ℜ → ℜ + = [0, ∞)

llamada función de densidad de la v.a. X tal que

P( X ∈ A) = ∫ f ( x)dx ∀ A⊆ℜ
A

53
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

En particular, si A = [a, b] , entonces

b
P(a ≤ X ≤ b) = ∫ f ( x)dx
a

y P( X = a ) = P(a ≤ X ≤ a ) = 0 ∀a ∈ ℜ.

Propiedad: Para que una función f (x) sea una función de densidad, debe satisfacer

f ( x) ≥ 0 ∀ x ∈ ℜ

∫ f ( x)dx = 1
−∞
Observación: Notar que f (x) no es una probabilidad, de hecho puede ser mayor que 1.
Es simplemente el valor de una función en un punto.

Ejemplo: Sea

⎧ a x2 si 1 ≤ x ≤ 3
f ( x) = ⎨
⎩0 en otro caso

Otra forma de expresar la densidad es f ( x) = a x 2 I [1,3] ( x) , donde la función I se define


como

⎧1 si x ∈ A
I A ( x) = ⎨
⎩0 si x ∉ A

a) Calcular el valor de la constante a .

∞ 3 3 3
x3 26 3
∫ = ⇔ ∫1 = ⇔ ∫1 = ⇔ =1⇔ a =1⇔ a = .
2 2
f ( x ) dx 1 a x dx 1 a x dx 1 a
−∞
3 1
3 26

b) Calcular P(X ≥ 2).

∞ 3
27 − 8 19
3
3 2 3 x3
P ( X ≥ 2) = ∫ f ( x)dx = ∫ x dx = = = .
2 2
26 26 3 2
26 26

Definición: La función de distribución acumulada de una v.a. continua X con función de


densidad f (x) se define para todo x ∈ ℜ , como

54
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

x
F ( x) = P( X ≤ x) = ∫ f (t )dt
−∞

Ejemplo: En el ejemplo anterior, obtengamos la función de distribución acumulada de la


v.a. X.

x x
Si x < 1 , F ( x) = P ( X ≤ x) = ∫
−∞
f (t )dt = ∫ 0 dt = 0
−∞

x
x3 −1
x x
3 2 3 t3
Si 1 ≤ x ≤ 3 , F ( x) = ∫ f (t )dt = ∫ t dt = =
−∞ 1
26 26 3 1
26

x 3
3 2
Si x > 3, F ( x) = ∫
−∞
f (t )dt = ∫
1
26
t dt =1

Resumiendo,

⎧0 si x < 1
⎪ x3 − 1
F ( x) = ⎨ si 1 ≤ x ≤ 3
⎪ 26
⎩1 si x > 3

Observamos que se trata de una función continua, no decreciente que toma valores entre
0 y 1.

Propiedades de la función de distribución acumulada: Sea X una v.a. continua,

55
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

i) ∀x ∈ ℜ, FX ( x) ∈ [0,1] .
ii) FX (x) es monótona no decreciente, es decir que si x1 < x 2 ⇒ FX ( x1 ) ≤ FX ( x 2 ).

iii) FX (x) es continua en todo punto.


iv) lim FX ( x) = 1 y lim FX ( x) = 0
x →∞ x →-∞

Observemos que las propiedades i), ii) y iv) ya las hemos demostrado en general al
considerar las v.a. discretas. Respecto a la propiedad iii), en el caso discreto probamos
que la función de distribución es continua a derecha en todo punto, mientras que en este
caso es continua en todo punto.

Proposición: Sean a y b tales que a ≤ b , entonces

P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b) = F (b) − F (a) .

Dem: Resulta inmediatamente del hecho que, si X es continua, P( X = x) = 0

Proposición: Si X es una v.a. continua con función de densidad f (x) y función de


distribución acumulada F ( x) , entonces en todo punto donde F ( x) es derivable,

∂F ( x)
F ' ( x) = = f ( x)
∂x

Dem: Resulta del Teorema Fundamental del Cálculo Integral, y de la definición de F ( x) .

Distribución Uniforme:

Definición: Se dice que X tiene distribución Uniforme en el intervalo [A,B ], si su función de


densidad es

1
f ( x) = I [ A, B ] ( x )
B−A

es decir, la densidad es constante sobre el intervalo [ A,B ] y 0 fuera de él. A y B son los
parámetros de la distribución.

Notación: X ~ U (A,B).

56
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Función de distribución: Hallemos la función de distribución acumulada de X ~ U (A,B).

x x
Si x < A ⇒ F ( x) = ∫
−∞
f (t )dt = ∫ 0 dt = 0 .
−∞

x
x−A
x x
1 t
Si A ≤ x ≤ B ⇒ F ( x) = ∫ f (t ) dt = ∫ dt = = .
−∞ A
B−A B−A A B−A

B
B−A
x B
1 t
Si x > B ⇒ F ( x) = ∫ f (t )dt = ∫ dt = = = 1.
−∞ A
B−A B−A A B−A

Resumiendo,

⎧ 0 si x < A


⎪⎪ x − A si A ≤ x ≤ B
F ( x) = ⎨ B − A

⎪ 1 si x > B

⎪⎩

57
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Percentiles de una distribución continua: Sea X una v.a. continua con función de
densidad f (x) y función de distribución acumulada F (x) y sea 0 < p < 1. El percentil
(100 p)-ésimo de la distribución de X es el valor xp tal que

xp

F ( x p ) = P( X ≤ x p ) = ∫ f (t )dt = p
−∞

3 2
Ejemplos: 1) Sea X con función de densidad f ( x) = x I [1,3] ( x) . Su función de
26
distribución está dada por

⎧0 si x < 1
⎪ x3 − 1
F ( x) = ⎨ si 1 ≤ x ≤ 3
⎪ 26
⎩1 si x > 3

Obtengamos el 25-percentil de esta distribución ( p = 0.25). Buscamos x0.25 tal que


F ( x 0.25 ) = 0.25 .

x 03.25 − 1
F ( x 0.25 ) = 0.25 ⇔ = 0.25 ⇔ x 0.25 = (0.25 ⋅ 26 + 1) = 1.96
1/ 3

26

2) Sea X ~ U (A,B). Su función de distribución está dada por

58
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

⎧ 0 si x < A


⎪⎪ x − A si A ≤ x ≤ B
F ( x) = ⎨ B − A

⎪ 1 si x > B

⎪⎩

Hallemos el 50-percentil de esta distribución ( p = 0.50). Buscamos x0.50 tal que


F ( x 0.50 ) = 0.50 .

x 0.50 − A A+ B
F ( x 0.50 ) = 0.50 ⇔ = 0.50 ⇔ x 0.50 = 0.50( B − A) + A = .
B−A 2

El 50-percentil se denomina mediana de la distribución.

Esperanza o valor esperado de una v.a. continua:

Definición: Sea X una v.a. continua con función de densidad f ( x) , la esperanza o valor
esperado de X se define como


E( X ) = μ X = ∫ x f ( x)dx
−∞


siempre que ∫x
−∞
f ( x)dx < ∞ . Si esta integral es ∞, la esperanza no puede definirse y

decimos que no existe.

Ejemplo: Sea X ~ U (A,B),

∞ B
B 2 − A2 A + B
B
1 x2
E ( X ) = ∫ x f ( x)dx = ∫ x dx = = = .
−∞ A
B−A 2( B − A) A
2( B − A) 2

Proposición: Si la v.a. continua X tiene función de densidad f (x) , entonces la esperanza


de cualquier función real h(X), está dada por


E (h( X )) = ∫ h( x) f ( x)dx
−∞

59
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004


si ∫ h( x) f ( x)dx < ∞ .
−∞

Propiedad (Linealidad): Si a y b son constantes reales, E (aX + b) = aE ( X ) + b .

Dem: Sea h( X ) = aX + b, entonces

∞ ∞ ∞ ∞
E (h( X )) = ∫ h( x) f ( x)dx =
−∞
∫ (ax + b) f ( x)dx = a ∫ x
−∞ −∞
f ( x)dx + b ∫ f ( x)dx = aE ( X ) + b .
−∞

Ejemplo: Dos especies compiten en una región para controlar una limitada cantidad de
cierto recurso. sea X: proporción del recurso controlada por la especie 1. Supongamos
que X ~ U (0,1), es decir

⎧1 si x ∈ [0,1]
f ( x) = ⎨
⎩0 si x ∉ [0,1]

Este modelo de asignación de recursos se denomina “broken stick” o “vara rota” ya que es
análogo a quebrar una vara en un punto aleatorio. La especie que controla la mayoría del
recurso, controla la cantidad.

⎧ 1
⎪1 − X si 0 ≤ X <
2
Sea h( X ) = max ( X ,1 − X ) = ⎨
1
⎪X si ≤ X ≤1
⎩ 2

El valor esperado para la cantidad controlada por la especie que más controla es:

∞ ∞ 1/ 2 1
E (h( X )) = ∫ h( x) f ( x)dx = ∫ max( x,1 − x) f ( x)dx = ∫ (1 − x) f ( x)dx + ∫ x f ( x)dx =
−∞ −∞ 0 1/ 2

1/ 2 1
1/ 2 1
⎛ x2 ⎞ x2 1 1 1 1 1 3
= ∫
0
(1 − x) dx + ∫ x dx = ⎜⎜ x −
1/ 2 ⎝
⎟⎟ +
2 ⎠0 2
= − + − =1− = .
2 8 2 8 4 4
1/ 2

Varianza de una v.a. continua:

Definición: Sea X una v.a. continua con esperanza μX y densidad f (x) , la varianza de X,
que se denotará V(X), σ X2 ó σ 2 , es

60
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

= E [( X − μ ) ] = ∫ ( x − μ

V (X ) = σ 2 2
X X X ) 2 f ( x)dx
−∞

y el desvío standard de X, es σ X = + V ( X ) .

Proposición: V ( X ) = E ( X 2 ) − (E ( X ) ) .
2

Dem:

∞ ∞
V ( X ) = E (( X − μ X ) ) = ∫ ( x − μ X ) f ( x) dx = ∫ ( x 2 − 2 xμ X + μ X2 ) f ( x) dx =
2 2

−∞ −∞

∞ ∞ ∞

∫ x f ( x)dx − 2μ X ∫ x f ( x)dx + μ X ∫ f ( x)dx = E ( X ) − 2μ X μ X + μ X2 = E ( X 2 ) − μ X2


2 2 2

−∞ −∞ −∞

como queríamos demostrar.

A+ B
Ejemplos: Sea X ~ U (A,B), hemos demostrado que E ( X ) = , es decir el punto
2
medio del intervalo. Hallemos la varianza de X. Como V ( X ) = E ( X 2 ) − (E ( X ) ) ,
2

necesitamos calcular E ( X 2 ).

∞ B
B 3 − A 3 ( B − A)( B 2 + AB + A 2 )
B
1 x3
E ( X ) = ∫ x f ( x)dx = ∫ x
2 2
dx = 2
= = =
−∞ A
B-A 3( B − A) A
3( B − A) 3( B − A)

( B 2 + AB + A 2 )
=
3

Entonces,

( B 2 + AB + A 2 ) ⎛ A + B ⎞
2

V ( X ) = E ( X 2 ) − (E ( X ) ) = −⎜ ⎟ =
2

3 ⎝ 2 ⎠

4( B 2 + AB + A 2 ) − 3( A 2 + 2 AB + B 2 ) B 2 − 2 AB + A 2 ( B − A) 2
= = = .
12 12 12

61
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

( B − A) 2
Por lo tanto, V ( X ) = .
12

Propiedad de la varianza y del desvío standard: Sea X una v.a. continua con densidad
f (x) ,

V (aX + b) = a 2V ( X ) y σ aX +b = a σ X .

Dem: : Observemos que, en general,


V (h( X )) = ∫ (h( x) − E (h( X ))
2
f ( x)dx
−∞
entonces, si h( x) = ax + b,

∞ ∞
V (aX + b) = ∫ [(ax + b) − E (aX + b)] f ( x)dx = ∫ [ax + b − aE ( X ) − b] f ( x)dx =
2 2

−∞ −∞

∞ ∞
= ∫ [ax − aE ( X )] f ( x)dx = a ∫ [x − E ( X )] f ( x)dx = a V ( X ),
2 2 2 2

−∞ −∞

como queríamos demostrar.

Obviamente, σ aX + b = a σ X .

62
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Variables aleatorias continuas

Distribución Uniforme: Recordemos que X tiene distribución uniforme en el intervalo


[A,B ], si su función de densidad es

1
f ( x) = I [ A, B ] ( x )
B−A

Notación: X ~ U (A,B).

Su función de distribución acumulada está dada por:

⎧ 0 si x < A
⎪x− A
F ( x) = ⎨ si A ≤ x ≤ B
⎪B − A
⎩ 1 si x > B

Esperanza y varianza de una variable aleatoria uniforme: Sea X ~ U (A,B), hemos


demostrado que

A+ B ( B − A) 2
E( X ) = y V (X ) = .
2 12

Distribución Normal: Se dice que X tiene distribución Normal de parámetros μ y σ2


( μ ∈ ℜ, σ > 0) si su función de densidad es

− 1 x−μ
2
( )
e 2σ
1 2
f ( x) = (1)
2π σ

Notación: X ~ N (μ, σ2).

El gráfico de la función de densidad normal tiene forma de campana con eje de simetría
en x = μ y puntos de inflexión en x = μ + σ y x = μ - σ.

63
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

μ-σ μ μ+σ

En esta distribución, μ indica la posición de la curva y σ es el parámetro de dispersión. En


el siguiente gráfico se muestran densidades correspondientes a μ=0 y distintos valores de
σ.

Densidades Normal
0.8

N(0,1)
N(0,1/4)
N(0,2)
0.6

N(0,4)
0.4
0.2
0.0

-4 -2 0 2 4
x

64
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

La importancia de la distribución normal radica no sólo en que frecuentemente en la


práctica se hallan variables que tienen esta distribución (por ejemplo, los errores de
medición) sino porque, bajo ciertas condiciones, suele ser una buena aproximación a la
distribución de otras variables aleatorias.

Se puede verificar que en efecto la función (1) es una función de densidad, es decir que la
integral sobre toda la recta es 1. No lo haremos, pero sí verificaremos que su gráfico es
simétrico respecto de μ, punto en el cual alcanza su único máximo y que tiene puntos de
inflexión en x = μ + σ y x = μ - σ.

Probemos en primer lugar que la densidad es simétrica respecto de μ, o sea que

f(μ − x)= f(μ + x) ∀x

En efecto,

x2
− 1 ( μ − x − μ )2 −
f(μ − x)=
1
e 2σ 2 =
1
e 2σ 2
σ 2π σ 2π

x2
− 1 ( μ + x − μ )2 −
f(μ + x)=
1
e 2σ 2 =
1
e 2σ 2
σ 2π σ 2π

y, por lo tanto, se verifica la igualdad.

Observemos ahora que la densidad alcanza un único máximo en x = μ.

⎡ (x − μ )2 ⎤⎥ − 1 (x − μ )
1 2
⎢ −
∂f ( x ) ∂ 2
e 2σ
1
e 2σ
1 2 1
= ⎢ ⎥=0⇔− (x−μ)=0
∂x ∂x ⎢ 2π σ ⎥ 2π σ σ2
⎢⎣ ⎥⎦

⇔ ( x − μ ) = 0 ⇔ x = μ.

Ejercicio: Verificar que la derivada segunda en x = μ es menor que 0 y por lo tanto se trata
de un máximo y que la densidad tiene dos puntos de inflexión en x = μ + σ y x = μ - σ.

65
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Distribución Normal Standard: Se dice que Z tiene distribución normal standard si


sus parámetros son μ = 0 y σ2 = 1, es decir Z ~ N (0,1). Su función de densidad estará
dada por

2
1 −z
f ( z) = e 2

Su función de distribución, que se notará Φ (z ) , es:

2
z 1 −t
Φ( z ) = F ( z ) = ∫ e 2 dt
−∞ 2π

Esta función está tabulada, ya que su integral no tiene una expresión analítica conocida.

Ejemplo: Z ~ N (0,1),

P(Z ≤ 1.25) = Φ (1.25) = 0.8944

P(Z > 1.25) = 1 - P(Z ≤ 1.25) = 1 - Φ (1.25) = 1 - 0.8944 = 0.1056

P(-0.38 ≤ Z ≤ 1.25) = Φ (1.25) - Φ (-0.38) = 0.5424

Percentiles de la distribución Normal Standard: Sea 0 < p < 1, el percentil (100 p)-
ésimo de la distribución normal standard es el valor z tal que

Φ ( z ) = p,

es decir, es el valor que deja a su izquierda un área igual a p.

Ejemplo: Z ~ N (0,1), el percentil 99 de la distribución es 2.33 ya que Φ (2.33) = 0.99 .

66
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Propiedades de la distribución Normal:

X −μ
1) Si X ~ N ( μ , σ 2 ) ⇒ Z = ~ N (0,1)
σ
Dem:
⎛X −μ ⎞
FZ ( z ) = P( Z ≤ z ) = P⎜ ≤ z ⎟ = P( X ≤ σ z + μ ) = FX (σ z + μ )
⎝ σ ⎠

Como FZ es derivable en todo punto,

− (σ z + μ − μ )
2
∂ ∂ 1 2σ 2
fZ ( z ) = FZ ( z ) = F ( σ z + μ ) = f X ( σ z + μ )σ = e σ=
∂z ∂z X 2π σ

2
1 −z
= e 2

y, por lo tanto Z ~ N(0,1) como queríamos demostrar.

2) Si Z ~ N (0,1) y σ > 0 ⇒ X = σ Z + μ ~ N ( μ , σ 2 ) .

Dem: Ejercicio.

3) Sean X ~ N ( μ , σ 2 ) y Z ~ N (0,1) . Si denotamos x p y z p a los 100 p-ésimos


percentiles de X y Z respectivamente,

xp =σ zp + μ

Dem: El 100 p-ésimo percentil de X es el valor x p tal que F ( x p ) = p .

⎛ X − μ xp − μ ⎞ ⎛x −μ⎞
F ( x p ) = p ⇔ P( X ≤ x p ) = p ⇔ P⎜⎜ ≤ ⎟ = p ⇔ Φ⎜ p


⎜ σ ⎟= p
⎝ σ σ ⎠ ⎝ ⎠

xp − μ
⇔ = zp ⇔ xp =σ zp + μ .
σ

67
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Esperanza y varianza de una variable aleatoria normal: Hallaremos inicialmente la


esperanza y la varianza de la distribución normal standard y luego, utilizando propiedades
ya demostradas, hallaremos la esperanza y la varianza de una distribución normal en
general.

Proposición: Sea Z ~ N(0, 1), entonces E(Z) = 0 y V(Z) = 1.

Dem:

∞ ∞ z2
1 −
E( Z ) = ∫ zf ( z )dz = ∫ z
−∞ −∞ 2π
e 2
dz = 0

pues el integrando es una función integrable e impar.

∞ z2 ∞ z2
1 − 1 −
V ( Z ) = E( Z ) − ( E( Z )) = E( Z ) = ∫z dz = ∫z
2 2 2 2 2 2
e ze dz
−∞ 2π −∞ 2π

Aplicando integración por partes, con

z2 z2
1 − 1 −
u=z dv = ze 2
dz du = dz v=− e 2

2π 2π

se obtiene

z2

∞ z2 ⎛ z2
M

1 − 1 − ⎜ 1 − ⎟
V( Z ) = −

ze 2
+ ∫
−∞ 2π
e 2
dz = lim ⎜ −
M →∞
⎜ 2π
ze 2 ⎟⎟ + 1 .
−∞ ⎝ −M ⎠

Aplicando la regla de L’Hospital,

⎛ ⎞ ⎛ ⎞
⎜ 1 M ⎟ ⎜ 1 1

lim ⎜ − ⎟ = lim ⎜ − ⎟=0
M →∞⎜ 2π M 2 ⎟ M→∞⎜ 2π M 2 ⎟
⎜ ⎟ ⎜ ⎟
⎝ e 2 ⎠ ⎝ Me 2 ⎠
y
⎛ ⎞ ⎛ ⎞
⎜ 1 M ⎟ ⎜ 1 1

lim ⎜ ⎟ = lim ⎜ ⎟=0
M →− ∞⎜ 2π M 2 ⎟ M→− ∞⎜ 2π M2 ⎟
⎜ ⎟ ⎜ ⎟
⎝ e 2 ⎠ ⎝ Me 2 ⎠

y, por lo tanto, V(Z) = 1.

68
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Proposición: Sea X ~ N(μ, σ2), entonces E(X) = μ y V(X) = σ2.

X −μ
Dem: Recordemos que, si X ~ N(μ, σ2), entonces ~ N (0,1) .
σ

⎛X −μ⎞
Como E ( Z ) = E ⎜ ⎟ = 0 , por linealidad de la esperanza,
⎝ σ ⎠

1
(E ( X ) − μ ) = 0 ⇒ E ( X ) = μ .
σ

⎛X −μ⎞
Como V ( Z ) = V ⎜ ⎟ = 1 , por propiedades de la varianza,
⎝ σ ⎠

1
V (X ) =1⇒V (X ) = σ 2 .
σ 2

Distribución Gamma: Se trata de una familia de distribuciones que provee un modelo


adecuado para histogramas que presentan cierto tipo de asimetría. Antes de presentar a
las v.a. con distribución Gamma, es necesario recordar cómo se define la función Gamma
o factorial, la cual cumple un rol importante en muchas ramas de la Matemática..

Definición: Dado α > 0, se define la función Gamma o función factorial como


Γ(α ) = ∫ x α −1 e − x dx
0

Propiedades:

1) Si α > 1, Γ(α ) = (α − 1) Γ(α − 1)

2) Si α ∈ N, Γ(α ) = (α − 1)!

⎛1⎞
3) Γ⎜ ⎟ = π
⎝2⎠

Dem: 1) Sea α > 1. Aplicando integración por partes con u = x α −1 y dv = e − x dx ,

69
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

∞ ∞

Γ(α ) = ∫ x α −1 e − x dx = − x α −1 e − x + ∫ (α − 1) x α − 2 e − x dx =
0
0 0


M α −1
= − lim + 0 + ( α − 1 )∫ x ( α −1 )−1 e − x dx = 0 + 0 + ( α − 1 )Γ( α − 1 ) = ( α − 1 )Γ( α − 1 ).
M →∞ e M
0

2) Ejercicio.

3)
∞ 1 ∞ 1
⎛1⎞ −1 −
Γ⎜ ⎟ = ∫ x 2 e − x dx = ∫ x 2 e − x dx
⎝2⎠ 0 0

2
Aplicaremos el siguiente cambio de variable: u = 2 x , con lo cual du = dx .
2x

Entonces,

∞ u2 ∞ u2 ∞ u2
⎛1⎞ − 1 − 1 −
Γ⎜ ⎟ = ∫ 2 e 2 du = ∫ 2 e 2 du = π ∫ e 2 du = π ,
⎝2⎠ 0 − ∞ 2π
2 −∞

ya que la integral de la última igualdad es la integral de la densidad normal standard y por


lo tanto es igual a 1.

Definición: Se dice que X tiene distribución Gamma de parámetros α y λ (α > 0, λ > 0) si


su función de densidad está dada por

e − λ x xα − 1 λα
f ( x) = I ( x)
Γ(α ) (0, ∞)

Notación: X ~ Γ (α , λ) o bien X ~ G (α , λ).

En el siguiente gráfico se muestra la densidad correspondiente a X ~ G (α , λ) para


distintos valores de los parámetros.

70
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Densidades Gamma

1.0
G(1,1)
G(2,3)
G(2,1/2)
0.8

G(2,1)
0.6
0.4
0.2
0.0

0 2 4 6 8 10
x

Definición: Si λ = 1, la distribución se denomina Gamma standard. Es decir, X tiene


distribución Gamma standard de parámetro α (X ~ Γ (α , 1)) si su densidad está dada por:

e − x xα −1
f ( x) = I (0,∞) ( x )
Γ(α )

Esta función de densidad es estríctamente decreciente si α ≤ 1, y si α > 1 alcanza un


máximo y después decrece.

La distribución Gamma standard está tabulada para diferentes valores de α.

Volviendo a la densidad Gamma general, λ es un parámetro de escala ya que valores de


λ distintos de 1, comprimen o expanden la curva.

71
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

1.0 Densidades Gamma Standard

G(1,1)
G(2,1)
0.8

G(5,1)
0.6
0.4
0.2
0.0

0 2 4 6 8 10
x

Esperanza y varianza de una variable aleatoria Gamma:

α α
Proposición: X ~ Γ (α , λ), entonces E ( X ) = y V (X ) = 2 .
λ λ
Dem:

∞ e − λx xα −1 λα ∞ e − λx xα λα ∞ e − λx x (α +1)−1 λα
E( X ) = ∫ x dx = ∫ dx = ∫ dx =
0 Γ(α ) 0 Γ(α ) 0 Γ(α )

Γ(α + 1) ∞ e −λ x x (α +1)−1 λα +1 α Γ(α ) α


= ∫ dx = = .
λ Γ(α ) 0 Γ(α + 1) λ Γ(α ) λ

Observemos que la última integral es la integral, sobre todo su rango, de la densidad de


una v.a. con distribución Γ(α+1, λ) y por lo tanto es igual a 1.

Calculemos ahora E ( X 2 ).

72
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

2 ∞ 2 e − λ x x α −1 λα ∞ e − λ x x α +1 λα ∞ e − λ x x α + 2 −1 λα
E(X ) = ∫ x dx = ∫ dx = ∫ dx =
0 Γ (α ) 0 Γ (α ) 0 Γ (α )

Γ(α + 2) e −λ x xα + 2−1 λα + 2 (α + 1)α Γ(α ) = (α + 1)α .



= ∫
λ Γ(α ) 0
2
Γ(α + 2)
dx =
λ2 Γ(α ) λ2

Observemos que la última integral es la integral, sobre todo su rango, de la densidad de


una v.a. con distribución Γ(α+2, λ) y por lo tanto es igual a 1.

(α + 1)α ⎛α ⎞ α α α α
2 2 2
Finalmente, V ( X ) = − ⎜ ⎟ = 2 + 2 − 2 = 2 , como queríamos demostrar.
λ2 ⎝λ⎠ λ λ λ λ

Propiedad: Si X ~ Γ (α , λ) y a > 0, a X ~ Γ (α , λ / a).

Dem: Ejercicio.

Nota: Esta última propiedad permite obtener probabilidades para una v. a. con
distribución Gamma a partir de una distribución Gamma standard. En efecto,
supongamos que X ~ Γ (α , λ), entonces λ X ~ Γ (α , 1) y, por ejemplo

P ( X ≤ x) = P(λX ≤ λx ) = FλX (λx)

Observación: Algunos autores, por ejemplo J. Devore, utilizan otra parametrización de la


distribución Gamma, definiendo como segundo parámetro de la distribución a 1/λ. es
decir: X ~ Γ(α , β ) si su función de densidad está dada por

−x
β α −1
e x
f ( x) = α I ( x)
β Γ(α ) (0,∞)

En este caso, E ( X ) = α β y V ( X ) = α β 2 .

Distribución Exponencial: Se trata de un caso particular de la distribución Gamma, ya


que una v.a. exponencial es una v.a. Gamma con parámetro α = 1.

Definición: X tiene distribución exponencial de parámetro λ (λ > 0) si su función de


densidad está dada por:
f ( x ) = λ e −λ x I (0,∞ ) ( x )

Notación: X ~ ε(λ).

73
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Densidades Exponencial

1.0

E(1)
E(2)
E(1/2)
0.8
0.6
0.4
0.2
0.0

0 2 4 6 8 10
x

Función de distribución de una v.a. exponencial: Si X ~ ε (λ), su función de distribución


acumulada está dada por

⎧ 0 si x ≤ 0

F ( x) = ⎨
⎪1 − e −λx si x > 0

En efecto, si x > 0,

x x
F ( x ) = ∫ λ e −λt dt = − e −λt = −e −λx + 1,
0 0

como queríamos demostrar.

1 1
Proposición: Si X ~ ε (λ), entonces E ( X ) = y V (X ) = .
λ λ2
Dem: Se deduce inmediatamente de la esperanza y la varianza de una v.a. Gamma con
parámetro α = 1.

74
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

Ejemplo: Supongamos que el tiempo de respuesta de una terminal conectada en línea es


una v.a. X con distribución exponencial con esperanza igual a 5 segundos.

a) ¿Cuál es la probabilidad de que el tiempo de respuesta sea mayor de 10 segundos?

Observemos que, dado que E(X)=5, X ~ ε (1/5), entonces

⎛ − 10 ⎞
1

P ( X > 10) = 1 − F (10) = 1 − ⎜1 − e 5 ⎟⎟ = e − 2 = 0.135.



⎝ ⎠

b) ¿Cuál es la probabilidad de que el tiempo de respuesta esté entre 5 y 10 segundos?

⎛ −
10
⎞ ⎛ − ⎞
5

P(5 ≤ X ≤ 10) = F (10) − F (5) = ⎜⎜1 − e 5 ⎟⎟ − ⎜⎜1 − e 5 ⎟⎟ = e −1 − e − 2 = 0.233.


⎝ ⎠ ⎝ ⎠

Proposición (Propiedad de Falta de Memoria): Sea X ~ ε (λ), y sean s y t números reales


positivos cualesquiera,

P( X > s + t | X > s) = P( X > t )

Dem: Ejercicio. (Sugerencia: Usar que si X ~ ε (λ), P ( X > s ) = e − λ s ).

Relación de la distribución exponencial con los procesos de Poisson: Supongamos


que la ocurrencia de cierto tipo de eventos sigue un proceso de Poisson de intensidad o
tasa media de ocurrencia ν, y por lo tanto la v.a. Xt: “número de ocurrencias en un
intervalo de longitud t “ tiene distribución P(ν t).

Se puede demostrar que la v.a. T: “tiempo hasta la ocurrencia del primer evento” (o
equivalentemente, tiempo entre la ocurrencia de dos eventos sucesivos), tiene distribución
exponencial.

Proposición: Dado un proceso de Poisson de intensidad ν, si se define la v.a. T: “tiempo


hasta la ocurrencia del primer evento”, entonces T~ ε(ν).

Dem: Si t ≤ 0, FT (t ) = 0 . Sea t > 0,

FT (t ) = P(T ≤ t ) = 1 − P(T > t ) = 1 − P ( X t = 0) .

En efecto, si el tiempo hasta la primera ocurrencia es mayor que t, no ha ocurrido ningún


evento en el intervalo (0,t) y recíprocamente. Entonces,

75
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez 2004

e −νt (νt ) 0
FT (t ) = 1 − P( X t = 0) = 1 − = 1 − e −ν t ,
0!

y por lo tanto

⎧ 0 si x ≤ 0

F ( x) = ⎨
⎪1 − e −ν x si x > 0

es decir, T~ ε (ν).

Ejercicio: Demostrar que el tiempo de espera hasta la segunda ocurrencia del evento
tiene distribución Γ(2, ν).

76

También podría gustarte