Está en la página 1de 105

1

Executive Master of
Business Administration - III

Curso: Data, decisiones y modelos

Docente: Patricio Saco

Sesión N° 1 y 2: Probabilidades y eventos

2023
2

INTRODUCCIÓN AL CURSO
3

Objetivos
• Comprender los conceptos fundamentales más importantes
para el análisis práctico de las decisiones de gestión
• Contar con herramientas para evaluar la incertidumbre
• Utilizar datos históricos e información limitada de forma eficaz
• Simular sistemas complejos
• Asignar recursos de manera óptima
• Utilizar modelos
4

Sistema de evaluación
PONDERACIÓN
CRITERIO(S) DE EVALUACIÓN INSTRUMENTO DE EVALUACIÓN SOBRE LA
NOTA FINAL
Participación en clase Aporte a la discusión en clase y a los
10%
(individual) compañeros de clase
Desarrollo de casos (grupal) Casos y problemas grupales de cada sesión 20%
Resolución de caso de negocio grupal y
Paper 1 (grupal) comunicación de resultados en Paper 1 (4-5 20%
páginas)
Resolución de caso individual y comunicación
Paper 2 (individual) 40%
de resultados en Paper 2 (1-2 páginas)
5

Sesiones
Sesion Contenido Fecha
1 Introducción probabilidad 20-Ago
Distribuciones discretas y continuas
2 Correlación / Covarianza / Pruebas de 06-Set
independencia
Target cualitivo: Modelos de clasificación
3y4 07-Set
Target cuantitativo: Modelos de regresión
5 Series temporales 08-Set

6 Simulación - Optimización 09-Set


6

Conozcámonos un poco más


7

INTRODUCCIÓN A LA INTELIGENCIA
ARTIFICIAL
8

¿Qué es IA?
• La inteligencia artificial (IA) se refiere a la
simulación de procesos de inteligencia
humana mediante la programación de
sistemas informáticos.
• En esencia, busca crear máquinas
capaces de realizar tareas que
normalmente requerirían la intervención
humana y el uso de habilidades
cognitivas, como el aprendizaje, la
resolución de problemas, el
razonamiento y la toma de decisiones.
9

El futuro está llegando más rápido que nunca


10

Algunas preguntas estratégicas para los diferentes sectores


11

La ciencia de datos es un campo multidisciplinario que


utiliza un conjunto de herramientas para extraer
conocimiento de los datos y respaldar la toma de
decisiones.

El aprendizaje automático y el aprendizaje profundo


se encuentran entre las principales herramientas de la
Ciencia de Datos.

(*) Libro: Managing Data Science - Kirill Dubovikov


12

¿QUÉ ES
MACHINE LEARNING?

“Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico”.

SAS Institute
13
14

Algunos algoritmos de
Machine Learning
Capa de Capa Capa de
entrada oculta salida
No
Traf. Churner
Entrada 1 1 Offnet
1 >2h
Churner
2 Edad
Entrada 2
Salida <45
2 1 No
Factu Churner
Entrada 3 3 … >120
… m Churner

Entrada n n

Regresión Redes Neuronales Árbol de Decisión

“Un modelo es una “Los modelos son “A un modelo no se le exige absoluta


representación simplificada de errados pero útiles” veracidad, sino utilidad de acuerdo a
la realidad” los objetivos para los que fue creado”
15

Modelos en la Ciencia de Datos


Modelo Método Datos

Supervisado Estructurados
(Predicen futuro) DWH, archivos planos
-Clasificación (Var categórica)
-Predicción (Var numérica)
No estructurados
Habla, texto, imágenes
No Supervisado
(Describen pasado)
-Clustering
-Reglas de asociación
-Análisis componentes
principales
Los algoritmos tienen el rol de aprender de los datos
y predecir

Accede Aprendizaje Automático Conocimiento Negocio


Algoritmo Datos Patrones, Predicciones
tendencias

APRENDIZAJE SUPERVISADO APRENDIZAJE NO SUPERVISADO


Existe evidencia directa del problema de No existe evidencia directa del problema de

negocio y de las variables que puedan explicar negocio pero si contamos con variables

el problema. que puedan explicar el problema.

Ejemplo: Predecir la venta de un producto Ejemplo: Segmentación por preferencias


17

ETAPAS DEL DESARROLLO DE UNA SOLUCIÓN DE


DATA SCIENCE

¿Cómo le ha ido al negocio? ¿Cómo le irá al negocio?


(vista al pasado - BI) (vista al futuro - PREDICTIVOS)
18
Ciclo de vida de un proyecto de
ML
1 DISEÑO

4 DESPLIEGUE
ORGANIZACIÓN
2
DATOS

3 DESARROLLO
MODELOS

Foundational Methodology for Data Science


(IBM White Paper, 2016)
19

PARA EL DESARROLLO
DEBEMOS SEGUIR
ALGUNOS PASOS…
PROBLEMA

DESPLIEGU
E DATA
Modelos
Predictivos

EVALUAR
PREDICTIVO
20

INTRODUCCIÓN A LAS
PROBABILIDADES
21

Probabilidad

La teoría de la probabilidad se ocupa del estudio de experimentos en el que los


resultados no se pueden predecir con exactitud; es decir, los resultados del
experimento son producto del azar.
22

EXPERIMENTO ALEATORIO
Un experimento es aleatorio cuando el resultado de este no se puede
predecir con exactitud. Es importante tener claro que la repetición de un
experimento implica hacerlo bajo las mismas condiciones y que los
resultados obtenidos en cada repetición no tienen ninguna influencia sobre los
resultados futuros.
ESPACIO MUESTRAL (Ω)
El espacio muestral de un experimento aleatorio es el conjunto formado por todos
los posibles resultados del experimento; además, cada resultado recibe el
nombre de evento elemental. Para representar el espacio muestral se utiliza la
letra griega Ω y para representar un evento elemental se utiliza la letra w.
23

Ejemplo 1
Sea el experimento:
ε1 = Lanzar un dado y observar el número mostrado en la cara superior.
Este es un ejemplo de un experimento aleatorio porque, aunque se
conozcan todos los números inscritos en las caras del dado, no se puede
predecir con exactitud cuál será el número mostrado en la cara superior.

Si en las caras del dado están inscritos los números 1, 2, 3, 4, 5 y 6,


entonces, el espacio muestral que corresponde al experimento es:

Ω = {1, 2, 3, 4, 5, 6}.
24

Evento (A, B, …)
Un evento es cualquier subconjunto del espacio muestral. Para representar un
evento se utilizan las letras mayúsculas A, B, etc.

Ejemplo 2
A partir del experimento del ejemplo 1, se definen tres posibles eventos:

A = Número mostrado en la cara superior es igual a seis  A = {6}


B = Número mostrado en la cara superior es par  B = {2, 4, 6}
C = Número mostrado en la cara superior es menor que cinco  C = {1,
2, 3,4}
25

Operaciones entre eventos


COMPLEMENTO DE UN EVENTO (𝐀𝐜)
Dado un evento A, su complemento se define como el evento formado por todos
los elementos del espacio muestral que no pertenecen al evento A y se
representa como 𝐀𝐜. En términos de ocurrencia de eventos, el evento Ac ocurre
si el evento A no ocurre.

Ω
𝐀𝐜

A
26

UNIÓN DE EVENTOS (𝐀 ∪ 𝐁)
Dados dos eventos A y B, la unión que se representa como 𝐀 ∪ 𝐁, se define como
el evento formado por los elementos que pertenecen al menos a uno de los dos
eventos. En términos de ocurrencia de eventos, el evento A ∪ B ocurre si al
menos uno de los dos eventos ocurre.

A
B Ω
27

INTERSECCIÓN DE EVENTOS (𝐀 ∩ 𝐁)
Dados dos eventos A y B, la intersección que se representa como (𝐀 ∩ 𝐁), se
define como el evento formado por los elementos que pertenecen a los dos
eventos simultáneamente. En términos de ocurrencia de eventos, el evento
(A ∩ B ) ocurre, si y solo si, los dos eventos ocurren
simultáneamente.
Ω
A
B

𝐀
∩𝐁
28

EVENTOS MUTUAMENTE EXCLUYENTES


Dados dos eventos A y B, se dice que estos eventos son mutuamente
excluyentes si no tienen elementos en común, es decir, si su intersección es el
evento vacío (A ∩ B = ∅). En términos de ocurrencia de eventos, si el evento A
ocurre, entonces el evento B no ocurre.

Ω
A B
29

Considere el siguiente experimento:


ε2 = Lanzar un dado dos veces y observar los números mostrados en los dos lanzamientos. En este
experimento, el espacio muestral es:
Ω = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4),
(3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2),
(6,3), (6,4), (6,5), (6,6)}
Entonces, al lanzar el dado dos veces, se tienen 36 posibles resultados. Ahora, considere los siguientes
eventos:
A = Número mostrado en el primer lanzamiento es igual a uno 
A = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6)}
B = Suma de los números mostrados es igual a cinco 
B = {(1,4), (2,3), (3,2), (4,1)}
C = Suma de los números mostrados es igual a siete 
C = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
30

Una caja contiene cinco USB, de los cuales dos son defectuosos. De la caja se
selecciona al azar un USB y se prueba, repitiéndose la selección hasta que
aparezca un defectuoso. Construya el espacio muestral asociado a este
experimento.
Sean los eventos:
D = USB es defectuoso D𝐶 = USB no es defectuoso El
diagrama de árbol correspondiente es:
Luego, el espacio muestral
asociado al experimento es:

Ω={𝐷, 𝐷 𝐶 𝐷 , 𝐷 𝐶 𝐷 𝐶 𝐷 , 𝐷 𝐶 𝐷 𝐶 𝐷 𝐶 𝐷}
31

Algunas propiedades
A partir de la definición de probabilidad, se obtienen las siguientes
propiedades:
1. Sea el evento 𝜙 que representa al vacío, entonces la probabilidad
de este evento es:
𝐏 𝝓 =𝟎
2. Sea el evento A, con probabilidad P(A), entonces la probabilidad
del complemento del evento A se define de la siguiente manera:
𝐏(𝑨𝒄) = 𝟏 − 𝐏(𝐀)
3. Sean A y B dos eventos, con probabilidades P A y
P(B)
respectivamente, tales que A ⊂ B, entonces se cumple que:
𝐏 𝑨 ≤ 𝐏(𝐁)
32

Algunas propiedades
Sea Ω, el espacio muestral que corresponde a un experimento aleatorio,
entonces la probabilidad del evento 𝐀 ⊂ 𝛀 se representa como P(A), y
satisface:
0≤P A ≤1
P Ω=1
 Si A1, A2, … , A n son eventos mutuamente excluyentes, entonces:

𝐏(𝑨𝟏 ∪ 𝑨𝟐 ∪ ⋯ ∪ 𝑨𝒏) = 𝐏(𝑨𝟏) + 𝐏(𝑨𝟐) + … + 𝐏(𝑨𝒏)


33

Algunas propiedades

Dados dos eventos A y B, este principio es útil si nos interesa calcular la


probabilidad de que ocurra al menos uno de los dos eventos. Para dos eventos
A y B cualesquiera, se cumple que:

𝐏 ( 𝐀 ∪ 𝐁)= 𝐏( 𝐀 ) + 𝐏( 𝐁 ) − 𝐏(𝐀 ∩ 𝐁)
34

Definición clásica de probabilidad


Para un experimento con resultados igualmente probables, se define:
Dado el evento A, la probabilidad de ocurrencia de este evento se
calcula de la siguiente manera:

𝐧 (𝐀)
𝐏 𝐀 =
𝐧(𝛀)
Donde:

n A = Número de elementos del evento A


n Ω = Número de elementos del espacio muestral
35

Ejemplo 3
La probabilidad de que un poblador de un distrito de Arequipa tenga la ganadería como
actividad principal es 0.40, la probabilidad de que tenga la agricultura como actividad principal es 0.55
y la probabilidad de que tenga ambas actividades como actividades principales es 0.08.
Considere los eventos:
G: Poblador tiene como actividad principal la ganadería. A: Poblador tiene
como actividad principal la agricultura.
a) Represente el problema mediante un diagrama de Ven Euler y considere todas las
probabilidades correspondientes.
b) Represente gráficamente el evento 𝐺 ∪ 𝐴𝑐
c) Calcule la probabilidad de que el poblador tenga como actividad principal solo una de
las actividades
36

Solución
a) Represente el problema mediante un diagrama de Ven Euler y considere
todas las probabilidades correspondientes.
37

b) Represente gráficamente el evento 𝐺 ∪ 𝐴𝑐

c) Calcule la probabilidad de que el poblador tenga como actividad


principal solo una de las actividades
𝑃 (𝑠ólo 𝐺 o sólo 𝐴) = 0.32 + 0.47 = 0.79
38

Probabilidad condicional

Para dos eventos cualesquiera A y B, con P B > 0, la probabilidad


condicional del evento A dado que ocurrió el evento B está definida por:

𝐏(𝐀 ∩ 𝐁)
𝐏(𝐀/𝐁) = 𝐏(𝐁)
39

Ejemplo 4
El gerente de una empresa tiene la siguiente información acerca de su
personal administrativo: El 35% habla Inglés, el 40% utiliza perfectamente el
Microsoft Office y el 45% no habla Inglés ni utiliza perfectamente el
Microsoft Office. Si un día cualquiera, el gerente selecciona aleatoriamente a un
empleado de su p
a) Defina los eventos correspondientes y represente el problema mediante un
diagrama de Venn.
b) Calcule la probabilidad de que hable Inglés si se sabe que
utiliza perfectamente el Microsoft Office.
c) Calcule la probabilidad de que utilice perfectamente el Microsoft Office si se
sabe que habla inglés.
40

Solución
a) Los eventos son:
I = Empleado habla Inglés  P(I) = 0.35
M = Empleado utiliza perfectamente el Microsoft Office  P(M) = 0.4
Como información adicional, se tiene: P (I c ∩ Mc ) = 0.45
El diagrama de Venn que corresponde, incluyendo algunos cálculos posteriores es:
41

b) A partir de la fórmula de la probabilidad condicional, se tiene que:

P(I ∩ M) 0.2
P(I / M) = = = 𝟎. 𝟓
P(M)
0.4

c) A partir de la fórmula de la probabilidad condicional, se tiene que:

P(I ∩ M) 0.2
P(M / I) = = = 𝟎. 𝟓𝟓𝟓𝟓
P(I) 0.35
42

Ejemplo 5
A continuación, se presenta la distribución de un grupo de familias según lugar de residencia
por tipo de servicio con el que cuentan:

Lugar de Tipo de servicio


Totales
residencia Internet (I) Cable TV (T)

Lima (L) 80 85 165


Callao (C) 95 60 155
Totales 175 145 320
Suponga que cada familia tiene la misma probabilidad de ser elegida y que usted selecciona una, se pide:
a) Calcule la probabilidad de que la familia tenga Internet y resida en Lima
b) Si la familia tiene cable TV. Calcule la probabilidad de que resida en el Callao.
c) Si la familia reside en Lima, calcule la probabilidad de que tenga Internet.
43

Solución
Sean los eventos:
I = Familia tiene internet
T = Familia tiene cable TV
L = Familia reside en Lima
C = Familia reside en el
Callao
a) Se pide:
80
P I ∩ L = 320 = 𝟎. 𝟐𝟓
44

Solución

b) Se pide:
P (C ∩ T) 60 ⁄ 320
P (C
60 ⁄ T)= = =
= 𝟎. 𝟓𝟓𝟒𝟒
P (T)
145 ⁄ 320 145

80
P (I⁄𝐿) = = 0.4848
c) Se pide: 165
45

Principio de multiplicación para dos eventos

Dados dos eventos A y B, este principio es útil si es de interés calcular la


probabilidad de que ocurran los dos eventos de manera simultánea. Para dos
eventos A y B cualesquiera, se cumple que:

𝐏 𝐀 ∩ 𝐁 = 𝐏 𝐀 𝐏 𝐁/𝐀
46

Principio de multiplicación para n eventos

Dados n eventos A1, A2, … , A n , este principio es útil si es de interés calcular la


probabilidad de que ocurran los n eventos de manera simultánea. Para n eventos
cualesquiera, A1, A2, … , A n , se cumple que:

𝐏(𝐀𝟏 ∩ 𝐀𝟐 ∩ ⋯ ∩ 𝐀𝐧 ) = 𝐏(𝐀𝟏) 𝐏(𝐀𝟐/𝐀𝟏) … 𝐏(𝐀𝐧/𝐀𝟏 ∩ ⋯ ∩ 𝐀𝐧−𝟏)


47

Ejemplo 6
Una junta de directorio está formada por dos economistas, un
administrador y tres ingenieros. Si se eligen tres directivos al azar, calcule la
probabilidad de que el primero sea economista, el segundo ingeniero y el tercero
administrador.
SOLUCIÓN
Sean los eventos:
A1 = Primer directivo seleccionado es economista.
A2 = Segundo directivo seleccionado es ingeniero.
A3 = Tercer directivo seleccionado es administrador.
48

Se pide, calcular la probabilidad de que ocurran los tres eventos


simultáneamente ( A1 ∩ A2 ∩ A3 ) Para esto, se utiliza el principio de multiplicación

P ( A1 ∩ A2 ∩ = P(A1) P(A2/A1) P(A3/A1 ∩ A2).


A3 )
P ( A 1 ∩ A2 ∩ 2× 3×
=
A3 ) 1
6 1 5
P ( A 1 ∩ A2 ∩ A3 )
20 4
=

P (A1 ∩ A2 ∩ A3) =
0.05
49

Eventos independientes
Definición
Se dice que dos eventos A y B son independientes si la ocurrencia de un evento
no afecta en nada la probabilidad de ocurrencia del otro evento.
Es decir:

𝐏(𝐀/𝐁) = 𝐏(𝐀)

Para dos eventos independientes A y B, se cumple lo siguiente:

𝐏(𝐀 ∩ 𝐁) = 𝐏(𝐀) × 𝑷(𝐁)


50

Teorema sobre eventos independientes

Si A y B son dos eventos independientes, entonces se cumple que:


 Los eventos 𝐴 𝑦 𝐵 𝑐 , también son independientes.
 Los eventos 𝐵 𝑦 𝐴𝑐 , también son independientes.
 Los eventos 𝐴𝑐 𝑦 𝐵 𝑐 , también son independientes.
51

Ejemplo 7
Una oficina cuenta con un sistema de aire acondicionado que está formado por dos
ventiladores (A y B) que funcionan diariamente de manera independiente y cada uno
lo hace con una probabilidad igual a 0.925. Calcule la probabilidad de que, en un día
cualquiera, la oficina no se encuentre sin ventilación.

SOLUCIÓN

Sean los eventos:


A = Ventilador A funciona  P(A) = 0.925
B = Ventilador B funciona  P(B) = 0.925
N = La oficina no se encuentra sin ventilación
52

El diagrama de Venn asociado es:


53

La oficina no se encuentra sin ventilación si funciona al menos uno de los dos


ventiladores, por lo que la probabilidad pedida se calcula de la siguiente manera:

𝐏 (N) = 𝐏(𝐀 ∪ 𝐁)

Como (A ∪ B) y (Ac ∩ Bc ) son eventos complementarios, se tiene que:


P ( N ) = 1 − P ( Ac ∩ Bc )
P ( N ) = 1 − P ( Ac ) × P ( Bc )
P ( N ) = 1 − 0.075 × 0.075
P ( N ) = 0.994375
54

Teorema de probabilidad total


Sean A1, A2,… An una colección de eventos mutuamente excluyentes con
probabilidades conocidas y cuyaunión es el espacio muestral, es decir:
Ω = A1 ∪ A2 ∪ ⋯ ∪ An . Sea A un evento cualquiera que satisface:
A = (A ∩ A1) ∪ ( A ∩ A2) ∪ ⋯ ∪ ( A ∩ A n ) con probabilidades condicionales
conocidas P(A/Ai); i = 1, 2 … n; entonces, la probabilidad del evento A se calcula
de la siguiente manera:

𝐏(𝐀) = 𝐏(𝐀𝟏) × 𝐏(𝐀/𝐀𝟏) + 𝐏(𝐀2) × 𝐏(𝐀/𝐀𝟐) + ⋯ + 𝐏(𝐀𝐧) × 𝐏(𝐀/𝐀𝐧)

Esta probabilidad es conocida como la probabilidad total del evento A.


55

Teorema de Bayes
Sean A, A1, A2,…, An una colección de eventos que satisfacen todas las
condiciones del teorema anterior. Ahora, suponga que es de interés
calcular la probabilidad de que ocurra el evento Ai dado que ocurrió el
evento A, entonces se cumple que:

𝐏(𝐀 𝐢 ∩ 𝐀)
𝐏(𝐀 𝐢 / 𝐀) =
𝐏(𝐀)

𝐏 𝐀𝐢 × 𝐏(𝐀/𝐀𝐢)
𝐏(𝐀 𝐢 / 𝐀) = ; 𝐢
𝐏(𝐀𝟏) × 𝐏(𝐀/𝐀𝟏) + 𝐏 𝐀𝟐 × 𝐏(𝐀/𝐀𝟐) + ⋯ + 𝐏(𝐀𝐧) × 𝐏(𝐀/𝐀𝐧)
56

Ejemplo 8
El administrador de una estación de servicio de combustible sabe que los
porcentajes de los clientes que consumen combustible de 98 y 95 octanos son 35
y 40 respectivamente, mientras que el resto consume otro octanaje. Además,
sabe que los porcentajes de los clientes que utilizan tarjeta de crédito son 85,
65 y 20 si consumen combustible de 98, 95 u otro octanaje respectivamente. Si
en un día cualquiera, un cliente llega a la estación de servicio, se pide:
57

a) Calcule la probabilidad de que el cliente consuma combustible de 98


octanos y utilice tarjeta de crédito.

b) Calcule la probabilidad de que el cliente utilice tarjeta de crédito.

c) Si el cliente utiliza tarjeta de crédito, calcule la probabilidad de que haya


consumido combustible de 95 octanos.

d) Si el 30% de los clientes que consumen combustible de 98 octanos y utilizan


tarjeta de crédito, llenan su tanque. Calcule la probabilidad de que un
cliente que consume combustible de 98 octanos y utiliza tarjeta de crédito,
no llene su tanque.
58

Solución
Sean los eventos:
A = Cliente consume combustible de 98 octanos  P(A) = 0.35
B = Cliente consume combustible de 95 octanos  P(B) = 0.40
C = Cliente consume otro combustible  P(C) = 0.25
D = Cliente utiliza tarjeta de crédito

Además, del enunciado se tienen las siguientes probabilidades


condicionales:
𝑃(𝐷/𝐴) = 0.85
𝑃(𝐷/𝐵) = 0.65
𝑃(𝐷/𝐶) = 0.20
59

Ahora, toda esta información se muestra en el siguiente diagrama de árbol:


60

a) Para calcular esta probabilidad, se utiliza el principio de multiplicación, así:


P(A ∩ D)= P(A) P(D/A)
P(A ∩ D) = 0.35

× 0.85 P(A ∩ D) =
0.2975
b) Para calcular esta probabilidad, se utiliza el teorema de probabilidad total, así:
P(D) = P(A)P(D/A) + P(B)P(D/B) + P(C)P(D/C)
P(D) = 0.35 × 0.85 + 0.40 × 0.65 + 0.25 × 0.20
P (D)= 0.6075
61

c) Para calcular esta probabilidad condicional se utiliza el teorema de Bayes, así:

P(B ∩ D)
P(B/D) = P(D)

0.40 × 0.65
P(𝐵⁄𝐷) =
0.6075

P(B/D) = 0.4280
62

d) Para calcular esta probabilidad se utiliza el principio de multiplicación, así:

P (A ∩ D ∩ Ec ) = P (A) P(D/A) P(Ec/D ∩ A) P (A ∩ D ∩ Ec )

= 0.35 × 0.85 × 0.70

P(A ∩ D ∩ E c ) = 0.2083
63

MANOS A LA OBRA
TALLER #1
64

Caso1
A lo largo del último año se ha realizado un estudio de las diversas iniciativas legislativas presentadas y aprobadas.
Para ello, se han obtenido las probabilidades de que una iniciativa legislativa sea aprobada o rechazada en función
del grupo parlamentario que la presenta. Los resultados se recogen en la siguiente tabla:

Resto de grupos
Gobierno Oposición
parlamentarios

Se aprueba 0,2 0,1 0,02

Se rechaza 0,12 0,35 0,21


65

Caso 1
a) ¿Cuál es la probabilidad de que una iniciativa legislativa haya sido presentada por la oposición?

b) ¿Cuál es la probabilidad de que no se apruebe una iniciativa legislativa?

c) ¿Cuál es la probabilidad de que se apruebe una iniciativa legislativa presentada por el gobierno o la
oposición?

d) ¿Cuál es la probabilidad de que una iniciativa legislativa presentada por el resto de grupos parlamentarios
no se apruebe?

e) ¿Cuál es la probabilidad de que una iniciativa legislativa que no haya sido presentada por el gobierno se
apruebe?
66

Caso 2
Dos carreteras salen de una cárcel. Un preso se escapa de la cárcel y elige una carretera aleatoriamente. Si la
carretera I es elegida, la probabilidad de escapar es de 0.25, si la carretera II es elegida, la probabilidad de éxito es
0.10. Se pide:

a) ¿Cuál es la probabilidad de que el preso tenga éxito en su escapada?

b) Si el prisionero escapa con éxito, ¿Cuál es la probabilidad de que escapara utilizando la carretera I? ¿Y la II?
67

Caso 3
Según una encuesta realizada por una conocida revista, el 33% de los hombres han sido infieles alguna vez, mientras
que en el caso de las mujeres este porcentaje es del 23%. Se pide:

a) Suponiendo que son independientes ambos sucesos en una pareja. ¿Cuál es la probabilidad de que en una
pareja heterosexual ambos hayan sido infieles alguna vez?

b) De la población donde se ha realizado la encuesta (en la que el 45% eran mujeres) se elige a una persona
al azar y resulta que ha sido infiel. ¿Cuál es la probabilidad de que sea mujer?
68

Caso 4
Tres compañías de seguros copan el mercado de una ciudad. El 30% de las pólizas suscritas corresponden a la
compañía A, el 25% a la B y el 45% restante a la compañía C. El porcentaje de pólizas de seguros de vida en cada una
de ellas es del 15 y 20 y 25% respectivamente

a) ¿Qué proporción del total de las pólizas suscritas corresponde a seguros de vida?

b) Un individuo ha suscrito un seguro de vida ¿cuál es la probabilidad de que su póliza sea de la compañía A?
69

Caso 5
En una sala multicine funcionan simultáneamente dos salas de proyección A y B. Representamos por SA el suceso de
que en una determinada sesión la sala A se llene antes de empezar la proyección y por SB el suceso de que en la
misma sesión se llene la sala B antes del comienzo. Sabemos que P(SA)=0,7; P(SB)=0,5 y P(SA∩SB)=0,45.
Se pide:

a) Probabilidad de que al menos una sala se llene.


b) Probabilidad de que la sala A se llene y la B no se llene.
c) Probabilidad de que una sala se llene y la otra no.
d) Probabilidad de que ninguna de las dos se llene.
e) Probabilidad de que al menos una de las dos no se llene.
f) Probabilidad de que se llene B, supuesto que ya se ha llenado A.
g) ¿Son independientes SA y SB? Razone su respuesta.
70

Caso 6
Se ha realizado un estudio a 9.200 clientes de una tienda de telefonía móvil sobre sus preferencias en las marcas de
los terminales móviles para la próxima renovación de sus smartphones. Los resultados se resumen en la siguiente
tabla:
Hombre Mujer
Huawei 1.739 1.198
Samsung 1.542 889
Xiomi 683 483
Iphone 576 383
Otros 795 912

Calcule:
a) Probabilidad de que se prefiera Huawei.
b) Probabilidad de que entre los hombres se prefiera Xiomi.
c) Probabilidad de que una mujer prefiera Huawei.
71

Caso 7
Se sabe que un 1% de deportistas de alto nivel desarrolla una lesión importante en algún momento de su carrera
deportiva. Un equipo de doctores deportivos está desarrollando un test de esfuerzo para deportistas, obteniendo
como resultado que el 80% de los deportistas que desarrollan una lesión han dado positivo en el test, mientras que
un 9,6% de deportistas que no tienen ninguna lesión también han dado positivo.

Para valorar la fiabilidad del test, calcule la probabilidad de que, habiendo dado positivo en el test, el deportista
tenga una lesión.
72

DISTRIBUCIONES DE PROBABILIDAD
73

Variable aleatoria
VARIABLE ALEATORIA
Una variable aleatoria es una función que asigna un número a cada
elemento en Ω.
VARIABLE ALEATORIA DISCRETA
Una variable aleatoria X, es discreta si los valores que toma la variable son
enumerativos; es decir, existe un primer valor, un segundo valor, etc.
74

Distribución Binomial
A partir de ciertas características los siguientes experimentos aceptan un modelo Binomial:

 Lanzar una moneda veinte veces y observar el número de caras que


aparecen.
 Lanzar un dado diez veces y observar el número de veces que el dado muestra inscrito el número
cinco.

Un experimento Binomial tiene las siguientes características:


 Consiste de n ensayos independientes.
 En cada ensayo, solo hay dos posibles resultados, a uno se le denomina éxito y al otro fracaso.
 La probabilidad p de éxito es la misma en cada ensayo.
75

Distribución Binomial
Una variable aleatoria X sigue distribución Binomial con parámetros n y p, y se
representa por XBi(n,p), si su función de probabilidad está dada por:

𝐏 𝐗 = 𝐱 = ∁𝐧𝐩𝐱 𝟏 − 𝐩 𝐧−𝐱, 𝐱 = 𝟎, 𝟏, 𝟐,
…,𝐧
𝐱
Donde:
n = Número de ensayos
p= Probabilidad de éxito en cada ensayo

Medidas de resumen
Esperanza matemática: Varianza:
𝐄 𝐗 =𝐧𝐩 𝐕 𝐗 = 𝐧 𝐩 (𝟏 − 𝐩)
76

Ejemplo 1
Se lanza una moneda 10 veces, si el interés es contar el número de caras que
aparecen en los 10 lanzamientos, calcule:

a) La probabilidad de que el número de caras sea igual a tres.


b) La probabilidad de que el número de caras sea a lo más dos.
c) La probabilidad de que el número de caras sea al menos dos.
d) El valor esperado y la varianza del número de caras.
77

Solución:
La variable aleatoria es:
X = Número de caras obtenidas en los diez lanzamientos n=10,
p=0.5 (probabilidad de que resulte cara en cualquier lanzamiento)
a) Se pide: P(X = 3)
P X = 3 = ∁3100.53 1 − 0.5 10−3

𝐏 𝐗=𝟑 =
0.1172
b) Se pide: P X≤2
P (X ≤ 2)= P(X = 0) +
P X ≤ 2 = ∁0100.50 P(X
1 −=0.5
1) 10−0
+ P(X+ ∁=10
1 2)
0.51 1 − 0.5 10−1 + ∁100.52 1 − 0.5 10−2

2
𝐏 𝐗 ≤ 𝟐 = 0.0547
78

c) Se pide: P X ≥ 2
P X≥2 =1−P X<2
P X ≥ 2 = 1 − [P X = 0 + P X = 1 ]
P X ≥ 2 = 1 − [∁0100.50 1 − 0.5 10−0 + ∁10
1 0.5
1 1 − 0.5 10−1]

P X ≥ 2 = 1 − [0.0107]
𝐏 𝐗 ≥ 𝟐 = 0.9893

d) El valor esperado se calcula de la La varianza se calcula de la siguiente


siguiente manera: manera:

E X = np V X = np(1 − p)
E X = 10 × 0.5 V X = 10 × 0.5 × (1 − 0.5)
𝐄 𝑿 =5 𝐕 𝑿 = 2.5
79

Ejemplo 2
A un restaurante llegan dos tipos de clientes, los que piden comida criolla y los que
piden pescados y mariscos. Si ocho clientes llegan al restaurante y la probabilidad
que un cliente que llega pida comida criolla es 0.70, se pide:

a) Defina la variable de estudio


b) Identifique los parámetros que le corresponden a la variable definida
c) Calcule la probabilidad de que como máximo dos de los clientes pidan
comida criolla.
d) Si se sabe que por lo menos dos clientes piden comida criolla. Calcule la
probabilidad de que menos de cuatro pidan comida criolla.
e) Calcule el número de clientes que tendrían que llegar al restaurante para que el
número esperado de clientes que pidan comida criolla sea igual a 21. Justificar.
80

Solución:
a) Sea la variable:
X = Número de clientes que piden comida criolla de un total de ocho.
b) Sea los parámetros:
n=8 p = 0.7 (Probabilidad de que un cliente pida comida
criolla)

c) P X ≤ 2 = P X = 0 + P X = 1 + P X = 2

P X ≤ 𝟐 = C𝟗(0. 𝟏)0(0. 𝟑)𝟗+C𝟗(0. 𝟏)𝟏(0. 𝟑)𝟏+C𝟗(0. 𝟏)𝟐(0. 𝟑)𝟔


0 𝟏 𝟐

𝐏 𝐗≤𝟐 = 𝟎. 𝟎𝟏𝟏𝟑
81
d) Se pide:

P X < 4 𝑋 ≥ 2 = 𝑃(2 ≤ 𝑋 < 4)


𝑃(𝑋 ≥ 2)

X < 4 P X=2 +P X=3


P 𝑋≥2 = 1 − 𝑃(𝑋 < 2)

P X=2 +P X=3
P X<4𝑋≥2 =
1− P X=0 +P X=1

C8(0.7)2(0.3)6+C8(0.7)3(0.3)5 0.0567
P X < 4 𝑋 ≥ 2 = 1 − C8(0.7)0(0.3)8+C8(0.7)1(0.3)7
2 3
= 0.9987
0 1

𝐏 𝑿<4 = 0.0568
𝑿 ≥𝟐
82

e) Sea la variable:
Y = Número de clientes que piden comida criolla de un total de n
n=? p = 0.70
Se sabe que:
𝐸 Y = 21 ⟹ p𝑛 = 21 ⟹ 0.70𝑛 = 21 ⟺ 𝒏 = 𝟑𝟎
83

Distribución Poisson
A partir de ciertas características los siguientes experimentos aceptan
un modelo Poisson:

 Observar el número de aviones que llegan a un aeropuerto en una hora


determinada.
 Observar el número de llamadas que recibe la central telefónica de una
universidad entre las ocho y nueve de la mañana.

En un experimento Poisson, se observa el número de ocurrencias de


un evento en una unidad de espacio o tiempo.
84

Distribución Poisson
Una variable aleatoria X sigue una distribución Poisson con parámetro λ, y
se representa por (XP (λ)), si su función de probabilidad está dada por:

𝐞 −𝛌𝛌𝐱
𝐏 𝐗=𝐱 = , 𝐱 = 𝟎, 𝟏, 𝟐,
𝐱! …
Donde:
λ = Número promedio de ocurrencias de un evento

Medidas de resumen

Esperanza matemática: Varianza:


𝐄 𝐗 =𝛌 𝐕 𝐗 =𝛌
85

Ejemplo 3
El jefe del área de control de calidad de la empresa “San Ignacio Industrial” ha
observado que el número de botellas defectuosas que fabrica una máquina
sigue una distribución Poisson con una media de cinco botellas cada cuatro
horas.
Si el jefe del área hace una supervisión y toma una muestra a las dos horas de
haber empezado la fabricación de las botellas, se pide:

a) Defina la variable de estudio y parámetro


b) Calcule la probabilidad que obtenga cinco botellas defectuosas.
c) Calcule la probabilidad que obtenga a lo más dos botellas defectuosas.
d) Si se sabe que habrán menos de cinco botellas defectuosas.
Calcule la probabilidad que se obtengan más de dos botellas defectuosas
86

Solución
a) X: Número de botellas defectuosas en dos horas

𝜆 = 5 botellas ⟶ 4 ℎ𝑜ras
𝝀 = 𝟐. 𝟓 botellas ⟶ 2 ℎoras
2.55
b) 𝑃 𝑋 = 5 = 𝑒−2.5 × 5! = 0.0668
c) P X ≤ 2 = P X = 0 + P X = 1 + P X = 2
2.50 2.51
𝑃 𝑋 ≤0! 2 = 𝑒−2.5
×1! + × 𝑒−2.5 2!
2
+𝑒 𝑃
−2.5 ×𝑋 ≤
2.5 2 = 0.0821 + 0.2052 + 0.2565

𝑷 𝑿 ≤ 𝟐 = 0.5438
87

d) Se pide:

P X>2X<5 =P 2<X<5 =
P X=3 +

P X = 4P X < 5 P
X<5
−2.5 2.53 −2.5 2.54
𝑒 × 3! + 𝑒 × 4!
P X>2 =
X<5 2.50 2.51 2.52 2.53
𝑒−2.5 × 2.5
0!4 + 𝑒−2.5 ×
1! + 𝑒−2.5 ×
2! + 𝑒−2.5 ×
3! + 𝑒−2.5 ×
4!

0.2138 + 0.1336
𝑋 > 2 = 0.3474
𝑃 𝑋<5 =
0.0821 + 0.2052 + 0.2565 + 0.2138 + 0.1336 0.8912

𝑷 𝑿>𝟐 = 0.3898
𝑿 <𝟓
88

Variables aleatorias continuas


Definición
Una variable aleatoria X es continua si puede tomar cualquier valor dentro de un
intervalo. La representación gráfica es una curva que es conocida como función de
densidad de probabilidad.
89

Distribución normal
La distribución Normal es una de las distribuciones de probabilidad
más importante y es una de las más utilizadas en la Estadística Inferencial.
Definición
Una variable aleatoria continua X sigue una distribución normal con
parámetros µ y σ2 (X ~ N µ, σ2 ) si su función de densidad de probabilidad está
dada por:
𝟏 𝟏 𝒙−𝝁 𝟐
𝒇 𝒙 = 𝒆 𝟐
− , −∞ < 𝛍 < +∞, 𝛔>𝟎
𝝈 𝟐𝟐 𝝈
Donde:
µ = Media poblacional
σ = Desviación estándar poblacional
90

Propiedades de la curva de la distribución normal


 Tiene forma acampanada.

 Está determinada por dos parámetros: la media (µ) y la varianza (σ2).

 Es simétrica con respecto a la media.

 El punto más alto de la curva se encuentra sobre el promedio, el cual coincide con la
mediana y la moda.

 Se hace más plana a medida que la varianza crece.


91

Gráfica de la distribución normal


σ =1
σ = 1.5 La gráfica de la distribución
Normal es simétrica con respecto a
la recta x = µ. A esta se le
conoce con el nombre de
Campana de Gauss.
σ =2

-4 -3 -2 -1 0 1 2 3 4
92

A continuación, se presentan algunos resultados válidos para esta curva:

 El área bajo la curva que comprende entre µ −


σ y µ + σ es aproximadamente el 68.26% del
área total.
 El área bajo la curva que comprende entre µ −
f(X)

2σ y µ + 2σ es aproximadamente el 95.50%
del área total.
σ σ σ σ σ σ
µ X  El área bajo la curva que comprende entre µ −
68.26%
3σ y µ + 3σ es aproximadamente el 99.99%
95.50%
del área total.
99.99%
93

Distribución normal standard


Definición
Una variable aleatoria continua Z sigue una distribución normal estándar si sus
parámetros son µ = 0 y σ2 = 1 ( Z~N(0, 1)), si su función de densidad de
probabilidad está dada por:

𝟏
𝐟 𝒛 = 𝐞−𝟐𝟏𝒛𝟐 , −∞ < 𝐳 < +∞
𝟐𝟐
94

Tabla de la distribución normal standard


Para calcular probabilidades de variables aleatorias continuas que siguen una
distribución Normal, se utiliza la tabla de la distribución normal estándar.
Z 0 1 2 …… 7 8 9

0.0 0.50000 0.50399 0.50798 …… 0.52790 0.53188 0.53586

0.1 0.53983 0.54380 0.54776 …… 0.56749 0.57142 0.57535


P Z ≤ 0.40 = 0.65542 0.2 0.57926 0.58317 0.58706 …… 0.60642 0.61026 0.61409

0.3 0.61791 0.62172 0.62552 …… 0.64431 0.64803 0.65173

0.4 0.65542 0.65910 0.66276 …… 0.68082 0.68439 0.68793


……
P Z ≤ 3.78 = 0.99992


3.5 0.99977 0.99978 0.99978 …… 0.99982 0.99983 0.99983

3.6 0.99984 0.99985 0.99985 …… 0.99988 0.99988 0.99989

3.7 0.99989 0.99990 0.99990 …… 0.99992 0.99992 0.99992

3.8 0.99993 0.99993 0.99993 …… 0.99995 0.99995 0.99995

3.9 0.99995 0.99995 0.99996 …… 0.99996 0.99997 0.99997


95

Propiedades
P a≤Z≤b =P Z≤b −P Z≤ 𝑃 𝑍 ≥ a =1−𝑃 𝑍 <a
a

 P Z ≥ −a =P Z≤a  P(Z ≤ −a) = P(Z ≥ a)


96

Ejemplo 1
Si Z sigue una distribución Normal Estándar, calcule la probabilidad de que Z sea
menor o igual que 1.63.

Solución
La representación gráfica es la siguiente:

La probabilidad buscada, es el área bajo


la curva a la izquierda de 1.63. De la
tabla, se tiene que:
P(Z ≤ 1.63) = 0.94845
97

Ejemplo 2
Si Z sigue una distribución Normal Estándar, calcule la probabilidad de que Z sea
menor o igual a -2.60.

Solución
La representación gráfica es la siguiente:

La probabilidad buscada, es el área bajo la


curva a la izquierda de -2.60. De la tabla, se
tiene que:
P(Z ≤ −2.60) = 0.00466
98

Ejemplo 3
Si Z sigue una distribución Normal Estándar, calcule la probabilidad de que Z tome
valores entre -2.53 y 1.87.
Solución
La representación gráfica es la siguiente:

La probabilidad buscada, es el área bajo la curva


entre - 2.53 y 1.87, luego:
P( −2.53 ≤ Z ≤ 1.87)
= P (Z ≤ 1.87) − P ( Z < −2.53)
= 0.96926 − 0.00570 = 0.96356
99

Ejemplo 4
Si Z sigue una distribución Normal Estándar, calcule la probabilidad de que Z sea
mayor a 1.76.

Solución
La representación gráfica es la siguiente:

La probabilidad buscada, es el área bajo la


curva a la derecha de 1.76, luego:
P(Z > 1.76) = 1 − P(Z ≤ 1.76)
= 1 − 0.96080 = 0.0392
100

Estandarización
Teorema 1
Si la variable aleatoria continua X sigue una distribución Normal con
parámetros µ y σ2, la variable aleatoria:
X−µ
Z=
σ

sigue una distribución Normal Estándar, es decir: Z ~ N(0, 1).

Observación
El cambio de variable anterior (X ⟶ Z) recibe el nombre de estandarización.
101

Ejemplo 5
En un restaurante se sabe que el ingreso diario por la venta de comida sigue una
distribución normal con media igual a 625 nuevos soles y desviación estándar
igual a 49 nuevos soles. Para un día cualquiera:

a) Defina la variable de interés


b) Identifique los parámetros que le corresponden a la variable definida.
c) Calcule la probabilidad de que el ingreso sea a lo más 600 nuevos soles.
d) Calcule la probabilidad de que el ingreso este comprendido entre 611 y 639
nuevos soles.
e) Se sabe que solo el 4.5% de los días son considerados con la denominación de
excelente con respecto a la venta de comida, calcule el ingreso mínimo diario
para que un día sea considerado con esta denominación.
102

Solución
a) Sea la variable:
X = Ingreso diario por la venta de comida.

b) Sea los parámetros:


μ = 625 y σ2 = 492
c) Se pide:
P X ≤ 600 = P X − µ 600 − 625

P (X ≤ 600) σ = P (Z ≤ −0.51)
49

P ( X ≤ 600) = 0.30503
103

d) Se pide:
P 611 ≤ X ≤ 639 = P 611 − 625 ≤ X − µ ≤ 639 − 625
49 σ 49
P 611 ≤ X ≤ 639 = P −0.29 ≤ Z ≤ 0.29

P 611 ≤ X ≤ 639 = P Z ≤ 0.29 − P Z < −0.29

P 611 ≤ X ≤ 639 = 0.61409 − 0.38591

P 611 ≤ X ≤ 639 = 0.22818


104

e) Gráficamente: En la tabla de distribución Normal Estándar, el


valor de z al que le corresponde un área igual a
0.955 es aproximadamente 1.70. Igualando, se
tiene:
k − 625
= 1.70
0.955 0.045 49
k
k = Ingreso mínimo para que un día sea considerado
excelente
Del gráfico: k = 708.3
P X≤ El ingreso mínimo diario para que el día sea
k = considerado con la denominación de
0.955 excelente con respecto a la venta de
P k − 625 = 0.955 comida es 708.3 nuevos soles.
Estandarizando,
Z≤ se
49tiene:
105

Ejercicio propuesto
Una empresa cervecera sabe que el consumo de cerveza anual por persona en una
ciudad sigue una distribución Normal con un consumo promedio de 45 Litros y una
desviación estándar de siete litros. Para una persona de esta ciudad, se pide:
a) Defina la variable de interés.
b) Identifique los parámetros que le corresponden a la variable definida.
c) Calcule la probabilidad de que su consumo de cerveza de sea por lo menos 50
litros.
d) Calcule la probabilidad de que su consumo de cerveza este comprendido entre
30 y 60 litros.
e) Si se considera de buenos bebedores al 10% que más consume, ¿cuántos litros de
cerveza como mínimo tendría que consumir para considerarse dentro de este grupo?

También podría gustarte