Estadística para Riesgos

ESTADÍSTICA PARA EL
ANÁLISIS DE RIESGOS
Msc. Miguel Angel Bello

INTRODUCCIÓN A LA ESTADÍSTICA
Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 2

Principales
Importancia
Definiciones
Objetivo de la
Investigación
Fuentes de
Escalas de Medida Estadística Importancia del Información
y Tipos de Datos Muestreo
Procedimientos de
Investigación
Material
Oportunidades Funciones Estadístico

Definición
“ES LA CIENCIA QUE SE ENCARGA DE

APRENDER DE LOS DATOS, MEDIRLOS,
CONTROLARLOS Y COMUNICAR LA
INCERTIDUMBRE”
American Statistical Association (ASA)

El rey romano Servio Tulio elaboró un
Carlosmagno ordena la creación catastro de todos los dominio de Roma y
El rey David ordena un de un registro de todas sus mando a crear un registro en el que los
censo para conocer el propiedades, así como de los propietarios debían inscribir sus
número de habitantes bienes de la iglesia propiedades, personal de servidumbre,
esclavos. Estos censos eran cada cinco años.
Año
Año 762 Año 578-535
1000
A.C A.C
A.C

Definición
La estadística es la rama de la matemática que estudia el comportamiento de un conjunto de individuos; en el caso
de que no se cuente con la posibilidad de obtener información de la población (N), la estadística permitirá concluir
y tomar decisiones a partir de una muestra (n). La estadística utiliza el método científico para recolectar, organizar,
presentar todos los datos con los que cuenta para luego analizar e interpretar resultados. Gracias a esta
metodología, se pueden tomar decisiones para el beneficio de los tomadores de decisiones.
Importancia
• Administradores de Empresas. Análisis del Problema. Áreas
• Analistas de Riesgos. relacionales. Importancia del Negocio.
• Economistas. Ciencia de Descripción, Gráficos y
• Investigación de Mercados. los Datos Análisis de los Datos.
• Marketing. Toma de Decisiones Gerenciales a
• Ciencias del Comportamiento. partir de Modelos.
• Finanzas Cuantitativas y Corporativas.

Fuente: Facebook (Giselle Escalante, 2020)


Conocer mejor a los clientes Fidelizar a mis clientes
Modelos de pronóstico para

Estadística Descriptiva anticipar la fuga de clientes
Anticiparme a las Conocer qué tipos de

necesidades de mis usuarios comprarán mis
usuarios productos
Recomendaciones a partir Análisis de conglomerados

del Pronóstico ¿Qué
queremos
solucionar? Conocer clientes a los que
les puede ofrecer mejores
Aumentar la efectividad de
descuentos
mis campañas publicitarias
Calcular CLV (Customer
Muestras aleatorias con
lifetime Value)
asignación de incentivos
Principales Definiciones
Población y Parámetro
Muestra y Estadístico
Estimador y Estimación
Variable
Estadística Descriptiva
Estadística Inferencial
Error de Muestreo

Población y Parámetro
La población es el conjunto de elementos que están en estudio y que puede ser infinita o finita.
Estudiantes de la universidad
Habitantes de Bogotá, Colombia, Estados Unidos..
Alumnos del Curso de Estadística Básica
Número de Automóviles Nuevos en Barranquilla
En la práctica, observar y analizar a la población resulta costoso. Asimismo, se requiere de mucho

tiempo para hacerlo, por lo tanto, es común llevar a cabo estudios por medio de una muestra.
El parámetro es una medida descriptiva de la variable en la población
Salario promedio de los docentes de la universidad

Edad promedio de la comunidad estudiantil
Velocidad promedio de los jugadores del futbol español


Muestra y Estadístico
La muestra es un subconjunto representativo de la población que trata de preservar características de ella.
Alumnos de Carrera de Administración (Población: Alumnos de la Universidad).

Automóviles de marca Renault (Población: Automóviles de un Parqueadero).
Salario de los jugadores Españoles (Población: Salario de los jugadores en Europa)
Para determinar el tamaño de la muestra ideal va a depender de los siguientes factores:
1. Población objetivo.
2. Nivel de confianza de la investigación.
3. Tamaño del error permisible (General 5%)
4. Variabilidad de la población o muestra piloto.
5. Tiempo y recursos para el estudio (realizar la encuesta y manejo de la base de datos).
El estadístico es una medida descriptiva de la variable en la muestra y sirve como una estimación del parámetro
de la población.


Estimador y Estimación
El estimador en estadística, es una función usada para estimar un parámetro desconocido de la población.
Si deseamos por ejemplo conocer el precio promedio del galón de gasolina en las bombas de Bogotá (Parámetro
Desconocido) se analizará el precio de algunas bombas (Muestra) y se calculará la media aritmética muestral como
estimador del precio promedio.
σ 𝑋𝑖 σ 𝑋𝑖
𝑀𝑒𝑑𝑖𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 → 𝜇 = 𝐸𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑠𝑒𝑟á 𝑙𝑎 𝑀𝑒𝑑𝑖𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 → 𝑥ҧ =
𝑁 𝑛
La estimación es el valor que toma el estimador, esta puede ser puntual o también se puede calcular a partir de un intervalo.
Miremos por ejemplo los principales indicadores financieros de Colombia: Inflación, Desempleo, Crecimiento Anual y
Trimestral del PIB, Tipo de Cambio, UVR…
OJO: TODO ESTIMADOR ES UN ESTADÍSTICO, PERO NO TODO ESTADÍSTICO ES UN ESTIMADOR.

PARA QUE SEA UN ESTIMADOR DEBE CUMPLIR CON CIERTAS PROPIEDADES (ESTADÍSTICA
APLICADA)

Variable
Una variable es la característica observable objeto de estudio de la población. Esta característica puede tomar cierto
conjunto de valores medibles.
Alumnos: edad, carrera, IMC, género.
Automóviles: precio, mpg, peso, longitud, color, origen.
Inversiones: riesgosas, no riesgosas, activos renta variable, renta fija.
Nominales Clasificar
A,B,C,D
Cualitativas
Categorías Ordinales Jerarquizar
I,II,III
Discretas Contar
Cuantitativas 1,2,3,4
Numéricas Continuas Medir
1.26, 3.1416

Variable
Cualitativa Cuantitativa
Es aquel tipo de variable cuya Es aquel tipo de variable cuya
representación es de cualidad (atributo). representación es de cantidad.
Nominales Ordinales Discretas Continuas
Son aquellas variables que son Son aquellas variables que

Son nombres o clasificaciones que Son aquellas que clasifican las
contables y su formato se limita a pueden tomar cualquier valor
se utilizan para datos en observaciones en categorías con
valores enteros. Con frecuencia son dentro de un rango de posibles
categorías distintas y separadas. un orden significativo.
el resultado del conteo. valores.

¿Cuáles variables ¿Cuáles variables
influyen en el scoring influyen en el
de un jugador? otorgamiento de un
crédito de consumo?

Importancia del Muestreo y Error de Muestreo
Descriptiva
La estadística descriptiva es el proceso de recolectar, agrupar y presentar datos
de tal manera que se pueda presentar y mostrar el problema de manera fácil.
Estadística Permite descubrir las leyes que regulan su aparición y transformación
Inferencial
La estadística inferencial involucra la utilización de la muestra para concluir sobre
el comportamiento del fenómeno de la población.
La exactitud de toda estimación es de enorme importancia (se están tomando decisiones). Azar en el proceso
La exactitud va a depender de la forma de tomar la muestra y del cuidado que se de muestreo Casos atípicos.
tenga para garantizar que la muestra sea confiable y representativa de la población,
sin embargo, se puede comprobar que en muchas ocasiones la muestra no es Sesgo Muestral Tendencia a favorecer la selección
representativa y resultará un error de muestreo. El error de muestreo es la diferencia de ciertos elementos de muestra en
entre el estadístico de la muestra y el valor real pero desconocido del parámetro. lugar de otros.

Funciones de la Estadística
Consumo
Recolección
Organización
Presentación
Ingresos Netos
$10 $20 $30 $40 $50
Análisis Precio de Venta $9 $11
Unidades 9 11
Interpretación
Costo Variable
de Datos
$6 $5
Abajo
Costo Fijo $22 $18
Arriba
Ingreso

Escalas de Medida
Los datos son generados a partir de las siguientes escalas de medida, dependiendo de la manera en que se clasifican las
variables, el análisis y la manera de presentar la información puede variar.
Escala de Definición Ejemplos
Medida
Género.
Raza.
Nominal Nombres o clasificaciones que se utilizan para datos en categorías distintas y separadas.
Estado Civil.
Tipo de Inversión.
Factores de Riesgo.
Son las que clasifican las observaciones en categorías con un orden significativo. Los datos con Conformidad.
Ordinal
escala ordinal pueden ser numéricos (Clasificación) y no numéricos. Nivel o Calidad de Vida.
Tamaño de la Empresa.
Medidas en una escala numérica en la cual el valor de cero es arbitrario pero la diferencia entre Temperatura.
Intervalo
valores es importante. El cero de la escala no expresa el valor nulo o ausencia de atributo. Calificaciones.
Velocidad y Distancia
Medidas numéricas en las cuales el cero es un valor fijo en cualquier escala y la diferencia entre Ingresos.
Razón
valores es importante. Rentabilidad y Riesgo.
Pulsaciones.

•NIVELES DE MEDICIÓN:
Medidas en Escala Nominal: Clasificaciones que se utilizan para datos en categorías distintas y separadas.
No indica ningún orden de preferencia.
➔Tipo de Automóvil:
✓1 = Auto Familiar
✓2 = Transporte Público
✓3 = Transporte de Carga
➔Género:
✓1 = Hombre
✓2 = Mujer

Medidas en Escala Ordinal: Se clasifican las observaciones en un orden significativo. La magnitud de los
números no es importante.
➔Nivel de Satisfacción del cliente:

✓1 = Alto
✓2 = Medio
✓3 = Bajo
➔Nivel de Escolaridad:
✓0 = Sin educación
✓1 = Primaria
✓2 = Secundaria
✓3 = Universidad

Medidas en Escala de Intervalo: Las observaciones tienen un orden inherente y su magnitud es significativa. El cero
es un punto más en la escala, pero no indica ausencia.
➔Temperatura (°F)
Celsius Fahrenheit
-17.7 0
0 33.8
5 41
10 50
➔ Ubicación en una carretera respecto a un punto de referencia.
➔ Puntuaciones de Exámenes (TOEFL, GMAT. Etc.)

Medidas en Escala de Intervalo: Las observaciones tienen un orden inherente y su magnitud es significativa. El cero
es un punto más en la escala, pero no indica ausencia.

La variable fecha, ¿Qué escala de medida es?

Medidas en Nivel de Razón: Posee todas las características de las escalas por intervalo.
El cero tiene sentido en la escala, indica ausencia.
La razón entre dos números es significativa
➔Nivel de Ingresos.
➔Nivel de Gastos.
➔Edad.
➔Ventas.
➔Precio de un activo financiero.
➔Calorías consumidas.

Medidas en Nivel de Razón: Posee todas las características de las escalas por intervalo.
El cero tiene sentido en la escala, indica ausencia.
La razón entre dos números es significativa

Proceso de Medición en Investigación de Mercados
Objeto de
Propiedades Proceso de Medición Resultado de la Medición
Análisis
¿Qué edad tiene?

Edad 35 años
Personas ____ años
Indique su preferencia por c/u de ¿Cuál es su género?

Productos Hombre
las marcas (1era, 2da, 3era, etc.) __ Hombre; __ Mujer.
Marcas Califique la marca en una escala ¿Cuál es su marca favorita?

Marca A
de 1 a 10. __ A; __ B; __ C
Compañías
¿Que tantas veces usted utiliza ¿Cómo califica nuestra marca?

Etc. Excelente
cada marca? __ Mala; __ Buena; __ Excelente.
Fuente: Marketing Research

Tipos de Datos
Series de Tiempo
Una serie de tiempo es un conjunto de observaciones sobre los valores de una

variable en diferentes momentos. Tal información debe recopilarse en intervalos
regulares.
Series Transversales
Tipos de
Datos Los datos transversales consisten en datos de una o más variables recopilados en
el mismo punto del tiempo
Información Combinada
Los datos combinados reúnen elementos de series de tiempo y transversales. Hay
un tipo especial de datos combinados en el cual se estudia a través del tiempo la
misma unidad transversal (por ejemplo, una familia o una empresa). Este tipo de
datos se llama Datos de Panel

Aplicaciones
Empresarial:
• Informar a un cliente.
• Vender un producto.
• Premiar al cliente.
• Atender al cliente.
¿Por qué hay oportunidades de Aplicar la Estadística en el ámbito empresarial?
1. Vivimos en una sociedad “Swipe Right Culture”

2. Los clientes son impacientes que recomiendan o desprestigian. En esta parte, el cliente esta sirviendo de canal para
aprender sobre sus hábitos de consumo, generación de necesidades…
3. El 90% de los datos que tiene una empresa es acerca de los clientes. Nombre, edad, género, ubicación…
4. La Estadística debe generar dinero en las empresas. ¿Cómo?, Aplicando las 4p’s del marketing (Producto, Plaza,
Promoción y Precio), podríamos integrar procedimientos estadísticos para identificar clientes, fijar precios en el mercado,
georreferenciar de manera dinámica nuestros productos , calcular la probabilidad y recurrencia de compra de un
producto.
De esta manera estaríamos entregando lo correcto: producto, clientes, contenido, canal, frecuencia.

Ejemplos

Ejemplos
Adj Close
Bitcoin
20000
15000
10000
5000
0
Fuente: Elaboración propia con base en://finance.yahoo.com/

WTI PRICE
120
100
80
60
40
20
0

Fuentes de Información
1. Fuentes Estadísticas
http://www.banrep.gov.co/es/-estadisticas
https://www.dane.gov.co/index.php/estadisticas-por-tema
1. Fuentes de Indicadores Económicos

https://www.grupoaval.com/wps/portal/grupo-aval/aval/portal-financiero
https://www.bvc.com.co/pps/tibco/portalbvc
1. Fuentes de Información Financiera

https://www.superfinanciera.gov.co/jsp/index.jsf
https://www.supersociedades.gov.co/SitePages/Inicio.aspx
https://finance.yahoo.com/
1. Fuentes de Data Science

https://www.kaggle.com/

Ejercicio en Clase
¿Por qué es importante el análisis numérico?
Nombre de la Inversión Costo Ingreso Riesgo

Una unidad de A $50 $50 $25
Una unidad de B $250 $200 $200
Una unidad de C $100 $100 $10
¿Cuál debería ser la mejor inversión haciendo el supuesto de que se tiene $1,000? ¿Por qué?
TIP: En la inversión A puedo invertir en 20 unidades (1,000/50)

Ejercicio en Clase
Sacando el mejor provecho, A (2), B (1), C (10), se debe escoger el Proyecto C. Con un presupuesto de $1,000, es
posible obtener lo siguiente:
Proyecto A: 20 Proyectos X retornando $1,000, con riesgo de $500

Proyecto B: 4 Proyectos Y retornando $800, con riesgo de $800
Proyecto C: 10 Proyectos Z retornando $1,000, con riesgo de $100
Proyecto A: Por cada retorno de $1, se toma un riesgo de $0.5

Proyecto B: Por cada retorno de $1, se toma un riesgo de $1.0
Proyecto C: Por cada retorno de $1, se toma un riesgo de $0.1
Proyecto A: Por cada riesgo tomado de $1, se obtiene un ingreso de $2

Proyecto B: Por cada riesgo tomado de $1, se obtiene un ingreso de $1
Proyecto C: Por cada riesgo tomado de $1, se obtiene un ingreso de $10
El riesgo es importante. Ignorar los resultados de riesgo es tomar la decisión incorrecta.

ORGANIZACIÓN Y REPRESENTACIÓN GRÁFICA

ORGANIZACIÓN Y REPRESENTACIÓN GRÁFICA
Datos
Los datos es el diamante en bruto de los analistas, existen
múltiples fuentes de información, sin embargo, no tendrían
sentido si no se pueden interpretar para tomar decisiones
o solucionar fenómenos en particular, el objetivo principal
es utilizar los datos para interpretar los datos. Los
principales problemas de los analistas es la recolección,
descripción y el análisis de los datos.
Fuente: Tomado de The Cartoon Guide to Statistics.

REPRESENTACIÓN GRÁFICA: BARRAS Y TORTAS







REPRESENTACIÓN GRÁFICA: DISTRIBUCIÓN DE FRECUENCIAS









REPRESENTACIÓN GRÁFICA: GRÁFICOS DE LÍNEAS



REPRESENTACIÓN GRÁFICA: GRÁFICOS DE CAJAS

REPRESENTACIÓN GRÁFICA: GRÁFICOS DE CAJAS

REPRESENTACIÓN GRÁFICA: GRÁFICO DE DISPERSIÓN

REPRESENTACIÓN GRÁFICA: GRÁFICO DE DISPERSIÓN

DESCRIPCIÓN DE LOS DATOS
Distribución de Frecuencias
La distribución de frecuencias es un sistema o método para organizar la información recolectada y poder resumirla
en una tabla. Mediante este método podríamos identificar el número de veces que sucede un evento y su
probabilidad empírica. La probabilidad es un valor que esta acotado entre 0 y 1, que describe la posibilidad
relativa de un evento.
La distribución de frecuencias entonces, nos permitirá organizar grandes volúmenes de información, en forma de
tablas y que se pueden complementar con gráficos (Diagramas de Frecuencias, Histogramas de Frecuencia, Ojivas
y Polígonos de Frecuencia)

Elaboración de la Tabla de Frecuencias
nyN Intervalos de Clase Frecuencia Frecuencia Marca de Clase
Tamaño de la Muestra y Población
𝒚′𝒊−𝟏 - 𝒚′𝒊 𝒏𝒊 Relativa 𝒉𝒊 𝒚𝒊
𝒙𝒊 Identificación para cada valor observado 87.5-102.5 2 2.22% 95

102.5-117.5 9 9.8% 110
𝒏𝒊 Frecuencias Absolutas
117.5-132.5 19 20.6% 125
𝒉𝒊 Frecuencias Relativas 132.5-147.5 17 18.5% 140

147.5-162.5 27 29.3% 155
𝑵𝒊 Frecuencias Absolutas Acumuladas 162.5-177.5 8 8.7% 170
𝑯𝒊 Frecuencias Relativas Acumuladas 177.5-192.5 8 8.7% 185
Identifica la variable discreta o las marcas de clase de 192.5-207.5 1 1.1% 200

𝒚𝒊
la continua 207.5-222.5 1 1.1% 215
𝒚′𝒊−𝟏 - 𝒚′𝒊 Identifica a la variable continua con sus intervalos TOTAL 92 100%
Fuente: Tomado de The Cartoon Guide to Statistics.
C Amplitud del intervalo
m Número de valores de la variable o de intervalos

Recursos
https://www.socscistatistics.com/descriptive/histograms/

Pasos para realizar una Distribución de Frecuencias para Variable Aleatoria Continua
X1=74 X16=58 1. Determinar el valor máximo y mínimo de las data histórica y luego calcular el rango o recorrido.
X2=67 X17=76 Rango=Máximo-Mínimo.
X3=94 X18=57 2. Debemos determinar el valor del número de intervalos “m” que se van a tomar en cuenta para
X4=70 X19=72 resumir la información en una tabla. Existen diferentes maneras para calcular este valor, vamos a
X5=69 X20=66 recomendar la Fórmula de Sturges, m=1+3.3*log(n). Pero también dependerá del analista, se
X6=61 X21=48 recomienda un número arbitrario entre 5 y 18. Si se utiliza la fórmula de Sturges, ese valor se
X7=71 X22=56 puede redondear a cero decimales tanto por encima como por debajo (se debe tener un valor
X8=79 X23=63 entero).
X9=47 X24=71 3. Vamos a calcular una amplitud constante, C=Rango/m. Siempre debemos aproximar al número
X10=85 X25=60 inmediatamente superior, por pequeña que sea la fracción.
X11=82 X26=64 4. Recalcular el rango o recorrido, c ajustado x m, este último valor se llamará, rango hipotético. La
X12=55 X27=68 diferencia entre el rango hipotético y el rango se le podrá restar al límite inferior o aumentarse al
X13=65 X28=83 limite superior para realizar el ajuste y que ningún valor posible se quede por fuera de la
X14=88 X29=74 distribución de frecuencias.
X15=52 X30=92 5. Organizar los valores dentro de los limites inferior y superior, 𝒚′𝒊−𝟏 - 𝒚′𝒊 , para cada intervalo.
6. Calcular la marca de clase 𝒚𝒊 .

Distribución de Frecuencias
Propiedades de las Frecuencias:

𝒚′𝒊−𝟏 - 𝒚′𝒊 𝒏𝒊 𝑵𝒊 𝒉𝒊 𝑯𝒊 𝒚𝒊
46-54 3 3 0.1 0.1 50
1. Las frecuencias absolutas son siempre valores enteros.
2. La suma de las frecuencias absolutas es igual a n.
54-62 6 9 0.2 0.3 58 3. Las frecuencias relativas son siempre valores
62-70 8 17 0.27 0.57 66 fraccionados que por lo general se presentan en
términos porcentuales .
70-78 6 23 0.2 0.77 74
4. La suma de las frecuencias relativas es igual que 1.
78-86 4 27 0.13 0.9 82 5. El último valor de las frecuencias absolutas
86-94 3 30 0.1 1.00 90 acumuladas debe ser igual que n.
6. El último valor de las frecuencias relativas
𝛴 30 1 -
acumuladas debe ser igual que 1

ELABORACIÓN DE GRÁFICOS
Principales recomendaciones para realizar gráficos
• Gráficos simples, con títulos, enumeraciones, fuentes y ejes totalmente nombrados.
• Los gráficos se complementan con los resultados estadísticos y la presentación de tablas.
• Estas son algunas recomendaciones para la presentación de datos.

1. Datos Cualitativos: tortas, gráficos de barras horizontales y verticales, mapa de árbol.
2. Datos Cuantitativos: histograma de frecuencias, polígonos de frecuencias, gráficos circulares, gráficos
de dispersión, gráficos de burbuja, tortas, gráficos de línea, gráficos de barras, diagramas de caja.

Gráficos
Histograma: es una gráfica en la que las clases se señalan en el eje de las Ojiva: Representación gráfica para las frecuencias absolutas y relativas
abscisas y las frecuencias de clase en el eje de las ordenadas. Las acumuladas. Para esto, se determinan los puntos de intersección entre cada valor
frecuencias de clase se representan por medio de las alturas de las barras. de la variable y su respectiva frecuencia, luego se unen con trazos rectilíneos.
Histrograma de Frecuencias
9 Ojiva
8
8 30
7
6 6 25
6
20
5
4
ni
15
Ni
4
3 3
3 10
2
5
1
0
0
46 54 62 70 78 86 94
46-54 54-62 62-70 70-78 78-86 86-94 Intervalos de Clase
Intervalos de Clase

Gráficos
Polígono de Frecuencias: representación gráfica que combina las marcas de clase y la frecuencia.
Polígono e Histograma
9
8
7
6
5
ni
4
3
2
1
0
46-54 54-62 62-70 70-78 78-86 86-94
Intervalos de Clase

Tener cuidado con este error común
Ingresos Frecuencias Amplitud Frecuencias Altura
16-25 55 Ci ni ni/Ci
25-28 47 9 55 6.11
La amplitud no
28-31 32 es constante 3 47 15.66
31-40 26 3 32 10.66
𝛴 160 9 26 2.88

DESCRIPCIÓN DE
LOS DATOS

Recursos
Principales estadísticos (una variable)
https://home.ubalt.edu/ntsbarsh/Business-stat/otherapplets/Descriptive.htm
http://digitalfirst.bfwpub.com/stats_applet/stats_applet_8_ovc.html
https://www.rossmanchance.com/applets/2021/descstats/Dotplot.htm?hideExtras=1
Principales estadísticos para dos variables (Correlación) y Análisis de Regresión
https://www.rossmanchance.com/applets/2021/guesscorrelation/GuessCorrelation.html
https://www.rossmanchance.com/applets/2021/regshuffle/regshuffle.htm
https://digitalfirst.bfwpub.com/stats_applet/stats_applet_5_correg.html
https://www.statcrunch.com/applets/type2&regbyeye
https://mste.illinois.edu/activity/regression/

Principales Medidas para la Descripción Numérica de los Datos.
1. Medidas de Tendencia Central y Posición Fecha Precio Fecha Precio Fecha Precio
a) Media Aritmética Febrero 2017 139.89 Octubre 2017 168.70 Junio 2018 188.96
b) Media Acotada
Marzo 2017 139.89 Noviembre 2017 166.72 Julio 2018 226.04
c) Mediana
Abril 2017 148.76 Diciembre 2017 164.95 Agosto 2018 224.95
d) Moda
e) Media Ponderada Mayo 2017 140.82 Enero 2018 175.48 Septiembre 2018 218.09
f) Media Geométrica Junio 2017 145.43 Febrero 2018 165.97 Octubre 2018 177.95
g) Cuartiles, Deciles y Percentiles. Julio 2017 160.36 Marzo 2018 163.47 Noviembre 2018 157.74
2. Medidas de Dispersión y Variabilidad. Agosto 2017 151.29 Abril 2018 184.85 Diciembre 2018 166.40
a) Rango o Recorrido.
Septiembre 2017 165.94 Mayo 2018 183.82 Enero 2019 166.52
b) Varianza.
c) Desviación Estándar.
d) Coeficiente de Variación.
e) Puntaje típico o estandarizado “Z”
3. Medida de Deformación.
a) Coeficiente de Asimetría
4. Medida de Apuntamiento.
a) Curtosis
b) Exceso de Curtosis
Medidas de
Tendencia Central y
Posición

Medidas de Tendencia Central y Posición
Necesitamos calcular un valor representativo del conjunto de datos, una medida descriptiva que se refiera al
punto medio de una distribución o valor esperado de una variable incierto. La manera más sencilla para
calcular un valor representativo del conjunto de datos se conoce como media aritmética, esta media se podrá
calcular para la población, media poblacional, o para el subconjunto de posibles valores de la variables
aleatoria, media muestral.
Propiedades la Media Aritmética: σ𝑥
1. Los datos deben pertenecer a las escalas de medida de intervalo o razón. 𝑥ҧ =
𝑛
2. Todos los valores se deben incluir en el cálculo.
3. La media es única, cada conjunto de datos posee una y solo una media.
𝑥:ҧ 𝑀𝑒𝑑𝑖𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙
4. La suma de las desviaciones de cada valor a la media es cero. σ 𝑥 − 𝜇 = 0
𝑛: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎
σ𝑥
𝜇=
𝑁
𝜇: 𝑀𝑒𝑑𝑖𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑁: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
Media 1 Media 2

¿Cuál es el promedio de goles por

partido de Falcao 2014/2021?

¿Qué pasaría con el cálculo de la media aritmética en presencia de valores extremos?.
Ejemplo: Un distribuidor de bienes perecederos requiere un buen estimador de la demanda para fines de inventarios. Las
decisiones equivocadas significan $100 adicionales por unidad en mercancía deteriorada versus $175 por costos de Fed Ex
El analista obtiene datos históricos y calcula el nivel promedio de la demanda en 5 unidades por día. Debido a que la
distribución está sesgada, el promedio es una mala medición y da una cantidad significativa de costo agregado.
Frecuencia
Frecuencia Histograma de Datos Reales
8
Coste Total Distribución simulada de Coste Total
7 1400,00
6 1200,00
5 1000,00
800,00
4
Los niveles actuales de demanda
600,00
3
400,00
2 Inventario de prueba
200,00
1
0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
0 2 4 6 8 10 12 14 More

Deberíamos utilizar dos medidas descriptivas en presencia de casos atípicos en la información con el propósito de describir el
centro de la información numérica: 1) Media Acotada o 2) Mediana. La media acotada es una función estadística que calcula
el promedio de un conjunto de datos interior y la mediana calcula el punto medio de los valores una vez que se han ordenado
de menor a mayor.
Datos: 1, 2, 8,10, 12, 24, 25, 35, 75
Media Acotada con un porcentaje del 40%, elimina el 20% de los datos por encima y 20% de los datos por debajo de la
𝑛∗𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒% 𝑛∗𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒%
siguiente manera → y se redondea por debajo para luego calcular la media aritmética. =
2 2
10∗40%
= 1.8 ≅ 1, por lo tanto se elimina el primer y último valor, luego se calcula el promedio de 2,8,10,12,24,25,35.
2
𝑳𝟓𝟎 = 𝒏 + 𝟏 ∗ 𝟓𝟎% → Permite calcular la posición del dato que se encuentra en medio, en caso de que las observaciones
sea un número par, se deberá calcular la media aritmética de los dos datos del medio.
𝐿50 = 𝑛 + 1 ∗ 50% → 9 + 1 ∗ 50% = 5 → 𝑀𝑒 → 12

Moda: valor de la observación que aparece con mayor frecuencia. La moda es de especial utilidad para
resumir datos con escala de tipo nominal, ordinal y variable cuantitativa discreta, sin embargo, es posible
determinar la moda para todas las escalas de medida, la moda tiene la ventaja de no verse afectada por
valores extremos pero tiene una desventaja y es que en ocasiones no existen modas o pueden existir más de
modas dificultando la interpretación de resultados.
Ejemplo: Se tienen valores aleatorios 𝒚𝒊 con una frecuencia 𝒏𝒊 (la frecuencia es el número de veces que se
presenta una característica). Si tenemos los siguientes datos: 2,2,2,3,3,3,3,3,4,4,4,4,4,4,5,5,5; la tabla se
presentaría de la siguiente manera:
𝒚𝒊 𝒏𝒊
2 3 𝑴𝒅 = 𝟒
3 5
4 6
5 3
𝛴 17

Media Ponderada: la media ponderada es un caso especial de la media aritmética, se presenta cuando hay
observaciones con una importancia relativa diferente.
σ 𝑥𝑖 𝑤𝑖 𝑥ҧ𝑤 : 𝑀𝑒𝑑𝑖𝑎 𝑃𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎

𝑥ҧ𝑤 = 𝑥𝑖 : 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑝𝑎𝑟𝑎 𝑒𝑙 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑖
σ 𝑤𝑖 𝑤𝑖 : 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑖𝑚𝑝𝑜𝑟𝑡𝑎𝑛𝑐𝑖𝑎 𝑝𝑎𝑟𝑎 𝑒𝑙 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑖
Ejemplo:
Rentabilidad de un Portafolio Se quiere calcular el precio promedio de la venta de productos de una empresa,
se sabe que la empresa tiene tres productos: bebidas, comidas y otros. El precio
Rentabilidad Esperada A=10% σ 𝑥𝑖 𝑤𝑖 promedio de las bebidas es de 8.5 usd, el de las comidas 12 usd y otros 2.5 usd,
𝑥ҧ𝑤 =
Rentabilidad Esperada B=25% σ 𝑤𝑖 durante el último periodo se vendieron 500 unidades de bebidas, 1200 unidades
Rentabilidad Esperada C=-5% de comida y 50 unidades de otros.
Participación A=10% 0.1 ∗ 0.1 + 0.25 ∗ 0.5 ∗ + −0.05 ∗ (0.4) σ 𝑥𝑖 𝑤𝑖 8.5 ∗ 500 + 12 ∗ 1200 + 2.5 ∗ (50)
Participación B=50% 0.1 + 0.5 + 0.4 𝑥ҧ𝑤 = =
σ 𝑤𝑖 500 + 1200 + 50
Participación C=40%
0.115
= 11.5% 18775
1 = 10.72
1750

¿Cuál es el salario promedio por hora para cada producto y el promedio del costo de trabajo para cada
producto?
σ 𝒙𝒊 𝒘𝒊
Horas de mano de obra por ഥ
𝒙𝒘 =
σ 𝒘𝒊
Nivel de mano Salario por hora unidad
de obra en Euros
Producto 1 Producto 2 𝑺𝒂𝒍𝒂𝒓𝒊𝒐 𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝒑𝒓𝒐𝒅𝒖𝒄𝒕𝒐 𝟏
No calificado 5.00 1 4 5 ∗ 1 + 7 ∗ 2 + [ 9 ∗ 5] 64
𝑥ҧ𝑤1 = = =8
Semicalificado 1+2+5 8
7.00 2 3
Calificado 9.00 5 3 𝑺𝒂𝒍𝒂𝒓𝒊𝒐 𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝒑𝒓𝒐𝒅𝒖𝒄𝒕𝒐 𝟐
5 ∗ 4 + 7 ∗ 3 + [ 9 ∗ 3] 68
𝑥ҧ𝑤2 = = = 6.8
4+3+3 10

σ 𝑥𝑖 𝑤𝑖
𝑥ҧ𝑤 =
σ 𝑤𝑖
Ejemplo:
María Paula quiere saber su nota definitiva de la materia Estadística para el análisis de riesgos. Tiene la
siguientes notas:
Primer corte: 6.5

Segundo corte: 5
Tercer corte: 9.2
El primer corte tiene un peso (participación, ponderación,…) del 30%, el segundo de 30% y el último de 40%

Media Geométrica: la media geométrica es útil para determinar el cambio promedio de porcentajes, razones,
índices o tasas de crecimiento. La media geométrica de un conjunto de n números positivos se define como la raíz
enésima de un producto de n valores. La media geométrica siempre es menor o igual (nunca mayor) que la
media aritmética. Los valores deben ser TODOS positivos.
𝑛 𝑛 𝑉𝑎𝑙𝑜𝑟 𝐹𝑖𝑛𝑎𝑙 𝑑𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜

𝑀𝑒𝑑𝑖𝑎 𝐺𝑒𝑜𝑚é𝑡𝑟𝑖𝑐𝑎 = 𝑥ҧ 𝐺 = 𝑥1 𝑥2 … (𝑥𝑛 ) 𝑇𝑎𝑠𝑎 𝑑𝑒 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜 𝑐𝑜𝑛 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 = 𝑉𝑎𝑙𝑜𝑟 𝑎𝑙 𝑖𝑛𝑖𝑐𝑖𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜
−1
Tasa de Interés Promedio Otra aplicación de la media geométrica se relaciona con la determinación de un
cambio porcentual promedio durante cierto periodo. Suponga que la población
Suponga que un préstamo tiene tasas de interés fijas conocidas y quisiera en 1990 es de 258295 habitantes y para el 2011 fue de 584539, la pregunta
calcular la tasa de interés promedio de la colocación de su dinero. El monto de la sería: ¿Cuál fue le incremento anual promedio?
inversión es de 5,000 usd, el primer año tendrá una tasa efectiva anual de 10%, 𝑛 𝑉𝑎𝑙𝑜𝑟 𝐹𝑖𝑛𝑎𝑙 𝑑𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜
el segundo año de 25% y el tercer año de 12.5%. 𝑇𝑎𝑠𝑎 𝑑𝑒 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜 𝑐𝑜𝑛 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 = −1
𝑉𝑎𝑙𝑜𝑟 𝑎𝑙 𝑖𝑛𝑖𝑐𝑖𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜
3
𝑀𝐺 = 1 + 0.1 ∗ 1 + 0.25 ∗ (1 + 0.125) = 1.1565 − 1 = 15.65% 584539
𝑇𝑎𝑠𝑎 𝑑𝑒 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜 𝑐𝑜𝑛 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 = 21 − 1 = 0.0397 = 3.97%
258295

𝑛 𝑛 𝑉𝑎𝑙𝑜𝑟 𝐹𝑖𝑛𝑎𝑙 𝑑𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜

𝑀𝐺 = 𝑥1 𝑥2 … (𝑥𝑛 ) 𝑇𝑎𝑠𝑎 𝑑𝑒 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜 𝑐𝑜𝑛 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 = 𝑉𝑎𝑙𝑜𝑟 𝑎𝑙 𝑖𝑛𝑖𝑐𝑖𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜
−1
Suponga que un préstamo tiene tasas de interés fijas conocidas y quisiera calcular la tasa de interés promedio de la colocación de
su dinero. El monto de la inversión es de 5,000 usd, el primer año tendrá una tasa efectiva anual de 10%, el segundo año de 25%
y el tercer año de 12.5%.
3
𝑀𝐺 = 1 + 0.1 ∗ 1 + 0.25 ∗ (1 + 0.125) = 1.1565 − 1 = 15.65%
Periodo Valor Inicial Interés Factor de Crecimiento Valor al Final En este caso cometeríamos un error si calculamos el
promedio de los intereses y lo incorporamos en la
1 5,000 10% (1+0.10) 5,500 fórmula de Valor Futuro
2 5,500 25% (1+0.25) 6875

𝑉𝐹 = 𝑉𝑃(1 + 𝑖)𝑛
3 6,875 12.5% (1+0.125) 7734.375
𝑉𝐹 = 5,000(1 + 0.1583)3 = 7,770.88

Otras Medidas de Posición

Existen otros métodos que consisten en determinar la ubicación de los valores que dividen un conjunto de
observaciones en partes iguales. Estas medidas incluyen los cuartiles, deciles y percentiles.
Cuartiles
Q1 Q2 Q3 Q4
25% 50% 75% 100%
Deciles
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Percentiles
P1 P2 P3 … P50 … P100
1% 2% 3% 50% 100%

Para formalizar el proceso de cálculo, supongamos que 𝐿𝑝 representa la ubicación de cierto percentil que se
busca.
𝑃
𝐿𝑝 = (𝑛 + 1)
100
Cuando se calcula un número entero es sencillo encontrar este dato dentro del conjunto de observaciones.
Cuando es un número fraccionado es necesario realizar el siguiente proceso:
Ejemplo: 43, 61, 75, 91, 101 y 104

25
𝐿25 = 6 + 1 = 1.75
100
La fórmula de localización indica que el percentil 25 o cuartil 1 se encuentra entre el primer y segundo valor, y
es 0.75 la distancia entre ellos. El primer valor es 43 y el segundo es 61, de esta manera, la distancia entre
estos valores es de 18. El percentil sería 43+0.75*(61-43)=56.5

Medidas de
Dispersión

Medidas de Dispersión o Variabilidad
La dispersión se refiere a la separación de los datos en Mayor riesgo

una distribución, teniendo como criterio una medida de
tendencia central.
¿Por qué es importante medir la variabilidad?
➢ Las medidas de posición, solo describen el centro de Promedio

los datos.
Menor riesgo Mismo Valor Esperado->Promedio
➢ Para medir el control de la calidad estadística.
➢ Nos proporciona información adicional para juzgar la
confiabilidad de la medida de tendencia central.
➢ Reconocer la dispersión de los datos.
➢ Comparar la dispersión de diferentes muestras.
Promedio

Riesgo = 5%
$900
$800
$700
Riesgo = 20%
$600
$500
Riesgo = 0%
Time
Año 1 Año 2 Año 3 Año 4 Año 5
Promedio

Nos hace falta más que analizar el

promedio.

Permiten calcular la variación típica o dispersión promedio del conjunto de observaciones.
Rango y Máximo –Mínimo

Rango Intercuartilico 𝑄3 − 𝑄1
Varianza Mide la cantidad media respecto de las cual los

valores de un población o muestra varían
Raíz cuadrada de la varianza. Indica la variación

Desviación Estándar promedio en unidades de la variable
En una distribución simétrica: 68% de la data se

Regla Empírica encuentra ± una desviación estándar, 95% a ±
dos y 99.7% a ± tres desviaciones
Coeficiente de Medida relativa de dispersión. Sirve para

Variación comparar la variación promedio de dos
variables.

Rango y Rango Intercuartílico: El rango es la diferencia entre la observación mayor y menor, cuanto mayor es la
dispersión de los datos con respecto al centro de la distribución, mayor es el rango. Aunque el rango mide la
dispersión total de los datos, puede ser una medida insatisfactoria debido a que los casos atípicos influyen en
él.
El rango intercuartílico (RIC) mide la dispersión que hay en el 50% central de los datos, es la diferencia entre el
tercer cuartil y el primer cuartil.
25% 50% 75%
𝑄1 𝑄2 𝑄3
Observación más baja Primer Cuartil Media=Mediana=Moda Tercer Cuartil Observación más alta
Diagrama de Caja o Bigotes
Un diagrama de caja es una representación gráfica basada en cuartiles que ayuda a presentar un conjunto de
datos. Además, permite identificar datos atípicos, es decir, valores que no concuerdan con el resto de los datos y
que se pueden obtener a partir del rango intercuartílico.
Valor Máximo “Outlier”

Valor Máximo
Q3
Q3+1.5RIC
Q3
Mediana RIC=Rango
intercuartil
Mediana
Q1 Q1
Valor Mínimo Q1-1.5RIC Valor Mínimo

Varianza: La varianza mide la cantidad media respecto de la cual los valores de una población o muestra
varían. A diferencia del rango, toma todos los valores para calcular la variación promedio. La varianza es la
media aritmética de los valores absolutos de las desviaciones con respecto a la media aritmética.
σ 2
σ(𝑥 − 𝜇)2 (𝑥 − 𝑥)
ҧ
𝜎2 = 𝑠2 =
𝑁 𝑛−1
𝜎 2 : 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑠 2 : 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙

𝑁: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑛 − 1: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎
𝜇: 𝑀𝑒𝑑𝑖𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑥:ҧ 𝑀𝑒𝑑𝑖𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Tome todas las desviaciones o distancias entre la media y calcule el

promedio

Desviación Típica o Estándar: indica en promedio como se dispersa una observación con respecto a la media
aritmética. También es útil para describir cuanto se apartan las observaciones individuales con respecto a la
media, se le conoce como resultado estándar.
σ(𝑥 − 𝑥)ҧ 2
σ(𝑥 − 𝜇)2 𝑠=
𝑛−1
𝜎=
𝑁
𝜎: 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑠: 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Tome todas las desviaciones o distancias entre la media y calcule el

promedio, pero ahora calcule la raíz cuadrada

Coeficiente de variación o variación relativa: medida relativa de variabilidad, medida en términos porcentuales.
Expresa la desviación típica en porcentaje de la media. Proporciona una estimación de la magnitud de la desviación respecto
a la magnitud de la media.
Tiene en cuenta la escala con que se miden las unidades poblacionales.

σ(𝑥 − 𝜇)2
➢ CV de 0% a 11% Muy homogéneo 𝜎 𝑁
𝐶𝑉 = =
➢ 11.1% y 20% Homogéneo 𝜇 σ𝑥
➢ 20% y 40% Heterogéneo 𝑁
σ(𝑥 − 𝑥)ҧ 2
➢ Mayor que 40% Muy heterogéneo. 𝑠 𝑛−1
𝐶𝑉 = =
𝑥ҧ σ𝑥
𝑛

Regla Empírica: en cualquier distribución de frecuencias simétrica con forma de campana, aproximadamente
68% de las observaciones se encontrarán entre más o menos una desviación estándar de la media; cerca de
95% de las observaciones se encontrarán entre más o menos dos desviaciones estándar de la media y, de
hecho, “todas” (99.7%) estarán entre más o menos tres desviaciones estándar.
68%
68%
95%
99.7%

Un matemático ruso, estableció los intervalos de datos de cualquier conjunto de datos, independientemente de
la forma de la distribución.
Teorema de Chebyshev
Para cualquier población de media 𝜇 y desviación estándar 𝜎 y k>1, el porcentaje de observaciones que se
encuentran dentro del intervalo 𝜇 ± 𝑘𝜎 es
1
100 1 − %
𝑘2
Supongamos que el precio promedio de una acción es de 82 y la desviación estándar es de 4. Según el

teorema, al menos el 75% de los precios se encuentran en el intervalo comprendido entre 74 y 90 y al menos el
88.89% se encuentra en el Intervalo comprendido entre 70 y 94.

Puntaje típico o estandarizado: este estadígrafo, muy utilizado en la distribución normal y en el análisis del coeficiente de
correlación, mide la desviación de una observación con respecto a la media aritmética en unidades de desviación típica,
determinando la posición de una observación dada, dentro de un conjunto de observaciones. El puntaje típico sirve para
comparar dos o más datos individuales, aunque pertenezcan a distribuciones diferentes, incluso, en casos en que la media y/o
varianza no coincidan.
En una distribución normal estándar “z”, la media es 0 y la varianza es 1. Un valor de z mayor que cero indica que el valor es
mayor que la media, un valor de cero indicar que el valor es igual a la media.
𝑥𝑖 − 𝜇
𝑧=
𝜎

Medidas de
Deformación

Medida de Deformación
Otras característica de un conjunto de datos es la forma. Hay cuatro formas: simétrica, sesgo positivo, sesgo negativo y
bimodal.
Asimetría < 0
Sesgada a la izquierda Coeficiente de
Sesgo de Pearson
A B C 3(𝑥ҧ − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝑆𝑘 =
𝑠
Medida acotada entre -3 y 3
Asimetría > 0 Coeficiente de

Sesgada a la derecha Sesgo
3
𝑛 𝑥 − 𝑥ҧ
𝑆𝑘 = ෍
(𝑛 − 1)(𝑛 − 2) 𝑠
D E F
Valor de cero indica simetría, >0 indica
sesgada hacia la derecha y <0 indica
¿Dónde están la Media, Mediana y la Moda de las dos distribuciones? sesgada hacia la izquierda.
bimodal.
Asimetría < 0
Sesgada a la izquierda Coeficiente de
Sesgo de Pearson
A B C 3(𝑥ҧ − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝑆𝑘 =
Media Mediana Moda 𝑠
Medida acotada entre -3 y 3
Asimetría > 0 Coeficiente de

Sesgada a la derecha Sesgo
3
𝑛 𝑥 − 𝑥ҧ
𝑆𝑘 = ෍
(𝑛 − 1)(𝑛 − 2) 𝑠
D E F
Valor de cero indica simetría, >0 indica
Moda Mediana Media
sesgada hacia la derecha y <0 indica
¿Dónde están la Media, Mediana y la Moda de las dos distribuciones? sesgada hacia la izquierda.
bimodal.
Distribución con Sesgo Positivo Distribución con Sesgo Negativo
Distribución sin Sesgo

Medidas de
Apuntamiento

Medida de Apuntamiento
La curtosis mide el grado de “elevación” o “aplanamiento” que ésta tiene. La curtosis es la medida que revela este dato
tomando a la distribución normal o en forma de campana como referencia.
s1 = s2
Curtosis
Una mayor curtosis significa 1 𝑥−𝜇 4

Asimetría= 0 una mayor posibilidad de que 𝑘= ෍
ocurran eventos extremos… la 𝑁 𝜎
Exceso de Curtosis > 0
esencia de la gestión de Un valor de tres tiene el nombre de distribución
riesgo. mesocúrtica, >3 indica leptocúrtica y <3 indica
platicúrtica.
Exceso de
Curtosis
4
m1 = m2 𝑛(𝑛 + 1) 𝑥 − 𝑥ҧ 3(𝑛 − 1)2
𝑘= ෍ −
(𝑛 − 1)(𝑛 − 2)(𝑛 − 3) 𝑠 (𝑛 − 2)(𝑛 − 3)
Un valor de cero se llama distribución mesocúrtica, >0 indica
leptocúrtica y <0 indica platicúrtica.

¿Cuáles son las distribuciones? Mesocúrtica, platicúrtica y leptocúrtica.

Debemos tener mucho cuidado con la interpretación de la curtosis y

exceso de curtosis cuando se trabaja con software especializado y
Microsoft Excel, a pesar de que en Excel la función se llama curtosis
verdaderamente no la calcula, miremos el ejemplo:
2,4,5,7,8,10
STATA

Medidas de
Asociación Lineal

Medidas descriptivas entre dos variables
Hay situaciones en las que la relación entre dos variables se estudia, por ejemplo: la relación entre precio y cantidad en una función de
demanda, la relación del crecimiento económico y la tasa de ahorro de un país, precio de venta de viviendas y el metro cuadrado construido,
las ventas realizadas por una empresa y los gastos en publicidad, el precio de un activo financiero y las rentabilidades del mercado, el peso y
la estatura, las estatura de los padres y la de los hijos, las calificaciones y las horas de estudio, entre otros.
La representación gráfica bivariada más utilizada es el diagrama de dispersión o ScatterPlot. Para trazar un diagrama se necesitan dos
variables, una de las variables se escala sobre el eje horizontal (eje x) y la otra variable, a los largo del eje vertical (eje y).
Y Y Y
X X X
Asociaciones Lineales Asociaciones NO Lineales

1. Precio y cantidad en la ley de la demanda.

2. Consumo e ingreso disponible de la función
¿Cuál sería la asociación de Keynes.
entre? 3. Precio de la vivienda y tamaño del lote.
4. Precio de vehículos y kilometraje.
5. Salario y años de experiencia.

Medidas descriptivas entre dos variables: Medidas de Asociación Lineal
Indican si existe relación lineal entre dos variables.
➢ Covarianza: es una medida de relación lineal entre dos variables. Un valor positivo indica una
relación lineal directa o creciente y un valor negativo indica una relación lineal decreciente.
σ(𝑥𝑖 − 𝜇𝑥 )(𝑦𝑖 − 𝜇𝑦 )
𝐶𝑜𝑣 𝑥, 𝑦 → 𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 → 𝜎𝑥𝑦 =
𝑁
𝜇𝑥 : 𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑑𝑒 𝑥
𝜇𝑦 : 𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑑𝑒 𝑦
𝑁: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
σ(𝑥𝑖 − 𝑥)(𝑦
ҧ 𝑖 − 𝑦)
ത
𝐶𝑜𝑣 𝑥, 𝑦 → 𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 → 𝑠𝑥𝑦 =
𝑛−1
𝑥:ҧ 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑑𝑒 𝑥
𝑦:
ത 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑑𝑒 𝑦
𝑛: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Medidas descriptivas entre dos variables: Medidas de Asociación Lineal
➢ Coeficiente de correlación o producto momento de Pearson: medida más útil, ya que indica el sentido
como el grado de relación. Es una media estandarizada de la relación lineal entre dos variables.
𝐶𝑜𝑣 𝑥, 𝑦 σ(𝑥𝑖 − 𝜇𝑥 )(𝑦𝑖 − 𝜇𝑦 ) 𝑠𝑥𝑦 σ(𝑥𝑖 − 𝑥)(𝑦

ҧ 𝑖 − 𝑦)
ത
𝜌= = →𝑟= =
𝜎𝑥 𝜎𝑦 𝑁𝜎𝑥 𝜎𝑦 𝑠𝑥 𝑠𝑦 (𝑛 − 1)𝑠𝑥 𝑠𝑦
Propiedades:
1. −1 ≤ 𝑟𝑥𝑦 ≤ 1, rango delimitado.

2. 𝑟𝑥𝑦 no depende de las unidades de medida.
3. Mide la dirección.
4. Mide el grado; fuerte, débil y no existe.
5. Relación simétrica.
6. No hay relación de causa y efecto.
7. Regla útil para identificar si existe una relación importante con
2
el tamaño de muestra seleccionado 𝑟 ≥
𝑛
RESUMEN
Media, mediana, percentil 50, media Rango, rango intercuartílico, varianza,
ponderada y media geométrica desviación estándar y coeficiente de
variación.
Mide la tendencia central
Mide la dispersión y la amplitud de la
Mide la ubicación central distribución
Valor esperado y retornos esperados Justifica el riesgo y la incertidumbre
Primer Momento Segundo Momento
MOMENTOS
MEDIDAS DE ASOCIACÓN LINEAL
Tercer Momento Cuarto Momento Covarianza
Coeficiente de Correlación Lineal
Coeficiente de Asimetría Coeficiente de Exceso de Curtosis

Asimetría significa Media ≠ Mediana Exceso de curtosis de 0 implica colas
Sesgo de 0 implica simetría regulares o normales (mesocúrtica)
Una distribución Normal implica sesgo 0 Leptocúrtica (colas gordas) con un alto
exceso de curtosis, es positiva e implica
Sesgo > 0 si Media > Mediana mayores posibilidades de ocurrencia de
Sesgo < 0 si Mediana > Media eventos extremos.
Sesgo es 0 si Media = Mediana y la Distribuciones sin colas son platicúrticas
distribución es considerada como simétrica. con un exceso de curtosis negativa.

ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

MODELOS ESTADÍSTICOS: ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

Análisis de Regresión Lineal Simple
El análisis de regresión es un proceso estadístico que permite estimar la relación

entre una variable dependiente y una o más variables independientes. A partir de
su estimación, se analiza el valor de la pendiente (sensibilidad) y el poder
explicativo del modelo (bondad de ajuste). Además, con la estimación de la
ecuación de la línea recta se podrá realizar pronósticos.

• El análisis de regresión trata del estudio de la dependencia de la variable dependiente, respecto a una o
más variables, con el objetivo de estimar y/o predecir el valor promedio poblacional de la primera en
términos de los valores conocidos o fijos de la última.
• El análisis de regresión, es el valor esperado de Y dado una variable X “E(Y|X)”.
• A pesar de que el análisis de regresión tiene que ver con la dependencia de una variable respecto a otras
variables, esto no implica causalidad necesariamente. Las ideas de causalidad deben venir de
consideraciones a priori, estadísticas externas y, en último termino de una u otra teoría.

Covarianza y Coeficiente de Correlación de Pearson

REGRESIÓN
• En el análisis de correlación el objetivo principal es medir la fuerza o el
grado de asociación lineal entre dos variables. En el análisis de regresión
se trata de estimar o de predecir el valor promedio de una variable sobre la
base de valores fijos de otras variables.
• El análisis de regresión supone asimetría en los valores, por un lado una

CORRELACIÓN variable dependiente aleatoria, y por otro lado, una variable independiente
con valores fijos.

¿Qué preguntas queremos responder con la aplicación de la regresión lineal?
✓ ¿Por cuánto se podría vender una casa con un número de baños y

habitaciones?
✓ ¿Cuánto tiempo va a permanecer un cliente antes de que se fuge?
✓ ¿Cuánto tiempo tardará mi trayecto en Cabify?
✓ ¿Cuál será la demanda de un bien y/o servicio si establezco un precio en
el mercado?
✓ ¿Cuál será el salario ideal por años de educación?
✓ ¿Cuánto serán las ventas si invierto 1,000 dólares más en publicidad?

✓ ¿Cuáles son las principales variables que afectan la demanda de un bien?

✓ ¿Cuáles son las principales variables que afectan los costos operativos de mi empresa?
✓ ¿Existe alguna relación entre el nivel de tasa de interés y el índice de la bolsa?
✓ ¿Cómo afectan las uniones y fusiones de empresas los retornos (rendimientos) de los inversionistas?
✓ ¿Debo invertir en títulos de Gobierno de largo plazo o títulos Privados de corto plazo?
✓ ¿Cuál es la probabilidad de entrar en default?
✓ Probar si el Modelo CAPM representa un modelo adecuado para la determinación de los retornos de un activo.
✓ Medir y pronosticar la volatilidad de retornos de bonos.
Los expertos en cada caso tendrán ALGO que decir (especular) pero difícilmente están
seguros de CUÁNTO, en esos casos la Modelación cuantitativa les puede ayudar.
En general todas estas preguntas cuantitativas son:

1. Complicadas de responder y
2. (Usualmente) se requiere de una respuesta para la toma de decisiones.

Objetivos Pronóstico: 1) Regresión Simple y 2) Regresión múltiple.

Análisis estructural: Regresión múltiple
Tipos de
Modelo 1. Económico o Financiero: el consumo depende del ingreso.
2. Econométrico: el consumo depende del ingreso y de un término de error. El error, recoge el
efecto combinado de otras variables independientes que explican el comportamiento de la
variable dependiente y que no fueron incluidas en el modelo.

Tipos de
Modelo 1. Económico:
Versión Simplificada de una realidad económica.
Ejemplo: Modelo de Consumo y Modelo de Demanda
𝐶𝑜𝑛𝑠𝑢𝑚𝑜 = 𝛼0 + 𝛽 𝐼𝑛𝑔𝑟𝑒𝑠𝑜
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 = 𝛼0 + 𝛽 𝑃𝑟𝑒𝑐𝑖𝑜
2. Estadístico/Econométrico:
𝐶𝑜𝑛𝑠𝑢𝑚𝑜 = 𝛼0 + 𝛽 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 + 𝑒𝑖
El error, recoge el efecto combinado de otras variables independientes que explican el
comportamiento de la variable dependiente y que no fueron incluidas en el modelo.

Fases del
Proceso
Se deben desarrollar cinco pasos:
1. Identificación del problema a resolver.

2. Especificación del modelo.
3. Estimación del modelo.
4. Validación estadística del modelo.
5. Desarrollar un objetivo: pronóstico y/o análisis estructural

Partiendo de una función lineal entre dos variables, se puede estimar una relación de
tal manera que la variable independiente explique de manera exclusiva el
comportamiento de la variable dependiente, este modelo de regresión es llamado Y
determinístico.
𝑌 = 𝛽0 + 𝛽1 𝑋
Donde 𝛽0 y 𝛽1 , representan respectivamente, el valor de corte con el eje de las

ordenadas cuando la variable independiente toma el valor de cero y la pendiente de 𝛽1
la recta de la regresión. El conocimiento de dichos parámetros permitirá determinar en

𝛽0
qué cantidad se incrementa o disminuye la variable dependiente ante cambios en la
X
variable independiente y, asimismo, predecir el valor de la variable dependiente,
dado un valor en la variable independiente.

El modelo determinístico se encuentra muy limitado al comportamiento de la variable

dependiente debido a que existe un sin número de variables que podrían afectar la
estabilidad del modelo y de esta misma manera los parámetros de la regresión lineal. Y
Una manera adecuada de solucionar este problema consiste en incorporar una variable
aleatoria al modelo. De esta manera se pasa de un modelo determinístico a un modelo de
tipo estocástico. La función de regresión poblacional será de la siguiente manera.
𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝑒 𝛽1
𝛽0
El término 𝑒 es una variable estocástica inobservable que captura los errores de
X
especificación dentro del modelo, tales como variables omitidas, forma funcional
incorrecta, comportamiento aleatorio de los individuos y errores de medida.

La ecuación anterior representa una función de la variable dependiente que recoge

observaciones tanto de la variable Y como de X correspondiente a la población
estadística. Por lo tanto β0 y β1, son los parámetros de la población y se puede considerar Y
como los coeficientes verdaderos de la regresión. Sin embargo, los investigadores no 𝑌෠𝑖 = 𝛽መ0 + 𝛽መ1 𝑋
suelen trabajar con la población sino con una muestra de tamaño n, a partir de la cual se
estiman los parámetros de la regresión, la cual se denomina función de regresión muestral.
𝑌𝑖 = 𝛽መ0 + 𝛽መ1 𝑋𝑖 + 𝑒Ƹ𝑖 𝛽መ1
𝑌𝑖 = 𝑌෠𝑖 + 𝑒Ƹ𝑖 𝛽መ0
Donde 𝛽መ0 y 𝛽መ1 , son los estimadores muestrales de 𝛽0 y 𝛽1 poblacionales. X

𝑌 = 𝛽መ0 + 𝛽መ1 𝑋 + 𝑒Ƹ
𝑌 = 𝑌෠𝑖 + 𝑒Ƹ Y
𝑌෠𝑖 = 𝛽መ0 + 𝛽መ1 𝑋

Donde 𝛽መ0 y 𝛽መ1 , son los estimadores muestrales de 𝛽0 y 𝛽1 poblacionales.
• 𝑌෠ es el valor estimado de y, y es una variable dependiente

• 𝛽መ0 es el intercepto, el valor que toma y dado que x es cero. 𝛽መ1
• 𝛽መ1 es la pendiente, ante un cambio unitario en x es el cambio promedio en y.

(Cambio promedio en y por la variación de una unidad (incremento/disminución) en 𝛽መ0
la variable independiente X)
X
• X es el valor de la variable independiente.

¿Cuál será la mejor línea?

Método de estimación: Mínimos cuadrados ordinarios M.C.O

Este método minimiza la perturbación aleatoria. El objetivo de este método es determinar el mejor modelo lineal
que minimiza la suma de cuadrados de los errores entre las observaciones en un conjunto de datos y las
estimaciones del modelo.
𝛽෠0 = 𝑌ത − 𝛽෠1 𝑋ത
σ 𝑋 − 𝑋ത 𝑌 − 𝑌ത
𝛽መ1 =
σ 𝑋 − 𝑋ത 2
𝑆𝑥𝑦 𝐶𝑜𝑣 (𝑥, 𝑦) 𝑆𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎 𝑑𝑒 𝑥𝑦

𝛽መ1 = = =
𝑆𝑥𝑥 𝑉𝑎𝑟(𝑥) 𝑆𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎 𝑑𝑒 𝑥

Análisis de Regresión Lineal Simple y Bondad de Ajuste
Una medida de bondad de ajuste en el modelo de regresión lineal, es el Coeficiente de Determinación 𝑅2 . Este permite encontrar el
porcentaje de variación de la variable dependiente que es explicado por el comportamiento de las variables independientes.
𝑆𝐶𝐸
𝑅2 =
𝑆𝐶𝑇
El coeficiente de determinación puede tomar valores menores o iguales a uno o valores mayores o iguales a cero. Entre más cercano a uno
este el coeficiente de determinación indica un poder predictivo más fuerte.
Y 𝑌𝑖
𝑌෠𝑖 𝑌𝑖 − 𝑌ത = 𝑌𝑖 − 𝑌෠𝑖 + (𝑌෠𝑖 − 𝑌ത ൯
𝑌𝑖 − 𝑌෠𝑖 2 2
𝑌𝑖 − 𝑌ത ෍ 𝑌𝑖 − 𝑌ത 2
= ෍ 𝑌𝑖 − 𝑌෠𝑖 + ෍ 𝑌෠𝑖 − 𝑌ത
𝑌෠𝑖 − 𝑌ത = 𝑃𝑎𝑟𝑡𝑒 𝐸𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎
𝑌ത ෍ 𝑌𝑖 − 𝑌ത 2
= 𝑺𝑪𝑻 = 𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙
෍(𝑌෠𝑖 − 𝑌)
ത 2 = 𝑺𝑪𝑬 = 𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎
2
𝑋ത X ෍ 𝑌𝑖 − 𝑌෠𝑖 = 𝑺𝑪𝑹 = 𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠

Dificultades al pronosticar
Pronosticar una variable siempre será una combinación ideal entre arte y ciencia. A continuación, se detalla de manera
gráfica los principales problemas al analizar una relación entre variables.
Casos Relación no
Atípicos Lineal

Relación no Varianza no
Lineal Constante

Varianza no
Constante

Juegos
de Azar
PROBABILIDAD
Probabilidad Probabilidad de
de Fuga Incumplimiento

CONCEPTOS DE PROBABILIDAD
Teoría de la Probabilidad
La teoría de la probabilidad esta basada en tres conceptos fundamentales: resultados, eventos y medida de
probabilidad.
1. Un resultado es el posible desenlace de un experimento aleatorio. Un experimento es una acción.

2. En algunas disciplinas se asume que un experimento aleatorio puede ser repetido y observado bajo las mismas
condiciones cuantas veces sea necesario.
3. El conjunto de posibles resultados se conoce como espacio muestral y se denota generalmente con la letra
griega Ω.
4. Cada posible resultado o elemento del espacio muestral se conoce como punto muestral. Los puntos muestrales
de denotan usualmente con la letra griega 𝜔.

Probabilidad
Es un valor acotado entre cero y uno, inclusive, que

describe la posibilidad relativa de un evento.
No existe ninguna posibilidad Posibilidad de obtener una cara Con seguridad el evento
de que el evento ocurra. en el lanzamiento de una moneda sucederá.
0.00 0.5 1.00
Experimento Resultado
Toda acción definida donde se conocen todos los resultados posibles de

Ocurrencia particular de un experimento.
antemano pero existe incertidumbre sobre la ocurrencia del resultado final.
Espacio Muestral y Punto Muestral Evento o Suceso

Es el conjunto de todos los resultados posibles de un experimento aleatorio, Subconjunto de resultados del espacio muestral. Se puede interpretar como
“Ω o S”. Cada punto muestral crea una ponderación de ocurrencia, una algo que puede o no ocurrir en cada realización del experimento aleatorio.
probabilidad de punto muestral, “Pi”. Se denota a partir de letras A,B,C…
Al lanzar dos dados simultáneamente un posible
resultado es un par de números, uno por cada
cara, tal como (3,2) o (5,5). En este caso el
espacio muestral sería:
Ω= 𝜔1 , 𝜔2 : 𝜔𝑖 𝜖 𝑖 = 1,2,3,4,5,6, 𝑖 = 1,2
Contar el número de miembros que hacen parte de la junta
Experimento Lanzar un Dado directiva de las 500 mejores empresas dentro de los cuales
su edad sea superior de 60 años
Este será un conjunto de 36 resultados posibles.
Se lanza una moneda hasta obtener cara. En

Observar un 1 Ninguno tiene más de 60 años
Observar un 2 Uno tiene más 60 años este caso, el espacio muestral contiene un
Todos los
posible
Observar un 3 … número contable infinito de posibles resultados.
Observar un 4 …
resultados
Observar un 5 29 miembros tienen más de 60 años
Observar un 6 ... Ω = C, SC, SSC, SSSC, SSSSC, …
Algunos
Observar un número par
Más de 13 miembros tienen más de 60 años
¿Cuál sería el conjunto de resultados en donde
Observar un número mayor que 4 la suma del lanzamiento de dos dados sea
posibles eventos Menos de 20 miembros son mayores de 60 años
Observar un número menor o igual que 3
igual que 10?

Asignación de Probabilidades
Enfoques de
Probabilidad
Objetivo Subjetivo
Probabilidad Probabilidad Parte de información disponible,

Clásica Empírica de la que tienen, de su
experiencia y del modo en que la
interpretan.
Se basa en resultados Se sustenta en las

igualmente probables frecuencias relativas.

Asignación de Probabilidades
La probabilidad clásica es la proporción de veces que ocurrirá un suceso, suponiendo que todos los resultados contenidos en el
espacio muestral tienen la misma probabilidad de ocurrir. Se obtiene a partir de la división entre el número de resultados
contenidos en el espacio muestral que satisface el suceso entre el número total de resultados.
𝑁𝐴
𝑃 𝐴 =
𝑁
La frecuencia empírica o relativa es el número de sucesos contenidos en la población que satisfacen la condición divido por el
número total de sucesos. Estas probabilidades indican la frecuencia con que ocurrirá un suceso en comparación con otros.
𝑛𝐴
𝑃 𝐴 =
𝑛
En este caso, la probabilidad es el límite a medida que n se hace más grande.

Principios de Conteo
Si la cantidad de posibles resultados de un experimento es pequeña, resulta relativamente fácil contarlos. ¿Cuántos
resultados se tienen al lazar una moneda, dos monedas y tres monedas?
Espacio Muestral al lanzar una moneda {C,S}

Espacio Muestral al lanzar dos monedas {CC,CS,SC,SS}
Espacio Muestral al lanzar tres monedas {CCC,CCS,CSC,CSS,SCC,SCS,SSC,SSS}
Sin embargo, si hay un número muy grande de resultados, tal como el número de resultados de un experimento al
lanzar 20 monedas, sería tedioso contar todas las posibilidades.
Para esto, se analizarán tres fórmulas para contar: la fórmula de la multiplicación, la fórmula de las permutaciones
y la fórmula de las combinaciones.

Fórmula de la Multiplicación
Si hay m formas de hacer una cosa y n de hacer otra, hay m x n formas de hacer ambas
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑖𝑠𝑝𝑜𝑠𝑖𝑐𝑖𝑜𝑛𝑒𝑠 = 𝑚 ∗ (𝑛)
Si un distribuidor de telefonía móvil quiere colocar todos sus modelos de iPhone en el mostrador de la tienda
(Tamaño, Color y Modelo) ¿Cuántos tipos distintos de iPhone se pueden ofrecer?
Modelos: 7, 8, Xr y Xs 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑖𝑠𝑝𝑜𝑠𝑖𝑐𝑖𝑜𝑛𝑒𝑠 = 𝑚 ∗ 𝑛

Tamaño: 5.5 y 4.7. 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑖𝑠𝑝𝑜𝑠𝑖𝑐𝑖𝑜𝑛𝑒𝑠 = 4 ∗ 2 ∗ 4 = 32
Color: White, Black, Blue y Red.

Fórmula de las Permutaciones
✓ La fórmula de la multiplicación se aplica para determinar el número posible de disposiciones de dos o más
grupos.
✓ La fórmula de las permutaciones hace referencia al número de arreglos que se pueden hacer con un conjunto
de elementos cuando solo hay un grupo de objetos.
✓ De cuantas maneras diferentes es posible organizar los datos.
✓ Es importante el orden.
Cualquier distribución de r objetos seleccionados de un solo grupo de n posibles objetos.
𝑛!
𝑛𝑃𝑟 = 𝑑𝑜𝑛𝑑𝑒 𝑛 𝑒𝑠 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑗𝑒𝑡𝑜𝑠 𝑦 𝑟 𝑒𝑠 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑗𝑒𝑡𝑜𝑠 𝑠𝑒𝑙𝑒𝑐𝑐𝑖𝑜𝑛𝑎𝑑𝑜𝑠
𝑛−𝑟 !
La notación denominada n factorial se representa como n! y significa el producto de n(n-1)(n-2)...(1)

Fórmula de las Combinaciones
Si el orden de los objetos seleccionados no es importante, cualquier selección se denomina combinación. La forma
para contar el número de r combinaciones de objetos de un conjunto de n objetos es:
𝑛 𝑛!
𝑛𝐶𝑟 = = 𝑑𝑜𝑛𝑑𝑒 𝑛 𝑒𝑠 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑗𝑒𝑡𝑜𝑠 𝑦 𝑟 𝑒𝑠 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑗𝑒𝑡𝑜𝑠 𝑠𝑒𝑙𝑒𝑐𝑐𝑖𝑜𝑛𝑎𝑑𝑜𝑠
𝑟 𝑟! 𝑛 − 𝑟 !

Ejercicios
Dado que hay 5 postres en una repostería y supongamos que ustedes comen dos postres por cada visita. ¿Cuántas veces podría
visitar la repostería sin comer los mismos postres?
Ahora, ¿Qué pasaría si usted prefiere comer primero una banana Split y después una torta de chocolate y su satisfacción es
diferente que comer primero una torta de chocolate y una banana Split?
El espacio muestral contiene 5A y 7B. ¿Cuál es la probabilidad de que un conjunto de 2 seleccionado aleatoriamente contenga 1A
y 1B?
y 2B?
En una ciudad de 180,000 personas, hay 20,000 inmigrantes legales procedentes de Latinoamérica. ¿Cuál es la probabilidad de
que una muestra aleatoria de dos personas de la ciudad contenga dos inmigrantes legales procedentes de Latinoamérica?

Ejercicios
Dado que hay 5 postres en una repostería y supongamos que ustedes comen dos postres por cada visita. ¿Cuántas veces podría
visitar la repostería sin comer los mismos postres?
AB,AC,AD,AE,BC,BD,BE,CD,CE,DE
5!
𝐶25 = = 10
2! ∗ 5 − 2 !

Ejercicios
Ahora, ¿Qué pasaría si usted prefiere comer primero una banana Split y después una torta de chocolate y su satisfacción es
diferente que comer primero una torta de chocolate y una banana Split?
5!
𝑃25 = = 20
5−2 !

Ejercicios
y 1B?
El número total de resultados en el espacio muestral

12!
𝑁 = 𝐶212 =
2! 12 − 2 !
El número de maneras de seleccionar 1A a partir de 5 disponibles

5!
𝐶15 =
1! 5 − 1 !
El número de maneras de seleccionar 1B a partir de 7 disponibles
7!
𝐶17 =
1! 7 − 1 !
El número de resultados que satisfacen la condición de 1A y 1B= 𝑁𝐴 = 5 ∗ 7 = 35

Ejercicios
y 2B?
El número total de resultados en el espacio muestral

10!
𝑁 = 𝐶310 = = 120
3! 10 − 3 !
El número de maneras de seleccionar 1A a partir de 6 disponibles
6!
𝐶16 = =6
1! 6 − 1 !
El número de maneras de seleccionar 2B a partir de 4 disponibles
4!
𝐶24 = =6
2! 4 − 1 !
El número de resultados que satisfacen la condición de 1A y 2B= 𝑁𝐴 = 6 ∗ 6 = 36

Ejercicios
En una ciudad de 180,000 personas, hay 20,000 inmigrantes legales procedentes de Latinoamérica. ¿Cuál es la probabilidad de
que una muestra aleatoria de dos personas de la ciudad contenga dos inmigrantes legales procedentes de Latinoamérica?
𝑛𝐴 20,000
𝑃 𝐴 = = = 11.11%
𝑛 180,000
La probabilidad de que una muestra aleatoria de 2 personas de la ciudad contenga 2 inmigrantes legales de América Latina es
11.11%*11.11%=1.23%
Un método alternativo de obtener la probabilidad es:
𝐶220,000
𝑃 𝐴 = = 1.23%
𝐶2180,000

Probabilidad Clásica
La probabilidad clásica parte del supuesto de que los resultados de un experimento son igualmente posibles. La
probabilidad de un evento se calcula dividendo el número de resultados favorables entre el número de posibles
resultados.
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑅𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 =
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠
Mutuamente
Excluyente ✓ El hecho de que un evento se presente significa que ninguno de los demás
puede ocurrir.
Compatibles
✓ Sucesos que pueden ocurrir simultáneamente.
Dependientes ✓ Si influye en la ocurrencia de otro evento.
Independientes
✓ Evento donde la presentación de uno, no tiene efecto sobre la probabilidad
de presentación de cualquier otro.

Probabilidad Empírica
El segundo tipo de probabilidad, se basa en el número de veces que ocurre un evento como proporción del número
de sucesos similares en el pasado.
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑜𝑐𝑢𝑟𝑟𝑒

𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝐸𝑚𝑝í𝑟𝑖𝑐𝑎 =
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
Este enfoque se basa en la llamada ley de los grandes números. La ley de los grandes números indica que en una
gran cantidad de intentos, la probabilidad empírica de un evento se aproximará a su probabilidad real.

Probabilidad Subjetiva
Si se cuenta con poca o ninguna información con la cual sustentar la probabilidad, es posible aproximarla de
manera subjetiva. Existe un amplio grado de incertidumbre en este tipo de probabilidad, la cual se basa,
principalmente, en el conocimiento que posee el individuo del proceso que estudia.

Recursos
Diagrama de Venn
http://www.stat.ucla.edu/~vlew/stat11/lectures/venn/venn.html
Diagrama de Venn (Parte 2)

https://www.geogebra.org/m/e267ejtx
Teoría de conjuntos (Probabilidad a partir del diagrama de Venn)

https://www.stat.berkeley.edu/~stark/Java/Html/Venn3.htm

Regla de la Adición para calcular probabilidades
Existen dos reglas de la adición: la regla especial y la regla general.
1. Regla Especial de la adición: se aplica cuando los eventos son mutuamente excluyentes. Por lo tanto, la regla
especial de la adición establece que la probabilidad de que ocurra uno u otro es igual a la suma de sus
probabilidades marginales. Una probabilidad marginal se refiere a la probabilidad de ocurrencia de un
suceso.
𝑅𝑒𝑔𝑙𝑎 𝐸𝑠𝑝𝑒𝑐𝑖𝑎𝑙 𝑑𝑒 𝑙𝑎 𝐴𝑑𝑖𝑐𝑖ó𝑛 𝑃 𝐴 𝑜 𝐵 = 𝑃 𝐴 + 𝑃 𝐵
El concepto de eventos mutuamente excluyentes, así como de otras reglas para combinar probabilidades se
ilustra mediante el diagrama de Venn. Para construir un diagrama de Venn, primero se encierra un espacio
de forma rectangular, el cual representa el total de los posibles resultados. Así, un evento se representa por
medio de un área circular que se dibuja dentro del rectángulo, la cual corresponde a la probabilidad del
evento.

Regla del Complemento
La regla del complemento se emplea para determinar la probabilidad de que un evento ocurra restando de 1 la
posibilidad de un evento que no ha ocurrido. Esta regla es útil porque en ocasiones es más fácil calcular la
probabilidad de que un evento suceda determinando la probabilidad de que no suceda y restando el resultado
de 1.
𝑅𝑒𝑔𝑙𝑎 𝑑𝑒𝑙 𝐶𝑜𝑚𝑝𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑃 𝐴 = 1 − 𝑃 ~𝐴 → 𝑃 𝐴 + 𝑃 ~𝐴 = 1

Regla general de la Adición
Los resultados de un experimento pueden no ser mutuamente excluyentes. Cuando dos eventos ocurren al mismo
tiempo, se habla de probabilidad conjunta.
𝑅𝑒𝑔𝑙𝑎 𝑔𝑒𝑛𝑒𝑟𝑎𝑙 𝑑𝑒 𝑙𝑎 𝐴𝑑𝑖𝑐𝑖ó𝑛 𝑃 𝐴 𝑜 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑃(𝐴 𝑦 𝐵)

𝑅𝑒𝑔𝑙𝑎 𝑔𝑒𝑛𝑒𝑟𝑎𝑙 𝑑𝑒 𝑙𝑎 𝐴𝑑𝑖𝑐𝑖ó𝑛 𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑃(𝐴 ∩ 𝐵)

Tablas de contingencia y probabilidad
La tabla de contingencia se utiliza para clasificar observaciones de una muestra de acuerdo con
dos o más características identificables. Una tabla de contingencia consiste en una tabulación
cruzada que resume simultáneamente dos variables de interés, así como la relación entre estas.
Golosinas Golosinas
Frecuencia Si No Total Probabilidad Si No Total
Spam 4 16 20 Spam 4% 16% 20%
Ham 1 79 80 Ham 1% 79% 80%
Total 5 95 100 Total 5% 95% 100%
En este caso se tienen cuatro probabilidades marginales: P(Spam), P(Ham),

P(Si Golosinas) y P(No Golosinas)

Ejercicios
Golosinas Golosinas
Spam 4 16 20 Spam 4% 16% 20%
Ham 1 79 80 Ham 1% 79% 80%
Total 5 95 100 Total 5% 95% 100%

Ejercicios
Golosinas Golosinas
Spam 4 16 20 Spam 4% 16% 20%
Ham 1 79 80 Ham 1% 79% 80%
Total 5 95 100 Total 5% 95% 100%

Ejercicios
Golosinas Golosinas
Spam 4 16 20 Spam 4% 16% 20%
Ham 1 79 80 Ham 1% 79% 80%
Total 5 95 100 Total 5% 95% 100%

Ejercicios
Se tiene la siguiente información de reclamaciones. La tabla muestra las probabilidades de los números de quejas semanales. Sea
A el suceso, habrá al menos una reclamación a la semana y B el suceso, habrá menos de diez reclamaciones a la semana.
Número de
0 Entre 1 y 3 Entre 4 y 6 Entre 7 y 9 Entre 10 y 12 Más de 12
Reclamaciones
Probabilidad 14% 39% 23% 15% 6% 3%
1. Hallar la probabilidad de A.
2. Hallar la probabilidad de B.
3. Hallar la probabilidad del complemento de A.
4. Hallar la probabilidad de la unión de A y B.
5. Hallar la probabilidad de la intersección de A y B
6. ¿Son A y B sucesos mutuamente excluyentes?
7. ¿Son A y B sucesos colectivamente exhaustivos?

Ejercicios
𝑃 𝐴 = 39% + 23% + 15% + 6% + 3% = 86%
𝑃 𝐵 = 14% + 39% + 23% + 15% = 91%
𝑃 𝐴ҧ = 1 − 𝑃 𝐴 = 14%
𝑃 𝐴 ∪ 𝐵 = 3% + 6% + 14% + 15% + 23% + 39% = 100%
𝑃 𝐴 ∩ 𝐵 = 39% + 23% + 15% = 77%
𝑁𝑜 𝑠𝑜𝑛 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑚𝑢𝑡𝑢𝑎𝑚𝑒𝑛𝑡𝑒 𝑒𝑥𝑐𝑙𝑢𝑦𝑒𝑛𝑡𝑒𝑠 𝑃 𝐴 ∩ 𝐵 ≠ 0
𝑆𝑖, 𝑝𝑜𝑟𝑞𝑢𝑒 𝑃 𝐴 ∪ 𝐵 = 100%

¿Qué pasaría si ahora son tres conjuntos?
𝑃 𝐴 𝑜 𝐵 𝑜 𝐶 = 𝑃 𝐴 + 𝑃 𝐵 + 𝑃 𝐶 − 𝑃 𝐴 𝑦 𝐵 − 𝑃 𝐴 𝑦 𝐶 − 𝑃 𝐵 𝑦 𝐶 + 𝑃(𝐴 𝑦 𝐵 𝑦 𝐶)
𝑃 𝐴 ∪ 𝐵 ∪ 𝐶 = 𝑃 𝐴 + 𝑃 𝐵 + 𝑃 𝐶 − 𝑃 𝐴 ∩ 𝐵 − 𝑃 𝐴 ∩ 𝐶 − 𝑃 𝐵 ∩ 𝐶 + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)
A B

Una revista de noticias publica tres columnas tituladas “Arte” (A), “Libros” (B) y “Cine” C. Los hábitos de lectura de
un lector seleccionado al azar con respecto a estas columnas son:
Lee con
A B C 𝐴∩𝐵 𝐴∩𝐶 𝐵∩𝐶 𝐴∩𝐵 ∩𝐶
regularidad
Probabilidad 14% 23% 37% 8% 9% 13% 5%
A B

Una revista de noticias publica tres columnas tituladas “Arte” (A), “Libros” (B) y “Cine” C. Los hábitos de lectura de
un lector seleccionado al azar con respecto a estas columnas son:
Lee con
A B C 𝐴∩𝐵 𝐴∩𝐶 𝐵∩𝐶 𝐴∩𝐵 ∩𝐶
regularidad
Probabilidad 14% 23% 37% 8% 9% 13% 5%
A B
2% 3% 7%
5%
4% 8%
20%
C

Reglas de la Multiplicación
En esta parte vamos a estudiar las reglas para calcular la probabilidad de que la ocurrencia de dos eventos sea
simultánea, es decir, su probabilidad conjunta.
Al igual que la regla de la adición, la regla de la multiplicación tiene dos tipos: especial y general.
1. Regla Especial de la Multiplicación
Recordemos que un evento independiente, se llama independiente si un evento ocurre y no tiene ningún efecto
sobre la probabilidad de que otro evento acontezca.
𝑃 𝐴 𝑦 𝐵 = 𝑃 𝐴 ∗ 𝑃(𝐵)
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 ∗ 𝑃(𝐵)

Reglas de la Multiplicación
Golosinas Golosinas
Spam 4 16 20 Spam 4% 16% 20%
Ham 1 79 80 Ham 1% 79% 80%
Total 5 95 100 Total 5% 95% 100%
¿El evento Golosinas y Spam son eventos independiente? RTA// No, la multiplicación de las probabilidades
marginales es diferente a la probabilidad conjunta.
𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 = 5%, 𝑃 𝑆𝑝𝑎𝑚 = 20%, 𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 𝑦 𝑆𝑝𝑎𝑚 = 4%
𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 ∗ 𝑃 𝑆𝑝𝑎𝑚 = 5% ∗ 20% = 1%

Regla General de la Multiplicación
Si dos eventos no son independientes, se dice que son dependientes. Supongamos que hay 10 latas de gaseosa en
un refrigerador, 7 de las cuales son Coca Cola y 3 son colombiana. La probabilidad de que sea una lata de
colombiana es 3/10, y la probabilidad de que sea una lata de Coca Cola es de 7/10. Luego, se elige una
segunda lata sin devolver la primera. La probabilidad de que la segunda lata sea Coca Cola o colombiana
depende de que la primera lo haya sido o no. La probabilidad de que sea colombiana será 2/9 o 3/9
dependiendo del evento anterior, esto se llama probabilidad condicional.
La probabilidad condicional es una probabilidad de un evento en particular suceda, dado que otro evento haya
acontecido.
𝑃 𝐴 𝑦 𝐵 = 𝑃 𝐴 ∗ 𝑃(𝐵|𝐴)
Se tendrá entonces que la probabilidad conjunta, que los dos eventos sucedan, es la multiplicación de la
probabilidad marginal (probabilidad sencilla que quiere decir que solo un evento puede llevarse a cabo) y la
probabilidad condicional (la probabilidad de B dada A)

Tablas de Contingencia
La tabla de contingencia se utiliza para clasificar observaciones de una muestra de acuerdo con dos o más
características identificables. Una tabla de contingencia consiste en una tabulación cruzada que resume
simultáneamente dos variables de interés, así como la relación entre estas.
Edad
Películas por mes Menos de 30 30 hasta 60 60 o Más Total
𝐵1 𝐵2 𝐵3 𝑃 6 𝑜 𝑚á𝑠 𝑝𝑒𝑙í𝑐𝑢𝑙𝑎𝑠
0 𝐴1 15 50 10 75 𝑃 2 𝑜 𝑚𝑒𝑛𝑜𝑠 𝑝𝑒𝑙í𝑐𝑢𝑙𝑎𝑠
1 o 2 𝐴2 25 100 75 200 𝑃 6 𝑜 𝑚á𝑠 𝑝𝑒𝑙𝑖𝑐𝑢𝑙𝑎𝑠 𝑜 60 𝑎ñ𝑜𝑠 𝑜 𝑚á𝑠
3,4 y 5 𝐴3 55 60 60 175 𝑃 6 𝑜 𝑚á𝑠 𝑝𝑒𝑙í𝑐𝑢𝑙𝑎𝑠 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝑙𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑡𝑖𝑒𝑛𝑒 60 𝑎ñ𝑜𝑠 𝑜 𝑚á𝑠
6 o más 𝐴4 5 15 30 50 𝑃(6 𝑜 𝑚á𝑠 𝑝𝑒𝑙𝑖𝑐𝑢𝑙𝑎𝑠 𝑦 𝑡𝑖𝑒𝑛𝑒 60 𝑎ñ𝑜𝑠 𝑜 𝑚á𝑠)
Total 100 225 175 500

Diagramas de Árbol
El diagrama de árbol es una gráfica útil para organizar y calcular probabilidades y mejorar la solución de problemas de
probabilidad. Este tipo de problema implica varias etapas y cada una se ilustra con la rama del árbol. Las ramas del árbol se
etiquetan con las probabilidades.
1. Se comienza dibujando un cuadro a la izquierda para representar la raíz del árbol.
2. Hay tres ramas principales que salen de la raíz. En la rama superior se representa el evento de un adulto que tiene menos de
30 años. La rama se etiqueta con la probabilidad 𝑃 𝐵1 = 100/500.
3. De cada una de las ramas principales salen cuatro ramas, las cuales representan las cuatro categorías de películas vistas por
mes. Las ramas superiores del árbol representan la probabilidad condicional de un adulto que no vio ninguna película dado
que tiene menos de 30 años. Estas se escriben 𝑃(𝐴1 𝐵1 , 𝑃(𝐴2 𝐵1 …
4. Por último, se determinan las diversas probabilidades conjuntas. Por tanto, la probabilidad conjunta de que un adulto
seleccionado al azar tenga menos de 30 años y no vea películas durante el mes es:
100 15
𝑃(𝐵1 𝑦 𝐴1 ) = 𝑃 𝐵1 ∗ 𝑃(𝐴1 𝐵1 = ∗ = 0.03
500 100

Diagramas de Árbol
100 15
Probabilidad Marginal 15 0 ∗ = 0.03
= 0.15 500 100
100
Probabilidad Condicional 100 25
25 1o2 ∗ = 0.05
Probabilidad Conjunta = 0.25 500 100
100
100 55
55 3, 4 y 5 ∗ = 0.11
30 años = 0.55 500 100
100
100 5
100 5 6 o más ∗ = 0.01
= 0.2 = 0.05 500 100
500 100
50 225 50
= 0.22 0 ∗ = 0.10
225 500 225
100 225 100
225 = 0.44 1o2 ∗ = 0.20
= 0.45 225 500 225
500 30 hasta 60 225 60
Edad 60
años = 0.27 3, 4 y 5 ∗ = 0.12
225 500 225
15 225 15
= 0.07 6 o más ∗ = 0.03
225 500 225
10 175 10
175 = 0.06 0 ∗ = 0.02
175 500 175
= 0.35
500 75 175 75
= 0.43 1o2 ∗ = 0.15
175 500 175
60 años o 60 175 60
más = 0.34 3, 4 y 5 ∗ = 0.12
175 500 175
30 175 30
= 0.17 6 o más ∗ = 0.06
175 500 175

Femenino P(Casado ∩ Femenino)=
P(F|C)=
Género
P(M|C)= Masculino P(Casado ∩ Masculino)=
P(Casado)=
Femenino P(Separado ∩ Femenino)=

P(F|S)=
Género
P(Separado)= P(M|S)= Masculino P(Separado ∩ Masculino)=
Femenino P(Soltero ∩ Femenino)=

P(F|S)=
P(Soltero)=
Estado
Género
Civil
P(M|S)= Masculino P(Soltero ∩ Masculino)=
Femenino P(Unión Libre ∩ Femenino)=

P(F|UL)=
P(Unión Libre)=
Género
P(M|UL)= Masculino P(Unión Libre ∩ Masculino)=
P(Viudo)=
Femenino P(Viudo ∩ Femenino)=

P(F|V)=
Género
P(M|V)= Masculino P(Viudo ∩ Masculino)=

Teorema de Bayes
Corresponde a la probabilidad condicional cuando mediante el efecto se estima la probabilidad de la causa. Otra manera de
definirlo es que el Teorema de Bayes permite reconsiderar las probabilidades condicionadas utilizando la información de la que se
dispone, este proceso ajusta las estimaciones de la probabilidad, dada la información adicional.
𝐶𝑎𝑢𝑠𝑎
𝑃
𝐸𝑓𝑒𝑐𝑡𝑜
Por ejemplo, ¿Cuál de estas situaciones se acomoda al Teorema de Bayes? La primera situación nos dice que un estudiante aprobó
el último parcial de estadística y probabilidad ¿Cuál es la probabilidad de que haya estudiado?, y la segunda situación no dice
que él estudio todo el semestre ¿Cuál es la probabilidad de que haya aprobado el parcial de estadística y probabilidad?
Lo primero que debemos definir es que evento es la causa y cuál es el efecto. En nuestras situaciones el efecto es aprobar el parcial
de estadística y probabilidad y la causa haber estudiado durante el semestre. Entonces la primera situación es la que cumple con
el lineamiento del Teorema de Bayes.
𝐸𝑠𝑡𝑢𝑑𝑖𝑎𝑟
𝑃
𝐴𝑝𝑟𝑜𝑏ó 𝑒𝑙 𝑝𝑎𝑟𝑐𝑖𝑎𝑙

Teorema de Bayes
𝑃 𝐴𝑖 ∗ 𝑃(𝐵|𝐴𝑖 )
𝑇𝐸𝑂𝑅𝐸𝑀𝐴 𝐷𝐸 𝐵𝐴𝑌𝐸𝑆 𝑃 𝐴𝑖 𝐵 =
σ𝑘𝑖=1 𝑃 𝐵 𝐴𝑖 ∗ 𝑃(𝐴𝑖 )
𝑃 𝐴1 ∗ 𝑃(𝐵|𝐴1 )
𝑃 𝐴1 𝐵 =
𝑃 𝐴1 𝑃 𝐵 𝐴1 + 𝑃 𝐴2 𝑃(𝐵|𝐴2 )
Probabilidad a Priori, la que está basada en el nivel de información actual. 𝑃 𝐴𝑖
Probabilidad a Posteriori, la que se revisa a partir de información adicional. 𝑃 𝐴𝑖 𝐵
Probabilidad condicional. 𝑃(𝐵|𝐴𝑖 )
Probabilidad Marginal (Total). 𝑃 𝐴1 𝑃 𝐵 𝐴1 + 𝑃 𝐴2 𝑃(𝐵|𝐴2 )

Teorema de Bayes
Miremos como se construye la fórmula del Teorema de Bayes. Recordemos la fórmula de probabilidad conjunta y la probabilidad
condicional
𝑃 𝐴 ∩𝐵 =𝑃 𝐵∩𝐴
𝑃 𝐴 ∗𝑃 𝐵 𝐴 = 𝑃 𝐵 ∗𝑃 𝐴 𝐵
𝑃 𝐴 ∗𝑃 𝐵 𝐴 𝑃 𝐴1 𝑃 𝐵 𝐴1
𝑃 𝐴𝐵 = =
𝑃(𝐵) 𝑃 𝐴1 𝑃 𝐵 𝐴1 + 𝑃 𝐴2 𝑃 𝐵 𝐴2 + ⋯ + 𝑃 𝐴𝐾 𝑃 𝐵 𝐴𝐾
Estos son los cuatro pasos para calcular la probabilidad por medio del Teorema de Bayes
1. Se definen los sucesos de los subconjuntos, dado el problema.
2. Se definen las probabilidades y las probabilidades condicionadas de los sucesos definidos en el paso 1.
3. Se calculan los complementos de las probabilidades.
4. Se construye el diagrama de árbol o se aplica directamente la fórmula del Teorema de Bayes para calcular la probabilidad.

Teorema de Bayes: Ejemplo
¿Cuál es la probabilidad de que un correo sea spam dado que tiene la palabra Golosinas?
𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 𝑆𝑝𝑎𝑚 ∗ 𝑃(𝑆𝑝𝑎𝑚) 𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 𝑆𝑝𝑎𝑚 ∗ 𝑃(𝑆𝑝𝑎𝑚)

𝑃 𝑆𝑝𝑎𝑚 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 = =
𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 𝑆𝑝𝑎𝑚 ∗ 𝑃(𝑆𝑝𝑎𝑚) + 𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 ~𝑆𝑝𝑎𝑚 ∗ 𝑃(~𝑆𝑝𝑎𝑚) 𝑃(𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠)
Golosinas
20
𝑃 𝑆𝑝𝑎𝑚 = = 0.2
Frecuencia Si No Total 100
Spam 4 16 20 4
𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 𝑆𝑝𝑎𝑚 = = 0.2
20
Ham 1 79 80
Golosinas
5
Total 5 95 100 𝑃 𝐺𝑜𝑙𝑜𝑠𝑖𝑛𝑎𝑠 = = 0.05
Probabilidad Si No Total 100
Spam 4/20 16/20 20
𝟒 𝟐𝟎
Ham 1/80 79/80 80 𝟐𝟎 ∗ 𝟏𝟎𝟎
𝑷 𝑺𝒑𝒂𝒎 𝑮𝒐𝒍𝒐𝒔𝒊𝒏𝒂𝒔 = = 𝟎. 𝟖 = 𝟖𝟎%
𝟓
Total 5/100 95/100 100 𝟏𝟎𝟎

Teorema de Bayes: Ejemplo 1
Un concesionario de automóviles sabe por experiencia que el 10% de las personas que entra en la tienda y hablan con un asesor
terminan comprando. Para aumentar las posibilidades, se propone ofrecer una cena gratis a todas las personas que estuvieran
dispuestas a escuchar la presentación comercial del vendedor. Se sabe que algunas personas hacen cualquier cosa por obtener
algún beneficio gratis aunque no tenga intención de comprar un automóvil y otras personas prefieren no cenar con un vendedor de
automóviles. Por tanto, se quiere comprobar la eficacia de este incentivo. El proyecto se realizó durante seis meses y el 40% de las
personas que compraron un automóvil cenó gratis. También cenó gratis el 10% de las personas que no compraron automóvil. Se
quieren resolver dos preguntas: 1) ¿tienen las personas que aceptan la cena una probabilidad mayor de comprar un vehículo? Y 2)
¿Qué probabilidad hay de que una persona que no acepta una cena gratis compre un vehículo?
Definir los sucesos de los subconjuntos Definir las probabilidades de los Calcular los complementarios de las Aplicar la fórmula
sucesos probabilidades de Bayes
CC: Cliente compra y CN: Cliente no compra. P(Cliente Compra)=10% P(Cliente no compra)=90% 1)P(CC|CI)=30.76%
CI: Cliente incentivo y CNI: Cliente no incentivo
P(Cliente Incentivo|Cliente Compra)=40% P(Cliente no Incentivo|Cliente Compra)=60% 2)P(CC|CNI)=6.89%
P(Cliente Incentivo|Cliente no Compra)=10% P(Cliente no Incentivo|Cliente no Compra)=90%

𝑃 𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜|𝐶𝑜𝑚𝑝𝑟𝑎𝑟 = 40% 4%
𝑃 𝐶𝑜𝑚𝑝𝑟𝑎𝑟 ∗ 𝑃(𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜 |𝐶𝑜𝑚𝑝𝑟𝑎𝑟)

𝑃 𝐶𝑜𝑚𝑝𝑟𝑎𝑟 = 10% 𝑃 𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐶𝑜𝑚𝑝𝑟𝑎|𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜 =
𝑃(𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜)
4%
𝑃 𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐶𝑜𝑚𝑝𝑟𝑎|𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜 = = 30.76%
𝑃 𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝑁𝑜 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜|𝐶𝑜𝑚𝑝𝑟𝑎𝑟 = 60% 6% 4% + 9%
𝑃 𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜|𝑁𝑜 𝐶𝑜𝑚𝑝𝑟𝑎𝑟 = 10% 9%
𝑃 𝑁𝑜 𝐶𝑜𝑚𝑝𝑟𝑎𝑟 = 90% 6%
𝑃 𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝐶𝑜𝑚𝑝𝑟𝑎|𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝑁𝑜 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜 = = 6.89%
6% + 81%
𝑃 𝐶𝑙𝑖𝑒𝑛𝑡𝑒 𝑁𝑜 𝐼𝑛𝑐𝑒𝑛𝑡𝑖𝑣𝑜|𝑁𝑜 𝐶𝑜𝑚𝑝𝑟𝑎𝑟 = 90% 81%

Un fabricante de teléfonos celulares compra un microchip en particular, a tres proveedores: Samsung, Intel y
Toshiba. Del total de piezas, 30% los adquiere con Samsung 𝑃 𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = 30%, 20% con Intel 𝑃 𝐼𝑛𝑡𝑒𝑙 =
20% y 50% con Toshiba 𝑃 𝑇𝑜𝑠ℎ𝑖𝑏𝑎 = 50%. El fabricante cuenta con un historial de piezas defectuosas por
proveedor: 3% Samsung 𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = 3%, 5% Intel 𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝐼𝑛𝑡𝑒𝑙 = 5% y 4% Toshiba
𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝑇𝑜𝑠ℎ𝑖𝑏𝑎 = 4%.
Un trabajador selecciona un microchip para instalarlo y lo encuentra defectuoso. ¿Cuál es la probabilidad de que
lo haya fabricado Intel?
𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎 𝐼𝑛𝑡𝑒𝑙 ∗ 𝑃(𝐼𝑛𝑡𝑒𝑙)

𝑃 𝐼𝑛𝑡𝑒𝑙 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎 =
𝑃(𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎)

Probabilidad a Priori Probabilidad Condicional Probabilidad Conjunta
𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = 3% 𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎 𝑦 𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = 0.9%
𝑃 𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = 30% 𝑃 ~𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = 97% 𝑃 ~𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎 𝑦 𝑆𝑎𝑚𝑠𝑢𝑛𝑔 = 29.1%
𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝐼𝑛𝑡𝑒𝑙 = 5% 𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎 𝑒 𝐼𝑛𝑡𝑒𝑙 = 1%
𝑃 𝐼𝑛𝑡𝑒𝑙 = 20%
𝑃 ~𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝐼𝑛𝑡𝑒𝑙 = 95% 𝑃 ~𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎 𝑒 𝐼𝑛𝑡𝑒𝑙 = 19%
𝑃 𝑇𝑜𝑠ℎ𝑖𝑏𝑎 = 50% 𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝑇𝑜𝑠ℎ𝑖𝑏𝑎 = 4% 𝑃 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎 𝑦 𝑇𝑜𝑠ℎ𝑖𝑏𝑎 = 2%
𝑃 ~𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎|𝑇𝑜𝑠ℎ𝑖𝑏𝑎 = 96% 𝑃 ~𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎 𝑦 𝑇𝑜𝑠ℎ𝑖𝑏𝑎 = 48%

DISTRIBUCIONES DE PROBABILIDAD

DISTRIBUCIÓN DE PROBABILIDAD
Distribución de Probabilidad
Una distribución de probabilidad proporciona toda la gama de valores que pueden presentarse en un
experimento y la probabilidad de que cada uno se presente. Es similar a una distribución de frecuencias relativas,
pero, en lugar a referirse al pasado, describe la probabilidad de un evento se presente en el futuro.
Distribución de Probabilidad
Lista de todos los resultados de un experimento y la probabilidad asociadas a cada uno
de ellos.
Características de una Distribución de Probabilidad

1. La probabilidad de un resultado en particular se encuentra entre 0 y 1, inclusive.
2. Los resultados son eventos mutuamente excluyentes.
3. La lista es exhaustiva. Por lo tanto, la suma de las probabilidades de los diversos
eventos es igual a 1.

DISTRIBUCIÓN DE PROBABILIDAD
Variable Aleatoria
En cualquier experimento, los resultados se conocen pero se presentan al azar; así a este se le denomina variables
aleatoria. Cada valor de la variable aleatoria se relaciona con una probabilidad que indica la posibilidad de un
resultado determinado.
Suponga que el experimento consta en lanzar una moneda tres veces. ¿Cuál es el experimento?, ¿Cuál es el
espacio muestral? ¿Cuál es el evento? y ¿Cuál es la variable aleatoria?
Posibles resultados de tres lanzamientos de moneda (C=Cara, S=Sello)
SSC CSS
SSS SCS CSC CCC
CSS CCS
Ocurre un evento {una cara} y la variable aleatoria X=1

Variables Aleatorias
Una variable aleatoria discreta adopta solo cierto número de valores claramente
separados que se obtienen como resultado de contar algo. Acá vamos a tener la
función de masa de probabilidad (PMF) y la función de distribución acumulada
Variables Aleatorias. Es una variable (CDF). La probabilidad de que la variable X tome el valor específico x se representa
que toma valores numéricos por medio de P(X=x). Vamos a utilizar X para denotar la variable aleatoria y x,
realizados por los resultados para representar su valor posible.
contenidos en el espacio muestral
generado por un experimento
aleatorio Una variable aleatoria continua adopta infinitos valores dentro de un rango de
posibles valores que se obtienen como el resultado de algún tipo de medición. Acá
vamos a tener la función de densidad de probabilidad (PDF, f(x)) que representa la
altura de la función de una distribución de probabilidad continua y la función de
distribución acumulada (CDF, F(x)) que se denota como F(x)=P(X ≤ 𝑥) y que se
calcula cómo una integral definida de la función de densidad.
Variable Aleatoria Variable Aleatoria
Discreta Continua
Tener cuidado con la diferencia entre variable aleatoria y distribución de
probabilidad. La primera representa un valor numérico como resultado de un
experimento aleatorio; mientras que la segunda, representa TODOS los posibles
resultados, así como la probabilidad correspondiente.

Variables Aleatorias
La función de probabilidad, P(x) de una variable aleatoria discreta X

expresa la probabilidad de que X tome un valor x, como una función de
Variables Aleatorias. Es una variable X. Es decir, P(x)=P(X=x), para todos los valores de x.
que toma valores numéricos
realizados por los resultados Se deben satisfacer dos propiedades: 1)Las probabilidades están
contenidos en el espacio muestral acotadas entres 0 y 1, inclusive y 2) Las probabilidades individuales
generado por un experimento
aleatorio suman 1, es decir, σ𝑥 𝑃 𝑥 = 1 .
La distribución de probabilidad acumulada, 𝐹(𝑥0 ), de una variable

aleatoria X, expresa la probabilidad de que X no tenga un valor
superior a 𝑥0 , como una función de 𝑥0 . Es decir, 𝐹(𝑥0 ) = 𝑃(𝑋 ≤ 𝑥0 ).
Variable Aleatoria Variable Aleatoria
Discreta Continua
Para esta función de distribución acumulada se tienen dos propiedades:
1) 0 ≤ 𝐹 𝑥0 ≤ 1 para todo número 𝑥0 y 2) Si 𝑥0 y𝑥1 son dos números
tales que 𝑥0 < 𝑥1 , entonces se puede decir que 𝐹(𝑥0 ) ≤ 𝐹(𝑥1 ).

DISTRIBUCIÓN DISCRETA DE PROBABILIDAD
Variables Aleatorias Discretas: Ejemplo
x P(x) F(x) 𝐹𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑀𝑎𝑠𝑎 𝑑𝑒 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 PMF 𝐹𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐴𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝐶𝐷𝐹
1 0.3 0.3 0.1 𝑋 = 3 0𝑋 <1

2 0.2 0.5 0.2 𝑋 = 2 0.3 1 ≤ 𝑋 < 2
𝑃 𝑥 = 0.3 𝑋 = 1 𝐹 𝑥 = 0.5 2 ≤ 𝑋 < 3
3 0.1 0.6
0.4 𝑋 = 4 0.6 3 ≤ 𝑋 < 4
4 0.4 1 0 𝑃𝑎𝑟𝑎 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 1𝑋 ≥4
P(x) F(x)
0.4 1
0.6
0.3
0.5
0.2 0.3
0.2
0.1
0.1
1 2 3 4 1 2 3 4 x
x

¿Cómo generar una distribución de probabilidad?
Ejemplo de distribución de probabilidad. Se lanzan dos dados (uno rojo y uno verde) y se suman los resultados de
sus caras.
Rojo 1 2 3 4 5 6
Esta secuencia provee un ejemplo de un variable aleatoria discreta. Suponga que usted tiene un dado rojo que va
de uno a seis en su cara con igual probabilidad de ocurrencia para cada una de las caras.

sus caras.
Rojo
1 2 3 4 5 6
Verde
1
2
3
4
5
6
Suponga que tiene un dado verde que puede tomar los valores de 1 a 6 con igual probabilidad de ocurrencia..

sus caras.
Rojo
1 2 3 4 5 6
Verde
1
2
3
4
5
6
Definiremos la variable aleatoria X como la suma de las dos caras de los dados que se lanzan..

sus caras.
Rojo
1 2 3 4 5 6
Verde
1
2
3
4
5
6 10
Por ejemplo, si el dado rojo es 4 y el verde es 6 la variable aleatoria X tomará el valor de 10..

sus caras.
Rojo
1 2 3 4 5 6
Verde
1
2
3
4
5 7
6 10
Similarmente si el dado rojo es 2 y el verde es 5, la variable aleatoria X es igual a 7.

sus caras.
Rojo
1 2 3 4 5 6
Verde
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
La tabla muestra TODOS los resultados posibles que se pueden obtener para la variable aleatoria X.

sus caras.
X
Rojo
1 2 3 4 5 6 2
Verde 3
1 2 3 4 5 6 7 4
5
2 3 4 5 6 7 8 6
3 4 5 6 7 8 9 7
8
4 5 6 7 8 9 10 9
5 6 7 8 9 10 11 10
11
6 7 8 9 10 11 12 12
Si usted observa en la tabla, puede ver que la variable aleatoria X puede ser cualquier número de 2 a 12. ¿Cómo
se definen estos valores en términos estadísticos? A partir de su probabilidad de ocurrencia.
sus caras.
X f
Rojo
1 2 3 4 5 6 2
Verde 3
1 2 3 4 5 6 7 4
5
2 3 4 5 6 7 8 6
3 4 5 6 7 8 9 7
8
4 5 6 7 8 9 10 9
5 6 7 8 9 10 11 10
11
6 7 8 9 10 11 12 12
Definimos ahora f como la frecuencia asociada con los posibles valores de X

sus caras.
X f
Rojo
1 2 3 4 5 6 2
Verde 3
1 2 3 4 5 6 7 4
5 4
2 3 4 5 6 7 8 6
3 4 5 6 7 8 9 7
8
4 5 6 7 8 9 10 9
5 6 7 8 9 10 11 10
11
6 7 8 9 10 11 12 12
Por ejemplo, hay cuatro resultados en los que la variable aleatoria X puede ser igual a 5.

sus caras.
X f
Rojo
1 2 3 4 5 6 2 1
Verde 3 2
1 2 3 4 5 6 7 4 3
5 4
2 3 4 5 6 7 8 6 5
3 4 5 6 7 8 9 7 6
8 5
4 5 6 7 8 9 10 9 4
5 6 7 8 9 10 11 10 3
11 2
6 7 8 9 10 11 12 12 1
De forma similar se pueden encontrar otros valores de frecuencia para X.

sus caras.
X f P(x)
Rojo
1 2 3 4 5 6 2 1
Verde 3 2
1 2 3 4 5 6 7 4 3
5 4
2 3 4 5 6 7 8 6 5
3 4 5 6 7 8 9 7 6
8 5
4 5 6 7 8 9 10 9 4
5 6 7 8 9 10 11 10 3
11 2
6 7 8 9 10 11 12 12 1
Finalmente, podemos derivar la probabilidad de ocurrencia para cada uno de estos valores de x.

sus caras. X f P(x)
Rojo
1 2 3 4 5 6 2 1
Verde 3 2
1 2 3 4 5 6 7 4 3
5 4
2 3 4 5 6 7 8 6 5
3 4 5 6 7 8 9 7 6
8 5
4 5 6 7 8 9 10 9 4
5 6 7 8 9 10 11 10 3
11 2
6 7 8 9 10 11 12 12 1
Si hay una probabilidad de 1/6 de obtener cada número en el dado rojo y la misma probabilidad en el dado
verde, cada resultado en la tabla ocurrirá con una probabilidad de 1/36.
sus caras.
X f P(x)
Rojo
1 2 3 4 5 6 2 1 1/36
Verde 3 2 2/36
1 2 3 4 5 6 7 4 3 3/36
5 4 4/36
2 3 4 5 6 7 8 6 5 5/36
3 4 5 6 7 8 9 7 6 6/36
8 5 5/36
4 5 6 7 8 9 10 9 4 4/36
5 6 7 8 9 10 11 10 3 3/36
11 2 2/36
6 7 8 9 10 11 12 12 1 1/36
Aquí, para obtener las probabilidades asociadas con los diferentes valores de X, dividimos las frecuencias entre
36.
sus caras.
X f P(x)
2 1 1/36
3 2 2/36
4 3 3/36
5 4 4/36
6 5 5/36
7 6 6/36
8 5 5/36
9 4 4/36
10 3 3/36
11 2 2/36
12 1 1/36
La distribución se muestra en la gráfica. En este ejemplo la distribución es simétrica, donde el valor más alto se da
en X igual a 7 y declina hacia ambos lados.
Media, Varianza y Desviación Estándar de una Distribución de Probabilidad Discreta
Recordemos que la media indica la posición central de los datos y la varianza describe la dispersión de estos en
comparación a la media.
La media represente un valor típico para mostrar la posición central de una distribución de probabilidad. También
es el promedio de la variable aleatoria.
La media de una distribución de probabilidad también recibe el nombre de valor esperado. Se trata de un
promedio ponderado en el que los posibles valores de una variable aleatoria se ponderan por sus
correspondientes probabilidades de ocurrir.
𝐸 𝑋 = 𝜇 = ෍ 𝑥𝑃(𝑥)
𝑥

𝑿𝒊
𝑋1
𝑋2
𝑋3
𝑋4
𝑋5
𝑋6
𝑋7
𝑋8
𝑋9
𝑋10
𝑋11
A partir de aquí veremos como se calcula el Valor Esperado. Primero en forma abstracta y luego con el concepto
de variable aleatoria que definimos previamente. Inicialmente se muestran los posibles valores de X.

𝑿𝒊 𝑷𝒊
𝑋1 𝑃1
𝑋2 𝑃2
𝑋3 𝑃3
𝑋4 𝑃4
𝑋5 𝑃5
𝑋6 𝑃6
𝑋7 𝑃7
𝑋8 𝑃8
𝑋9 𝑃9
𝑋10 𝑃10
𝑋11 𝑃11
Ahora se muestran las probabilidades asignadas a cada posible valor de 𝑋𝑖

𝑿𝒊 𝑷𝒊 𝑿𝒊 𝑷𝒊
𝑋1 𝑃1 𝑿𝟏 𝑷𝟏
𝑋2 𝑃2 𝑿𝟐 𝑷𝟐
𝑋3 𝑃3 𝑿𝟑 𝑷𝟑
𝑋4 𝑃4 𝑿𝟒 𝑷𝟒
𝑋5 𝑃5 𝑿𝟓 𝑷𝟓
𝑋6 𝑃6 𝑿𝟔 𝑷𝟔
𝑋7 𝑃7 𝑿𝟕 𝑷𝟕
𝑋8 𝑃8 𝑿𝟖 𝑷𝟖
𝑋9 𝑃9 𝑿𝟗 𝑷𝟗
𝑋10 𝑃10 𝑿𝟏𝟎 𝑷𝟏𝟎
𝑋11 𝑃11 𝑿𝟏𝟏 𝑷𝟏𝟏
Se define una columna en la cual los valores son ponderados por las probabilidades correspondientes. Y así se
haría para cada valor correspondiente.

𝑿𝒊 𝑷𝒊 𝑿𝒊 𝑷𝒊
𝑋1 𝑃1 𝑿𝟏 𝑷𝟏
𝑋2 𝑃2 𝑿𝟐 𝑷𝟐
𝑋3 𝑃3 𝑿𝟑 𝑷𝟑
𝑋4 𝑃4 𝑿𝟒 𝑷𝟒
𝑋5 𝑃5 𝑿𝟓 𝑷𝟓
𝑋6 𝑃6 𝑿𝟔 𝑷𝟔
𝑋7 𝑃7 𝑿𝟕 𝑷𝟕
𝑋8 𝑃8 𝑿𝟖 𝑷𝟖
𝑋9 𝑃9 𝑿𝟗 𝑷𝟗
𝑋10 𝑃10 𝑿𝟏𝟎 𝑷𝟏𝟎
𝑋11 𝑃11 𝑿𝟏𝟏 𝑷𝟏𝟏
E(X)
El valor esperado es la suma de los valores de la tercera columna

𝑿𝒊 𝑷𝒊 𝑿𝒊 𝑷𝒊 x f P(x) xP(x)
𝑋1 𝑃1 𝑿𝟏 𝑷𝟏 2 1 1/36 2/36
𝑋2 𝑃2 𝑿𝟐 𝑷𝟐 3 2 2/36 6/36
𝑋3 𝑃3 𝑿𝟑 𝑷𝟑 4 3 3/36 12/36
𝑋4 𝑃4 𝑿𝟒 𝑷𝟒 5 4 4/36 20/36
𝑋5 𝑃5 𝑿𝟓 𝑷𝟓 6 5 5/36 30/36
𝑋6 𝑃6 𝑿𝟔 𝑷𝟔 7 6 6/36 42/36
𝑋7 𝑃7 𝑿𝟕 𝑷𝟕 8 5 5/36 40/36
𝑋8 𝑃8 𝑿𝟖 𝑷𝟖 9 4 4/36 36/36
𝑋9 𝑃9 𝑿𝟗 𝑷𝟗 10 3 3/36 30/36
𝑋10 𝑃10 𝑿𝟏𝟎 𝑷𝟏𝟎 11 2 2/36 22/36
𝑋11 𝑃11 𝑿𝟏𝟏 𝑷𝟏𝟏 12 1 1/36 12/36
E(X) 252/36
Observemos los valores de la variable aleatoria X definidos previamente y sus respectivas probabilidades. El valor esperado es
igual a 7, recordemos que cuando vimos la distribución que era simétrica dicho valor se aproximaba a 7.

Propiedades del Valor Esperado
1. 𝐸 𝑋 =𝑘
2. 𝐸 𝑘 =𝑘
3. 𝐸 𝑘 + 𝑋 = 𝑘 + 𝐸(𝑋)
4. 𝐸 𝑘𝑋 = 𝑘𝐸 𝑋
5. 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌
6. 𝑆𝑖 𝑋 ≥ 0, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝐸 𝑋 > 0
7. 𝑆𝑖 𝑋 ≤ 𝑌, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝐸 𝑋 ≤ 𝐸(𝑌)
Si 𝑌 = 𝑏1 + 𝑏2 𝑋, ¿ 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑎 𝑞𝑢é 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝐸 𝑌 ?

La media constituye un valor típico para resumir una distribución de probabilidad discreta. Sin embargo, no
describe el grado de dispersión (variación) en una distribución. El valor esperado de la desviación al cuadrado es
conocido como la varianza poblacional de X. Esta es una medida de la dispersión de la distribución de X
alrededor de su media poblacional.
𝑉𝑎𝑟 𝑋 = 𝜎 2 = 𝐸[ 𝑋 − 𝜇 2 ] = ෍(𝑥 − 𝜇)2 𝑃(𝑥)

𝑥
𝜎 2 = 𝐸 𝑋 2 − 𝜇2 = ෍ 𝑥 2 𝑃 𝑥 − 𝜇2
𝑥
Para calcular la varianza poblacional se deben seguir los siguientes pasos: 1) La media se resta de cada valor de
la variable aleatoria y la diferencia se eleva al cuadrado, 2) cada diferencia al cuadrado se multiplica por su
probabilidad y 3) se suman los productos resultantes para obtener la varianza.
La desviación estándar 𝜎, se determina al extraer la raíz cuadrada de 𝜎 2 .

x f P(x) X-𝝁
2 1 1/36
3 2 2/36
4 3 3/36
5 4 4/36
6 5 5/36
𝝁𝑿 = 𝟕
7 6 6/36
8 5 5/36
9 4 4/36
10 3 3/36
11 2 2/36
12 1 1/36
Calcularemos la varianza poblacional de la variable aleatoria X definida en el primer ejemplo. Necesitamos una columna que nos
de las desviaciones de los posibles valores de X alrededor de su media poblacional, recordemos que la media poblacional en
nuestro ejemplo fue igual a 7.

X f P(x) X-𝝁
2 1 1/36 -5
3 2 2/36 -4
4 3 3/36 -3
5 4 4/36 -2
6 5 5/36 -1
𝝁𝑿 = 𝟕
7 6 6/36 0
8 5 5/36 1
9 4 4/36 2
10 3 3/36 3
11 2 2/36 4
12 1 1/36 5
Cuando X toma el valor de 2, la desviación es -5. Se realizan los cálculos similares para los demás valores.

x f P(x) X-𝝁 (X−𝝁 )𝟐
2 1 1/36 -5 25
3 2 2/36 -4 16
4 3 3/36 -3 9
5 4 4/36 -2 4
6 5 5/36 -1 1
7 6 6/36 0 0
8 5 5/36 1 1
9 4 4/36 2 4
10 3 3/36 3 9
11 2 2/36 4 16
12 1 1/36 5 25
Ahora se tomará en cuenta las desviaciones al cuadrado, en nuestro caso para X=2, la desviación es de 25.

x f P(x) X-𝝁 (X−𝝁 )𝟐 X−𝝁 𝟐
𝑷(𝒙)
2 1 1/36 -5 25 0.69
3 2 2/36 -4 16 0.89
4 3 3/36 -3 9 0.75
5 4 4/36 -2 4 0.44
6 5 5/36 -1 1 0.14
7 6 6/36 0 0 0
8 5 5/36 1 1 0.14
9 4 4/36 2 4 0.44
10 3 3/36 3 9 0.75
11 2 2/36 4 16 0.89
12 1 1/36 5 25 0.69
Ahora se pondera el cuadrado de las desviaciones por las correspondientes probabilidades.

x f P(x) X-𝝁 (X−𝝁 )𝟐 X−𝝁 𝟐
𝑷(𝒙)
2 1 1/36 -5 25 0.69
3 2 2/36 -4 16 0.89
4 3 3/36 -3 9 0.75
5 4 4/36 -2 4 0.44
6 5 5/36 -1 1 0.14
7 6 6/36 0 0 0
8 5 5/36 1 1 0.14
9 4 4/36 2 4 0.44
10 3 3/36 3 9 0.75
11 2 2/36 4 16 0.89
12 1 1/36 5 25 0.69
5.83
La suma de la última columna es la varianza poblacional y si se saca la raíz cuadrada obtendríamos la desviación estándar
poblacional.

Propiedades de la Varianza
DEMOSTRACIÓN DE LA PROPIEDAD NÚMERO CINCO
1. 𝕍𝑎𝑟 𝑋 ≥ 0
2. 𝕍𝑎𝑟 𝑘 = 0 𝑉𝑎𝑟 𝑋 = 𝐸[(𝑋 − 𝜇)]2
3. 𝕍𝑎𝑟 𝑘𝑋 = 𝑘 2 𝕍𝑎𝑟 𝑋 = 𝐸 𝑋 2 − 2𝑋𝜇 + 𝜇 2

4. 𝕍𝑎𝑟 𝑘 + 𝑋 = 𝕍𝑎𝑟 𝑋
= 𝐸 𝑋 2 + 𝐸 −2𝑋𝜇 + 𝐸 𝜇 2
2 2
5. 𝕍𝑎𝑟 𝑋 = 𝐸 𝑋 − [𝐸 𝑋 ]
= 𝐸 𝑋 2 − 2μ𝐸 𝑋 + 𝜇 2
6. 𝕍𝑎𝑟 𝑋 + 𝑌 = 𝕍𝑎𝑟 𝑋 + 𝕍𝑎𝑟 𝑌 + 2𝐶𝑜𝑣(𝑋, 𝑌)
7. 𝕍𝑎𝑟 𝑎𝑋 + 𝑏𝑌 = 𝑎2 𝕍𝑎𝑟 𝑋 + 𝑏 2 𝕍𝑎𝑟 𝑌 + 2𝑎𝑏𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸 𝑋 2 − 2𝜇 2 + 𝜇 2
= 𝐸 𝑋 2 − 𝜇2

Notación Empleada
𝐸 𝑋 = 𝜇 = ෍ 𝑋𝑖 𝑃𝑖
𝐼=1
𝑉𝑎𝑟 𝑋 = 𝐸[(𝑋 − 𝜇)]2 = 𝜎 2 = ෍(𝑋𝑖 − 𝜇)2 𝑃𝑖

𝑖=1
𝑉𝑎𝑟(𝑋) = 𝜎2 = 𝜎

1. Una variable aleatoria tiene la siguiente función de distribución de probabilidad:
X P(X)
0 b
• ¿Cuál es el valor de b?
1 2b • Encuentre 𝑃 𝑋 ≤ 2 𝑦 𝑃(2 ≤ 𝑋 ≤ 3)
2 3b • Encuentre el valor esperado de X.
• Encuentre la desviación estándar de X.
3 4b
4 5b
2. Suponga que el valor esperado de X es de 8 E[X]=8 y la varianza de X es 4, VAR[X]=4. ¿Que se podría decir sobre el valor
esperado y la varianza de Y para las siguientes expresiones?.
• Y=3X+2
• Y=0.5X-4
• Y=X/4

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
Recursos
https://www.geogebra.org/m/UGJsyzZ4
Binomial y Poisson: https://www.stat.auckland.ac.nz/~fergusson/prob_dist_explorer/features/
Binomial: https://homepage.divms.uiowa.edu/~mbognar/applets/binnormal.html
Hipergeométrica: https://homepage.divms.uiowa.edu/~mbognar/applets/hg.html
Poisson: https://homepage.divms.uiowa.edu/~mbognar/applets/pois-like.html

DISTRIBUCIÓN BERNOULLI Y BINOMIAL
Jacob Bernoulli

Distribución de Probabilidad Binomial
Antes de comenzar con la distribución Binomial, se comenzará desarrollando primero la distribución de tipo
Bernoulli, la cual es la base de la distribución Binomial y otras distribuciones más complejas, por ejemplo: la
distribución geométrica y la distribución binomial negativa. La distribución Bernoulli es la distribución binomial solo
con un ensayo.
La distribución Bernoulli es una distribución de probabilidad para variable aleatoria discreta con dos resultados,
por ejemplo: éxito o fracaso, cara o sello, perder o ganar, subir o bajar, si o no, 0 o 1; estos eventos son
mutuamente excluyentes y colectivamente exhaustivos.
La distribución Bernoulli tiene el objetivo de encontrar una probabilidad de éxito o fracaso. Un éxito no
necesariamente es algo positivo; puede corresponder, por ejemplo, al número de productos defectuosos que
produce una máquina. Como solo se tienen dos resultados se le asigna el valor de 1 al éxito y 0 en caso contrario;
si el éxito consiste en seleccionar una sociedad anónima, le corresponderá un valor de 1, pero si se seleccionara
cualquier empresa con otra organización como limitada, unipersonal o sociedad en comandita, le corresponderá 0.

Distribución de Probabilidad Bernoulli

A continuación, se presenta la función de masa de probabilidad P(x)
1−𝑃 𝑝𝑎𝑟𝑎 𝑥 = 0
𝑃 𝑋 =
𝑃 𝑝𝑎𝑟𝑎 𝑥 = 1
También se puede expresar de la siguiente manera:
𝑃 𝑋 = 𝑃 𝑥 (1 − 𝑃)1−𝑥
A cada suceso se le asigna una probabilidad. En general al éxito se le denomina, P y a la probabilidad de

fracaso (1-P), para nuestro caso la denotaremos con la letra q. La probabilidad de éxito (P) es el único
parámetro de la distribución de probabilidad.

X P(X) X*P(X) X^2*P(X)

0 1-P 0 0
1 P P P
Sumatoria 1 P P
𝐸 𝑋 = 𝜇 = ෍ 𝑥𝑃(𝑥) = 𝑃
𝑥
𝜎 2 = ෍ 𝑥 2 𝑃 𝑥 − 𝜇2 = 𝑃 − 𝑃2 = 𝑃(1 − 𝑃)
𝑥

La distribución binomial es una distribución de probabilidad para variable aleatoria discreta cuyo objetivo es el describir
el número de veces que un evento en particular puede ocurrir en un número de ensayos fijos, en otras palabras, permite
calcular la probabilidad de obtener x éxitos en n ensayos o intentos independientes posibles.
Las principales características de esta distribución de probabilidad son:

• Para cada intento, existen únicamente dos resultados posibles que son mutuamente excluyentes, uno llamado éxito y
otro fracaso, El éxito se encuentra asociado con el objetivo de la investigación.
• La probabilidad de éxito p y la probabilidad de fracaso q son constantes para cada intento.
• El resultado de un intento no influye en el resultado del siguiente intento, esto quiere decir que los intentos son
independientes.
• El experimento se puede repetir n veces, sin embargo, cuando el número de intentos tiende a infinito, la distribución de
probabilidad se ajustaría a una distribución normal.
• La variable aleatoria es el número de éxitos en el número total de ensayos.

Varios ejemplos se podrían analizar con esta distribución: (1) lanzamiento de un dado donde la variable aleatoria
discreta describe la posibilidad de obtener un número par, (2) lanzamiento de una moneda donde la variable
aleatoria discreta describe la posibilidad de obtener cara, (3) colocar un nuevo producto en el mercado, donde la
variable aleatoria discreta describe el éxito del producto en el mercado y (4) perforación de múltiples pozos en
una cuenca donde la variable aleatoria discreta describe el éxito de encontrar reservas.
En cada uno de los ejemplos anteriores existen únicamente dos resultados, éxito o fracaso. A partir de esta
característica, la unión de eventos nos define todos los elementos del espacio muestral, y en el caso que se vuelva a
replicar el experimento con las mismas condiciones saldrá un resultado de los dos, lo que se conoce como sucesos
colectivamente exhaustivos.

Para construir una probabilidad binomial particular se necesita: 1) el número de ensayos y 2) la probabilidad de
éxito de cada ensayo.
𝑛!
𝑃 𝑋 = nCX𝑃 𝑋 (1 − 𝑃)𝑛−𝑋 = ∗ 𝑃 𝑋 (1 − 𝑃)𝑛−𝑋
𝑥! 𝑛 − 𝑥 !
C corresponde al símbolo de combinación.
𝑃 𝑋 es la probabilidad de tener un valor en especifico.
𝑛 es el número de ensayos/tamaño de muestra.
𝑋 es la variable aleatoria definida como el número de éxitos.
P es la probabilidad de éxito en cada ensayo. Esta letra griega representa un parámetro de población binomial.
𝐸 𝑋 = 𝑛𝑃
𝑉𝑎𝑟 𝑋 = 𝑛𝑃(1 − 𝑃)

Un estudio de una agencia que busca proteger y promover la salud de la población, mediante la
gestión del riesgo asociada al consumo y uso de alimentos, reveló que el 65% de los lotes de
productos de conserva provenientes de mar tenían altos contenidos de mercurio. Si se selecciona una
muestra aleatoria de 12 lotes, calcule los siguientes enunciados:
1. Probabilidad de tener cinco lotes con altos contenidos de mercurio.

2. Probabilidad de tener a lo mucho 2 lotes con altos contenidos de mercurio.
3. Probabilidad de tener al menos tres lotes con altos contenidos de mercurio.

Tabla de Probabilidad Binomial
Con la fórmula de la función de masa se puede construir cualquier tipo de probabilidad binomial dada la
probabilidad y el número de ensayos, sin embargo, si n es grande, los cálculos consumirían mucho tiempo. Por
conveniencia, la siguiente tabla muestra el resultado de la aplicación de la fórmula en el caso de varios valores de
n y 𝜋. Sin embargo, applets y Microsoft Excel permitirán calcular de manera eficiente la probabilidad puntual y
acumulada.

Comportamiento de la Distribución Binomial
1. Si n permanece igual y la probabilidad se incrementa, la forma de la distribución cambia. Pequeñas
probabilidades implican que la distribución de probabilidad tenga sesgo positivo.
𝑛 = 10 𝑛 = 10 𝑛 = 10 𝑛 = 10 𝑛 = 10 𝑛 = 10
𝑃 é𝑥𝑖𝑡𝑜 = 10% 𝑃 é𝑥𝑖𝑡𝑜 = 20% 𝑃 é𝑥𝑖𝑡𝑜 = 30% 𝑃 é𝑥𝑖𝑡𝑜 = 50% 𝑃 é𝑥𝑖𝑡𝑜 = 70% 𝑃 é𝑥𝑖𝑡𝑜 = 90%

Comportamiento de la Distribución Binomial
2. Si la probabilidad de éxito conserva el mismo valor, pero n aumenta, la forma de la distribución binomial se
torna más simétrica, cuando n tiende a infinito la distribución binomial se aproxima a la distribución normal.
𝑛 = 10 𝑛 = 20 𝑛 = 50 𝑛 = 100
𝑃 é𝑥𝑖𝑡𝑜 = 20% 𝑃 é𝑥𝑖𝑡𝑜 = 20% 𝑃 é𝑥𝑖𝑡𝑜 = 20% 𝑃 é𝑥𝑖𝑡𝑜 = 20%

DISTRIBUCIÓN HIPERGEOMÉTRICA
Abraham de Moivre
Christiaan Huygens

Distribución de Probabilidad Hipergeométrica
Para aplicar una distribución binomial, la probabilidad de un éxito debe permanecer igual en cada
ensayo. ¿ Que sucede cuando la muestra es finita y el experimento no implica reemplazo?.
La distribución hipergeométrica permite calcular la probabilidad de que la muestra contenga “x”
éxitos, a partir del número posible de muestras “n” tomadas de una población pequeña “N” .
La distribución hipergeométrica se aplica cuando: 1) se selecciona una muestra finita sin reemplazo en
una población pequeña y 2) el tamaño de la muestra “n” es mayor que el 5% de la población.

Las características de la distribución de probabilidad Hipergeométrica son las siguientes:

1. El proceso de muestreo es sin reemplazo o sin reposición, lo que hace que la probabilidad de éxito p o fracaso q no
sean constantes.
2. La población es finita y pequeña.
3. La variable aleatoria es la cantidad de éxitos de un número fijo de ensayos.
4. El resultado de un ensayo influye en el resultado del siguiente, es decir, los sucesos son dependientes.
5. El muestreo se realiza con una población finita sin reemplazo y n/N>5%. Por lo tanto, la probabilidad de éxito
cambia en cada ensayo. Si el tamaño de la muestra es menor que el 5% de la población, basta con aplicar la
distribución de probabilidad binomial.

s N
𝐶𝑥𝑠 es el número de formas en que pueden
seleccionarse x éxitos en la muestra de un total
x de s éxitos contenido en la población.
n
𝑁−𝑠
𝐶𝑛−𝑥 es el número de formas en que se pueden
seleccionar n-x fracasos en la población que
𝐶𝑥𝑠 𝐶𝑛−𝑥
𝑁−𝑠
𝑁𝐶𝐸 contiene N-s fracasos.
𝑃 𝑋 = =
𝐶𝑛𝑁 𝑁𝐶𝑃
N representa el tamaño de la población.
𝐶𝑛𝑁 es el número total de muestras de tamaño n
s es el número de éxitos en la población. 𝑁≥𝑠
que pueden obtenerse en una población de
𝑥 es el número de éxitos en la muestra. 𝑁>𝑛 tamaño N. TODAS LAS POSIBILIDADES QUE SE
n es el tamaño de la muestra o el número de ensayos. 𝑛≥𝑥 TIENEN.
C corresponde al símbolo de combinación.

Las principales propiedades de la distribución son:

Valor esperado
𝑠𝑛
𝐸 𝑋 =
𝑁
Varianza
𝑁 − 𝑠 𝑠𝑛(𝑁 − 𝑛) 𝑠 𝑠 𝑁−𝑛
𝑉𝑎𝑟 𝑋 = = 𝑛 1 −
𝑁 2 (𝑁 − 1) 𝑁 𝑁 𝑁−1

Como ejemplo suponga que en un proceso de producción se fabrican procesadores Intel en lotes de 40 unidades.
Además se sabe que en dicho proceso cinco componentes de un lote particular son defectuosos. Se quiere hallar la
probabilidad de que exactamente uno de estos cinco componentes defectuosos aparezca en una muestra de cuatro
seleccionados aleatoriamente. En otras palabras, se quiere hallar la probabilidad de que una muestra de tamaño
cuatro contenga exactamente un componente defectuoso y tres buenos.
En términos de este ejemplo, la probabilidad de obtener un componente defectuoso cambia después de la revisión
de cada uno de los cuatro seleccionados. Por ejemplo, la probabilidad de que el primer procesador seleccionado
sea defectuoso es de 5/40, es decir de 0.125; si este componente es defectuoso, solo quedan 4 defectuosos; de
modo que en la segunda extracción la probabilidad de obtener uno defectuoso es de 4/39, es decir, 0.10256.
Como se observa la probabilidad cambia con cada extracción a diferencia del modelo binomial.

Ejercicios
Una empresa recibe un envío de 20 artículos. Como es caro inspeccionarlos, se tiene una política de comprobar una
muestra aleatoria de seis artículos de ese envío y si no hay más de un artículo defectuoso en la muestra, no
comprueba el resto. ¿Cuál es la probabilidad de que un envío de cinco artículos defectuosos no se someta a una
comprobación adicional?
20−5
𝐶𝑥𝑠 𝐶𝑛−𝑥
𝑁−𝑠
𝐶𝑥5 𝐶6−𝑥
𝑃 𝑥 = =
𝐶𝑛𝑁 𝐶620
El envío no se verifica más si la muestra contiene 0 o 1 defectos, por lo que la probabilidad de que se acepte será:
𝑃 𝑒𝑛𝑣í𝑜 𝑎𝑐𝑒𝑝𝑡𝑎𝑑𝑜 = 𝑃 0 + 𝑃(1)

Ejercicios
1. Hay que formar un comité de ocho miembros de un grupo de ocho hombres y ocho mujeres. Si los miembros del
comité se eligen aleatoriamente. ¿Cuál es la probabilidad de que exactamente la mitad sean mujeres?
2. Un analista de bonos recibió una lista de 12 bonos de empresa. Seleccionó de esa lista tres cuya calificación
creía que corría el riesgo de que se rebajara al año siguiente. En realidad, al año siguiente se rebajó la
calificación de cuatro de 12 bonos. Suponga que el analista hubiera elegido simplemente tres bonos
aleatoriamente de la lista. ¿Cuál es la probabilidad de que al menos dos de los elegidos se encontraran entre
los bonos cuya calificación se rebajo el año siguiente?
3. Un ejecutivo de banca recibe diez solicitudes de crédito. Los perfiles de los solicitantes son similares, salvo que
cinco pertenecen a minorías y cinco no. Al final, el ejecutivo autoriza seis de las solicitudes. Si estas
autorizaciones se eligen aleatoriamente del grupo de diez solicitudes, ¿Cuál es la probabilidad de que menos
de la mitad de las autorizaciones sean autorizaciones de solicitudes de personas que pertenecen a minorías?

Ejercicios
4. Una empresa recibe un envío de 16 artículos. Se selecciona una muestra aleatoria de cuatro y se rechaza el
envío si cualquiera de estos artículos resulta ser defectuoso.
a) ¿Cuál es la probabilidad de que se acepte un envío que contiene cuatro artículos defectuosos?
b) ¿Cuál es la probabilidad de que se acepte un envío que contiene un artículo defectuoso?
c) ¿Cuál es la probabilidad de que se rechace un envío que contiene un artículo defectuoso?

DISTRIBUCIÓN DE POISSON
Siméon Denis Poisson

Distribución de Probabilidad de Poisson
La distribución de probabilidad de Poisson permite calcular la probabilidad del número de veces que se presenta un evento
durante un intervalo continuo, el cual puede ser de tiempo, distancia, área o volumen.
La distribución se basa en cinco supuestos:
1) Cada intervalo se divide en un gran número de pequeños subintervalos, cuya probabilidad de ocurrencia en cada uno de ellos
es muy pequeña.
2) La probabilidad de que ocurra un suceso es constante en todos los subintervalos
3) No puede haber más de una ocurrencia en cada subintervalo.
4) Las ocurrencias son independientes y no se superponen, es decir, una ocurrencia en un intervalo no influye en la probabilidad
de una ocurrencia en otro intervalo
5) La probabilidad de que ocurra un evento es proporcional al tamaño del intervalo. Es decir, cuanto más grande sea el
intervalo, mayor será la probabilidad de que se presente un evento.
Esta distribución constituye una forma restrictiva de la distribución binomial cuando la probabilidad de éxito es muy pequeña y n
es grande.

Suponga que se divide la hora dada en subintervalos de un minuto; que la probabilidad de que
llegue un cliente al banco en cualquier minuto es muy pequeña y constante; que solo puede entrar un
cliente en un minuto dado (puerta anti-atraco) y que los clientes no dejan de entrar o se marchan
cuando ven filas de atención muy largas. En este caso se tiene un experimento de Poisson en donde
interesa hallar la probabilidad de “x” ocurrencias (llegadas al banco) sobre algún intervalo de
tiempo (cada minuto en una hora específica).

𝜆𝑥 𝑒 −𝜆
𝑃 𝑥 = , 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑥 = 0,1,2, …
𝑥!
𝜆 es la media de la cantidad de veces (éxitos) que se presenta un evento en un intervalo particular.
𝑒 es la constante 2.711828 Euler (base del sistema de logaritmos neperianos)
𝑥 es el número de veces que se presenta un evento.
Ejemplo: Un director de un centro informático, reporta de que su sistema ha experimentado tres fallos de componentes en los 100
últimos días. Con este información se debe calcular las siguientes probabilidades:
• De que no haya ningún fallo en un día dado.
• De que haya uno o más fallos en día dado.
• De que haya al menos dos fallos en un periodo de tres días.
• ¿Cuál sería el valor esperado?
• ¿Cuál sería la desviación estándar?

La media de número de éxitos 𝜆 , puede determinarse con 𝑛𝑃 mediante la aproximación de Poisson de la distribución binomial,
en este caso n es el número total de ensayos y 𝑃, la probabilidad de éxito. En caso de tener información histórica del evento, se
calcula la media aritmética para obtener el parámetro de la función de masa de probabilidad. De esta manera, la probabilidad
de Poisson es una estimación aproximada de la probabilidad binomial efectiva, siempre y cuando n sea grande y nP tiene un
tamaño moderado (preferiblemente 𝝀 ≤ 𝟕).
𝐸 𝑋 = 𝑛𝑃 = 𝜆
𝑉𝑎𝑟 𝑋 = 𝑛𝑃 = 𝜆
(𝑛𝑃)𝑥 𝑒 −𝑛𝑃
𝑃 𝑥 =
𝑥!
Ejemplo: Un analista ha predicho que el próximo año quebrará el 3.5% de todas las pequeñas empresas. Suponiendo que la
predicción del analista es correcta, estima la probabilidad de que el próximo año quiebren al menos tres empresas de una muestra
aleatoria de 100.

Tabla de Probabilidad de Poisson

Distribución de Probabilidad de Poisson: Comparación con una Distribución Binomial
Poisson:
• Los casos analizados son muy grandes y el número medio de éxitos es pequeño, por ejemplo, menos que 30.
• Cuando P (probabilidad de éxito) es menor que 5% y n (tamaño de muestra) es grande.
Binomial:
• Problema se basa en una pequeña muestra de observaciones.
• Además de tener una muestra pequeña, probabilidad de éxito está comprendida entre 5 y 95%.
Es posible demostrar que cuando n es mayor o igual que 20 y P (probabilidad de éxito) menor o igual que 5% y
la media poblacional es la misma, se observa que los valores de la probabilidad son los mismos en las dos
distribuciones.

Ejercicios
1. Los clientes llegan a una caja registradora ocupada a una tasa media de tres por minuto. Si las llegadas siguen una
distribución de Poisson, halle la probabilidad de que en un minuto dado lleguen dos clientes o menos.
2. El número de accidentes que se producen en una fábrica tiene una distribución de Poisson con una media de 2.6 al mes.
• ¿Cuál es la probabilidad de que haya menos de dos accidentes en un mes dado?

• ¿Cuál es la probabilidad de que haya más de tres accidentes en un mes dado?
3. Un centro de servicio al cliente de la India recibe, por término medio 4.2 llamadas telefónicas por minuto. Si las llamadas
siguen una distribución de Poisson, ¿Cuál es la probabilidad de que reciba al menos tres llamadas en un determinado minuto?
4. Una empresa tiene 250 ordenadores personales. La probabilidad de que uno cualquiera de ellos necesite una reparación en
una semana dada es de 1%. Halle la probabilidad de que menos de cuatro de los ordenadores personales necesiten una
reparación en una semana dada.

Ejercicios
5. Los datos indican que en la hora punta de la mañana se producen, por término medio, 3.2 colisiones al día en una vía urbana.
• Hallar la probabilidad de que un día dado se produzcan menos de dos colisiones en esta vía durante la hora punta de
la mañana.
• Halle la probabilidad de que en un día dado se produzcan más de cuatro colisiones en esta vía durante la hora punta
de la mañana.
6. Delta internacional transporta alrededor de un millón de paquetes al día entre el Este asiático y Estados Unidos. Una muestra
aleatoria del número de fallos registrado en el envío de paquetes en los últimos seis meses dio los siguientes resultados:
15,10,8,16,11,12,11,9,8,12,9,10,8,7,16,14,12,10,9,8,11. No ocurrió nada excepcional durante estos días, por lo que los
resultados pueden considerarse representativos. Utilizando estos datos y sus conocimientos responda lo siguiente:
• ¿Qué modelo de probabilidad debe utilizarse y por qué?

• ¿Cuál es la probabilidad de que en un futuro día representativo haya diez fallos o más en el envío de paquetes?
• ¿Cuál es la probabilidad de que haya menos de seis fallos?
• Halle el número de fallos tal que la probabilidad de que se supere este número sea de un 10% o menos.

Ejercicios
7. Asesores Financieros recibe una media de 19.5 solicitudes semanales para la realización de un estudio
financiero personal. La realización de cada estudio requiere un día del tiempo de un analista. Suponga que
las solicitudes recibidas durante una semana cualquiera se asignan a un analista para que las realice la
semana siguiente. Si no las termina durante la segunda semana, el cliente anula la solicitud.
• ¿Cuántos analistas hay que contratar para que la empresa pueda afirmar que el 90% de los estudios se
terminarán durante la segunda semana?
• Suponga que decide contratar un analista menos de los contratados en el numeral anterior ¿Cuál es la
probabilidad de que los clientes anulen su solicitud dado este nivel de dotación de personal?

DISTRIBUCIÓN CONTINUA DE PROBABILIDAD

¿Cómo generar una Distribución de Probabilidad?
Una variable aleatoria discreta es aquella que puede tomar solo un conjunto finito de valores. En este caso
utilizamos el ejemplo de la suma de las caras de los dos dados.
Sin embargo, la mayoría de variables aleatorias encontradas en administración y economía son continuas. Estas
toman un único conjunto infinito de valores definidos sobre un rango o posibles rangos.


Comportamiento Esperado Bitcoin
100000
90000
80000
70000
60000
50000
40000
30000
20000
10000
0
1/01/2019 1/02/2019 1/03/2019 1/04/2019 1/05/2019 1/06/2019 1/07/2019 1/08/2019 1/09/2019 1/10/2019 1/11/2019 1/12/2019 1/01/2020 1/02/2020


¿Cómo calcular una probabilidad a partir de una función de densidad?
La función de densidad de probabilidad (PDF o f(x)) es igual a la altura de la función con respecto al eje Y. Esta
función muestra el contorno de la distribución de probabilidad. A continuación, el gráfico de la función de
densidad de la distribución uniforme.

densidad de la distribución triangular.

densidad de la distribución normal.

La función que si muestra la probabilidad de ocurrencia es la función de distribución acumulada F(x).

En el caso de una variable aleatoria continua la probabilidad de que sea igual a un valor finito (por ejemplo,
temperatura igual a 55.473927) es siempre infinitesimal.
Por esta razón, se puede hablar acerca de la probabilidad de una variable aleatoria continua teniendo en cuenta
la distancia entre dos valores dados. La probabilidad es dada entonces por un área. El área bajo la curva de la
función de densidad es una probabilidad.

Altura
Podemos medir la probabilidad de que la temperatura de
la habitación este entre 55 y 56 grados.
55 56 60 65 70 75 X
Podemos medir la probabilidad de que la temperatura de la habitación este entre
Altura 55 y 56 grados.
Dado que la temperatura puede estar entre 55 y 75 con igual probabilidad, la

probabilidad de estar entre 55 y 56 debe ser de 0.05. ¿Por qué 5%?
0.05
55 56 60 65 70 75 X
Altura Matemáticamente, la densidad de probabilidad es escrita como una función de la
variable, por ejemplo f(X). En este ejemplo, f(X) es 0.05 para 55≤ X ≤ 75 y es
cero en otro caso.
0.05
f(X) = 0.05 para 55≤ X ≤ 75

f(X) = 0 para X < 55 y X > 75
55 56 60 65 70 75 X
Densidad de Probabilidad El eje vertical se conoce como el sello de densidad de probabilidad. f(X) es
conocida como la función de densidad de probabilidad y se muestra como la línea
f(X)
negra gruesa punteada que está en la parte superior de la gráfica y sobre el eje.
0.05
f(X) = 0.05 para 55≤ X ≤ 75

f(X) = 0 para X < 55 y X > 75
55 56 60 65 70 75 X
Suponga que desea calcular la probabilidad de que la temperatura este entre 65 y 70
Densidad de Probabilidad grados. Para hacer esto, usted debe calcular el área por debajo de la función de
densidad de probabilidad entre 65 y 70.
f(X) Generalmente se usa el cálculo integral para trabajar el área bajo la curva, pero para
este ejemplo simple basta con calcular el área del rectángulo.
0.05
55 60 65 70 75 X
Densidad de Probabilidad
La altura del rectángulo es 0.05 y su ancho es de 5, así el área es de 0.25.
f(X)
0.05
0.25
55 60 65 70 75 X
Cálculo de pendiente y área bajo la curva
Recordar los fundamentos de cálculo
𝑓 ′ 𝑥 = 𝑑𝑒𝑟𝑖𝑣𝑎𝑑𝑎
′
𝑓 𝑥+ℎ + 𝑓(𝑥)
𝑓 𝑥 = lim
ℎ→0 ℎ
Integral Indefinida (antiderivada)
න 𝑓′ 𝑥 𝑑𝑥 = 𝑓 𝑥 + 𝐶
𝑛
𝑥 𝑛+1
න 𝑥 𝑑𝑥 = + 𝐶 𝑆𝑖𝑒𝑛𝑑𝑜 𝑛 ≠ −1
𝑛+1

Densidad de Probabilidad Ahora supongamos que la temperatura es decreciente a partir del rango
f(X) de 65 a 75 grados, con una probabilidad que decrece uniformemente
cuando la temperatura aumenta.
65 70 75 X
Densidad de Probabilidad El área total del triángulo es la unidad ya que la probabilidad de que la
f(X) temperatura esté entre 65 y 75 es la unidad. Ya que la base del triángulo es 10, la
𝑏∗ℎ
altura debe ser 0.20. Recordemos que el área de un triángulo es
2
0.20
0.15
0.10
0.05
65 70 75 X
Densidad de Probabilidad En este ejemplo, la función de densidad de probabilidad es una línea de la
f(X) forma f(X) = b1 + b2X. Si no se acuerdan, entonces, Y=mx+b
Para pasar a través de los puntos (65, 0.20) y (75, 0), b1 debe ser igual a
0.20 1.50 y b2 debe ser igual a -0.02. Recordemos que la pendiente es igual a
𝑌2 −𝑌1
.
𝑋2 −𝑋1
0.15
0.10
0.05 f(X) = 1.50 – 0.02X para 65 ≤ X ≤ 75

f(X) = 0 para X < 65 y X > 75
65 70 75 X
Densidad de Probabilidad Suponga que estamos interesados en encontrar la probabilidad de que la
f(X) temperatura este entre 65 y 70 grados.
Podríamos realizar esto a partir de la evaluación de la integral, pero esto
0.20 no es estrictamente necesario.
0.15
f(X) = 1.50 – 0.02X para 65 ≤ X ≤ 75
f(X) = 0 para X < 65 y X > 75
0.10
0.05
65 70 75 X
Densidad de Probabilidad Es fácil mostrar geométricamente que la respuesta es 0.75.
f(X) Área de un cuadrado más área de un triángulo.
0.20
0.15
f(X) = 1.50 – 0.02X para 65 ≤ X ≤ 75
f(X) = 0 para X < 65 y X > 75
0.10
0.05
65 70 75 X
PROPIEDADES DE LA FUNCIÓN DE DENSIDAD

Función de Densidad de Probabilidad (PDF)
La función de densidad de probabilidad (PDF) es igual a la altura de la función con respecto al eje Y. Esta función
muestra el contorno de la distribución de probabilidad.
Propiedades
1. 𝑓 𝑥 ≥ 0
+∞
2. ‫׬‬−∞ 𝑓 𝑥 𝑑𝑥 = 1
𝑎
3. ‫ = 𝑥𝑑 𝑥 𝑓 𝑎׬‬0
𝑏
4. 𝑃 𝑎 < 𝑋 < 𝑏 = ‫𝑥𝑑 𝑥 𝑓 𝑎׬‬

1. 𝑓 𝑥 ≥ 0

+∞
2. ‫׬‬−∞ 𝑓 𝑥 𝑑𝑥 = 1

𝑎
3. ‫ = 𝑥𝑑 𝑥 𝑓 𝑎׬‬0

𝑏
4. 𝑃 𝑎 < 𝑋 < 𝑏 = ‫𝑥𝑑 𝑥 𝑓 𝑎׬‬
a b

PROPIEDADES DE LA FUNCIÓN DE
DISTRIBUCIÓN ACUMULADA
F(X)

Función de Distribución Acumulada (CDF)
La función que si muestra la probabilidad de ocurrencia es la función de distribución acumulada F(x).
Propiedades
0 𝑥
1. 𝐹 𝑥0 = 𝑃 𝑋 ≤ 𝑥0 = ‫׬‬−∞ 𝑓 𝑥 𝑑𝑥
2. 𝐹 +∞ = 1
3. 𝐹 −∞ = 0
4. 𝑃 𝑎 < 𝑋 < 𝑏 = 𝐹 𝑏 − 𝐹 𝑎
𝜕𝐹(𝑥)
5. 𝜕𝑥
= 𝑓(𝑥)

Función de Distribución Acumulada (CDF)
4. 𝑃 𝑎 < 𝑋 < 𝑏 = 𝐹 𝑏 − 𝐹 𝑎

FUNCIÓN DE DENSIDAD Y CÁLCULO DE SUS
PROPIEDADES

Ejemplo
Sea 𝑓 𝑥 = 𝑘𝑥 2 ; 0 ≤ x ≤ 1.
1. Encontrar el valor de k para que sea una función de densidad de probabilidad.
2. Mostrar la función de densidad de probabilidad.
3. Mostrar la función de distribución acumulada.
4. Calcular 𝑃 𝑋 ≤ 0.7
5. Calcular 𝑃 𝑋 ≤ 0.3
6. Calcular 𝑃 𝑋 > 0.7
7. Calcular 𝑃 0.3 ≤ 𝑋 ≤ 0.7

Ejemplo
Sea 𝑓 𝑥 = 𝑘𝑥 2 ; 0 ≤ x ≤ 1. Encontrar el k para que sea una función de densidad de probabilidad.
𝑓 𝑥 = 𝑘𝑥 2
3 3
1 1 3 1 x f(x)
𝑥
න 𝑘𝑥 2 𝑑𝑥 → 𝑘 න 𝑥 2 𝑑𝑥 → 𝑘 =1 0 0 2.5 2.43
0 0 3
0 0.1 0.03 2 1.92
0.5 0.75
13 03
f(x)
1.5 1.47
𝑘 − =1→𝑘=3 0.7 1.47
3 3 1.08
1
1 3
0.75
0.5 0.48
2
𝑓 𝑥 = ቊ 3𝑥 , 0≤x≤1 0.27
0.12
0 0 0.03
0 𝑒𝑛 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜 0 0.2 0.4 0.6 0.8 1
x

Ejemplo
0.7 0.7
3 3
2 3
𝑃 0.3 ≤ 𝑋 ≤ 0.7 = න 3𝑥 𝑑𝑥 → 𝑥
0.3
2.5 2.43
0.3
2 1.92
𝑃 0.3 ≤ 𝑋 ≤ 0.7 = 0.73 − 0.33 = 31.60%
f(x)
1.5 1.47
1.08
1
0.75
0.5 0.48
0.27
0.12
0 0 0.03
0 0.2 0.4 0.6 0.8 1
x

Ejemplo
𝑥0
x F(x) 𝐹 𝑥0 = 𝑃 𝑋 ≤ 𝑥0 = න 𝑓 𝑥 𝑑𝑥
−∞
0 0%
100.00%
0.1 0.10% 100.00%
𝑥0 𝑥0
𝐹 𝑥0 = 𝑃 𝑋 ≤ 𝑥0 = න 3𝑥 𝑑𝑥 → 3 න 𝑥 2 𝑑𝑥 → 𝑥𝑜3
2
0.5 12.50% 0 0
80.00%
0.7 34.30% 72.90%
𝐹 𝑥0 = 𝑥𝑜3 , 0 ≤ X ≤ 1
60.00% 1 100%
F(x)
51.20%
40.00% 𝑃 𝑋 > 0.5 = 1 − 𝑃 𝑋 ≤ 0.5 = 1 − 𝐹 0.5 = 1 − 0.53 = 87.5%

34.30%
20.00% 21.60%
𝑃 𝑋 ≤ 0.3 = 0.33 = 2.7%
12.50%
0.10% 0.80% 6.40%
0.00% 2.70%
0.00%
0 0.2 0.4 0.6 0.8 1
𝑃 0.2 ≤ 𝑋 ≤ 0.6 = 𝐹 0.6 − 𝐹 0.2 = 0.63 − 0.23 = 20.8%
x

Media, Varianza y Desviación Estándar de una Distribución de Probabilidad Continua
Valor Esperado
+∞
𝐸 𝑥 =න 𝑥𝑓 𝑥 𝑑𝑥
−∞
1 1 1
3 3
𝐸 𝑥 = න 𝑥3𝑥 𝑑𝑥 = 3 න 𝑥 𝑑𝑥 = 𝑥 4 =
2 3
0 0 4 4
0
3
𝐸 𝑥 =
4

Media, Varianza y Desviación Estándar de una Distribución de Probabilidad Continua
Varianza
+∞
𝑉𝑎𝑟 𝑥 = න (𝑥 − 𝜇)2 𝑓 𝑥 𝑑𝑥
−∞
Recordar las propiedades de la varianza y apliquémosela a la integral definida: 𝑉𝑎𝑟 𝑥 = 𝐸[(𝑥 − 𝜇)]2 = 𝐸 𝑥 2 − 𝜇2
+∞ +∞ 2
2
𝑉𝑎𝑟 𝑥 = න 𝑥 𝑓 𝑥 𝑑𝑥 − න 𝑥𝑓 𝑥 𝑑𝑥
−∞ −∞
1 1 2 1 2 2
2 2 4
3 3 3
𝑉𝑎𝑟 𝑥 = න 𝑥 3𝑥 𝑑𝑥 − න 𝑥𝑓 𝑥 𝑑𝑥 = 3 න 𝑥 𝑑𝑥 − = 𝑥5 − = 0.0375
0 0 0 4 5 4
𝑉𝑎𝑟 𝑥 = 𝜎 2 = 0.0375 → 𝜎 = 0.19

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
Principales Distribuciones Continuas de Probabilidad
Uniforme: todos los valores tienen la mismas probabilidades de producirse.
Es la mejor distribución cuando faltan datos. Es una distribución continua que describe una variable aleatoria en la que cualquier
ocurrencia tiene la misma probabilidad dentro de los límites inferior y superior. Por sus características la distribución de frecuencia
acumulada se presenta como una línea recta.
Se cumplen dos condiciones, el valor máximo y mínimo.

Ejemplos: costos de producción, ingresos futuros por ventas, costos de manufactura, ventas de un nuevo producto,
lanzamiento de un dado.
f(x)
𝑋𝑚𝑖𝑛 + 𝑋𝑚á𝑥
1 𝜇=
𝑓 𝑥 = ቐ𝑀á𝑥 − 𝑀í𝑛 , 𝑀í𝑛 ≤ 𝑥 ≤ 𝑀á𝑥 2
0, 𝑒𝑛 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜
𝑥 − 𝑀í𝑛 (𝑋𝑚á𝑥 − 𝑋𝑚𝑖𝑛)2

𝐹 𝑥 = 𝜎=
𝑀á𝑥 − 𝑀í𝑛 12

Triangular: extremadamente flexible, pero menos precisa que la distribución normal.
Cumple tres condiciones, valor mínimo, máximo y el valor más probable. Se recomienda que cuando se utilice el método de
expertos se utilicen como valores mínimos y máximos los percentiles 10 y 90, respectivamente
Es la distribución adecuada en ausencia de datos, los valores situados alrededor del valor más probable tienen más probabilidad
de producirse, por lo que se constituye en la manera más intuitiva en que se caracteriza la incertidumbre.
Ejemplos: Historial de ventas de una empresa, niveles de inventarios y precios del mercado accionario.
2(𝑥 − 𝑀í𝑛)
𝑝𝑎𝑟𝑎 𝑚í𝑛 ≤ 𝑥 ≤ 𝑚á𝑠 𝑝𝑟𝑜𝑏
𝑀á𝑥 − 𝑀í𝑛 𝑀á𝑠 𝑃𝑟𝑜𝑏 − 𝑀í𝑛
𝑋1 : 𝑀𝑖𝑛𝑖𝑚𝑜, 𝑋2 : 𝑀á𝑠 𝑃𝑟𝑜𝑏𝑎𝑏𝑙𝑒; 𝑋3 : 𝑀á𝑥𝑖𝑚𝑜 f(x) 𝑓 𝑥 =
2(𝑀á𝑥 − 𝑥)
𝑝𝑎𝑟𝑎 𝑚á𝑠 𝑝𝑟𝑜𝑏 ≤ 𝑥 ≤ 𝑚á𝑥
(𝑀á𝑥 − 𝑀í𝑛)(𝑀á𝑥 − 𝑀á𝑠 𝑃𝑟𝑜𝑏)
𝑋1 + 𝑋2 + 𝑋3 (𝑥 − 𝑀í𝑛)2
𝜇= 𝑝𝑎𝑟𝑎 𝑚í𝑛 ≤ 𝑥 ≤ 𝑚á𝑠 𝑝𝑟𝑜𝑏
3 𝑀á𝑠 𝑝𝑟𝑜𝑏 − 𝑀í𝑛 𝑀á𝑥 − 𝑀í𝑛
𝐹 𝑥 =
𝑀á𝑥 − 𝑥 2
1− 𝑝𝑎𝑟𝑎 𝑚á𝑠 𝑝𝑟𝑜𝑏 ≤ 𝑥 ≤ 𝑚á𝑥
𝑀á𝑥 − 𝑀á𝑠 𝑝𝑟𝑜𝑏 𝑀á𝑥 − 𝑀í𝑛
𝑋3 − 𝑋1 𝑋32 − 𝑋1 𝑋3 + 𝑋12 − 𝑋2 𝑋3 𝑋3 − 𝑋2 − 𝑋1 𝑋2(𝑋2 − 𝑋1 )
𝜎=
18(𝑋3 − 𝑋1 )

DISTRIBUCIÓN NORMAL Y NORMAL
ESTÁNDAR

Recursos Distribución Normal y Normal Estándar
https://homepage.divms.uiowa.edu/~mbognar/applets/normal.html
https://www.rossmanchance.com/applets/2021/normcalc/NormCalc.html
https://onlinestatbook.com/2/calculators/normal.html
https://stapplet.com/normal.html
https://stats.cpm.org/normal/

Distribución Continua de Probabilidad más utilizada en economía, finanzas, ciencias sociales, etc. Para la construcción de la
función de densidad de probabilidad se debe conocer de antemano la media y la varianza, estos son sus dos parámetros. La
forma de la PDF es una curva simétrica en forma de campana centrada en la media. Si conocemos la media y desviación estándar
de la población, podemos definir la distribución normal utilizando la siguiente notación: 𝑋~𝑁(𝜇, 𝜎).
Distribución Normal
(Media=100, Desviación Estándar=10)
𝟏 𝟏 𝒙−𝝁 𝟐
−
𝒇 𝒙 = 𝒆 𝟐 𝝈
𝝈 𝟐𝝅
60 70 80 90 100 110 120 130 140

𝟏 𝟏 𝒙−𝝁 𝟐
−
𝒇 𝒙 = 𝒆 𝟐 𝝈
𝝈 𝟐𝝅
(Media=100, Desviación Estándar=10)
60 70 80 90 100 110 120 130 140

La distribución normal no es una única función corresponde a una familia de distribuciones debido a que los parámetros pueden
tomar diferentes valores. A continuación, se presentan diferentes gráficas de la distribución normal teniendo en cuenta la misma
media, pero diferente desviación estándar y distintas medias poblacionales con la misma desviación estándar poblacional.

Los parámetros de una distribución normal son la media y la desviación estándar. De esta manera se dice que una variable X sigue
una distribución normal con parámetros media y desviación estándar poblacional.
𝑋~𝑁 𝜇, 𝜎
Distribución Normal (Media=100, Desviación Estándar=10)
𝜇 = 100 𝟏 𝟏 𝒙−𝝁 𝟐
−
𝜎 = 10 𝒇 𝒙 = 𝒆 𝟐 𝝈
𝝈 𝟐𝝅
𝑃(𝑥 ≤ 110)
𝟏𝟏𝟎 𝟏 𝒙−𝝁 𝟐
𝟏 −
𝑷 𝑿 ≤ 𝟏𝟏𝟎 = න 𝒆 𝟐 𝝈 𝒅𝒙
−𝜶 𝝈 𝟐𝝅
60 70 80 90 100 110 120 130 140

Los parámetros de una distribución normal son la media y la desviación estándar. De esta manera se dice que una variable X sigue
una distribución normal con parámetros media y desviación estándar poblacional.
𝜇 = 100 𝟏 𝟏 𝒙−𝝁 𝟐
−
𝜎 = 10 𝒇 𝒙 = 𝒆 𝟐 𝝈
𝝈 𝟐𝝅
𝑃(𝑥 ≤ 110)
𝟏𝟏𝟎 𝟏 𝒙−𝝁 𝟐
𝟏 −
𝑷 𝑿 ≤ 𝟏𝟏𝟎 = න 𝒆 𝟐 𝝈 𝒅𝒙
−𝜶 𝝈 𝟐𝝅

Distribución Normal Estándar
Podemos realizar la anterior integral “sería bastante complicado ya que no tiene una solución cerrada”
Distribución Normal Estándar o Tipificada “Z”
• Proceso mediante el cual una variable X medida en cualquier unidad se transforma en una variable Z.
• Una variable X se transforma en una medida en desviaciones estándar.
𝑍~𝑁 0,1
z es el número de desviaciones estándar en que se
𝑥−𝜇 aleja un valor x de su respectiva media.
𝑧= También se define como el valor del percentil de una
𝜎 distribución normal estándar.

Distribución Normal Estándar
𝑥−𝜇 110 − 100
𝜇 = 100 𝑧= →𝑧= =1
𝜎 10
𝜎 = 10
𝑃(𝑥 ≤ 110)
𝑃 𝑥 ≤ 110 = 𝑃(𝑧 ≤ 1)
60 70 80 90 100 110 120 130 140 𝑋
0 1 𝑍

DISTRIBUCIÓN NORMAL ESTÁNDAR (CDF)

Casos de la Distribución Normal y Distribución Normal Estándar
𝑷(𝑿 > 𝒙)
𝑷(𝑿 ≤ 𝒙)
𝑷(𝒁 ≤ 𝒛) 𝑷(𝒁 > 𝒛)
x X x X
Z Z
z z
𝐷𝑎𝑑𝑜 𝑢𝑛𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑, 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑟 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥

𝒙−𝝁
𝑷(𝒙𝟏 < 𝑿 ≤ 𝒙𝟐) 𝒛= → 𝐱 = 𝐳𝝈 + 𝝁
𝝈
𝑷(𝒛𝟏 < 𝒁 ≤ 𝒛𝟐)
30%
x1 x2 X X
z1 z2 Z Z

Estadística para Riesgos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística para Riesgos

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA PARA EL

Msc. Miguel Angel Bello

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 2

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 3

“ES LA CIENCIA QUE SE ENCARGA DE

American Statistical Association (ASA)

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 4

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 5

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 6

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 8

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 9

Modelos de pronóstico para

Anticiparme a las Conocer qué tipos de

Recomendaciones a partir Análisis de conglomerados

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 11

En la práctica, observar y analizar a la población resulta costoso. Asimismo, se requiere de mucho

El parámetro es una medida descriptiva de la variable en la población

Salario promedio de los docentes de la universidad

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 12

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 13

Alumnos de Carrera de Administración (Población: Alumnos de la Universidad).

Para determinar el tamaño de la muestra ideal va a depender de los siguientes factores:

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 14

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 15

OJO: TODO ESTIMADOR ES UN ESTADÍSTICO, PERO NO TODO ESTADÍSTICO ES UN ESTIMADOR.

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 16

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 17

Nominales Ordinales Discretas Continuas

Son aquellas variables que son Son aquellas variables que

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 18

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 19

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 20

Análisis Precio de Venta $9 $11

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 21

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 22

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 23

➔Nivel de Satisfacción del cliente:

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 24

➔ Ubicación en una carretera respecto a un punto de referencia.

➔ Puntuaciones de Exámenes (TOEFL, GMAT. Etc.)

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 25

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 26

La variable fecha, ¿Qué escala de medida es?

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 27

➔Precio de un activo financiero.

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 28

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 29

¿Qué edad tiene?

Indique su preferencia por c/u de ¿Cuál es su género?

Marcas Califique la marca en una escala ¿Cuál es su marca favorita?

¿Que tantas veces usted utiliza ¿Cómo califica nuestra marca?

Fuente: Marketing Research

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 30

Una serie de tiempo es un conjunto de observaciones sobre los valores de una

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 31

¿Por qué hay oportunidades de Aplicar la Estadística en el ámbito empresarial?

1. Vivimos en una sociedad “Swipe Right Culture”

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 32

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 33

Fuente: Elaboración propia con base en://finance.yahoo.com/

Estadística para el análisis de riesgos Miguel.Bello@Software-Shop.com Pág. 34

1. Fuentes de Indicadores Económicos

1. Fuentes de Información Financiera