Está en la página 1de 124

Curso de Nivelación

Probabilidad y Estadística
Maestría en Finanzas – Universidad Torcuato Di Tella
Prof. Sebastián Auguste
sauguste@utdt.edu
Objetivo

• Vamos a ver elementos de probabilidad y estadística que se ven en casi todas


las carreras de grado, mostrando aplicaciones a finanzas, que son
prerrequisitos para el curso obligatorio de Probabilidad y Estadística

MFIN. Nivelación. Prof. Sebastián Auguste 2


Motivación

• Tenemos una base de datos de panel de 100 mil hogares de EE.UU. y sus
ingresos anuales. ¿Qué análisis podemos hacer de estos datos históricos?

MFIN. Nivelación. Prof. Sebastián Auguste 3


Módulo 1. Índice

1. Intro a Estadísticas Descriptivas


2. Tabulados e Histogramas
3. Medidas de Centro
4. Medidas de Posición
5. Medidas de Dispersión
6. Medidas de Deformación
7. Medidas de Asociación

MFIN. Nivelación. Prof. Sebastián Auguste 4


1. Intro a Estadísticas Descriptivas

MFIN. Nivelación. Prof. Sebastián Auguste 5


Estadística Descriptiva

• ¿Que es? agrupación, resumen y presentación de los datos


• ¿Para qué? Entender mejor que nos dicen, encontrar relaciones, tomar
decisiones
• ¿Como? Tabulados, Técnicas gráficas, medidas (e.g. media, varianza,
etc.)

MFIN. Nivelación. Prof. Sebastián Auguste 6


Tipos de bases

• Series de tiempo (T)


• Evolución de las ventas de mi empresa
• Evolución del precio de una acción
• Cross Section (N)
• Una encuesta de satisfacción a clientes (que se hizo en cierta ventana de
tiempo)
• Una muestra de productos para hacer un control de calidad
• Datos de Panel (en general N grande y T chico)
• Evolución de los ratios contables de las empresas que cotizan en bolsa (veo a
distintas empresas y a la vez como evolucionan en el tiempo)
• Evolución de las ventas históricas para los distintos distribuidores de mi
producto

7
Tipo de “variables”

Variables

Cuali Cuanti
(categóricas) (numéricas)

Ejemplos:
◼ Estado Civil Discretas Continuas
◼ Equipo de Fútbol
◼ Color de Ojos
Ejemplos:
(Definen categorías) Ejemplos:
◼ Número de hijos
◼ Edad ◼ Altura
(Items contables) ◼ Ingreso
(Items incontables)
8
Tipo de estadística descriptiva

• Univariada: es una medida basada en una sola variable (e.g. media, varianza,
etc)
• Bivariada: relaciona dos variables (e.g. covarianza, coeficiente de correlación)
• Multivariada: relaciona a muchas variables (se usa para “describir” pero
también para “inferir”) e.g. regresión, componentes principales/análisis
factorial, clustering

EMBA-MBA. Nivelación. Prof. Sebastián Auguste 9


Univariadas

Datos categóricos o
Datos continuos
discretos)
se usan técnicas gráficas
tabulados simples o de
(histogramas) o medidas de
doble entrada (tablas de
posición y dispersión.
frecuencias)

10 MFIN. Nivelación. Prof. Sebastián Auguste


¿Cómo se obtienen los datos?

✓Encuestas: se elige a un subgrupo (muestra) de la población. Existen


muchas “técnicas de muestreo”
✓Censo: se recolecta información de toda la población
✓Estudios Experimentales: se obtienen los datos de un experimento
controlado (grupo de tratamiento y control)
✓Datos administrativos: e.g. base de datos de clientes, datos de la bolsa,
etc.
✓Internet: websites, redes sociales, etc.
✓Tipo de Base de Datos:
• No estructurados
• Corte transversal (cross-section)
• Series temporales (time-series)
• Datos en panel (panel data)

MFIN. Nivelación. Prof. Sebastián Auguste 11


Muestra vs Población

✓Muestrear es más barato que censar


✓Pero, ¿se pueden extrapolar los resultados a la población?
✓ Propiedades de un buen muestreo
✓ Aleatorio
✓ No existe sesgo de autoselección
✓ No existe errores de medición
✓Estudios Observacionales vs. Experimentales
✓Fuentes:
✓Primaria: recolectada por el investigador (encuestas o
experimentos)
✓Secundaria: recolectada por otra persona (censos, bases de datos
publicas, internet, etc.)

MFIN. Nivelación. Prof. Sebastián Auguste 12


• Base de datos típica: matriz con las filas correspondientes a las observaciones
y las columnas a las variables (una de ellas es el id)

MFIN. Nivelación. Prof. Sebastián Auguste 13


Fundamental…
 Saber cómo se obtuvo la muestra.

 Entender sus limitaciones

 Ver si es consistente (e.g. outliers, missings o errores)

 Entender si podemos decir algo válido sobre el universo o


población
 e.g. ¿puedo de mi muestra de clientes extrapolar
comportamiento a toda la demanda potencial?

14 MFIN. Nivelación. Prof. Sebastián Auguste


Técnicas de Muestreo

 Se refiere a cómo se obtiene la muestra a analizar


 ¿Qué tamaño de muestra mínima necesito?
 ¿Hago una encuesta telefónica eligiendo números al azar, o hago una
encuesta domiciliara eligiendo domicilios al azar?
 Ejemplos: (a) Encuestas de Intención de Votos, (b) Encuesta en
municipio
 ¿Qué hago cuando alguien no responde?
 Ejemplo: Encuesta FIEL Informalidad
 ¿Cómo sé si se responde la verdad?
 Prguntas double-check
 ¿Cómo armo la pregunta para evitar generar sesgos en las respuestas?

15 MFIN. Nivelación. Prof. Sebastián Auguste


Tipos de Muestras

 Aleatorias (los elementos son elegidos en forma aleatoria con una


probabilidad conocida de inclusión)
 Simple
 Sistemático
 Estratificado
 Clusters
 No-Aleatorias (en general sesgadas para inferir propiedades para la
población)
 Convenience Sample e.g. encuestas en supermercados
 Judgment Sample – elegidos por el investigador

16 MFIN. Nivelación. Prof. Sebastián Auguste


Fuentes comunes de error

 Error de muestreo (Sampling Error), la muestra difiere de la


población
 Error de cobertura: casos excluidos del marco muestral
 Self-Selection Bias –participantes que rechazan participar
 Non-response bias – sesgo cuando deciden no responder alguna
pregunta en particular
 Error de medición:
 Measurement Bias –preguntas pobremente fraseadas
 Response Bias –respuestas incorrectas o inverosímiles

17 MFIN. Nivelación. Prof. Sebastián Auguste


Errores por wording
 Double-barreled question: ¿cuán satisfecho está usted con su
salario y las condiciones laborales?
 Leading question: guía a la persona a la respuesta. ¿Estaba el
acusado usando una remera blanca? (en lugar de ¿qué usaba el
acusado?)
 Loaded questions: contienen supuestos implícitos. ¿Ya no le pega
más a su perro? ¿está de acuerdo con que el gobierno controle
nuestras vidas?
 One-sided question: incluye solo algunas alternativas en las
respuestas
 Ambiguous question: la pregunta admite interpretaciones varias

 Muy importante siempre hacer Prueba Piloto


18 MFIN. Nivelación. Prof. Sebastián Auguste
Conclusión
 Antes de hacer nada se debe conocer el alcance y las limitaciones
de los datos que vamos a usar.
 Saber cómo se obtuvo la muestra me indica que tipo de problemas
puedo tener.
 En Finanzas:
 datos de cotizaciones y balances (no es muestra aleatoria)
 Encuestas realizadas por instituciones
 Encuestas realizadas por la empresa

19 MFIN. Nivelación. Prof. Sebastián Auguste


Estadísticas Descriptivas
1. Tabulados e Histograma
2. Medidas de centro (tendencia central): apuntan a dar una idea
de donde se encuentra el centro o corazón de los valores de los
datos
3. Medidas de posición: nos dan otras posiciones que no sea el
centro
4. Medidas de dispersión: apuntan a dar una idea de cuan juntos o
dispersos están los datos alrededor de la posición central
5. Medidas de forma: deformadas respecto a algo, por lo que se
requiere un punto de comparación (la Normal)
6. Medidas de asociación: cuando tengo dos variables

20 MFIN. Nivelación. Prof. Sebastián Auguste


2. Tabulados e Histogramas

MFIN. Nivelación. Prof. Sebastián Auguste 21


1. Tablas de Frecuencias e Histograma

Días de ausentismo en el último


 Tabulados de resultados.
trimestre
 Filas = clases/categorías o intervalos Número
Número de
 Columna, frecuencias (pueden ser %
de días emplea-
absolutas o relativas (%)) dos
 Más útil para datos discretos
0 410 28.5
1 430 29.9
2 290 20.1
3 180 12.5
4 110 7.6
5 20 1.4
1440 100.0
22 MFIN. Nivelación. Prof. Sebastián Auguste
23 MFIN. Nivelación. Prof. Sebastián Auguste
 ¿Qué porcentaje de individuos tiene menos de 3 hijos?
 ¿y entre 4 y 6 hijos? (8,4+3,6+1,6 o bien 97,3 - 83,8)
 ¿cuál es el tamaño familiar más común?

¿Se deben
excluir los
missings?

24 MFIN. Nivelación. Prof. Sebastián Auguste


Outliers
20 20 22 24 85

20 20 22 24 ¿25?

25 MFIN. Nivelación. Prof. Sebastián Auguste


Histogramas
 Histograma: grafico en barras (verticales) de las frecuencias (absolutas o
relativas).
 Variables continuas, se arman los intervalos
 (e.g. ingreso, cantidad de personas entre 1000 y 2000)

– Dividir el rango de valores posibles


de la variable en intervalos
– Contar para cada intervalo la
cantidad de casos
– Se puede armar en Excel (casero o
usando Herramientas para Análisis,
complemento de Excel a instalar) o
en los paquetes estadísticos como E-
Views
26 MFIN. Nivelación. Prof. Sebastián Auguste
Clase Histograma Frecuencia Acumulada
0-999 5 5 6%
1000-1999 15 20 22%  Frecuencia
2000-2999
3000-3999
25
22
45
67
50%
74% Acumulada: como el
4000-4999
5000
15
8
82
90
91%
100% histograma pero
Histograma graficando las
30

25
frecuencias acumuladas
20

15

10  Graficos son útiles para


5

0
detectar outliers y
0-999 1000-1999 2000-2999 3000-3999 4000-4999 5000
potenciales errores.
Frecuencia Acumulada
120%

100%

80%

60%

40%

20%

27 0% MFIN. Nivelación. Prof. Sebastián Auguste


0-999 1000-1999 2000-2999 3000-3999 4000-4999 5000
Normalidad
 Los histogramas que representan datos reales frecuentemente
tienen forma de campana
 Esta forma se denomina distribución normal
 Hay buenas razones para que pase frecuentemente

28 MFIN. Nivelación. Prof. Sebastián Auguste


Encuentre el histograma

29 MFIN. Nivelación. Prof. Sebastián Auguste


Excel: Herramienta para Análisis

 Haga clic en el botón de Microsoft Office y, a continuación, haga clic en Opciones de Excel.
 Haga clic en Complementos.
 En el cuadro Administrar, haga clic en Complementos de Excel y, a continuación, en Ir.
 En el cuadro Complementos disponibles, siga uno de estos procedimientos:
 Para cargar Herramientas para análisis, active la casilla de verificación Herramientas para análisis y
haga clic en Aceptar.
 Para incluir funciones de Visual Basic para Aplicaciones (VBA) de Herramientas para análisis, active la
casilla de verificación Herramientas para análisis -VBA y, a continuación, haga clic en Aceptar.
 For Excel 2007 see http://office.microsoft.com/en-us/excel/HP100215691033.aspx
 For Excel 2003 see http://office.microsoft.com/en-us/excel/HP011277241033.aspx

30 MFIN. Nivelación. Prof. Sebastián Auguste


3. Medidas de Centro

MFIN. Nivelación. Prof. Sebastián Auguste 32


 Media: promedio simple de los valores de una variable.
 Mediana: valor del medio de la serie (ordenados de menor a
mayor)
 Moda: valor más frequente
 Otras: media ponderada, media móvil

33 MFIN. Nivelación. Prof. Sebastián Auguste


Media Aritmética
 La media aritmetica es la suma de las observaciones dividida el
número de observaciones (promedio simple)

 Características de la Media
 intuitiva y fácil de calcular.
 Su valor puede que no coincida con ninguno de los valores de la muestra
 Tiene sentido para variables cuantitativas, no para cualitativas

34 MFIN. Nivelación. Prof. Sebastián Auguste


Sumatoria
 El símbolo de sumatoria se usa para escribir de
manera sintética

Supongamos que tenemos un conjunto de datos {2,4,6,8}

Yo podría escribir también como 𝑥𝑖 = {𝑥1 , 𝑥2 ,…, 𝑥𝑛 } donde


el subíndice indica el orden de ese dato (el primer elemento, el
segundo y asi). Una forma elegante de resumir esta sumatoria
de n elementos es:
𝑛

෍ 𝑥𝑖 = 𝑥1 + 𝑥2 +…+ 𝑥𝑛
𝑖=1
35 MFIN. Nivelación. Prof. Sebastián Auguste
 Aplicación: Media o Promedio (suma de n
elementos dividido por n)

1 n
X =  xi x1 + x2 + ... + xn
X=
n i =1 n

 De hecho es una función

X = f ( x1 , x2 ,..., xn )

36 MFIN. Nivelación. Prof. Sebastián Auguste


Ejercicios de sumatoria

(1) compute σ4𝑖=1 (3i−1)


(2) Smalltown Bagels cocina n tipos de bagels. Hoy
planea cocinar xi tipos de i bagels, con un costo de
producción de ci pesos por unidad
a. Exprese el costo total
b. Dado los siguientes supuestos
n = 3 c1 = $1.20, x1 = 100 c2 = $1.50, x2 = 50 c3 =
$2.00, x3 = 50
compute el costo total de producción

37 MFIN. Nivelación. Prof. Sebastián Auguste


solución

El costo va a ser la cantidad x de cada tipo de bagel por el costo


ci de este tipo de bagel
𝑛

𝐶 = ෍ 𝑥𝑖 ∗ 𝑐𝑖
𝑖=1
En el caso de tres elementos:
𝐶 = 𝑥1 ∗ 𝑐1 + 𝑥2 ∗ 𝑐2 +𝑥3 ∗ 𝑐3
= 1.20 ∗ 100 + 1.5 ∗ 50 + 2 ∗ 50

38 MFIN. Nivelación. Prof. Sebastián Auguste


Media Geométrica
 Se define como la raíz n-ésima del producto de todos los valores
numéricos n

 Ventajas:
 considera todos los valores de la distribución
 es menos sensible que la media aritmética a los valores extremos.
 Desventajas:
 es de significado estadístico menos intuitivo que la media aritmética,
 su cálculo es más difícil y en ocasiones no queda determinada; por
ejemplo, si un valor xi=0 o hay valores negativos.

39 MFIN. Nivelación. Prof. Sebastián Auguste


 La media geométrica surge naturalmente en finanzas
cuando hay “compounding” (denominada tasa efectiva)

 Se usa también para tasas de inflación y tasas de


crecimiento (tasas en general!)

40 MFIN. Nivelación. Prof. Sebastián Auguste


Ejemplo: tasa de retorno efectiva
 Retorno, R: porcentaje de variación en el valor de un activo
en una unidad de tiempo.

 Retorno bruto, 1+R:

 Capitalizar: es el efecto del retorno sobre el capital


acumulado. Si la tasa mensual es 10% y pongo $100 por dos
períodos:
 t0 t1 t2
 100 110 121
 M0 M0*(1+R) M0*(1+R) (1+R)=Mo*(1+R)²

41 MFIN. Nivelación. Prof. Sebastián Auguste


 Si la tasa cambia de período en período tengo
(1+R1)*(1+R2)*….*(1+RT)
 Llamemos RG al retorno acumulado punta a punta,
tendremos que:
1+RG =(1+R1)*(1+R2)*….*(1+RT)
 Esta RG es igual a una tasa mensual fija que da el mismo
retorno, que sería la tasa promedio efectiva mensual
1+RG =(1+R)*(1+R)*….*(1+R)=(1+R)^T
 (1+R)=[(1+R1)*(1+R2)*….*(1+RT)]^(1/T)

42 MFIN. Nivelación. Prof. Sebastián Auguste


 Si la tasa del período cambia en cada mes tengo que la tasa
bruta promedio mensual obtenida en T períodos es la media
geométrica de las tasas brutas mensuales

1 + R G = (1 + R 1 )(1 + R 2 )(1 + R 3 )...(1 + R T )


1
T

1
 T 
R G =  (1 + R t ) − 1
T

 t =1 

43 MFIN. Nivelación. Prof. Sebastián Auguste


Productorio

 Es una forma resumida (y elegante) de


presentar una multiplicación de variables.

44 MFIN. Nivelación. Prof. Sebastián Auguste


La regla del 7 x 10

 Si inviertes tu dinero al 7% en 10 años duplicas tu capital


 Tras 10 años tendremos 100*(1+7%)10 =100*1.97  200

 Si invertes tu dinero al 10% en 7 años lo duplicas!


 Tras 7 años tendremos 100*(1+10%)7 =100*1.95  200

45 MFIN. Nivelación. Prof. Sebastián Auguste


Ejemplo: Tasa promedio de inflación
 La inflación mensual en los últimos tres meses de 2019 fue:

46 MFIN. Nivelación. Prof. Sebastián Auguste


 Forma incorrecta: (3,3%+4,3%+3,7%)/3

 Forma correcta: [(1+3,3%)*(1+4,3%)*(1+3,7%)]^(1/3)

47 MFIN. Nivelación. Prof. Sebastián Auguste


Aplicación. Precios corrientes o
constantes
❖ Si la tasa de inflación anual es =25%, un producto que vale
$100 hoy pero sigue a la inflación valdrá el próximo
año….$125.

❖La regla es P1=P0*(1+ )

❖También es una función P1=f(P0,)

❖Si se ve la inflación acumulada en t años esta será (1+  )t

48 MFIN. Nivelación. Prof. Sebastián Auguste


Ejercicio

❖ Cuando termine mi clase del MFIN me van a dar un premio de


USD1 millón, pero me lo pagarán en 3 años. ¿A cuanto equivale
ese millón a precios de hoy si el costo de oportunidad para mí es de
10%?

49 MFIN. Nivelación. Prof. Sebastián Auguste


Solución
Si para llevar hacia adelante $100 lo multiplico por (1+i) donde i
es la tasa de interés. Si tengo $100 mañana tengo que hacer el
camino inverso para llevarlo a valores de hoy, es decir
100/(1+i)
Cuando se hace el camino inverso de habla de “descontar”.

En el ejercicio USD
1M / (1+i)^3 = USD1M / 1.1^3 = USD 751.314,8

50 MFIN. Nivelación. Prof. Sebastián Auguste


Números Índices
 Si miramos evolución de ventas en el tiempo ventas(t)=
p(t)*q(t), la misma puede crecer porque sube el precio, la
cantidad o ambos a la vez.
 A menudo nos interesa fijar uno de estos para identificar los
efectos.
 Un “índice de precios” fija las cantidades y analiza la evolución
del precio en el tiempo
 Un “índice de cantidades” fija precios y mira evolución de
cantidades

51 MFIN. Nivelación. Prof. Sebastián Auguste


 Una práctica usual es indicar o reexpresar con 100 el
“año base” (el que se escoge para fijar precios o
cantidades).
 Fijando las cantidades de hoy (momento 0), armo el
índice de ventas como

Ventas fijando divido por q0p0 y


Tiempo Índice
cantidades multiplico por 100
0 q0 p0 (q0 p0)/ (q0 p0 ) *100 100
1 q0 p1 (q0 p1)/ (q0 p0 ) *100 100*p1/p0
2 q0 p2 (q0 p2)/ (q0 p0 ) *100 100*p2/p0
52 MFIN. Nivelación. Prof. Sebastián Auguste
Mediana
 Mediana Se ordeanda ascendentemente o descendentemente
los valores de una variables, y se define a la mediana como
aquel valor que deja el cincuenta por ciento de los datos por
debajo y otro cincuenta por encima. Depende si es par o impar:

53 MFIN. Nivelación. Prof. Sebastián Auguste


Moda
 Valor que más se repite en la muestra (i.e. cuya frecuencia
absoluta es máxima).
 Problemas:
 Puede no ser único (varios valores pueden tener la misma
frecuencia absoluta)
 Puede no existir (si ningún valor se repite)

 Se puede usar con todo tipo de variable, pero es más útil para
variables cualitativa

54 MFIN. Nivelación. Prof. Sebastián Auguste


¿Media, Mediana o Moda?
 Evolución del patrimonio neto ¿crees que no hay mucha
diferencia entre la media, mediana y modo? ¿Cuál es la
mejor medida?

2001 2010
$ 15,000 $ 15,000
$ 20,000 $ 20,000
$ 30,000 $ 30,000
$ 40,000 $ 40,000
$ 50,000 $ 100,000
Media …………. ………….
Mediana $30.000 $30.000.
55 Moda Prof. Sebastián Auguste ………….
MFIN. Nivelación. ………….
Pro Contras

-Cálculo sencillo. -Muy sensible a variaciones muestrales

-Interpretación muy clara -Robusto a variaciones fuera de la moda


Moda -Puede calcularse para variables -No siempre se sitúa hacia el centro de la
cualitativas distribución.

-Poco sentido para variables continuas (ingreso $)


-Puede haber más de una moda.

-Fácil de calcular -Solo sirve para variables numéricas u ordenables

Mediana -Robusto a outliers -Sensible a variaciones muestrales


concepto no tan familiar
-Todo el mundo entiende un
promedio -Afectado por outliers
-Poco sensible a variaciones
Media muestrales -Valor medio puede caer fuera de los posibles

-Usa todos los datos de la -No es útil para variables discretas (cuál es la media
56
variable
MFIN. Nivelación. Prof. Sebastián Auguste entre un hombre y una mujer)
Ejemplo de análisis de datos
 En los 1980s paradoja en los MBA de EE.UU., al tiempo que el
ingreso promedio de los egresados cayó de US$ 90.000 en 1980 a
US$ 88.000 en 1990, se daba un boom de matriculados.
 ¿Son los estudiantes de MBA irracionales? ¿Qué pudo causar esto?

57 MFIN. Nivelación. Prof. Sebastián Auguste


Composition bias!

 Sesgo por composición! (composition bias)

58 MFIN. Nivelación. Prof. Sebastián Auguste


Media Ponderada

 Promedio Simple era


𝑋1 + ⋯ + 𝑋𝑛 1 1
𝑋ത = = 𝑋1 + ⋯ + 𝑋𝑛
𝑛 𝑛 𝑛
 Podríamos querer que en lugar de ponderar cada observación
igual, que cada una pondere distinto.
𝑋ത = 𝑤1 𝑋1 + ⋯ +𝑤𝑛 𝑋𝑛
 Siempre que 𝑤1 + 𝑤2 +…+ 𝑤𝑛 =1

59 MFIN. Nivelación. Prof. Sebastián Auguste


Media Ponderada

 La media ponderada permite poner diferente peso o importancia


a las distintas observaciones. Por ejemplo, podríamos armar un
índice de retornos donde las empresas grandes ponderan más que
las chicas.
 Definición:

n n
X w =  wi X i donde 0  wi  1,  wi = 1
i =1 i =1

wi es el ponderador para la observación i. Los ponderadores deben


sumar uno
60 MFIN. Nivelación. Prof. Sebastián Auguste
Ejemplo. Muestreo estratificado
 Tenemos 3 barrios, en cada uno viven 1000 personas.
 Queremos tomar una muestra de 30 personas para conocer el
ingreso promedio. Sabemos que en el barrio 1 todas las personas
ganan lo mismo entre sí, y en el barrio 2 también. ¿No basta con
encuestar una? Podemos ahorrar costos y entrevistar a 12
personas.
 X1: persona barrio 1
 X2: persona barrio 2
 X3 a X12: personas en barrio 3
 Si para ver el ingreso promedio hacemos la media artimética
simple tienen más influencia las personas del barrio 3. El muestreo
que hicimos fue estratificado

61 MFIN. Nivelación. Prof. Sebastián Auguste


 Promedio ponderado. La persona en el barrio uno equivale a
10, y lo mismo en el barrio 2. El promedio ponderado para
desarmar la estratificación es:
10 10 1 1

𝑋= 𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋12
30 30 30 30

62 MFIN. Nivelación. Prof. Sebastián Auguste


 Algunos usos el promedio ponderado:
 Algunos índices compuestos (e.g. índice de precios, índice de
desempeño)
 Bases de datos estratificadas
 Portafolios de inversión
 WACC

63 MFIN. Nivelación. Prof. Sebastián Auguste


Benchmarking con grupos heterogeneos

 Supongamos que quiero comparar Argentina con “la


región”.
 ¿Cómo construyo un promedio regional? ¿hago un
promedio simple de países o uno ponderado? Y si
pondero, ¿cuál es la variable relevante para hacerlo?
 Si sumo el PBI de todos los países de Sudamérica y luego
lo divido por su población, ¿es lo mismo que promediar
los PBI per cápita de cada país? ¿cuál es la diferencia?

64 MFIN. Nivelación. Prof. Sebastián Auguste


Ejemplo
PBI per capita en ppp Tamaño población (millones) Ponderador
Argentina 19,940 43.8 13.3% 43.8/329.66
Belice 8,400 0.36 0.1%
Brasil 15,000 207.7 63.0%
Colombia 14,000 48.7 14.8%
Chile 23,100 17.9 5.4%
Costa Rica 16,600 4.9 1.5%
El Salvador 8,600 6.3 1.9%
TOTAL 329.66

Promedio simple 15,091

Promedio ponderado 15,843


Quiero tener una idea del ingreso promedio de mi mercado en Latam, ajustado por paridad de
compra de la moneda (ppp). Tengo datos del PBI per capita de cada país, pero si hago un
promedio simple pesa lo mismo El Salvador que Brasil y son muy distintos en tamaño. El
promedio ponderado lo armo primero armando el ponderador como el % que cada país
representa en el total de la población, y luego hago una suma de los PBI pero multiplicando
cada valor por su ponderador, esto es un promedio ponderado
65
Media móvil
 Es un promedio de los valores de una serie temporal para un
período de tiempo dado (ventana de estimación).
 Tendremos tantos promedios como Rolling Windows
podamos armar. Generalmente se grafican, y sirve para ver
tendencias eliminando la volatilidad de los datos.
 Issues:
 Se debe prefijar la ventana (e.g. 10 días)
 Se debe decidir si es promedio simple o ponderado (por
ejemplo ponderando más los valores más cercanos)

66 MFIN. Nivelación. Prof. Sebastián Auguste


67 MFIN. Nivelación. Prof. Sebastián Auguste
Excel
 Max() min()
 Count() o contar()

 Mediana…………mediana() o median()
 Media …………..promedio() o average()
 Moda……………moda() o mode()

69 MFIN. Nivelación. Prof. Sebastián Auguste


4. Medidas de posición

MFIN. Nivelación. Prof. Sebastián Auguste 70


Cuartiles
 Los cuartiles dividen a un conjunto de datos en cuatro
partes iguales (ordenados de menor a mayor).
 La mediana indicaba que el 50 por ciento de los datos son
mayores que la mediana y 50 por ciento son menores.
 De manera similar el primer cuartil (Q1) es el valor por
debajo del cual se encuentra el 25% de los datos
 (i.e. Q1 se puede entender como la mediana de la mitad inferior
de los datos ordenados y Q3 como la mediana de la mitad superior
de los datos ordenado).

71 MFIN. Nivelación. Prof. Sebastián Auguste


Quintiles y Percentiles
 El Quintil es el mismo concepto que el cuartil pero dividiendo en 5
partes. El percentil divide en 100 partes iguales.
 Sea Lp la posición del percentil deseado, entonces

 donde n es el numero de datos y p el percentil (e.g. el percentil 50 es el


P50, que es también la mediana ó el Q2. El percentil 25 es el P25=Q1y el percentil
75 es el P75=Q3)
 Calculo del p-ésimo percentil
 Paso 1: Ordenar los datos de manera ascendente.
 Paso 2: Calculamos el Lp
 Paso 3:
 a) Si Lp no es entero, se redondea. El valor entero inmediato mayor que Lp indica
la posición del p-ésimo percentil.
 b) Si Lp es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados
en los lugares i e i+1
72 MFIN. Nivelación. Prof. Sebastián Auguste
Excel lo hace por vos

 El comando percentile(A1:A15,k) te da el percentil al k%


para los datos que van de A1 a A15 en tu hoja de Excel.
 Si el Excel lo tenés en español, el comando es “percentil”

73 MFIN. Nivelación. Prof. Sebastián Auguste


5. Medidas de dispersión

MFIN. Nivelación. Prof. Sebastián Auguste 74


Medidas de Dispersión

75 MFIN. Nivelación. Prof. Sebastián Auguste


Profundidad
Promedio=90 cm.

76 MFIN. Nivelación. Prof. Sebastián Auguste


 A menudo nos interesa conocer cómo los datos se
aglomeran en torno a alguna medida de localización de
interés
 Se dice que tiene una dispersión grande si se esparcen
ampliamente alrededor de alguna medida de localización.
 Las medidas descriptivas más comunes de dispersión son: el
rango, la varianza, la desviación estándar y el rango
intercuartílico.
 El punto de interés sobre el cuál nos interesa ver la
dispersión suele ser la media.

77 MFIN. Nivelación. Prof. Sebastián Auguste


 Rango: diferencia entre valores máximo y mínimo (usado
para mostrar amplitud de los datos)

 Rango Intercuartil (IQR): intervalo que contiene 50%


central de las observaciones (longitud del intervalo que va
desde el 1er al 3er cuartil, o desde el percentil 25 al 75)

78 MFIN. Nivelación. Prof. Sebastián Auguste


 Rango mira solo extremos
 Otra idea es ver desvíos de la media

 Para tener una medida global podría sumar los desvíos,


pero ….¡da cero!

79 MFIN. Nivelación. Prof. Sebastián Auguste


Varianza Muestral

 Es el promedio de los desvíos de la media muestral al cuadrado.


 Es una suma positiva (a mayor valor mayor varianza) y Penaliza los
desvíos en forma cuadrática.
 No tiene igual unidad de medida que las variables originales

 Desvío Estandar muestral es simplemente la raíz cuadrada de la


varianza (la unidad de medida es la misma que la muestra).
 (ejemplo, si x era una variable en $, la varianza es algo así como pesos al
80
cuadrado, el desvío
MFIN. Nivelación. Prof. es pesosAuguste
Sebastián de nuevo)
Comparando varianzas
 ¿Se pueden comparar las varianzas de
dos variables distintas? Temperatura Cantidad de lluvia
Promedio promedio
 ¿Varía la lluvia promedio menos que la Semanal (C°) semanal (mm)
temperatura promedio? 31 12
29 11
 ¿Cual es cual? 27 6
23 6
21 6
35 16
12 14
30 14
25 6
12
25
18 3
10
20 22 3
8 Series1
15 Series2 25 2
6
10
Media 23.3 6.9
4
Varianza 30.5 16.8
5 2
Desvío 5.5 4.1
0 0
81 1 2 MFIN.
3 4 Nivelación.
5 6 7Prof.
8 Sebastián
9 10 Auguste
 Morningstar Fund Values en su Guia sobre cómo leer los
reportes financieros y recomendaciones a sus inversores
aclara:

 ¿Por qué el desvío estándar puede no ser una buena medida


de riesgo?
82 MFIN. Nivelación. Prof. Sebastián Auguste
Coeficiente de Variación Muestral

 Varianzas con medis distintas no son


comparables(varianza no está libre de unidad de
medida).
 Para tener una medida de variación independiente de la
unidad de medida se usa el Coeficiente de Variación

83 MFIN. Nivelación. Prof. Sebastián Auguste


◼ Seleccione:
tools / data analysis /
descriptive statistics

84 MFIN. Nivelación. Prof. Sebastián Auguste


 Ingrese los detalles
en el cuadro de
diálogo

 Clickee en
summary statistics

 Click OK

85 MFIN. Nivelación. Prof. Sebastián Auguste


Estadísticas descriptivas
de los datos de los precios
de las casas:
House Prices:

$2,000,000
500,000
300,000
100,000
100,000

86 MFIN. Nivelación. Prof. Sebastián Auguste


6. Medidas de deformación

MFIN. Nivelación. Prof. Sebastián Auguste 87


 Muchas veces nos
interesa ver como se
“deforma” una
distribución respecto a
la Normal

88 MFIN. Nivelación. Prof. Sebastián Auguste


Asimetría

 Días de concepción de un
 Ingresos, habilidad,
parto.
89 MFIN. Nivelación. Prof. Sebastián Auguste
Asimetría

 Simetría: decimos que una distribución es simétrica si los


valores de la serie de datos en un histograma tienen un solo
pico en el centro y "tiene el mismo aspecto" a la izquierda y
derecha (efecto espejo).

 Si el conjunto de datos es simétrico, la media y mediana son


aproximadamente iguales. Por lo que otra forma de ver
asimetría es computar media y mediana y ver si difieren mucho
entre sí
90 MFIN. Nivelación. Prof. Sebastián Auguste
Asimetría

 Días de concepción de un
 Ingresos, habilidad,
parto.
91 MFIN. Nivelación. Prof. Sebastián Auguste
Relación entre Tendencia Central y la
Simetría de la distribución

MFIN. Nivelación. Prof. Sebastián


Auguste
¿Cómo medirla?
 Hay varias formas propuestas, pero…Excel lo hace por vos¡
 SKEW function.
 SKEW > +1, positively skewed.
 SKEW < -1, negatively skewed.
 -1 < SKEW < +1, datos relativamente simétricos.

 La que usa Excel es el Coeficiente de Asimetría de Fisher-


Pearson definido como:

93 MFIN. Nivelación. Prof. Sebastián Auguste


 Income.xlsx contiene información de ingresos para
familias de EE.UU ajustadas por inflación para 1975,
1985, 1995, y 2005.
 ¿Están las familias mejorando en el tiempo?

 ¿Es la distribución del ingreso más asimétrica hoy que en


1975?

94 MFIN. Nivelación. Prof. Sebastián Auguste


Curtosis
Analiza el grado de concentración que presentan los
valores alrededor de la zona central de la distribución.

Leptocúrtica

Mesocúrtica

Platocúrtica

95 MFIN. Nivelación. Prof. Sebastián Auguste


Coeficiente de Curtosis:

 Distribución mesocúrtica: g2 = 0

 Distribución leptocúrtica: elevado grado de


concentración alrededor de los valores centrales de la
variable. g2 > 0
 Distribución platicúrtica: reducido grado de
concentración alrededor de los valores centrales de la
variable. g2 < 0

96 MFIN. Nivelación. Prof. Sebastián Auguste


Normalidad

 Histogramas acampanados
 Simétrico
 Sin exceso de curtosis
 Relación entre media y desvío estándar

97 MFIN. Nivelación. Prof. Sebastián Auguste


 Para datos aproximadamente normales:

98 MFIN. Nivelación. Prof. Sebastián Auguste


ejemplo
 Use Cisco.xlsx, que contiene retornos mensuales de Cisco
Systems para los 1990s.
 Use la regla previa para describir los retornos (celdas
E7:E12, computa los bounds)
 99.7% de los retornos mensuales se encuentran entre .055
± 3 (.122) — i.e.-31% a 42%.
 95% entre .055 ± 2 (.122) — i.e., -19% a 30%.
 68% entre .055 ± .122 - i.e., -7% a 18%.

99 MFIN. Nivelación. Prof. Sebastián Auguste


 En Cisco.xlsx tambien hay datos de GM y Microsoft.
 (1) esperaría que el 95% de los retornos mensuales de
Microsoft se encuentren entre __________ y ________.
 (2) y el 68% de los retornos mensuales de GM entre
__________ y __________.

100 MFIN. Nivelación. Prof. Sebastián Auguste


102 MFIN. Nivelación. Prof. Sebastián Auguste
103 MFIN. Nivelación. Prof. Sebastián Auguste
7. Medidas de asociación

MFIN. Nivelación. Prof. Sebastián Auguste 104


• Hasta ahora hemos discutido cómo utilizar las medidas de
tendencia central y variabilidad para resumir un conjunto de
datos.
• Ahora vemos la forma de medir la fuerza de la relación entre
dos conjuntos de datos.
• Por ejemplo, ¿cómo se relaciona el precio de una casa con el
tamaño? ¿Cómo se relacionan los rendimientos de dos activos?
• La relación entre dos conjuntos de datos se ve gráficamente
con el Diagrama de Dispersión y se mide por la covarianza y
correlación.

MFIN. Nivelación. Prof. Sebastián Auguste 105


Diagramas de Dispersión (Scatter Diagrams)

• En cada eje se pone una variable y cada punto corresponde a una


observación.
• Sirve para ver si dos variables están asociadas (positivamente si las dos
suben o caen al mismo tiempo, negativamente si se mueven en
dirección opuesta, no asociadas si no muestra una tendencia clara) y
para identificar comportamientos anómalos

MFIN. Nivelación. Prof. Sebastián Auguste 106


S. Auguste, R. Bebczuk y R. Moya (2011)“The Demand for Mortgages under
Macro Volatility: The Argentine Case”, IDB-TN-284, Inter-American Development
Bank.

107 MFIN. Nivelación. Prof. Sebastián Auguste


Auguste y Moskovits (2006) "La Presión Tributaria sobre el Sector de Negocios en la
Argentina“ en FIEL, La presión tributaria sobre el sector formal de la economía. FIEL,
Buenos Aires, 2006.

60

50
Presión Tributaria Bruta (impuestos gob
central+local+seguridad social)

40

Argentina(2005)
30

20 Argentina(2000)

10

0
- 5,000 10,000 15,000 20,000 25,000 30,000 35,000 40,000 45,000 50,000
PBI per capita (ppp en US$)
108 MFIN. Nivelación. Prof. Sebastián Auguste
Europa Oceanía Países Escandinavos EE.UU. y Canadá Argentina Latam Asia Lineal
 Un gráfico más complejo aún, pero más rico en el análisis es
el que se conoce como shift-share, donde se busca ver
correlación entre dos variables y a su vez importancia y
desempeño relativo.

109 MFIN. Nivelación. Prof. Sebastián Auguste


Auguste S. y Stein E. (2012) “Inserción Internacional en América
Central y República Dominicana. Diagnóstico y Desafíos”, RES-BID

75%
Crecimiento Anual de las Importaciones del

65%
Mercado de Destino (2001-2008)

55%

45% Mercados en Expansión

35%
United Arab Emirates
China
25% Russian Federation India
Trinidad and Tobago Brazil
Ecuador Chile
Korea Venezuela
EU Colombia Thailand
15% CAC Singapore Australia
Malaysia
Taiwan Hong Kong
Japan Jamaica
5% Mexico Región: sus mercados de
Canada
USA exportación crecieron (promedio
ponderado) menos que el
-5% mundo, y se perdió market share
en estos mercados
-15%
Mercados en Declive
-15% -5% 5% 15% 25% 35% 45% 55% 65% 75%

Crecimiento Anual de las Exportaciones de la Región al Mercado de Destino


110 MFIN. Nivelación. Prof. Sebastián Auguste
(2001-2008)
Covarianza
 Consideremos dos variables X e Y y una colección de datos
(X1,Y1),…, (Xn,Yn),
 Podemos computar las medias y varianzas, pero no
nos dice nada de cómo se mueven en forma conjunta.

( X1 − X )
2
+ ... + ( X n − X )
2
1 n
(X i − X )
var( X ) = = 
2

n −1 n − 1 i =1

(Y1 − Y ) + ... + (Yn − Y )


2 2
1 n
( )
var(Y ) = =  i −
2
Y Y
n −1 n − 1 i =1

 ¿Y si combinamos ambos?
111 MFIN. Nivelación. Prof. Sebastián Auguste
 Técnicamente Covarianza se define como

cov( X , Y ) =
( X 1 − X )(Y1 − Y ) + ... + ( X n − X )(Y1 − Y )
n −1
n
=
1
 ( X i − X )(Yi − Y )
n − 1 i =1
( X i − X )  0 (Yi − Y )  0
 Cov (X,Y)=SXY

 Idea de cómo se mueven en forma conjunta

 Ver excel , En Excel: COVAR(...)


 divide por n en lugar de n-1, con lo cual debería reajustarse si uno quiere obtener
la covarianza muestral
112 MFIN. Nivelación. Prof. Sebastián Auguste
INTUICIÓN
 Si en promedio cuando X está por encima de su media
pasa que Y también está por encima de su media
entonces su producto será un valor positivo
 Cov(X,Y)>0 indica que se mueven en forma proporcional (en promedio
ambas suben o bajan al mismo tiempo)
 Cov(X,Y)<0 indica que se mueven en direcciones opuestas.

 Al igual que la varianza, no está libre de escala y no puedo comparar


covarianzas entre distintas variables.

 La covarianza no me dice el grado de asociación (cuan parecido se


mueven o no) sino si lo hacen en igual dirección en promedio o no.
 Tenga en cuenta que la covarianza sólo mide la fuerza de una relación
lineal y no es útil para la detección de las relaciones no lineales entre
las variables. Por lo tanto, la covarianza es una medida de la
asociación lineal entre dos variables.
113 MFIN. Nivelación. Prof. Sebastián Auguste
 La covarianza entre dos variables depende de las unidades en
que se miden las variables.
 Por lo tanto, la interpretación de la magnitud de una
covarianza es difícil.
 La correlación de Pearson (denotado generalmente por r) es
una unidad de medida libre del grado de asociación lineal
entre dos conjuntos de datos X e Y.

114 MFIN. Nivelación. Prof. Sebastián Auguste


Coeficiente de Correlación (r,)
 Intenta medir cuan asociadas (linealmente) están dos variables

Propiedades
 Donde
•Libre de unidad
de medida
•Entre -1 y 1

 En Excel: CORR(...)
115 MFIN. Nivelación. Prof. Sebastián Auguste
Propiedades del coeficiente de
correlación
 Invariante al cambio de unidades (si paso de medir las ventas
de miles de USD a millones no cambia el coeficiente)
 −1   1 ya que está normalizado por los desvíos
 mide dependencia lineal, si los datos (Xi,Yi) ienden a caer
sobre una recta
 cuantifica la fuerza de la relación, pero no la forma de la recta
(su pendiente y ordenada al origen)
 Correlación no es lo mismo que Causalidad

116 MFIN. Nivelación. Prof. Sebastián Auguste


Variables con Correlación Positiva Perfecta
=1

117 MFIN. Nivelación. Prof. Sebastián Auguste


Dos ejemplos distintos de =1

118 MFIN. Nivelación. Prof. Sebastián Auguste


Variables con Correlación Negativa
Perfecta, =-1

119 MFIN. Nivelación. Prof. Sebastián Auguste


Variables con Correlación Cero

120 MFIN. Nivelación. Prof. Sebastián Auguste


Variables con una fuerte asociación no
lineal

121 MFIN. Nivelación. Prof. Sebastián Auguste


 Issues:
 ¿Correlación implica causalidad?
 ¿y si la relación no es lineal que me dice este índice?
 ¿y si quiero graficar una recta que represente la relación?
 ¿y si tengo más de dos variables que me interesa ver como se
relacionan entre sí?

122 MFIN. Nivelación. Prof. Sebastián Auguste


Correlación no implica causalidad

Fuente: The Trouble with QSAR (or How I Learned To Stop Worrying and Embrace Fallacy),
Stephen R. Johnson *
Bristol-Myers Squibb, Co., Princeton, New Jersey 08543
J. Chem. Inf. Model., 2008, 48 (1), pp 25–26
DOI: 10.1021/ci700332k
Publication Date (Web): December 28, 2007
Copyright © 2008 American Chemical Society
123 MFIN. Nivelación. Prof. Sebastián Auguste
Correlación no implica causalidad

 Fuente: The Trouble with QSAR (or How I Learned To Stop Worrying and Embrace Fallacy), Stephen R. Johnson *
 Bristol-Myers Squibb, Co., Princeton, New Jersey 08543
 J. Chem. Inf. Model., 2008, 48 (1), pp 25–26
 DOI: 10.1021/ci700332k
 Publication
MFIN.Date (Web): December 28, 2007
124 
Nivelación. Prof.
Copyright © 2008 American Chemical Society
Sebastián Auguste
Correlación no implica causalidad
 Cuantos más bomberos se envían a un incendio, más daño se hace.

 Los niños que reciben clases de apoyo obtienen peores calificaciones.

 Cuanto más polícias se mandan a la calle a patrullar, mayor es la tasa


de robos.

 Cuanto más gaseosas diet toma un individuo, mayor es el riesgo de


ser obeso.

125 MFIN. Nivelación. Prof. Sebastián Auguste


 Pero … Google ha hecho cientos de miles de millones de dólares sin
darle importancia a la causalidad.

 A veces correlación es suficiente para sacar conclusiones.


 ejemplo, los conductores varones se correlacionan con más accidentes,
por lo que las compañías de seguros con credit scoring les cobran más.
No se puede cambiar el género de los conductores de forma
experimental.

 Para encontrar la relación de causalidad, por lo general se necesitan


datos experimentales (no sirven los observacionales). Muchas veces
se dan cuasi-experimentos (e.g. AMIA).

 La correlación es una condición necesaria pero no suficiente para la


causalidad. Para demostrar la relación de causalidad se requiere un
contrafáctico (que hubiera pasado si…).
126 MFIN. Nivelación. Prof. Sebastián Auguste
127 MFIN. Nivelación. Prof. Sebastián Auguste

También podría gustarte