Está en la página 1de 40

APLICACIONES

Data Science
Ricardo Aravena C.
Data Science - Aplicaciones

Uso intensivo de técnicas estadísticas multivariadas


Data Science - Aplicaciones

Uso intensivo de técnicas estadísticas multivariadas


Data Science - Aplicaciones

¿Cómo lo hicieron?
Modelo econométrico
• Calificación ELO, una medida "de fortaleza“
• Analiza la fase de clasificación que se ha jugado
desde el año 2015
• Analiza es cómo se han comportado los equipos en
los mundiales
• Finalmente, considera la composición del grupo
Con base a esa información y mediante miles de
simulaciones se obtienen las probabilidades,
Data Science - Aplicaciones

Este domingo sabremos cómo les fue….


Data Science - Aplicaciones

Modelación
Tasa de desempleo vs PIB (España, trim2009-14)

¿Variable explicada o Variable explicatoria?


T.Desempleo  PIB
Data Science - Aplicaciones

Modelación
Ahorro  Ingreso (Reino Unido, 1946 – 1963)
Gráfica de dispersión de Y-Ahorro vs. X-ingreso

2,0

1,5
Y-Ahorro

1,0

0,5

0,0

10,0 12,5 15,0 17,5 20,0 22,5 25,0


X-ingreso
Data Science - Aplicaciones

Sin embargo, el objetivo era analizar el efecto de


una ley tributaria que buscaba potenciar el ahorro,
cambio que se implementó a partir de 1955.
Y-Ahorro vs X-Ingreso 1946-1954 y 1955-1963 - Reino Unido

2,0

1,5
Y-Ahorro

1,0

0,5

0,0
10,0 12,5 15,0 17,5 20,0 22,5 25,0
X-ingreso
Data Science - Aplicaciones

Modelación
Data Science - Aplicaciones

Modelación
Tasa de pobreza - CASEN 2011 vs. 2013
Alto Biobío
60,0%

50,0%
NinhueCañete
Treguaco Coihueco
San Ignacio
40,0% Negrete
El Carmen
Cobquecura Tirúa
San Fabián
A2013

Quilleco
San Carlos Pinto
Antuco
Ñiquén
Florida
Bulnes
Santa
Yungay Quirihue Bárbara San
Nacimiento
Portezuelo
Nicolás
Cabrero
Lebu
Ránquil
Pemuco
Tucapel
Hualqui
30,0% Quilaco Contulmo
Quillón Mulchén San Rosendo
Los Ángeles Santa Juana Los Alamos
San Pedro De La Paz Laja
ChillanViejo Tomé
Chillan Penco YumbelCoelemu
Coronel Lota Arauco
20,0% Curanilahue
Talcahuano
Chiguayante Hualpén

Concepción
10,0%

10,0% 20,0% 30,0% 40,0% 50,0% 60,0% 70,0%


A2011
Data Science - Aplicaciones
Análisis de Componentes Principales
Data Science - Aplicaciones
Análisis de Componentes Principales – IDH
Data Science - Aplicaciones

The Human Development Index (HDI) published in the Human


Development Report of the United Nations Development Program has
been calculated as a simple average of the Life Expectancy Index, the
Education Index and the Gross Domestic Product Index. This paper
provides statistical support for the use of this seemingly arbitrary equal
weighting of the three components by treating human development as a
latent concept imperfectly captured by its three component indices. We
show that a principal component analysis (PCA) based on the correlation
matrix of the components leads to practically the same weights.
Specifically we show that, for the period 1975–2005, the first principal
component accounts for between 78% and 90% of the total variability in
the data, and that its coefficients are positive and nearly equal. By
normalizing the coefficients, the simple average weighting (1/3, 1/3, 1/3)
scheme is obtained. The ranks of countries obtained using the PCA
weightings are very similar to those based on the HDI. An advantage of the
simple equal weighting is that one can define a simple index to measure
the balance of a country’s development, given its HDI.
Data Science - Aplicaciones
Análisis de Componentes Principales
Data Science - Aplicaciones
Data Science - Aplicaciones
Análisis de Componentes Principales
Índice de valoración de Ciclovías – Santiago
¿Qué atributos son deseables
para una buena ciclovía?
Data Science - Aplicaciones
Data Science - Aplicaciones
Índice de valoración de Ciclovías – Santiago

Rapidez ( 2/5 ): Una ciclovía debe ser directa,


paralela absolutamente a la calle que bordea, sin
obstáculos. Debe ser tan directa como la calle.

Seguridad ( 2/5 ): Al circular por una ciclovía se


requiere que los otros medios de transporte y
peatones no sean un peligro para los ciclistas.

Ubicación ( 1/5 ): Tal y como para los autos hay


calles, avenidas y autopistas, para las bicicletas
también debería priorizarse la infraestructura en
zonas de alta afluencia. De acuerdo a eso, hay
ciclovías más necesarias que otras.
Data Science - Aplicaciones
Análisis de Componentes Principales
Aplicación:
Municipio y la gobernabilidad del territorio comunal. Reforma
Municipal en la Mira. Expansiva Fuentes, Allard y Orellana;2007
– archivo Municipio.pdf).
Se dispone de información a nivel comunal (22 var):
X1: Población (en miles, Censo)
X2: Grado de ruralidad (%, Censo)
X3: Pobreza (%, Casen)
X4: Dependencia del Fondo Común Municipal (relación entre
ingresos propios y municipales, MINT).
ETC….(ver anexo 1 – en municipio.pdf)

Nos interesa “ordenación” social-demográfico, para lo cual utiliza ACP


(ver pag. 49 – municipio.pdf).
Data Science - Aplicaciones
Análisis de Componentes Principales
Data Science - Aplicaciones
Análisis de Componentes Principales

 Tipología I – fuerte componente geográfico – periféricas.

 Tipología II – comunas peri-centrales, han perdido


competitividad

 Tipología III – localización y falta de infraestructura vial. Bajo


desarrollo.

 Tipología IV – mayores ingresos y/o comunas rurales en


procesos de urbanización.

Este trabajo fue la semilla del actual ICVU


Data Science - Aplicaciones
.
Data Science - Aplicaciones
.
Data Science - Aplicaciones

Análisis Factorial
Data Science - Aplicaciones
Data Science - Aplicaciones
Data Science - Aplicaciones
Análisis de Conglomerados (Cluster Analysis)
Data Science - Aplicaciones
Análisis de Conglomerados (Cluster Analysis)
Data Science - Aplicaciones

Análisis de Conglomerados (Cluster Analysis)


Data Science - Aplicaciones

Análisis de Conglomerados (Cluster Analysis)


DIETA: Consumo de proteínas (1981)
Data Science - Aplicaciones
Análisis de Correspondencia
Data Science - Aplicaciones
Data Science - Aplicaciones

Análisis de Discriminante
Data Science - Aplicaciones

Factorial + Cluster
Data Science - Aplicaciones

Factorial + Cluster
Data Science - Aplicaciones

Factorial + Cluster
Data Science - Aplicaciones

Factorial
Data Science - Aplicaciones

Otros –
APLICACIONES
Data Science
Ricardo Aravena C.

También podría gustarte