Está en la página 1de 84

Introducci

on
Clustering
An
alisis Discriminante
An
alisis Factorial

Analisis Multivariante con Stata


Diploma Avanzado en Metodologa de Investigacion en Ciencias
de la Salud
EVES. Valencia, Oct 2013

Francisco Garca Garca


fgarcia@cipf.es

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Indice

Introducci
on

Clustering

An
alisis Discriminante

An
alisis Factorial

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

An
alisis Multivariante
An
alisis Multivariante con Stata

Algunas preguntas...

De qu
e forma se pueden agrupar a los pacientes que ingresan en un hospital
seg
un los recursos que consumen?

Qu
e criterios pueden ayudar a diagnosticar si una obstrucci
on de vas biliares
est
a provocada por un tumor maligno o es de naturaleza benigna?

C
omo se puede obtener un indicador de necesidad de servicios sanitarios en
distintas unidades geogr
aficas?

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

An
alisis Multivariante
An
alisis Multivariante con Stata

Qu
e tienen en com
un las preguntas anteriores?

Estas cuestiones tienen en com


un que sus respuestas se basan en el an
alisis
conjunto de muchas variables.
El An
alisis Multivariante presenta m
etodos que analizan conjuntamente varias
variables, medidas sobre un grupo de individuos u objetos.
Los resultados del An
alisis Multivariante proporcionar
a una informaci
on interesante para la toma de decisiones del investigador.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

An
alisis Multivariante
An
alisis Multivariante con Stata

Clasificacion de metodos multivariantes:

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

An
alisis Multivariante
An
alisis Multivariante con Stata

Analisis Multivariante con Stata

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

An
alisis Multivariante
An
alisis Multivariante con Stata

Nos centraremos en los siguientes m


etodos:

An
alisis Cl
uster.

An
alisis Discriminante.

An
alisis Factorial.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

An
alisis Cl
uster
Su objetivo es formar grupos de objetos (individuos) homog
eneos respecto a una
variedad de atributos que pueden ser tanto cualitativos como cuantitativos, de
forma que las observaciones pertenecientes a un grupo sean muy similares entre
s y muy disimilares del resto.
A diferencia del An
alisis Discriminante se desconoce el n
umero y la composici
on
de dichos grupos. El An
alisis de Clustering busca la formaci
on de grupos mientras
que el An
alisis Discriminante predice la pertenencia a grupos ya prefijados.
Ejemplos:
1

Detecci
on de subgrupos de pacientes con c
ancer de mama en funci
on de variables
clnicas y gen
eticas.

Agrupar diferentes frutas y verduras por sus caractersticas nutricionales (energa,


protenas, lpidos, gl
ucidos...)

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Los tipos de clustering variar


an en funci
on de 3 criterios:
1

Jer
arquico o no jer
arquico?

Qu
e m
etodo utilizamos para medir la similitud de los grupos?

Qu
e medida de distancia usaremos?

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

1. Jerarquico vs. no jerarquico

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

2. Metodo para medir la similitud entre grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

2. Metodo para medir la similitud entre grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

3. Tipo de medida de distancia utilizada.


Distancia eucldea

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

3. Tipo de medida de distancia utilizada.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Stata tiene implementado diversos metodos de analisis de


clustering:

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Clustering en Stata

Tambi
en en Stata, escogeremos el m
etodo de clustering que se ajuste a las contestaciones de las preguntas que ya comentamos:
1

Jer
arquico o no jer
arquico?

Qu
e m
etodo utilizamos para medir la similitud de los grupos?

Qu
e medida de distancia usaremos?

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Clustering en Stata

Independientemente del m
etodo elegido, seguiremos varios pasos:
1

Generamos el objeto cl
uster.

Visualizamos el dendrograma o
arbol de cl
uster (para algunos m
etodos no est
a implementado).

Extraemos informaci
on de los grupos detectados.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

1. Generamos un objeto cluster.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

2. Visualizamos el clustering mediante un dendrograma.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

3. Extraemos informacion sobre los grupos detectados

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Empezamos trabajando con el dataset homework.dta que describe la realizaci
on
de tareas dom
esticas de un grupo de 30 personas.
La matriz de datos tiene una dimensi
on de 30 filas y 61 columnas. Cada fila es
una persona y cada variable representa si esa persona realiza o no cada una de
las 60 tareas valoradas (variables binarias).
El objetivo es determinar grupos parecidos de personas seg
un las actividades
dom
esticas que realicen.
Para este primer ejemplo contamos con una informaci
on extra. El investigador nos
proporciona previamente a qu
e grupo pertenece cada individuo, seg
un sus criterios
(est
a recogido en la variable 61 del dataset). Esta referencia ser
a interesante para
evaluar como est
a trabajando nuestro clustering. Por supuesto, no ser
a habitual
que dispongamos de esta informaci
on al comienzo del estudio!

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Leemos los datos desde Stata. Tenemos varias posibilidades:
1. Insertando en la ventana de comandos:
use http://www.stata-press.com/data/r12/homework.dta
2. Recuperando el dataset del repositorio de datos de Stata: File / Example
Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual
3. Otra opci
on es directamente desde File / Open y seleccionamos el fichero de
datos en la carpeta donde lo tengamos almacenado.
En cualquier an
alisis estadstico que hagamos, siempre habr
a que realizar un
descriptivo que nos permita conocer nuestros datos:
Statistics / Summaries, tables and tests.
Graphics / Scatterplot matrix.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Paso 1. Generamos el objeto cluster:
Statistics / Multivariate Analysis / Cluster Analysis / Cluster Data

Si vamos al editor, observaremos que tenemos 3 nuevas variables: id, ord, hgt (id, orden
y altura). Son variables que proporcionan info sobre la construcci
on del clustering.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Paso 2. Representamos el dendrograma o
arbol cl
uster:
Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Dendrograms

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Paso 2. Representamos el dendrograma o
arbol cl
uster:
Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Dendrograms

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Paso 3. Extracci
on de informaci
on de los grupos generados:
Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Summary variables from cluster analysis

Tras la visualizaci
on del dendrograma, podemos decidir el n
umero de clusters con el que
queremos trabajar. Hemos escogido 3 y conoceremos que sujetos pertenecen a cada uno
de ellos. Esta informaci
on quedar
a incorporada en una nueva variable que se crear
a.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Paso 3. Extracci
on de informaci
on de los grupos generados:
Statistics / Summaries, tables and tests / Summary and descriptive statistics / Summary
statistics

En la pesta
na by if in , indicamos la variable que establece los grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Paso 3. Extracci
on de informaci
on de los grupos generados:
Statistics / Summaries, tables and tests / Summary and descriptive statistics / Summary
statistics

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:


Paso 3. Extracci
on de informaci
on de los grupos generados:
Statistics / Summaries, tables and tests /Table / Table of summary statistics

Como tenamos la asignaci


on real de sujetos a sus grupos iniciales, podemos evaluar
como ha realizado nuestro clustering la agrupaci
on de individuos: los resultados son
coincidentes!

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejemplo de analisis de clustering con Stata:

Paso 3. Extracci
on de informaci
on de los grupos generados:
Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Detailed listing
of clusters

Nos informa de las caractersticas del clustering utilizado.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Matrices de similitud/disimilitud

El an
alisis de clustering tambi
en se puede realizar sobre una matriz de similitud /
disimilitud.
Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 1: clustering jerarquico


Trabajaremos con el dataset labtech.dta disponible en File / Example Datasets
/ Stata 12 Manual Datasets / Multivariate Statistics Reference Manual
Los datos representan un par
ametro clnico medido en 50 pacientes. Para cada sujeto se determinaron 4 cuantificaciones a lo largo del da y las 4 fueron efectuadas
por el mismo t
ecnico.
De modo que nuestra matriz dispone de 50 filas (pacientes) y 5 columnas (una
para cada una de las 4 mediciones realizadas y una quinta columna con el nombre
del t
ecnico).
El objetivo del estudio es determinar si hay grupos homog
eneos de pacientes
considerando las medidas realizadas del par
ametro clnico.
Decidimos arbitrariamente elegir el clustering single-linkage con la distancia
eucldea que aparece por defecto.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 1: clustering jerarquico


Plan de trabajo:
1

Realiza una descripci


on de los datos. Explora gr
aficamente la relaci
on entre las
4 mediciones mediante gr
aficos de dispersi
on.

Realiza el an
alisis de clustering de las muestras obteniendo el correspondiente
dendrograma.

Hay alguna agrupaci


on clara en el
arbol del cluster? Detectas algo extra
no en
el dendrograma? Alguna explicaci
on?.
El an
alisis de clustering tambi
en constituye una buena herramienta de exploraci
on de los datos. Pista: cuando hagas el dendrograma cambia la variable
que se utiliza para dar nombre a las muestras y elige labtech que es el nombre
de los t
ecnicos de laboratorio.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 2: clustering no jerarquico

Trabajaremos con el dataset physed.dta disponible en File / Example Datasets /


Stata 12 Manual Datasets / Multivariate Statistics Reference Manual
Los datos recogen la informaci
on de velocidad, fuerza y flexibilidad de 80 personas
que participan en un programa de rehabilitaci
on.
Tenemos como objetivo determinar 4 grupos homog
eneos seg
un los atributos
fsicos medidos, para optimizar la formaci
on y asignaci
on de recursos dirigidos a
estos sujetos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 2: clustering no jerarquico


Plan de trabajo:
1

Leemos los datos en Stata.

Realiza un an
alisis descriptivo que nos permita conocer los datos con los que
estamos trabajando. Para empezar un resumen de estadsticos descriptivos y un
gr
afico de dispersi
on de las 3 variables estara bien.
Hay alg
un tipo de relaci
on entre las variables? A partir de este descriptivo
detectas la existencia de grupos de pacientes?.

Realiza el an
alisis de clustering no jer
arquico de las muestras utilizando el m
etodo
kmeans. Intenta realizar el correspondiente dendrograma. Alg
un problema?

Tras la realizaci
on del an
alisis de cl
uster, vamos a conocer mejor los grupos detectados. Contesta la siguientes preguntas:

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 2: clustering no jerarquico

Plan de trabajo:
Cu
antas personas est
an incluidas en cada uno de los 4 grupos?
Nos gustara conocer la media, mnimo y m
aximo de los atributos evaluados para
cada grupo y as confirmaremos si realmente est
an bien diferenciados. Comenta
los resultados.
Por u
ltimo, representa de nuevo los datos utilizando los gr
aficos de dispersi
on
pero esta vez en lugar de que aparezcan puntos, mejor si indicamos que aparezca
el n
umero del grupo al que pertenece cada sujeto, as visualizaremos la relaci
on
entre las variables incorporando esta informaci
on.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 2: clustering no jerarquico


Resultados:

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 2: clustering no jerarquico


Resultados:

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 2: clustering no jerarquico


Resultados:

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de clustering
Clustering con Stata
Ejercicios

Ejercicio 2: clustering no jerarquico


Resultados:

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

An
alisis Discriminante
Esta t
ecnica presenta reglas de clasificaci
on o
ptimas de nuevas observaciones de las que
se desconoce su grupo de procedencia bas
andose en la informaci
on proporcionada los
valores que en ella toman las variables independientes.

Ejemplos:
1

Determinar las variables clnicas que permitan discriminar mejor entre pacientes
de alto/no alto riesgo en una Unidad de Medicina Intensiva.

En planificaci
on y gesti
on sanitaria tambi
en se presentan problemas de discriminaci
on. C
omo se explican las diferencias entre los usuarios de la sanidad p
ublica
y la privada?, hasta qu
e punto son el nivel de renta, la gravedad de los sntomas,
etc., responsables de la elecci
on de m
edico? Las encuestas de salud proporcionan
informaci
on de base suficiente para contestar a estas preguntas con ayuda del
An
alisis Discriminante.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Tipos de An
alisis Discriminante:
1

Linear Discriminant Analysis (LDA).

Quadratic Discriminant Analysis (QDA).

Logistic Discriminant Analysis.

K th-Nearest-Neighbor Discriminant Analysis.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Tipos de An
alisis Discriminante:

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Como realizamos el Analisis Discriminante en Stata?

Varios pasos:
1

Descripci
on de los datos.

Estimaci
on del modelo.

Evaluaci
on del modelo y predicci
on.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Como realizamos el Analisis Discriminante en Stata?

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Empezamos trabajando con el dataset twogroups.dta que incluye 30 observaciones y
tres variables. La primera establece dos grupos y las variables x, y son las que discriminan
la pertenencia a un determinado grupo.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 1. Descripci
on de los datos: Graphs / Twoways graph: scatter

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 1. Descripci
on de los datos: Graphs / Twoways graph: scatter

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 1. Descripci
on de los datos: Graphs / Twoways graph: scatter

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 2. Estimaci
on del modelo:
Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 2. Estimaci
on del modelo:
Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 2. Estimaci
on del modelo:
Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 2. Estimaci
on del modelo:
Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Reports and statistics

Descripci
on de los datos por grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Reports and statistics

Descripci
on de los datos por grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Reports and statistics

Descripci
on de los datos por grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Reports and statistics

Descripci
on de los datos por grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Reports and statistics

Evaluaci
on del modelo: tasa de error por grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Reports and statistics

Evaluaci
on del modelo: tasa de error por grupos.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Reports and statistics

Evaluaci
on del modelo: sujetos mal clasificados.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Reports and statistics

Evaluaci
on del modelo: sujetos mal clasificados.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejemplo de Analisis Discriminante con Stata:


Paso 3. Evaluaci
on y predicci
on del modelo: Postestimation / Predictions and errors

Predicci
on para un nuevo caso o sujeto.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejercicio 1: Analisis Discriminante Lineal (DLA)

Trabajaremos con el dataset lawnmower2 disponible en File / Example Datasets


/ Stata 12 Manual Datasets / Multivariate Statistics Reference Manual
Tenemos 24 individuos con informaci
on correspondiente a tres variables: owner
que establece los dos grupos que hay en el dataset (propietario y no propietario),
income y lotsize son las dos variables que discriminan si un sujeto pertenece a un
grupo u a otro.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejercicio 1: Analisis Discriminante Lineal (DLA)

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
Tipos de An
alisis Discriminante
An
alisis Discriminante con Stata
Ejercicios

Ejercicio 1: Analisis Discriminante Lineal (DLA)


Plan de trabajo:
1

Realiza una descripci


on de los datos. Explora gr
aficamente los datos mediante un diagrama de dispersi
on. Crees que est
an bien diferenciados los sujetos
pertenecientes a cada grupo?

Realiza un an
alisis de discriminante DLA y pide la tabla de clasificaci
on Leaveone-out. Interpreta esta tabla, es un buen clasificador el modelo que hemos
escogido?. Describe con detalle el funcionamiento de las matrices de confusi
on:
significado de los valores que est
an en la diagonal, en los extremos. . .

Vamos a acercarnos un poco m


as a nuestros datos y al modelo que hemos
generado:
- Desde el men
u de Postestimation realiza un descriptivo por grupos para
ver como se comportan las variables.
- Por sujetos: lista aquellos sujetos mal clasificados y comenta los resultados que
nos ofrece STATA.
- Por grupos: cu
al es el grupo que presenta una probabilidad de error m
as alta?

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

An
alisis Factorial
Se utiliza para analizar interrelaciones entre un n
umero elevado de variables cuantitativas
explicando dichas interrelaciones en t
erminos de un n
umero menor de variables que se
denominan factores o componentes principales.

An
alisis Factorial vs. An
alisis de Componentes Principales:
El An
alisis Factorial y el An
alisis de Componentes Principales est
an muy relacionados. Algunos autores consideran el segundo como una etapa del primero.

El An
alisis de Componentes Principales trata de hallar componentes (factores)
que sucesivamente expliquen la mayor parte de la varianza total. Por su parte
el An
alisis Factorial busca factores que expliquen la mayor parte de la varianza
com
un.
El An
alisis Factorial supone que existe un factor com
un subyacente a todas las
variables, el An
alisis de Componentes Principales no hace tal asunci
on.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplos:
1

Si un psic
ologo quiere determinar los factores que caracterizan la inteligencia de
un individuo a partir de sus respuestas a un test de inteligencia, utilizara para
resolver este problema un An
alisis Factorial.

Determinaci
on de indicadores que midan las necesidades en los servicios sociales
de una ciudad a partir de datos de indicadores socioecon
omicos y demogr
aficos.
An
alisis de Componentes Principales.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Analisis Factorial con Stata

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Analisis Factorial con Stata

Varios pasos:
1

Descripci
on de los datos.

Elecci
on y realizaci
on del tipo de an
alisis: Factorial / Componentes Principales.

Post-estimaci
on: evaluaci
on de resultados.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:

Disponemos del set de datos audiometric.dta que incluye mediciones audiom


etricas de
ni
nos de 9 a
nos. Se midieron 4 intensidades diferentes para el odo derecho y el izquierdo.
As por ejemplo la variable lft1000 hace reference al odo izquierdo en la frecuencia 1000
Hz.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Paso 1. Descripci
on de los datos: correlaciones
Statistics / Summaries, tables, and tests / Summary and descriptive statistics / Correlations and covariances

La matriz de correlaciones de todas las variables nos proporciona una informaci


on
interesante sobre la relaci
on existente entre ellas.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Paso 2. An
alisis de Componentes Principales
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Seleccionamos las variables sobre las que realizaremos el an


alisis factorial.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Paso 2. An
alisis de Componentes Principales
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Elegimos el m
etodo de an
alisis factorial.
En este caso PCA (Principal Component Factor).

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Paso 2. An
alisis de Componentes Principales
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Descripci
on de las variables.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Paso 2. An
alisis de Componentes Principales
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Lista de valores propios y la proporci


on de variabilidad explicada.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Paso 2. An
alisis de Componentes Principales
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Componentes principales para cada variable.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Post-estimaci
on: evaluaci
on de resultados.
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Screeplot. Gr
afico de los valores propios.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Post-estimaci
on: evaluaci
on de resultados.
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Screeplot. Gr
afico de los valores propios.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Post-estimaci
on: evaluaci
on de resultados.
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Representaci
on gr
afica de las variables mediante sus dos primeras componentes
principales.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Post-estimaci
on: evaluaci
on de resultados.
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Representaci
on gr
afica de las variables mediante sus dos primeras componentes
principales.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Post-estimaci
on: evaluaci
on de resultados.
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Representaci
on de las observaciones mediante las puntuaciones en sus dos primeras
componentes principales.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Ejemplo de Analisis de Componentes Principales con Stata:


Post-estimaci
on: evaluaci
on de resultados.
Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Representaci
on de las observaciones mediante las puntuaciones en sus dos primeras
componentes principales.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Objetivos
An
alisis Factorial con Stata

Referencias bibliogr
aficas:
An
alisis Multivariante. Aplicaci
on al
ambito sanitario. Beatriz Gonz
alez L
opezValc
arcel. Editores SG.
Manual de Stata, versi
on 12.

Francisco Garca Garca

An
alisis Multivariante son Stata

Introducci
on
Clustering
An
alisis Discriminante
An
alisis Factorial

Francisco Garca Garca

Objetivos
An
alisis Factorial con Stata

An
alisis Multivariante son Stata

También podría gustarte