Documentos de Académico
Documentos de Profesional
Documentos de Cultura
introduccin
El anlisis discriminante se utiliza para describir las diferencias entre grupos y
explotar las diferencias en la asignacin (clasificacin) observaciones de
pertenencia a un grupo desconocido para los grupos. El anlisis discriminante
tambin se llama clasificacin en muchas referencias. Sin embargo, varias
fuentes utilizan la palabra de clasificacin en el sentido de anlisis de
conglomerados. Algunas aplicaciones del anlisis discriminante incluyen el
diagnstico
mdico,
la
investigacin
de
mercado,
la
clasificacin
de
Key
Number
Percent
Classified
nonowner
True owner
owner
Total
nonowner
10
83.33
2
16.67
12
100.00
owner
1
8.33
11
91.67
12
100.00
Total
11
45.83
13
54.17
24
100.00
Priors
0.5000
0.5000
Con clasificacin dejar uno fuera vemos que 5, en lugar de slo el 3, de las 24
observaciones mal clasificados.El predicen y comandos estat ofrecen otras
herramientas de anlisis discriminante predictivo. predecirgenera las variables
que contienen la parte posterior probabilidades de pertenencia a un grupo o
genera un grupomembresa variable de clasificacin. estat muestra cuadros de
clasificacin, muestra las tablas de tasas de error, yenumera las clasificaciones
y las probabilidades para las observaciones.Ahora usamos lista estat para
mostrar
el
resubstitution
posteriorprobabilidades
para
dejar
aquellas
fuera
de
una
observaciones
clasificacin
que
fueron
y
mal
Classification
Obs.
1
2
13
14
17
True
owner
owner
nonown
nonown
nonown
Class.
LOO Cl.
nonown *
owner
owner *
nonown
owner *
nonown
nonown
owner
owner
owner
Probabilities
LOO Probabilities
nonowner
owner
nonowner
owner
0.7820
0.4945
0.2372
0.5287
0.3776
0.2180
0.5055
0.7628
0.4713
0.6224
0.8460
0.6177
0.1761
0.4313
0.2791
0.1540
0.3823
0.8239
0.5687
0.7209
*
*
*
*
*
anlisis
discriminante
descriptivo;
ver
[MV]
discrim
lda
lote
afecta
la propiedad
de
montar
de
csped.
Anlisis
.3795228
.0484468
-11.96094
.7845512
.8058419
Echemos un vistazo a los datos. Siempre es una buena idea empezar con
estadstica descriptiva.
Variable
Obs
Mean
outdoor
social
conservative
244
244
244
15.63934
20.67623
10.59016
Std. Dev.
4.839933
5.479262
3.726789
Min
Max
0
7
0
28
35
20
tabstat outdoor social conservative, by(job) stat(n mean sd min max) col(stat)
Summary for variables: outdoor social conservative
by categories of: job
job
mean
sd
min
max
customer service
85
85
85
12.51765
24.22353
9.023529
4.648635
4.335283
3.143309
0
12
2
22
35
17
mechanic
93
93
93
18.53763
21.13978
10.13978
3.564801
4.55066
3.242354
11
9
0
28
29
17
dispatch
66
66
66
15.57576
15.45455
13.24242
4.110252
3.766989
3.69224
4
7
4
25
26
20
Total
244
244
244
15.63934
20.67623
10.59016
4.839933
5.479262
3.726789
0
7
0
28
35
20
tabulate job
1.0000
-0.0713
0.0794
social conser~e
1.0000
-0.2359
1.0000
job
Freq.
Percent
Cum.
customer service
mechanic
dispatch
85
93
66
34.84
38.11
27.05
34.84
72.95
100.00
Total
244
100.00
Este
Fcn
Canon.
Corr.
Eigenvalue
1
2
0.7207
0.4927
1.08053
.320504
Variance
Prop.
Cumul.
Likelihood
Ratio
0.7712
0.2288
0.3640
0.7573
0.7712
1.0000
F
52.382
38.46
df1
df2
Prob>F
6
2
478
240
0.0000 e
0.0000 e
e = exact F
outdoor
social
conservative
function1
function2
.3785725
-.8306986
.5171682
.9261104
.2128593
-.2914406
function1
function2
.3230982
-.7653907
.467691
.9372155
.2660298
-.2587426
Canonical structure
outdoor
social
conservative
discriminantes
no
observados
(dimensiones).
Las
funciones
customer service
mechanic
dispatch
group1
group2
group3
function1
function2
-1.2191
.1067246
1.419669
-.3890039
.7145704
-.5059049
Key
Number
Percent
Classified
group1 group2
True
group3
Total
group1
70
82.35
11
12.94
4
4.71
85
100.00
group2
16
17.20
62
66.67
15
16.13
93
100.00
group3
3
4.55
12
18.18
51
77.27
66
100.00
Total
89
36.48
85
34.84
70
28.69
244
100.00
Priors
0.3333
0.3333
0.3333
La salida incluye los medios de las funciones discriminantes para cada uno de
los tres grupos y una tabla de clasificacin. Los valores en la diagonal de la
tabla de clasificacin reflejan la correcta clasificacin de los individuos en
grupos en funcin de sus puntuaciones en las dimensiones discriminantes.
Por defecto, Stata asume a priori un nmero igual de personas en cada puesto
de trabajo. Esto se represneted por los 0.3333 Priores en la tabla anterior. Si
usted tiene diferentes proporciones esperadas en mente, usted puede
especificar con la opcin priores.
A continuacin, vamos a trazar un grfico de las personas en las dimensiones
discriminantes. Debido a la gran cantidad de temas vamos a acortar las
etiquetas para los grupos de trabajo para hacer que el grfico sea ms legible.
Mientras no salvamos el conjunto de datos, estas nuevas etiquetas no se har
permanente.
label define job 1 "c" 2 "m" 3 "d", modify
scoreplot, msymbol(i)
-2
discriminant score 2
0
2
Las
-4
m
m
m
c m
mc
m
mc
d
mcc m
md m m
c
mm
mm
m
m
m
m
m
m
mm mm
m
d
m
m
c cc c m
m
c mmm m d
m m
m
c m ccmc c m
m mm m m
m
md
m
c
m
c cm
m
d
m
d
mm mmmm
mc m
m mm
d dd
c cc
c cm
d
m
c
c
d
d
m
m
m
d
m
d
m
c c cc m mc c d
c cmdc m dm
m dd m
dd d d d d d d
m
cmdmd
c
d
c
c
d d
c
c
c c c cc
d
cc cd cm
cm
c d dm
mmm dd d
ccc c
d
d
d d dd d
d
m
m
c
d
c
c
d
c
m
c
m d
c
d
c
c
d
d c
c
d c cc c
dd
d
c c
c c
c c
c
c
d
c
d
d d
d
c
c
d
c
c
d
-4
-2
0
discriminant score 1
outdoor
social
-.5
conservative
-1
-.5
0
Standardized discriminant function 1
.5