Está en la página 1de 57

1

PERHITUNGAN PREMI ASURANSI JIWA BERJANGKA


MENGGUNAKAN MODEL STOKASTIK
TINGKAT SUKU BUNGA


Raden Muhamad Soffan

PT. Heksa Eka Life Insurance



ABSTRAK

Perhitungan Premi Asuransi Jiwa biasanya didasarkan pada asumsi bahwa tingkat
suku bunga bergerak secara tetap sepanjang waktu. Tentu saja asumsi ini tidak
sesuai dengan kenyataan yang ada bahwa tingkat suku bunga bergerak secara
fluktuatif. Untuk itu diperlukan model stokastik tingkat suku bunga yang telah
mempertimbangkan pergerakan tingkat suku bunga secara fluktuatif. Perhitungan
Premi dalam tulisan ini menggunakan model Vasicek sebagai model tingkat suku
bunga. Model ini merupakan model yang mengikuti fenomena mean reverting
bahwa untuk waktu yang semakin lama tingkat suku bunga akan konvergen pada
nilai tertentu dan tidak tergantung pada berapa nilai r
0
yang ditentukan.
Perhitungan Premi asuransi jiwa berjangka dilakukan untuk dua kasus, yaitu
kasus kontinu dan kasus diskrit. Untuk kasus kontinu, manfaat dibayarkan saat
meninggal dunia. Hukum mortalita Gompertz digunakan sebagai dasar
perhitungan premi untuk kasus kontinu.Untuk kasus diskrit, manfaat dibayarkan
di akhir tahun polis saat meninggal dunia.
Kata Kunci : Perhitungan premi, Model Vasicek, Mean Reverting, Hukum
Mortalita Gompertz

1. PENDAHULUAN
Perhitungan premi dengan mangasumsikan bahwa tingkat suku bunga
bergerak secara tetap sepanjang waktu tidak sesuai dengan kenyataan yang ada
karena tingkat suku bunga bergerak secara fluktuatif. Dalam beberapa tahun
terakhir ini, banyak literatur yang memperkenalkan perhitungan premi yang
melibatkan model stokastik tingkat suku bunga untuk mempertimbangkan kondisi
pergerakan tingkat suku bunga yang bergerak secara fluktuatif. Model Vasicek
adalah model stokastik tingkat suku bunga yang banyak digunakan dalam bidang
finansial dan mengikuti fenomena mean reverting bahwa untuk waktu yang
semakin lama tingkat suku bunga akan konvergen pada nilai tertentu.
Pembahasan dalam tulisan ini akan dimulai dengan bagian 2 mengenai
Model Vasicek, kemudian dilanjutkan dengan bagian 3 yang membahas
perhitungan premi dengan melibatkan model stokastik tingkat suku bunga, lalu
dilengkapi dengan bagian 4 yang membahas hasil empiris dari simulasi
perhitungan premi, dan terakhir di bagian 5 ditutup dengan kesimpulan dan saran.
2



2. MODEL VASICEK
Apabila tingkat suku bunga sedang naik, maka kondisi perekonomian
akan menurun. Hal ini disebabkan karena menurunnya permintaan pinjaman yang
berakibat pada menurunnya pertumbuhan ekonomi. Sebaliknya ketika tingkat
suku bunga sedang turun, maka kondisi perekonomian sedang bangkit karena
permintaan pinjaman meningkat yang akan menggerakkan kegiatan perekonomian
dan akhirnya akan meningkatkan pertumbuhan ekonomi. Fenomena ini dalam
ilmu ekonomi disebut sebagai equilibrium atau mean reverting. Jon Exley, Shyam
Mehta, dan Andrew Smith (2004) menuliskan bahwa sebuah aset dikatakan
sebagai mean reverting apabila harganya turun setelah mengalami kenaikan, dan
harganya akan naik setelah mengalami penurunan.
Berangkat dari kondisi ekonomi di atas, Vasicek pada tahun 1977
merekomendasikan sebuah model persamaan diferensial stokastik untuk tingkat
suku bunga. Model ini telah mengakomodir fenomena mean reverting. Model
Vasicek dituliskan dalam bentuk persamaan diferensial stokastik berikut ini :

Jr( t) = o (p r( t) ) Jt + o Jw( t) , r( 0) = r
0
(1)

dengan r( t) adalah tingkat suku bunga pada saat ke-t. o (p r( t) ) disebut
sebagai drift. o adalah speed of reversion, p adalah the long run equilibrium value
of the process atau mean reverting, o diinterpretasikan sebagai volatility yang
menggambarkan pergerakan yang fluktuatif dari tingkat suku bunga, dan w
t

adalah Proses Wiener. Parameter o, p, dan o memiliki nilai positif.
Apabila r( t) > p, maka drift akan bernilai negatif dan artinya tingkat
suku bunga akan menurun menuju nilai equilibriumnya. Begitupun apabila
r( t) < p, maka drift bernilai positif dan artinya tingkat suku bunga akan bergerak
naik menuju nilai equilibriumnya. Hal ini sesuai dengan kondisi ekonomi yang
telah dibahas sebelumnya.
Dengan menggunakan teorema formula Ito diperoleh solusi dari model
Vasicek di atas, yaitu :
r( t) = p + ( r
0
p) c
-ut
+ o c
-u( t-u)
Jw( u)
t
0
( 2)
Diperoleh ekspektasi dan variansi bersyarat bila diketahui r( 0) = r
0
, yaitu :
E( r( t) | r( 0) = r
0
) = p + ( r
0
p) c
-ut
( 3)
Ior( r( t) | r( 0) = r
0
) =
o
2
2o
( 1 c
-2ut
) ( 4)
Untuk nilai t yang besar maka E( r( t) | r( 0) = r
0
) akan menuju p. Dengan kata
lain bahwa
l i m
t
E( X
t
| X
0
= x
0
) = l i m
t
p + ( x
0
p) c
-ut
= p ( 5)
Hal ini mendukung teori mengenai mean reverting, bahwa dalam jangka panjang
tingkat suku bunga akan konvergen pada suatu nilai tertentu.
Untuk t
-1
< t

, fungsi kepadatan peluang dari r


t
i
yaitu

(r
t
i
; o, p, o)
adalah

3

(r
t
i
; o, p, o) = ( 2n)
-
1
2
_
o
2
2o
(1 c
-2u( t
i
-t
i-1
)
)_
-
1
2

cxp_
(r
t
i
p (r
t
i
p) c
-u( t
i
-t
i-1
)
)
2
2
o
2
2o
( 1 c
-2u( t
i
-t
i-1
)
)
_

Misalkan terdapat n + 1 data observasi dari suatu proses r, yaitu r
0
, r
1
, , r
n
,
maka fungsi log likelihood adalah
I( r; o, p, o) =
n
2
l og _
o
2
2o
_

1
2
l og|1 c
-2u( t
i
-t
i-1
)
]
n
=1

o
o
2

(r
t
i
p ( r
t-1
p) c
-u( t
i
-t
i-1
)
)
2
1 c
-2u( t
i
-t
i-1
)
n
=1
( 6)
Parameter maximum likelihood estimation (mle) o, p , dan
memaksimumkan fungsi log likelihood. Untuk menyelesaikan hal ini, digunakan
metode Quasi Newton dengan langkah BFGS sebagai salah satu metode numerik
untuk persamaan non linear dalam mencari o, p , dan yang optimal. Dalam
mencari estimasi untuk setiap parameter digunakan data observasi atau data
berdasarkan pengalaman tingkat suku bunga dari waktu ke waktu.


3. PERHITUNGAN PREMI
3.1. Hukum Mortalita
Tingkat mortalita diasumsikan mengikuti Hukum Mortalita Gompertz
yang memiliki karakteristik berikut ini :
(1) Force of Mortality :

p
x+t
= BC
x+t
, B > 0, C > 1, x 0 (7)

(2) Survival Function :

s( x) = cxp_
B
l n C
( C
x
1) _ ( 8)


Parameter B dan C dari Hukum Mortalita Gompertz dapat diestimasi
dengan mencocokkan l
x
, yaitu ekspektasi jumlah tertanggung yang hidup sampai
usia x yang diperoleh datanya dari suatu tabel mortalita, dengan l
`
x
yang
memenuhi Hukum Mortalita Gompertz dengan persamaan sebagai berikut :

l
`
x
= l
0
s( x) = l
0
cxp _
B
l n C
( C
x
1) _ ( 9)
4



Pencocokan tersebut akan dilakukan dengan menggunakan metode kuadrat
terkecil dalam regresi non linear.

3.2. Kasus Kontinu
Dalam kasus kontinu, manfaat asuransi dibayarkan tepat saat tertanggung
meninggal dunia. Misalkan I( x) adalah variabel acak yang menyatakan Future
Life Time. Misalkan Z adalah variabel acak yang menyatakan present value di
saat polis disetujui dari manfaat yang dibayarkan dan b
t
adalah fungsi manfaat
asuransi yang dibayarkan saat t ketika tertanggung meninggal dunia serta :
t

adalah fungsi diskonto dari tahun pembayaran manfaat asuransi dibayarkan yaitu
saat t ke tahun saat polis disetujui. Apabila z
t
adalah nilai present value dari b
t
,
maka dapat dinyatakan bahwa :

z
t
= b
t
:
t


Dengan demikian variabel acak Z dapat dinyatakan sebagai berikut :

Z = b
1
:
1


Sesuai manfaat asuransi yang diberikan, asuransi jiwa berjangka dapat dinyatakan
sebagai berikut :

b
t
= ]
1 t n
0 t > n


:
t
= :
t
t 0

Z = _
:
1
I n
0 T > n



Premi Tunggal Bersih atau Actuarial Present Value yang disimbolkan oleh A
i

x: n|
,
dinyatakan sebagai berikut :

A
i

x:n|
= E( Z)
= E( z
1
) = _ z
t

1( x)
( t) Jt

0

= _:
t
p
t x
p( x + t)
n
0
Jt ( 10)

5

dengan x adalah usia tertanggung saat mulai asuransi. p
t x
adalah peluang
tertanggung berusia x hidup sampai t tahun kemudian, p( x + t) adalah force of
mortality dari tertanggung berusia x + t yang mengikuti Hukum Mortalita
Gompertz, dan :
t
dapat dituliskan sebagai berikut :
:
t
= cxp__r( s)
t
0
Js_

dengan Tingkat suku bunga r( t) diasumsikan mengikuti model stolastik Vasicek.


3.3. Kasus Diskret

Dalam kasus diskrit, manfaat asuransi dibayarkan di akhir tahun ketika
tertanggung meninggal dunia. Misalkan K( x) adalah variabel acak yang
menyatatakan Curtate Future Life Time. Misalkan notasi Z adalah
merepresentasikan variabel acak yang menyatakan present value di saat polis
disetujui dari manfaat yang dibayarkan, b
k+1
adalah menyatakan fungsi manfaat
asuransi yang dibayarkan di akhir tahun ke k + 1 ketika tertanggung meninggal
dunia, dan :
k+1
adalah fungsi diskonto dari tahun pembayaran manfaat asuransi
dibayarkan yaitu di akhir tahun k + 1 sampai saat polis disetujui. Apabila z
k+1

adalah nilai present value dari b
k+1
, maka dapat dinyatakan bahwa :

z
k+1
= b
k+1
:
k+1


Dengan demikian variabel acak Z dapat dinyatakan sebagai berikut :

Z = b
K+1
:
K+1


Sesuai manfaat asuransi yang diberikan, asuransi jiwa berjangka dapat dinyatakan
sebagai berikut :

b
k+1
= _
1 k = 0, 1, 2, , n 1
0 l ai nnya


:
k+1
= :
k+1


Z = _
:
K+1
K = 0, 1, 2, , n 1
0 l ai nnya



Premi Tunggal Bersih atau Actuarial Present Value yang disimbolkan oleh A
i
x: n|
,
dinyatakan sebagai berikut :

A
i
x:n|
= E( Z) = :
k+1

K
( x)
n-1
k=0

6

= :
k+1
p
k x
q
x+k
n-1
k=0

= :
k+1
q
k| x
n-1
k=0
( 11)
dengan x adalah usia tertanggung saat mulai asuransi, p
k x
adalah peluang
tertanggung berusia x hidup sampai k tahun kemudian, q
x+k
adalah peluang
tertanggung yang berusia x + k akan meninggal 1 tahun kemudian, q
k| x
adalah
peluang tertanggung berusia x akan hidup k tahun kemudian dan meninggal 1
tahun setelahnya, dan :
k+1
adalah faktor diskonto yang dapat dituliskan sebagai
berikut :
:
k+1
= _
1
1 + E( r( i) | r( 0) = r
0
)
k+1
=1


dengan r( i) mengikuti model Vasicek yang diubah dalam bentuk diskrit dengan
memanfaatkan sifat dari Brownian Motion menjadi :
r( t + 1) = r( t) + o(p r( t) ) ( t

t
-1
) + o e t

t
-1
, r( 0) = r
0
(12)


4. HASIL EMPIRIS DAN SIMULASI

4.1. Estimasi Parameter Model Vasicek

Untuk mengestimasi parameter Model Vasicek dalam studi kasus ini
akan menggunakan data observasi berupa rata-rata tahunan tingkat suku bunga
SBI 1 bulan dari tahun 1992 sampai Juli 2010 seperti dalam grafik berikut ini :




Gambar 1 Rata-rata Tahunan Tingkat Suku Bunga SBI Tahun 1992 Juli 2010


7

Dengan menggunakan metode maximum likelihood yang dilakukan
dengan menggunakan metode numeric Quasi Newton langkah BFGS diperoleh
estimasi parameter Model Vasicek sebagai berikut :

Tabel 1 Estimasi Parameter Model Vasicek
Parameter Nilai Estimasi
o 0.7718020
p 0.1362509
o 0.1170741


5. PERHITUNGAN PREMI UNTUK KASUS KONTINU
Misalkan untuk studi kasus perhitungan ini menghitung premi asuransi
berjangka dengan manfaat asuransi Rp. 1000,00 dalam masa asuransi 10 tahun
untuk seorang tertanggung dengan usia saat masuk asuransi 40 tahun. Perhitungan
Premi Tunggal Bersih untuk kasus kontinu akan dilakukan dengan langkah-
langkah sebagai berikut:

(1) Dengan mencocokkan nilai l
x
dari Tabel Mortalita CSO 1958 dengan l
`
x
yang
memenuhi Hukum Mortalita Gompertz melalui metode kuadrat terkecil,
diperoleh parameter Gompertz yaitu B dan C seperti terlihat dalam Tabel 2
berikut ini :

Tabel 2 Estimasi Parameter Hukum Mortalita Gompertz
B C
0,00020659 1.0806

Gambar 2 berikut ini menunjukkan kecocokkan antara l
x
dari Tabel Mortalita
CSO 1958 dengan l
`
x
yang memenuhi Hukum Mortalita Gompertz.


Gambar 2 Kecocokan l
x
dalam Tabel Mortalita CSO 1958 dengan l
`
x


0 10 20 30 40 50 60 70 80 90 100
0
1
2
3
4
5
6
7
8
9
10
x 10
4
Kecocokan lx CSO 1958 dan lx^
x
l
(
x
)
8

(2) Tentukan Nilai r
0
. Misalkan r
0
dipilih data pada tahun terakhir yaitu pada
tahun 2010 sebesar 6,36%.
(3) Hitung E( r( t) ; r( 0) = r
0
) untuk suatu t dengan menggunakan persamaan (3)
(4) Hitung Premi dengan menggunakan Persamaan (10).

Dengan melakukan langkah-langkah di atas, untuk kasus kontinu diperoleh premi
sebesar Rp. 27,30. Jadi, dengan manfaat asuransi sebesar Rp. 1000,00 seorang
tertanggung yang berusia 40 tahun saat mulai asuransi harus membayar premi
tunggal bersih sebesar Rp. 27,30 untuk perlindungan asuransi jiwa berjangka
selama 10 tahun.


6. PERHITUNGAN PREMI UNTUK KASUS DISKRET
Misalkan untuk studi kasus perhitungan ini menghitung premi asuransi
berjangka dengan manfaat asuransi Rp. 1000,00 dalam masa asuransi 10 tahun
untuk seorang tertanggung dengan usia saat masuk asuransi 40 tahun.Perhitungan
premi asuransi jiwa berjangka untuk kasus diskrit dilakukan dengan langkah-
langkah sebagai berikut :
(1) Tentukan Nilai r
0
. Misalkan r
0
dipilih data pada tahun terakhir yaitu pada
tahun 2010 sebesar 6,36%.
(2) Bangkitkan variabel acak e yang berdistribusi Normal Standar sebanyak t
yang diulang N kali. Dalam simulasi ini akan dibangkitkan dengan t=1,2 , ,
100, dan diulang sebanyak 1000 kali.
(3) Hitung r( t) untuk setiap t dengan menggunakan Persamaan (12). Nilai
E( r( t) | r( 0) = r
0
) yaitu rata-rata r( t) untuk setiap t yang diulang sebanyak
1000 kali digambarkan oleh grafik sebagai berikut :



Gambar 3 Konvergensi r( t) pada parameter p

0 20 40 60 80 100 120
0.06
0.07
0.08
0.09
0.1
0.11
0.12
0.13
0.14
0.15
Konvergensi r(t)
t
r
(
t
)
9

Tampak bahwa r( t) konvergen di sekitar nilai p yaitu 13,62509%. Penentuan
nilai r
0
tidak akan merubah konvergensi r( t) menuju p. Gambar 4 berikut
menunjukkan bahwa konvergensi r( t) ke sekitar p tidak tergantung dari
pemilihan nilai r
0
.




Gambar 4 Konvergensi r( t) untuk setiap r
0
yang berbeda

(4) Pada perhitungan ini nilai q
x
diambil dari Tabel Mortalita CSO 1958.
Dengan menggunakan Persamaan (12) diperoleh Premi sebesar Rp. 28,07.
Jadi, dengan manfaat asuransi sebesar Rp. 1000,00 seorang tertanggung yang
berusia 40 tahun saat mulai asuransi harus membayar premi tunggal bersih
sebesar Rp. 28,07 untuk perlindungan asuransi jiwa berjangka selama 10
tahun.


7. KESIMPULAN DAN SARAN
Model Vasicek adalah salah satu model yang mengikuti fenomena mean
reverting bahwa untuk waktu yang semakin lama tingkat suku bunga akan
konvergen pada nilai tertentu. Konvergensi r( t) menuju p tidak tergantung pada
berapa nilai r
0
yang ditentukan. Berapapun nilai r
0
akan tetap konvergen pada p.
Perhitungan Premi Neto Asuransi Jiwa Berjangka dengan melibatkan model
stokastik tingkat suku bunga, dalam hal ini model Vasicek, telah
mempertimbangkan keadaan mean reverting yang sesuai dengan keadaan
ekonomi yang terjadi. Untuk mengembangkan tulisan ini, dapat dianalisa lebih
lanjut mengenai variansi dari tingkat suku bunga.




0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
0 4 8
1
2
1
6
2
0
2
4
2
8
3
2
3
6
4
0
4
4
4
8
5
2
5
6
6
0
6
4
6
8
7
2
7
6
8
0
8
4
8
8
9
2
9
6
1
0
0
Konver gensi r (t ) unt uk r
o
ber beda
r 0 : 6.36% r 0 : 10% r 0 : 15% r 0 : 20%
r 0 : 30% r 0 : 40% r 0 : 50%
10

8. REFERENSI

Bowers, N.L., Gerber, H.U., Hickman, J.C., Jones, D.A., dan Nesbitt, C.J. 1997.
Actuarial Mathematics, 2nd edition: The Society of Actuaries.
Dervis Bayazit. 2004. Yield Curve Estimation and Prediction with Vasicek Model:
The Middle East Technical University.
Edward W. Frees. 1990. Stochastic Life Contingencies with Solvency
Consideration: Transaction of Society of Actuaries.
Gary Parker. 1994. Distribution of Present Value of Future Cash Flow : Simon
Fraser University.
G.A.F Serber, C.J Wild. 2003. Nonlinear Regression: A John Wiley & Sons Inc
Publication.
George Roussas. 2003. An Introduction to Probability and Statistical Inference:
Academic Press.
H. A Waters, M.A, D.PHIL, FIA. 1978. The Moments and Distribution of
Actuarial Function: JIA.
Igor Griva, Stephen G. Nash, Ariela Sofer. 2009. Linear and Nonlinear
Optimization: Society Industrial and Applied Mathematics.
John A. Beekman and Clinton P. Fuelling. 1991. Interest and Mortality
Randomness in Some Annuities : Ball State University, Muncie, USA.
Jon Exley, Shyam Mehta, Andrew Smith. 2004. Mean Reversion, presented to
Faculty and Investment of Actuaries : Finance and Investment Conference,
Brussels.
Jose Carlos Garcia Franco. (tanpa tahun). Maximum Likelihood Estimation of
Mean Reverting Processes, Onward Inc.
Jordan, C.W Jr. 1991. Life Contingencies: Society of Actuaries, USA.
L. Noviyanti, Syamsuddin. (2005). Life Insurance with Stochastic Interest Rate :
The Proceeding of The 13
th
East Asian Actuarial Conference, Denpasar
Bali.
Masaki Kijima. 2003. Stochastic Process with Application to Finance: Chapman
& Hall/Crc.
Ocke Kurniandi. (tanpa tahun). Stochastic Model for premium Calculation Under
Syariah Law: PT. MAA Life Assurance Indonesia.
Sheldon Ross. 2006. A First Course in Probability 7
th
edition: Pearson Prentice
Hall.
Stefano M. Lacus. 2008. Simulation and Inference for Stochastic Differential
Stochastic with R Examples: Springer.
Syamsuddin. 2009. Workshop Matematika Keuangan : Jurusan Statistika
FMIPA UNPAD Bandung.
www.bi.go.id/web/id/Moneter/Operasi+Moneter/Suku+Bunga+SBI/


11

SUATU MODEL HARGA OBLIGASI


Lienda Noviyanti
1


1
Staf pengajar jurusan Statistika FMIPA - Universitas Padjadjaran, Bandung


ABSTRAK

Uang merupakan sebuah komoditas, sedangkan tingkat bunga adalah
biaya dari uang. Uang sebagai modal membiayai pertumbuhan suatu negara.
Biasanya, modal ini harus dipinjam. Peminjaman uang ini dapat dilakukan melalui
pasar obligasi (bond). Obligasi memberikan manfaat baik bagi peminjam maupun
investor, serta melibatkan sejumlah uang yang sangat besar, sehingga penentuan
harga obligasi sangatlah penting. Suatu model yang baik dibutuhkan untuk
menentukan harga obligasi. Harga obligasi bergantung dari tingkat bunga yang
nilainya berubah-ubah, sehingga nilai tingkat bunga pada masa yang akan datang
tidak diketahui dengan pasti. Penelitian ini membentuk model untuk menentuan
harga obligasi dengan kupon, yang didasarkan pada yield curve, dengan tingkat
bunga diasumsikan mengikuti gerak Brown.

Kata Kunci : yield curve, gerak Brown, obligasi dengan dan tanpa kupon


1. PENDAHULUAN
Obligasi (bond) adalah instrumen utang yang mewajibkan penerbit
obligasi (peminjam utang) untuk membayar utang kepada investor (pemberi
utang) sejumlah yang dipinjam ditambah bunga untuk periode tertentu. Obligasi
memiliki risiko cukup besar karena merupakan suatu investasi jangka panjang
yang nilainya bergantung pada perubahan tingkat bunga, kondisi perusahaan
penerbit obligasi dan juga kondisi ekonomi nasional. Penentuan harga obligasi
menjadi sangat penting karena besarnya jumlah uang yang diinvestasikan dalam
obligasi sehingga perubahan sedikitpun pada tingkat bunga akan sangat
berpengaruh pada harga obligasi. Harga tersebut haruslah wajar (fair) baik bagi
penerbit maupun pembeli obligasi. Hal ini berarti bahwa harga tersebut tidak
terlalu mahal juga tidak terlalu murah. Bila terlalu mahal, pembeli akan enggan
untuk membeli, sedangkan bila terlalu murah, tidak akan ada pihak yang akan
menerbitkan dan menjualnya. Untuk itu perlu dibuat suatu model untuk
menentukan harga obligasi tersebut. Masalah utama dalam menentukan harga
obligasi adalah tidak diketahuinya fluktuasi tingkat bunga pada masa mendatang.
Penentuan harga ini dapat dilakukan dengan terlebih dahulu menentukan yield
curve, yaitu hubungan antara waktu jatuh tempo obligasi dan tingkat bunga.
Dengan kata lain yield merepresentasikan tingkat tahunan yang harus dibayar
hari ini untuk sebuah obligasi yang jatuh tempo dalam sejumlah tahun mendatang.
Pemodelan tingkat bunga dapat dibentuk melalui dua pendekatan, yaitu
model-model deret waktu (times series models) dan model-model tingkat bunga
12

derivatif (interest rate derivatives models). Pada dasarnya, model-model deret
waktu bersifat umum. Produksi minyak bumi, persediaan suatu barang, harga
saham atau tingkat bunga dapat dimodelkan dengan model-model deret waktu.
Perkembangan analisis kuantitatif finansial yang tumbuh dengan pesat
menggunakan konsep stokastik seperti martingales untuk menangkap perilaku
ekonomi antara lain the absence of arbitrage opportunity atau no-arbitrage dan
equilibrium theory (Brigo, 2001; Lamberton et al, 2000; dan Stampfli, 2001.
Konsep dasar model-model tersebut adalah Brownian Motion atau Gerak Brown.
Pada penelitian ini tingkat bunga diasumsikan mengikuti Brownian Motion dalam
menentukan harga obligasi dengan kupon. Dengan menggunakan Lemma Ito
dapat diperlihatkan hubungan antara harga obligasi dengan perubahan tingkat
bunga jangka pendek dan waktu.
Struktur penyajian hasil penelitian ini adalah sebagai berikut; (1)
pendahuluan, (2) studi pustaka, (3) model harga obligasi, serta diakhiri dengan
(4) penentuan harga obligasi sebagai kesimpulan.


2. STUDI PUSTAKA
Obligasi adalah instrumen hutang yang mewajibkan penerbit (peminjam
uang) untuk membayar hutang kepada investor (pemberi hutang) sejumlah yang
dipinjam ditambah bunga untuk periode waktu tertentu. Tanggal di mana pokok
pinjaman harus dibayar disebut tanggal jatuh tempo (maturity time). Obligasi
diterbitkan dengan spesifikasi yaitu (1) tanggal tetap pada saat pinjaman (pokok
pinjaman) jatuh tempo dan (2) tingkat bunga, yang biasa dibayarkan setiap enam
bulan. Obligasi dapat diterbitkan oleh pemerintah pusat, pemerintah daerah dan
perusahaan (domestik atau asing).
Zero coupon bond ( discount bond ) merupakan suatu perjanjian di mana
satu pihak akan membayar sejumlah uang pada saat jatuh tempo tanpa
pembayaran keuntungan (coupon). Di dalam perjanjian ini tidak ada risiko
ataupun kegagalan dalam pembayaran. Harga dari zero coupon bond merupakan
fungsi ( ) , P t T , dengan t menyatakan waktu pada saat itu dan T adalah waktu pada
saat jatuh tempo. Selang waktunya adalah T t t = . Dengan pembayaran pada
saat waktu jatuh tempo (maturity time) adalah $1, maka harga obligasi pada saat
waktu jatuh tempo adalah ( ) , 1 P T T = .
Harga dari suatu obligasi sebenarnya merupakan (present value) dari
pembayaran akhir, yakni :

P( t, I) =
1
c
j( t,T) ( T-t)
(1)
Zero coupon rate atau yield to maturity dinotasikan sebagai y( t, I) merupakan
tingkat bunga yang diasumsikan akan terbagi-bagi pembayarannya (continuously
compounded). Dengan mengambil logaritma dari persamaan (1), persamaan zero
coupon rate adalah

13

y( t, I) =
In ( P( t,1) )
1-t
. (2)
Yield curve ditentukan dengan melihat hubungan-hubungan antara discount curve,
forward curve, dan yield curve (Hull, 1993; Hull and White, 1993).
- Hubungan antara yield curve dan discount curve
Dari yield curve bisa diperoleh discount curve
P( t, I) = c
( t,1) ( 1-t)
. (3)
- Hubungan antara yield curve dan forward curve
Dari discount curve ini bisa diperoleh forward curve
( t, I) =
P( t,1)
P( t,1)
. (4)
- Hubungan antara yield to maturity dengan forward rate dapat dinyatakan oleh
y( t, I) =
1
1-t
( u) Ju

0
. (5)
yang menyatakan yield sebagai rata-rata dari forward rate.
Persamaan terakhir merupakan tingkat bunga pada waktu t>0 dilihat
pada saat ini yang selanjutnya akan dinotasikan dengan r(t). Sesuai dengan yield
curve, pasar obligasi memberikan tingkat bunga untuk periode (0,t). Jadi pasar
menentukan forward rate melalui yield curve.
Nilai dari obligasi P( t, I) bergantung dari T (waktu jatuh tempo), t, dan
r(t), tingkat bunga jangka pendek. Lemma Ito memperlihatkan hubungan antara
perubahan harga obligasi dengan perubahan tingkat bunga jangka pendek dan
waktu. Misal P( t, I) merupakan fungsi dari suku bunga jangka pendek r(t) dan
waktu t. Proses Ito mengikuti persamaan perubahan tingkat bunga, dengan p dan
o merupakan fungsi dari r dan t, yakni;
Jr = p( r, t) Jt + o( r, t) JB, (6)
dengan B~ N( 0, Jt) merupakan gerak Brown.
Selanjutnya akan ditentukan JP dengan menggunakan deret Taylor dan asumsi
bahwa P differentiable diperoleh;
JP( t, I) =
oP
or
Jr +
oP
ot
Jt +
1
2
o
2
P
or
2
Jr
2
+
o
2
P
orot
Jr Jt +
1
2
o
2
P
ot
2
Jt
2
+
(7)
Dengan mensubsitusikan (6) ke (7) diperoleh Lemma Ito yang berbentuk;
JP( t, I) = [
P
t
+ p
P

+
1
2
o
2

2
P

2
Jt + o
P

JB (8)

3. MODEL HARGA OBLIGASI
Persamaan (8) dapat dituliskan kembali sebagai
JP( t, I) = p( t, I) Jt + :( t, I) JB. (9)
14

Selanjutnya bentuk portofolio yang terdiri dari dua obligasi dengan
kupon, dengan tanggal jatuh tempo yang berbeda yaitu T
1
dan T
2
. Misalkan harga
kedua obligasi tersebut masing-masing P
1
dan P
2
, maka portofolio tersebut adalah
n = P
1
P
2
; Jn = JP
1
JP
2
; P
1
= P( t, I
1
) ; P
2
= P( t, I
2
) . (10)
Substitusi JP
1
dan JP
2
dari persamaan (10) ke persamaan (9) maka diperoleh
Jn = ( u
1
u
2
) Jt + ( :
1
:
2
) JB. Dengan mengambil = :
1
/ :
2
, didapat
Jn = ( u
1
u
2
) Jt (11)
Oleh karena n berperilaku seperti investasi di pasar uang, return yang
dihasilkan harus sesuai dengan tingkat bunga jangka pendek. Misalkan K
1
dan K
2

masing-masing menyatakan kupon untuk obligasi dengan tanggal jatuh tempo T
1

dan T
2
, mak
Jn = ( r n K
1
+ K
2
) Jt.
Substitusi Jn ke persamaan (11) akan menghasilkan
1
:
1
( u
1
r P
1
+ K
1
) =
1
:
2
( u
2
r P
2
+ K
2
) .
Oleh karena ruas kiri pada persamaan terakhir hanya mengandung suku-
suku yang bergantung pada I
1
dan ruas kanan pada persamaan terakhir hanya
mengandung suku-suku yang bergantung pada I
12
maka
z( t, r) =
u( t, I) r( t, I) P( t, I) + K( t, r)
:( t, I)

tidak bergantung pada T. Notasi z menyatakan harga pasar dari risiko dan dapat
dituliskan kembali sebagai
u( t, I) = rP( t, I) + z:( t, I) K( t, r) .
Selanjutnya, kembalikan nilai u dan v dari persamaan (9) sehingga
diperoleh persamaan diferensial untuk harga obligasi sebagai berikut
oP
ot
+ p
oP
or
+
1
2
o
2
o
2
P
or
2
= rP + zo
oP
or
K
atau
P
t
+ ( p zo)
P

+
1
2
o
2

2
P

2
rP = Cr, (12)
dengan K = Cr.
Persamaan (12) merupakan persamaan diferensial parsial tak homogen.
Solusi dari persamaan tersebut adalah P =P
h
+ P
p
dengan P
h
menyatakan solusi
homogen dan P
p
menyatakan solusi khusus. Solusi homogen P
h
dari persamaan
(12) merupakan solusi dari persamaan diferensial parsial untuk obligasi tanpa
kupon (Noviyanti, 2006)
P
t
+ o
P

+
1
2
o
2

2
P

2
rP = 0 dan P( t, I) =
c
-_( 1-t) -
c
2
( 1-t)
2
o
2
6
( 1-t)
3
_
, yakni
P
h
= cxp[ A( t) r + B( t) ]
15

dengan A(t) =(T-t) dan B( t) =
u
2
( I t)
2
c
2
6
( I t)
3
.
Misalkan P
p
= k, substitusi ke persamaan (12) maka k = C. Jadi solusi untuk
persamaan (12) adalah
P = exp [ A r + B ] + C (13)


4. PENENTUAN HARGA OBLIGASI
Setiap obligasi dengan kupon mempunyai yield saat ini, Y(t), yang
dihitung dari harga pasar saat ini
( t) =
l n( P)
I t
.
Berdasarkan persamaan (13) model harga obligasi dengan kupon adalah
P( t, I) = cxp]( I t) r
u
2
( I t)
2
c
2
6
( I t)
3
+ C, (14)
sehingga
( t, I) =
-In_cxp_-( 1-t) -
c
2
( 1-t)
2
o
2
6
( 1-t)
3
_+C]
1-t
(15)
Persamaan tersebut dapat dihampiri dengan polinom berderajat tertentu,
misal 3, dalam T, sehingga diperoleh
( 0, I) I = l n( 1 + C) +
r
0
1 + C
I _
o + r
0
2
2( 1 + C)

r
0
2
2( 1 + C)
2
_I
2
_
1
6
o
2
+
1
2
r
0
o
1
6
r
0
3
1 + C
+
r
0
( o + r
0
2
)
6( 1 + C)
2
+
( o oC + r
0
2
C) r
0
3( 1 + C)
3
_
I
3

Parameter-parameter a,
2
dan C dapat diperoleh dari observasi data pasar pada
suatu tanggal tertentu.


5. DAFTAR PUSTAKA
Brigo, D. and Mercurio, F., 2001, Interest Rate Models, Theory and Practice,
Springer-Verlag, Germany.
Hull, J. C. 1993. Options, Future and Other Derivative Securities. 2
nd
ed. Prentice
Hall, Englewood Cliffs, NJ.
Hull, J. and A. White, 1993, " The Pricing of Options on Interest-Rate Caps and
Floors Using the Hull-White Model, The Journal of Financial Engineering
Volume 2, Numer 3, Pages 287-296.
16

Lamberton, D., and Lapeyre, B., 2000, Introduction to Stochastic Calculus,
Applied to Finance, Chapman&Hall, UK.
Noviyanti, L., 2006, Tingkat Bunga Stokastik dalam Kontrak Asuransi Jiwa,
Disertasi, Institut Teknologi Bandung, tidak dipublikasikan.
Stampfli, J. and Goodman, V., 2001, The Mathematics of Finance: Modeling and
Hedging, Brooks/Cole, Thomson Learning, USA.

17

PENENTUAN CADANGAN DISESUAIKAN
MELALUI METODE ILLINOIS PADA PRODUK
ASURANSI DWIGUNA BERPASANGAN


Suhartini

suhartini@gmail.com


ABSTRAK

Produk Asuransi Dwiguna memberikan dua manfaat bagi pemegang
polis yakni proteksi jiwa selama jangka waktu asuransi dan pengembalian dana
asuransi apabila pemegang polis hidup setelah masa asuransi berakhir. Manfaat
produk Asuransi Dwiguna hanya diberikan pada satu individu saja yang namanya
tercantum sebagai pemegang polis asuransi. Penelitian ini mengembangkan
proteksi jiwa untuk dua individu yang bersama-sama namanya dicantumkan
sebagai tertanggung pada polis asuransi sehingga ahli waris akan menerima 100%
Uang Pertanggungan apabila salah satu dari tertanggung meninggal selama masa
asuransi dan jaminan 100% Uang Pertanggungan jika kedua tertanggung masih
hidup sampai akhir masa asuransi. Selanjutnya produk ini dinamakan Asuransi
Dwiguna Berpasangan. Perhitungan besaran-besaran aktuaria dalam penelitian ini
selain melibatkan dua individu sebagai tertanggung, juga memperhitungkan
besarnya biaya komisi agen yang dibebankan pada pemegang polis selama m
tahun pertama pembayaran premi. Dengan demikian, besarnya cadangan asuransi
dihitung berdasarkan rumusan cadangan disesuaikan melalui Metode Illinois.

Kata Kunci : Asuransi Dwiguna berpasangan, Cadangan disesuaikan, Metode
Illinois


1. PENDAHULUAN
Dwiguna adalah salah satu produk asuransi berjangka n tahun yang
memberikan dua manfaat yakni (1) proteksi kematian selama masa asuransi dan
(2) uang pertanggungan apabila tertanggung hidup setelah masa asuransi berakhir.
Produk Dwiguna yang ditawarkan selama ini bersifat individu artinya perusahaan
asuransi hanya memberikan proteksi kepada satu orang saja. Produk ini
memberikan benefit berupa jaminan 100% Uang Pertanggungan jika tertanggung
hidup sampai akhir masa asuransi. Selain itu, ahli waris akan menerima 100%
Uang Pertanggungan apabila tertanggung meninggal dalam masa asuransi.
Penelitian ini mengembangkan produk Asuransi Dwiguna dengan
menambahkan satu orang lagi tertanggung pada polis asuransinya. Selanjutnya
produk tersebut akan dinamakan produk Asuransi Dwiguna Berpasangan dengan
Uang Pertanggungan diberikan saat salah satu dari kedua tertanggung meninggal
dunia dalam masa asuransi dan apabila keduanya masih hidup sampai akhir masa
asuransi, maka mereka akan menerima uang pertanggungan.
18

Selama kontrak asuransi telah ditandatangani pemegang polis,
Perusahaan asuransi akan menerima sejumlah pembayaran secara berkala yang
besarannya ditetapkan berdasarkan premi bersih dan biaya yang harus dibebankan
pada pemegang polis. Premi bersih digunakan untuk perhitungan benefit yang
harus diberikan kepada tertanggung jika terjadi klaim dari pemegang polis atau
ahli warisnya. Sedangkan biaya merupakan dana yang telah dikeluarkan
perusahaan selama promosi produk Asuransi Dwiguna seperti komisi yang
diberikan kepada agen marketing yang mendapatkan pemegang polis, biaya
pemasaran produk, dan biaya administrasi pembuatan dan pengiriman polis
asuransi. Pada awal tahun polis biasanya diperlukan biaya yang besar. Sedangkan
biaya pada tahun selanjutnya lebih kecil dari pada biaya tahun pertama.
Bentuk tanggung jawab perusahaan asuransi atas premi yang telah
diterima adalah menyiapkan cadangan asuransi yang sewaktu-waktu harus
dikeluarkan untuk membayar manfaat asuransi ketika terjadi klaim dari pemegang
polis. Pada dasarnya cadangan asuransi dihitung berdasarkan asumsi premi bersih
tahunan (tidak melibatkan biaya yang dikeluarkan tiap tahunnya oleh perusahaan).
Biaya yang dilibatkan dalam penelitian ini dikeluarkan untuk membayar komisi
kepada agen asuransi selama tiga tahun pertama pembayaran premi. Dengan
demikian, perhitungan cadangan asuransi untuk produk Dwiguna harus
memperhitungkan biaya dalam penetapan besaran premi tahunan yang harus
dibayarkan pemegang polis. Rumusan ini dinamakan cadangan asuransi
disesuaikan (modified reserve).
Besarnya nilai cadangan asuransi disesuaikan dalam penelitian ini akan
dihitung melalui pendekatan metode Illinois. Metode ini membatasi frekuansi
biaya yang dibebankan pada pembayaran premi tahunan paling lama 20 tahun.
Sehubungan dengan pernyataan di atas, penelitian ini menawarkan
inovasi pada produk asuransi dwiguna dengan proteksi kepada dua orang
tertanggung dan merumuskan besarnya cadangan asuransi disesuaikan melalui
metode Illinois

2. BESARAN-BESARAN AKTUARIA
2.1. Simbol-simbol Aktuaria
NOTASI
KETERANGAN
X Variabel acak yang menyatakan usia individu pertama
Y Variabel acak yang menyatakan usia individu kedua
( ) t
x
Laju kematian (force of mortality) dari seseorang yang berumur x tahun
1 k x
q
+
Peluang orang yang berumur x tahun akan hidup sampai k tahun dan
meninggal 1 tahun berikutnya


Lanjutan Tabel 2.1.
xy t
p Peluang orang yang berusia x tahun dan y tahun masih akan hidup kedua-
19

duanya dalam t tahun kemudian
t xy
q
Peluang seseorang yang lebih dulu meninggal dari sepasang tertanggung yang
berumur x tahun dan y tahun dalam t tahun kemudian
, x k y k
q
+ +

Peluang seseorang yang lebih dulu meninggal dari sepasang tertanggung yang
berusia x+k tahun dan y+k tahun dalam 1 tahun kemudian
1 k
b
+

Besarnya benefit yang dibayarkan perusahaan asuransi pada akhir tahun
terjadi risiko
v Nilai tunai (Present value)
i rate of interest (tingkat bunga efektif yang berlaku)
Z Variabel acak yang menyatakan fungsi present value benefit
1
; xy n
A
Premi tunggal bersih asuransi jiwa berjangka n tahun bentuk diskrit untuk
sepasang tertanggung yang berumur x tahun dan y tahun
1
: xy n
A
Premi tunggal bersih asuransi jiwa n-year pure endowment untuk sepasang
tertanggung yang berusia x tahun dan y tahun
: xy n
A
Premi tunggal bersih asuransi jiwa dwiguna bentuk diskrit untuk sepasang
tertanggung yang berusia x tahun dan y tahun
: xy n
A
Premi tunggal bersih asuransi jiwa dwiguna bentuk kontinu untuk sepasang
tertanggung yang berusia x tahun dan y tahun
o laju perubahan suku bunga terhadap satuan waktu terkecil (force of interest)
: xy n
a
Anuitas hidup berjangka n tahun untuk sepasang tertanggung yang berusia x
tahun dan y tahun
t
b
Besarnya benefit yang dibayarkan perusahaan asuransi pada saat terjadi risiko
(t)
P (
: xy n
A )
Premi bersih tahunan asuransi jiwa berpasangan dwiguna bentuk diskrit yang
dibayarkan setiap awal periode untuk seseorang yang berusia x tahun dan
berusia y tahun
H Waktu saat perhitungan cadangan
( )
:
h
xy n
V A
Cadangan premi tahunan asuransi jiwa dwiguna kontinu dengan premi
dibayarkan tiap awal tahun untuk setiap satuan waktu h
M Periode pembayaran premi dengan biaya
I
o Premi bersih untuk tahun pertama pada metode illinois
I
|
Premi bersih untuk tahun kedua dan seterusnya sampai ke-m pada metode
illinois
:
( )
il
h
xy n
V A
Cadangan illinois asuransi jiwa Dwiguna berpasangan kontinu dengan premi
dibayarkan tiap awal tahun setiap satuan waktu h
*
Fungsi present value total biaya komisi agen
1
Presentasi komisi agen untuk tahun pertama
2
Presentasi komisi agen untuk tahun kedua
3
Presentasi komisi agen untuk tahun ketiga



2.2. Asuransi Dwiguna Berpasangan
20

Besarnya premi tunggal bersih yang harus dibayarkan oleh individu
pertama yang berusia x tahun dan individu kedua yang berusia y tahun pada saat
pertama kali ikut asuransi kepada perusahaan asuransi adalah:

a. Jika Salah Satu dari Tertanggung Meninggal Dunia
1
100%UP
0
k
b
+
=
, untuk 0,1, 2,..., 1
, untuk , 1,...
k n
k n n
=
= +
Jika salah satu
tertanggung meninggal dunia maka benefit akan dibayarkan sebesar 100% Uang
Pertanggungan (UP) sekaligus pada akhir tahun tertanggung meninggal dunia atau
dapat dinyatakan sebagai berikut:
fungsi present value benefitnya adalah :
1
1
100%UP
0
k
v
Z
+
=
, untuk 0,1, 2,..., 1
, untuk , 1,...
k n
k n n
=
= +

karena K merupakan variabel acak, maka premi tunggal bersihnya adalah:
| | 1
1
1
1
: ,
0
(100%UP) . .
n
k
k xy
xy n x k y k
k
A E Z v p q

+
+ +
=
= =

(2.1)

b. Jika Kedua Tertanggung Masih Tetap Hidup Hingga Akhir Masa Asuransi
Jika kedua tertanggung masih tetap hidup hingga berakhirnya masa
asuransi maka benefit akan dibayarkan sebesar 100% Uang Pertanggungan
sekaligus pada akhir tahun ke-n atau dapat dinyatakan sebagai berikut:
0
100%UP
n
b =
, untuk 0,1, 2,..., 1
, untuk , 1,...
k n
k n n
=
= +

fungsi present value benefitnya adalah:
2
0
100%UP
n
Z
v
=
, untuk 0,1, 2,..., 1
, untuk , 1,...
k n
k n n
=
= +

sehingga premi tunggal bersihnya adalah:
| | 1
2
:
(100%UP) .
n
n xy
xy n
A E Z v p = = ...(2.2)
Maka besarnya premi tunggal bersih secara keseluruhan untuk produk
asuransi Dwiguna berpasangan merupakan penjumlahan antara Persamaan (2.1)
dan (2.2) sebagai berikut :
1
1
. ,
:
0
(100% ) . .
n
k n
k xy x k y k n xy
xy n
k
A UP v p q v p

+
+ +
=

= +
`
)

... (2.3)
Pada produk Dwiguna berpasangan, benefit diberikan tepat pada saat
salah satu dari tertanggung meninggal dunia. Oleh karena itu, perlu mengubah
asuransi Dwiguna berpasangan bentuk diskrit menjadi asuransi jiwa Dwiguna
berpasangan bentuk kontinu. Dengan menggunakan asumsi UDD (Uniform
Distribution of Death) hubungan asuransi jiwa dwiguna berpasangan bentuk
diskrit dengan asuransi jiwa dwiguna berpasangan bentuk kontinu adalah sbb:
21

o
| |
=
|
\ .
: : x y n x y n
i
A A
... (2.4)
Premi tahunan Dwiguna Berpasangan dihitung dengan menggunakan rumus:

( )
:
:
:
xy n
xy n
xy n
A
P A
a
=

... (2.5)

2.3. Perhitungan Cadangan Illinois Pada Produk Dwiguna Berpasangan
Penentuan cadangan disesuaikan melalui metode Illinois terdapat
persyaratan yang harus terpenuhi, yaitu nilai premi tahunan yang dibayarkan oleh
tertanggung lebih besar dari nilai premi tahunan asuransi seumur hidup dengan
jangka pembayaran premi 20 tahun pada usia yang sama. Dalam metode Illinois,
terdapat beberapa nilai premi bersih yakni
I
o (premi bersih untuk tahun pertama),
I
| (premi bersih untuk k - 1 tahun berikutnya), dan
:
( )
xy n
P A (prmi bersih untuk
setelah k tahun). Pada penentuan cadangan dengan mentode ini terdapat batasan
frekuensi biaya yang digunakan dalam perhitungan cadangan yakni maksimal
biaya 20 tahun. Perumuman dari pernyataan di atas dapat diilustrasikan sebagai
berikut :
: 1 : :
( )
I I
xy k xy n xy k
a P A a o |

+ = ... (2.6)
Atau dengan kata lain
I
o dapat dinyatakan pada Persamaan di bawah ini :
: : : 1
: 1
( )
1
xy n xy k xy k
I
xy k
P A a a
a

=
+

(2.7)
dan
I
| dapat dinyatakan pada Persamaan di bawah ini :
: :
: 1
( )
1
xy n xy k
I
xy k
P A a
a

+
=
+

(2.8)
Berdasarkan perumusan premi di atas, perhitungan cadangan yang
disesuaikan dengan menggunakan metode Illinois didefinisikan sebagai berikut :
: : : , :
( ) ( ) ( ( ))
il
h h I
xy n xy n xy n x h y h k h
V A V A P A a |
+ +
= (2.9)
dengan min( , 20) k m = serta m adalah periode pembayaran premi dengan biaya.
Besarnya total biaya yang dikeluarkan perusahaan untuk membayar
komisi agen, adalah sebagai berikut:
{ }
*
1 2 1 3 2
:
( )
xy xy
xy n
P A v p v p ( = + +

(2.10)
dengan
1
,
2
, dan
3
merupakan presentase komisi yang harus
dibayarkan oleh perusahaan kepada agen yang berhasil menjual produk asuransi
pada tahun pertama sampai tahun ke tiga dan besarnya diperoleh berdasarkan
tabel komisi. Pada penelitian ini besar min(3, 20) k = yakni k=3, sehingga
Persamaan (2.6) dapat dituliskan kembali sebagai berikut :
:2 : :3
( )
I I
xy xy n xy
a P A a o | + = ... (2.11)
22

Dengan kata lain
I
o pada Persamaan (2.7) dapat dinyatakan kembali
sebagai berikut :

*
: :3 :2
:2
( )
1
xy n xy xy
I
xy
P A a a
a

o

=
+

(2.12)
dan
I
| pada Persamaan (2.8) dapat dinyatakan kembali sebagai berikut :

*
: :3
:2
( )
1
xy n xy
I
xy
P A a
a

|
+
=
+

(2.13)
Berdasarkan perumusan valuasi premi di atas, perhitungan cadangan
yang disesuaikan dengan menggunakan metode Illinois didefinisikan sebagai
berikut :
: : : , :3
( ) ( ) ( ( ))
il
h h I
xy n xy n xy n x h y h h
V A V A P A a |
+ +
= (2.14)
dan perhitungan cadangan setelah tahun ke-3 akan menggunakan
perumusan cadangan premi bersih tahunan sbb:

( ) ( )
: , : : , :
h
xy n x h y h n h xy n x h y h n h
V A A P A a
+ + + +
= (2.15)

3. HASIL DAN PEMBAHASAN
3.1. Premi Tunggal Bersih Produk Dwiguna Berpasangan
Perhitungan premi tunggal bersih produk Dwiguna berpasangan bentuk
diskrit untuk ilustrasi yang telah disebutkan sebelumnya adalah sebagai berikut :

a. Jika salah seorang tertanggung meninggal dalam masa asuransi, maka premi
tunggal bersihnya adalah Rp. 529.744,98.
b. Jika kedua tertanggung masih tetap hidup hingga berakhirnya masa asuransi,
maka premi tunggal bersihnya adalah Rp. 9.775.327,32.

Dengan demikian, premi tunggal bersih asuransi Dwiguna berpasangan
bentuk diskrit adalah penjumlahan kedua premi tunggal bersih di atas yakni Rp.
10.305.071,30.
Pada produk Dwiguna berpasangan benefit diberikan tepat pada saat
salah satu dari tertanggung meninggal dunia. Oleh karena itu, perlu mengubah
asuransi Dwiguna berpasangan bentuk diskrit menjadi asuransi jiwa Dwiguna
berpasangan bentuk kontinu. Dengan menggunakan asumsi UDD, maka besar
premi tunggal bersih untuk asuransi Dwiguna berpasangan bentuk kontinu Rp.
10.661.469,00.
Biasanya tertanggung akan berkeberatan untuk membayar premi satu kali
diawal tahun secara sekaligus, oleh karena itu perlu dihitung besarnya premi
tahunan sehingga tertanggung menjadi lebih ringan dalam pembayaran preminya
tetapi tetap akan mendapatkan benefit yang sama.



3.2. Premi Tahunan
23

Besar anuitas berpasangan bentuk diskrit due adalah sebagai berikut:

( ) ( ) ( )
9
30,25
30,25:10
0
0 1 9
0 30,25 1 30,25 9 30,25
...
1 0, 9313 0, 8673 ... 0, 5254
7, 4081
k
k
k
a v p
v p v p v p
=
=
= + + +
= + + + +
=


Besarnya premi tahunan adalah sebagai berikut:
( )
30,25:10
30,25:10
30,25:25
10.661.469
7,4081
1.439.162, 525
A
P A
a
=
=
=


Dengan demikian, UP sebesar Rp.20.000.000,00 diperoleh apabila
pemegang polis membayar premi tanpa biaya sebesar Rp.10.661.469,00 yang
dibayarkan sekaligus di awal kontrak asuransi atau sebesar Rp.1.439.163,00 yang
pembayarannya dilakukan 10 kali secara kontinu di awal tahun.

3.3. Cadangan
Dalam perhitungan cadangan terlebih dahulu akan dihitung besar
cadangan Illinois selama tiga tahun pertama sebagai akibat biaya yang
dikeluarkan oleh perusahaan untuk membayar komisi agen. Kemudian untuk
tahun selanjutnya perhitungan cadangan akan menggunakan cadangan premi
bersih tahunan karena sudah tidak ada lagi biaya yang dikeluarkan perusahaan
untuk membayar komisi agen.
Total biaya yang dikeluarkan perusahaan untuk membayar komisi agen
selama tiga tahun pertama pembayaran premi adalah:

Tabel 3.1 Komisi Agen Produk Dwiguna Berpasangan
Tahun Besarnya Komisi Agen per tahun (Rp.)
1 359.791
2 67.015
3 31.205
Total 458.011

Besar premi bersih tanpa biaya dan premi bersih dengan biaya selama
tiga tahun pertama masa asuransi yang dibayarkan di awal tahun dapat dilihat
pada tabel di bawah ini :




Tabel 3.2 Premi Bersih Tahunan Produk Dwiguna Berpasangan
Selama Tiga Tahun Pertama Masa Asuransi
24

Tahun
ke-
Premi Bersih Tahunan
Tanpa Biaya (Rp.)
Premi Bersih Tahunan
dengan Biaya (Rp.)
0
1.439.163
1.072.260
1
1.530.272
2

Berdasarkan tabel 3.2 di atas diketahui bahwa besar premi bersih tahunan
dengan biaya tahun pertama adalah Rp.1.070.821. Sedangkan besar premi bersih
tahunan dengan biaya tahun kedua dan ketiga adalah Rp.1.531.017. Besar premi
bersih tahun pertama lebih kecil dari premi bersih tahun kedua dan ketiga, hal ini
dikarenakan pada tahun pertama diperlukan biaya besar untuk membayar komisi
agen, sedangkan biaya yang dikeluarkan oleh perusahaan asuransi untuk tahun
selanjutnya adalah lebih kecil. Sedangkan premi bersih tahunan tanpa biaya lebih
besar dari premi bersih tahunan dengan biaya untuk tahun pertama dan lebih kecil
dari besar pemi bersih tahunan dengan biaya untuk tahun kedua dan ketiga.
Berdasarkan tabel 3.3 dapat dilihat bahwa besar cadangan Illinois untuk
tahun ke-0 bernilai negatif, hal ini dikarenakan perusahaan asuransi belum
menerima pembayaran premi tahunan dari sepasang tertanggung tetapi perusahaan
asuransi tersebut harus mengeluarkan biaya untuk membayar komisi kepada agen
yang telah berhasil menjual produk asuransi. Sedangkan besar cadangan Illinois
untuk akhir tahun ke-1 dan ke-2 masingmasing adalah Rp.1.296.738,- dan
Rp.2.962.935,-.
Besar cadangan untuk h = 3 dan seterusnya sampai dengan akhir masa
asuransi yakni 10 tahun dapat dihitung dengan menggunakan cadangan premi
bersih tahunan. Cadangan premi bersih tahunan merupakan perhitungan cadangan
tanpa melibatkan faktor biaya. Dengan demikian besar cadangan produk Dwiguna
berpasangan untuk masa asuransi 10 tahun dengan biaya tiga tahun pertama
adalah sebagai berikut:

Tabel 3.3 Besar Cadangan Premi Asuransi pada
Produk Dwiguna Berpasangan berdasarkan premi bersih dan premi kotor
Tahun ke-
h
Cadangan premi
bersih (Rp.)
Cadangan premi kotor
melalui metode Illinois (Rp.)
0 0 -254.981
1 1.472.697 1.296.738
2 3.054.044 2.962.935
3 4.752.183 4.752.183
4 6.574.031 6.574.031
5 8.529.246 8.529.246
6 10.628.422 10.628.422
7 12.881.369 12.881.369
8 15.300.816 15.300.816
9 17.899.053 17.899.053
10 20.000.000 20.000.000

Berdasarkan tabel 3.3 di atas diketahui bahwa besar cadangan
disesuaikan untuk akhir tahun ke-0, 1, 2 akan lebih kecil dari cadangan premi
tahunan, hal ini dikarenakan pada perhitungan cadangan Illinois terdapat faktor
25

pengurang yaitu biaya, sedangkan pada perhitungan cadangan premi bersih
tahunan tidak memasukkan faktor biaya. Pada tahun ke-3 sampai dengan akhir
masa asuransi tidak ada biaya yang dikeluarkan oleh perusahaan, sehingga besar
cadangan untuk tahun ke-3 sampai dengan akhir masa asuransi akan sama dengan
cadangan premi tahunan pada tahun yang sama. Akhir tahun ke 10, besar
cadangan premi tahunan yang harus dimiliki perusahaan asuransi adalah sebesar
uang pertanggungan yaitu sebesar Rp.20.000.000. Uang tersebut kemudian akan
diberikan kepada sepasang tertanggung apabila keduanya masih tetap hidup
sampai akhir masa asuransi, dalam hal ini adalah 10 tahun.

4. KESIMPULAN
1. Penentuan besarnya cadangan disesuaikan dengan metode Illinois, akan
menghasilkan besaran cadangan yang lebih kecil dibandingkan dengan
besarnya cadangan premi tahunan. Cadangan premi tahunan merupakan
kondisi ideal yang dimiliki perusahaan. Tetapi perusahaan asuransi harus
mengeluarkan biaya untuk membayar komisi agen. Dan Biaya tersebut
dibebankan oleh perusahaan asuransi kepada tertanggung. Sehingga besar
biaya tersebut akan mengurangi besar cadangan yang dimiliki oleh perusahaan
asuransi.
2. Besar premi bersih tahunan tanpa biaya lebih besar dari besar premi bersih
tahunan dengan biaya untuk tahun pertama dan lebih kecil dari besar premi
bersih tahunan dengan biaya untuk tahun kedua dan ketiga atau dapat
dinyatakan dalam hubungan berikut ini:
30,25:10
( )
I I
P A o | < < .

5. DAFTAR PUSTAKA
Bowers, N.L., Gerber, H.U., Hickman, J.C., Jones, D.A., dan Nesbitt, C.J. 1997.
Actuarial Mathematics, 2nd Ed. The Society of Actuaries.
Futami, Takashi. 1993. Matematika Asuransi Jiwa Bagian I. Oriental Life
Insurance Cultural Development Centre, Inc. Tokyo, Japan.
Futami, Takashi. 1994. Matematika Asuransi Jiwa Bagian II. Oriental Life
Insurance Cultural Development Centre, Inc. Tokyo, Japan.
Larson, Robert E., Gaumnitz, Erwin A. 1962. Life Insurance Mathematics. New
York. John Wiley & Sons, Inc. London.


26

ANALISIS LATENT CLASS CLUSTER
DALAM PENGELOMPOKAN
LAHAN USAHA TAMBANG BAHAN GALIAN INDUSTRI


Anna Chadidjah

Jurusan Statistika FMIPA-Unpad
anna_chadidjah@yahoo.co.id


Abstract

The allocation of land mines to local businesses with the potential in the
Rencana Tata Ruang polices is one of the alternatives to minimize land use
conflicts of interest.
On the basis of these ideas required a grouping technique. Groupings are
based on 8 indicator variables are weighing the physical aspect. Grouping using
latent class cluster methods, where information about the number of groups is not
known in advance. The use of cluster techniques that rely on the concept of
similarity, measured through the concept of distance, for the latent variables were
not satisfactory. As an alternative. classifying the subject in latent class cluster
approach was not done but based on similarity measure based on a model that has
different parameters in each class.
From the 8 indicators variables, there are 6 indicators that are
determinant of establishing the cluster, namely: the value of minerals, the volume
of reserves, effective soil depth, gradient, and distance. The clustering results
produce a 2- cluster model that can be classified into a potential business area and
less potential in which each has its own characteristics.

Kata Kunci : Latent Class Cluster, Local Independence, Bivariate Residuals
(BVR), Object Classification


1. PENDAHULUAN
Bahan galian merupakan potensi sumber daya alam yang tak terbaharui.
Bahan galian terdapat di daerah tertentu dengan jumlah cadangan terbatas sesuai
dengan kondisi geologi dan tektoniknya. Salah satu daerah di Indonesia yang
memiliki banyak lahan usaha tambang bahan galian industri adalah Kabupaten
Sukabumi.
Pengalokasian lahan usaha tambang untuk daerah yang berpotensi bahan
galian di dalam kebijakan Rencana Tata Ruang Wilayah merupakan salah satu
alternatif guna memperkecil terjadinya benturan kepentingan penggunaan lahan.
Atas dasar pemikiran tersebut diperlukan suatu teknik pengelompokan
lahan usaha tambang bahan galian industri yang dapat menjadi keanggotaan
seluruh lahan usaha tambang tersebut terhadap kelompok-kelompok yang
terbentuk. Pengelompokan tersebut didasarkan pada beberapa variabel penimbang
27

dalam analisis peruntukan lahan usaha tambang.. Variabel-variabel penimbang
tersebut meliputi aspek fisik dan non fisik. Aspek fisik meliputi : nilai bahan
galian, volume cadangan, kedalaman efektif tanah, tingkat kemiringan,
ketinggian, tingkat bencana, tingkat penggunaan tanah dan jarak. Sedangkan
aspek non fisik adalah jumlah penduduk.
Berdasarkan uraian di atas, penulis tertarik untuk melakukan pengkajian
bagaimana mengelompokkan lahan usaha tambang bahan galian industri di
Kabupaten Sukabumi, serta bagaimana ciri (karakteristik) dari setiap kelompok
lahan usaha tambang yang terbentuk.
Manfaat yang dapat dipetik dari penelitian ini adalah dapat diketahuinya
pengalokasian lahan usaha tambang bahan galian industri serta mengetahui lahan
usaha tambang bahan galian industri mana saja yang memiliki prioritas untuk
dikembangkan, sehingga dapat menjadi bahan masukan dalam penetapan
kebijakan Rencana Umum Tata Ruang Daerah yang dapat menunjang
pengembangan wilayah.


2. TINJAUAN LITERATUR DAN METODE
2.1. Analisis Latent Class Cluster
Analisis Latent Class Cluster adalah analisis Cluster yang digunakan
untuk mengklasifikasikan objek kedalam dua atau lebih kelompok, dimana
banyaknya kelompok tidak diketahui. (Kauffman dan Rousseuw, 1990).
Menurut Vermunt dan Magidson (2002), Latent Class Cluster adalah
sebuah metode statistic untuk mengidentifikasi keanggotaan kelompok yang tidak
terukur antar objek-objek dengan menggunakan variable observed kontinu atau
kategori.
Analisis Latent Class Cluster dapat menjadi ide terbaik sebagai
perbaikan dari analisis klaster, dimana hasil analisisnya menggunakan konsep
statistic likelihood. Estimasi parameter digunakan untuk profil kelompok
(deskripsi dari masing-masing kelompok) dan ukuran masing-masing kelompok.
Dalam Analisis Latent Class Cluster objek mempunyai peluang keanggotaan
berupa posterior Latent Class Cluster, membership probability pada masing-
masing kelompok. Selain itu analisis ini dapat digunakan untuk semua tipe data,
yaitu biner, kontinu dan data cacah (Count data).
Pada prinsipnya, metode Latent Class Cluster, tidak jauh berbeda dengan
K-means cluster, yaitu mengelompokkan sejumlah objek yang terdekat dengan
pusat kelompoknya sehingga jarak setiap objek ke pusat kelompok dalam satu
kelompok adalah minimum. Perbedaannya adalah untuk menyatakan kedekatan
objek ke pusatnya, pada K-means cluster menggunakan pendekatan jarak,
sedangkan pada Latent Class Cluster didasarkan pada probabilitas
pengelompokan posterior (Magidson dan Vermunt, 2002). Jay Magidson dan
Jeroen K. Vermunt (2002), dalam Canadian Journal of Marketing Research,
Volume 20, yang berjudul Latent Class Models For Clustering: A Comparison
with K-means membahas mengenai perbandingan antara analisis latent class
cluster dengan K-means cluster. Berdasarkan hasil analisisnya, klasifikasi dalam
latent class cluster berdasarkan estimasi probabilitas pengelompokan posterior
menghasilkan angka misklasifikasi yang lebih kecil dibandingkan K-means
28

cluster. Selain itu, dalam K-means cluster tidak ada ketentuan untuk menetapkan
jumlah kelompok, namun pada latent class cluster disediakan berbagai diagnostik
seperti statistik Bayesian Criterion Information (BIC) yang dapat digunakan
dalam penentuan jumlah kelompok.
Jimmie Harison (2004), dalam skripsinya yang berjudul Analisis Latent
Class Cluster untuk Variabel Kontinu juga membahas mengenai perbandingan
antara analisis latent class cluster dengan K-means cluster. Penelitian ini
menggunakan data riil mengenai diagnosa penyakit diabetes dengan tiga variable
kontinu yang dilibatkan adalah kadar glukosa, kadar insulin, dan kadar sspg
(steady-state plasma glucose). Data diagnosa diabetes terdiri dari 145 observasi.
Pada data juga terdapat informasi klasifikasi medis dalam tiga kelompok, yaitu
diabetes stadium normal, chemical, dan overt. Dalam penelitian ini,
menyimpulkan bahwa hasil klasifikasi pada latent class cluster memiliki angka
misklasifikasi sangat kecil dibandingkan dengan hasil pada K-means cluster yang
jauh berbeda dari hasil sebenarnya (diagnosa klinik). Selain itu, model
pengelompokan dengan latent class cluster dilakukan secara lebih objektif
dibandingkan dengan K-means cluster, yaitu dalam penentuan banyaknya
kelompok dilakukan berdasarkan seleksi model menggunakan kriteria informasi
BIC.
Dalam penelitian yang akan dilakukan mengenai pengelompokan
terhadap lahan usaha tambang bahan galian industri berdasarkan variabel indicator
: nilai bahan galian, volume cadangan, kedalaman efektif tanah, tingkat
kemiringan, ketinggian, tingkat bencana, tingkat penggunaan tanah, dan jarak.
Jenis data pada penelitian ini memiliki skala pengukuran ordinal. Terdapat banyak
objek penelitian yang akan dianalisis dan juga tidak ada informasi mengenai
jumlah kelompok. Oleh karena itu, berdasarkan uraian yang telah dijelaskan di
atas, metode pengelompokan yang paling tepat digunakan dalam penelitian ini
adalah metode latent class cluster, dengan berbagai keuntungan sebagai berikut:
1. Hasil klasifikasi objek ke dalam cluster dilakukan berdasarkan sebaran
peluang keanggotaan yang diduga secara langsung dari model. Di sisi lain
pada analisis cluster klasik pendekatan cluster dilakukan berdasarkan pada
jarak antar objek (Vermunt dan Magidson,2002). Model analisis latent class
menghasilkan suatu pendekatan klastering dengan probabilistic, artinya
meskipun setiap objek menjadi milik suatu cluster, tetap ada ketidakpastian
menyangkut keanggotaan dari suatu objek.
2. Peubahnya dapat bersifat kontinu, kategorik (nominal, ordinal), count atau
kombinasinya.
3. Peubah eksogen (kovariat) dapat digunakan untuk menggambarkan cluster







2.2. Model Latent Class Cluster untuk Variabel Kategori
Misalkan D sebuah variable latent yang memiliki L kategori, dan
29

=
L
1
peluang dengan ,
peluang dengan , 1
t
t
L
D
K buah Variabel yang dapat diamati (manifest variable), masing-masing
dinyatakan sebagai
K
X X X , , ,
2 1
, dengan

=
.
, 1
I
X
i


Level dari X
i
i = 1, 2, . . ., I dianggap sama, untuk memudahkan penulisan. Dalam
kenyataannya boleh berbeda. X
i
I = 1, 2, . . ., I berskala pengukuran nominal.
Untuk I = 2, kombinasi respons yang mungkin terjadi untuk K = 2 nampak pada
Tabel 3.2 sebagai berikut:

Tabel 2.1
Tabel Kontingensi Dua Variable Indikator Dengan Dua Kategori
Kombinasi respons X1 X2 Frekuensi
1 1 1 n
11

2 1 2 n
12

3 2 1 n
21

4 2 2 n
22


Peluang bahwa respons pengukuran
i i
x X = bersyarat kepada latent class
D = d ditulis sebagai:

) | ( d D x X P
i i
= = . (2.1)
Hal ini menunjukkan bahwa klasifikasi berbasis model, seperti LCA,
memungkinkan pengukuran akurasi perangkat uji diagnostic; spesifitas dan
sensitivitas, melalui persamaan (2.1) di atas.

Sehingga untuk sebuah vector pengamatan ) , , , (
2 1 K
X X X = X , peluang
gabungannya

=
= = = = =
L
d
d D P d D P P
1
) ( ) | ( ) ( x X x X (2.2)
Dalam latent class analysis dianggap bahwa, dalam tiap latent class,
manifest variable X
i
i = 1, 2, . . ., I independen satu sama lain. Oleh karenanya
Persamaan (2.2) menjadi:

[
= =
= = = = =
L
d
k
i
i i
d D x X P d D P P
1 1
) | ( ) ( ) ( x X (2.3)
Untuk keperluan penetapan keanggotaan subjek kedalam laten class,
peluangnya dihitung melalui aturan Bayes

30

) (
) ( ) | (
) | (
x X
x X
x X
=
= = =
= = =
P
d D P d D P
d D P (2.4)

Dengan peluang penyebut dinyatakan dalam persamaan (2.3). Nilai
maximum peluang ini dalam sebuah latent class mengarahkan pada penetapan
keanggotaan subjek kedalam latent class tersebut.

2.2 Metode Estimasi dan Pengujian Hipotesis

Jika banyak kombinasi respons adalah M,
K
I M = , Kernel log-likelihood
untuk sampel acak X = x adalah:


(2.5)
Parameter dalam model ditaksir memakai Maximum Likelihood.

Beberapa masalah yang perlu mendapat perhatian dalam penkasiran adalah:
1. Masalah identifikasi: Tidak terdapat jawab tunggal.
2. Maksimum Lokal
3. Peluang nol

Untuk pengujian kesesuaian model dipergunakan statistic uji likelihood-ratio

=
=
) (
ln 2
2
x X P n
n
n L
i
i

(2.6)


n menyatakan ukuran sampel. berdistribusi chi-square dengan derajat bebas (db)
sama dengan banyak sel dalam table kontingensi, M, dikurangi banyak parameter
dikurangi satu.

Apabila banyak sel besar, maka ada kemungkinan sejumlah sel dengan frekuensi
nol; sparse table, dalam keadaan ini p-value ditaksir memakai bootstrap.
Perbandingan model, selain memakai statistic
2
L di atas, memakai criteria
informasi BIC yang dinyatakan sebagai berikut :

BIC = - 2 ln (L) = p ln (N) (2.7)
dengan :
ln (L) : logaritma natural likelihood
p : banyak parameter yang ditaksir dalam model
N : banyak objek

Seleksi model dilakukan untuk memperoleh informasi tentang jumlah kelompok
sebagai solusi terbaik, dengan kriteria model terbaik adalah model dengan BIC
terkecil dari beberapa solusi k kelompok yang didapat.

Kinerja dari pengkalsifikasian dinilai juga melalui keliru klasifikasi.
Taksiran Proporsi keliru klasifikasi adalah:

=
= =
M
i
i i
P n L
1
) ( ln ln x X
31


( ) { }

=
= = =
M
i
i
i
d D P
n
n
E
1
| ( max 1 x X . (2.8)


3 HASIL DAN PEMBAHASAN
3.1. Eksplorasi Data Lahan Usaha Tambang
Eksplorasi dilakukan sehubungan dengan data yang diolah menghasilkan
output yang sulit di interpretasikan, sehingga tidak bisa diambil kesimpulan,
Dalam penelitian ini eksplorasi yang dilakukan meliputi penyederhanaan jumlah
kategori, uji korelasi polichorik, dan pengurangan variabel indikator dengan
memperhatikan bivariat residual (BVR).
Penelitian ini menggunakan 80 lahan usaha tambang bahan galian industri
di Kabupaten Sukabumi yang telah memenuhi kriteria zonasi wilayah
pertambangan dengan delapan variabel penimbang dalam pengelompokan lahan
usaha tambang. Kedelapan variabel tersebut terdiri dari : nilai bahan galian,
volume cadangan, kedalaman efektif tanah, tingkat kemiringan, ketinggian,
tingkat bencana, tingkat penggunaan tanah, dan jarak. Jenis data pada penelitian
ini memiliki skala pengukuran ordinal
Analisis latent class cluster mempunyai asumsi bahwa variabel indikator
dalam setiap kelas tidak berkorelasi. Dengan menggunakan uji korelasi bisa
diketahui variabel indikator mana yang berkorelasi dan yang tidak. Hal ini
menjadi dasar apakah semua variabel indikator dilibatkan atau tidak dalam
pengelompokan tersebut (dalam analisis latent class cluster).
Dalam analisis ini awalnya data lahan usaha tambang diolah dengan
latent Gold versi 4.0, tapi hasilnya sulit diinterpretasikan, sebab p-value dari L
2
menunjukkan bahwa model terliihat tidak ada yang cocok dengan data. Jika
memperhatikan nilai BIC, model -cluster bisa dipilih. Tetapi jika melihat BVR
nya, ternyata asumsi independensi local dilanggar. Model LC cluster dan bivariat
residual untuk data lahan usaha tambang tersebut dapat dilihat pada Tabel 3.1 dan
Tabel 3.2 berikut ini :

Tabel 3.1 Model Latent Class Cluster Lahan Usaha
Tambang Bahan Galian Industri

LL BIC(LL) Npar L df p-val ue Cl ass.Er r or .
M odel 1 1Cl ust er -632.5487 1361.225 22 597.9519 57 3.30E-91 0
M odel 2 2-Cl ust er -609.8564 1355.166 31 552.5673 48 6.10E-87 0.0671
M odel 3 3-Cl ust er -586.5442 1347.866 40 505.9428 39 1.50E-82 0.045
M odel 4 4-Cl ust er -568.7395 1351.582 49 470.3335 30 1.40E-80 0.0484
M odel 5 5-Cl ust er -557.0898 1367.608 58 447.0341 21 1.60E-81 0.0544
Lanjutan Tabel 3.1
M odel 6 6-Cl ust er -544.4162 1381.586 67 421.6869 12 9.60E-83 0.0644
M odel 7 7-Cl ust er -534.828 1401.734 76 402.5104 3 6.30E-87 0.0577
M odel 8 8-Cl ust er -522.8609 1417.125 85 378.5762 -6 . 0.0313


Tabel 3.2. Bivariat Residual untuk Model Dua Klaster
32

Indicat or s BHM G VOL KEDLM AN KEM RNGAN TINGGI BENC PTNH JARAK
BHM G .
VOLUM E 0.008 .
KEDLM AN 0.061 0.0288 .

KEM RNGAN 0.0266 0.0119 0.1646 .

TINGGI 1.8718 0.5215 0.0935 1.0177 .
BENC 0.2332 0.2081 0.0524 0.1461 0.6643 .
PTNH 0.0389 0.002 0.0181 0.0299 1.6979 0.0078 .
JARAK 0.0199 0.0858 0 0.0125 0.0268 0.041 0.1582 .

Hal ini mungkin disebabkan oleh banyaknya kategori, sehingga banyak
sel yang kosong. Oleh karena itu perlu disederhanakan jumlah kategorinya,
sehingga untuk masing-masing variable indicator menjadi dua kategori saja.
Penyederhanaan kategori ini dilakukan berdasarkan pertimbangan fihak
terkait..Dari hasil penggabungan kategori pada masing-masing variable indicator
menjadi dua kategori, untuk kedelapan variable indicator, didapat hasil
pengelompokan seperti pada Tabel 3.3 dan Tabel 3.4 berikut :

Tabel 3.3 Model Latent Class Cluster Lahan Usaha Tambang
Bahan Galian Industri

LL BIC(LL) Npar L df p-val ue Cl ass.Er r or .
M odel 1 1-Cl ust er -339.2536 713.4627 8 154.2157 71 4.20E-08 0
M odel 2 2-Cl ust er -318.2031 710.6867 17 112.1147 62 0.0001 0.0629
M odel 3 3-Cl ust er -304.3867 722.379 26 84.4819 53 0.0039 0.1404
M odel 4 4-Cl ust er -298.4588 749.8483 35 72.6262 44 0.0042 0.1486
M odel 5 5-Cl ust er -294.1035 780.4628 44 63.9156 35 0.002 0.142
M odel 6 6-Cl ust er -288.4042 808.389 53 52.5169 26 0.0016 0.0855
M odel 7 7-Cl ust er -283.0341 836.9739 62 41.7767 17 0.00072 0.0381
M odel 8 8-Cl ust er -279.2236 868.678 71 34.1557 8 3.80E-05 0.058

Tabel 3.4. Bivariat Residual untuk Model 2-Cluster
(Variabel Indikator Masing-Masing Dua Kategori)
Indicat or s BHNG VOLUM E KEDLM AN KEM RNGAN TINGGI BENC PTNH JARAK
BHNG .
VOLUM E 1.4054 .
KEDLM AN 0.7134 0.0092 .
KEM RNGAN 2.4722 1.3088 0.601 .

TINGGI 6.3859 3.1994 0.3938 0.0291 .

BENC 2.8292 3.5668 0.7125 1.1242 0.5206 .
PTNH 2.3769 0.0379 0.4288 0.0029 0.0084 0.0069 .
JARAK 0.5522 0.4795 0.1149 2.9474 0.9597 3.2147 0.0227 .

Mengingat penyederhanaa kategori masih belum memperlihatkan hasil
yang memuaskan, artinya hasil pengolahan masih sulit diinterpretasikan, maka
langkah selanjutnya adalah melakukan pengolahan terhadap data hasil pengujian
korelasi polikhorik, yaitu terhadap 8 variabel indikator : BHNG, Volume,
Kedalaman, Kemiringan, Tinggi, BENC (Tingkat Bencana) PTHN (Tingkat
Penggunaan Tanah) serta. Jarak. Output pengolahan diperlihatkan dalam Tabel
3.5 dan Tabel 3.6. Dari Tabel 3.5 model yang cocok dengan data dan parsimony
33

adalah model 2 cluster. Selanjutnya jika memperhatikan nilai BVR pada Tabel 3.6
untuk model 2 cluster masih diragukan untuk dipilih, karena nilai BVR masih ada
yang lebih dari di 3,84.
Oleh karena belum didapat hasil yang memuaskan, maka eksplorasi
dilakukan dengan memperhatikan nilai BVR. BVR menandakan bagaimana
pendugaan dan pengamatan hubungan antar dua peubah. BVR merupakan alat
untuk mengukur secara luas asosiasi antara dua peubah yang dihasilkan model
(Vermunt & Magidson, 2003). Setiap BVR sesuai dengan statistic Pearson chi-
kuadrat dibagi dengan derajat kebebasan yang mana frekuensi pengamatan dalam
tabulasi silang dua arah dari peubah dibandingkan dengan jumlah ekspektasi
yang diduga di bawah model latent class yang sesuai. Nilai BVR > 3,84 menjadi
acuan untuk membuang variable indicator (Vermunt & Magidson, 2005).
Membuang variable indicator dengan jalan memperhatikan nilai BVR
yang paling besar dan > 3,84. Selain itu juga memperhatikan nilai-nilai BVR yang
besar yang berkaitan dengan variable indicator tersebut ke arah baris dan kolom.
Berdasarkan proses yang dilakukan berulang kali, maka variable indicator yang
dibuang adalah : Ketinggian dan Tingkat Penggunaan Tanah (PTNH).

3.2. Taksiran dan Kecocokan Model LC Cluster Lahan Usaha Bahan Galian
Industri
Setelah dua variabel indikator dibuang, untuk data tersebut didapat hasil
pengelompokan pada Tabel 3.7 berikut ini.

Tabel 3.7. Model Latent Class Cluster Lahan Usaha Tambang Bahan Galian
Industri (6 variabel indicator masing-masing terdiri dari dua kategori)


LL BIC(LL) Npar L df p-val ue Cl ass.Er r or .
M odel 1 1Cl ust er -258.4601 543.1368 6 71.9833 57 0.087 0
M odel 2 2-Cl ust er -247.5043 551.8115 13 50.0718 50 0.47 0.1498
M odel 3 3-Cl ust er -242.9181 573.2252 20 40.8993 43 0.56 0.1937
M odel 4 4-Cl ust er -238.9081 595.7912 27 32.8792 36 0.62 0.1221
M odel 5 5-Cl ust er -233.9499 616.4611 34 22.963 29 0.78 0.0803
M odel 6 6-Cl ust er -231.2495 641.6463 41 17.562 22 0.73 0.0661
M odel 7 7-Cl ust er -229.1597 668.0528 48 13.3824 15 0.57 0.1392
M odel 8 8-Cl ust er -226.5615 693.4427 55 8.1861 8 0.42 0.095

Seperti telah dijelaskan pada bagian sebelumnya bahwa dalam memilih
model yang cocok adalah dengan memperhatikan nilai statistic L
2
dan nilai p-
value nya. Nilai L
2
memperlihatkan jumlah asosiasi diantara variabel yang tidak
diterangkan setelah menaksir model, sehingga nilai yang lebih rendah
menunjukkan model yang makin cocok kepada data. Berdasarkan hal ini model
yang dipilih adalah 2 cluster. Model ini masih sulit untuk diinterpretasikan dalam
hal labelisasi cluster yang terbentuk. Bagaimana jika perhatian diarahkan kepada
nilai BIC ?
Pada umumnya untuk data dengan variable indicator minimal 10
indikator, ukuran yang digunakan adalah AIC dan BIC, tetapi dalam prakteknya
untuk variable indikator yang jumlahnya kurang dari 10 pun mempergunakan
criteria ini ketika ukuran statistik L
2
masih diragukan untuk dipergunakan.
34

Kriteria untuk menentukan banyaknya kluster dengan melihat kolom p-
value yang distribusi Chi Kuadrat . Biasanya model dimana p- value lebih besar
dari 0,05 disebut cocok dengan data dan apabila dari beberapa model yang cocok
tadi mempunyai jumlah parameter (N-par) paling sedikit, maka model tersebut
dikatakan sebagai model parsimony, dan model seperti ini yang akan terpilih.
Untuk itu perhatikan kembali Tabel 3.7 di atas. Model yang cocok dengan data
adalah model dengan 2 cluster. Selanjutnya perhatikan banyaknya parameter (N-
par) untuk masing-masing model.. Kriterianya adalah pilihlah model yang cocok
dengan data sertamempunyai N-par paling sedikit. Dengan demikian model yang
cocok dan parsimony adalah model 2 Cluster.

3.4 Deskripsi Lahan Usaha Tambang
Lahan usaha tambang bahan galian industry dengan Indikator tertentu
kemungkinan ada dalam kelas mana, dapat dilihat pada Tabel 3.9.

Tabel 3.9. Besar kelas dan Indikator-Indikator yang Diperlihatkan Lahan Usaha
Tambang






















Dari Tabel 3.9 nampak bahwa seandainya indicator nilai bahan galian
(BHNG) sebagai factor penentu suatu lahan usaha tambang masuk pada suatu
klaster, maka kemungkinan besar (93%) suatu lahan usaha tambang bahan galian
industry yang bernilai tinggi akan masuk pada klaster 1, dan suatu lahan tambang
bahan galian industry yang bernilai rendah kemungkinan besar (51%) akan masuk
pada klaster 2. Sedangkan untuk variable indicator lainnya, seperti Volume,
Kedalaman dan lainnya dapat dilihat secara lengkap pada Tabel 3.9

3.5 Deskripsi Kelas (Cluster)

Cluster1 Cluster2
1. Overall 0.5922 0.4078
2. Indicators
BHNG
Rendah 0.5066 0.4934
Tinggi 0.93 0.07
VOLUME
Rendah 0.6457 0.3543
Tinggi 0.3212 0.6788
KEDALAMAN
Sulit Ditambang 0.6917 0.3083
Mudah Ditambang 0.5047 0.4953
KEMIIRINGAN
Tidak Aman 0.8621 0.1379
Aman 0.2708 0.7292
BENC
Rawan Bencana 0.6526 0.3474
Tidak Rawan
Bencana 0.2198 0.7802
JARAK
Jauh 0.7234 0.2766
Dekat 0.1489 0.8511
35

Dalam Tabel 3.10 diperlihatkan besar kelas dan lahan usaha tambang
seperti apa dalam tiap kelasnya. Ukuran masing-masing kelas Nampak hamper
berimbang, kurang lebih 59% lahan usaha tambang ada pada cluster-1 dan 41%
lahan usaha tambang ada pada cluster-2. Hampir semua lahan usaha tambang
dalam cluster-1 memiliki nilai indicator yang rendah, nilai BHNG rendah, nilai
Volume rendah, nilai Kedalaman rendah, nilai Kemiringan rendah, BENC rendah,
Jarak rendah

Tabel 3.10 Besar Kelas dan Indikator-Indikatornya
Cl ust er 1 Cl ust er 2

Cl ust er Si ze 0.5922 0.4078

KEM IRINGAN Cl ust er 1 Cl ust er 2
Indicat or s


Ti dak Aman 0.7887 0.8106
BHM G


Aman 0.2113 1.8106
Rendah 0.6837 0.9627

M ean 1.2113
Ti nggi 0.3163 0.0373

BENC 0.7351
M ean 1.3163 1.0373

Raw an Bencana 0.9473 0.2649
VOLUM E


Tdk Raw an Bencana 0.0527 1.2649
Rendah 0.9099 0.7274

M ean 1.0527
Ti nggi 0.0901 0.2726

JARAK 0.5273
M ean 1.0901 1.2726

Jauh 0.9408 0.4727
KEDALAM AN


Dekat 0.0592 1.4727
Sul i t Di t ambang 0.5459 0.3557

1.0592

M udah
Di t ambang 0.4541 0.6443

M ean 1.4541 1.6443



3.6 Klasifikasi Lahan Usaha Tambang Bahan Galian Industri

Pada bagian ini akan diperlihatkan bagaimana klasifikasi lahan usaha
tambang bahan galian industry menurut kelas dilakukan berdasarkan kategori-
kategori indikatornya, seperti terlihat pada Tabel 3.11
Dalam Tabel 3.11 dapat ditunjukkan bahwa : suatu lahan usaha tambang
bahan galian industry dengan nilai bahan galian (BHNG) rendah, volume
cadangan (Volume) rendah, kedalaman efektif tanah (Kedalaman) menunjukkan
mudah ditambang, tingkat kemiringan yang tidak aman untuk ditambang, tingkat
bencana (BENC) yang rawan, serta jarak yang jauh dengan sarana jalan , ada 9
lahan yang masuk ke dalam klaster-1 dengan peluang sebesar 0,95.
Secara keseluruhan klasifikasi lahan usaha tambang bahan galian industry
ke dalam klaster mana, dapat dilihat pada Tabel 3.11. Adapun ekspektasi
kesalahan pengklasifikasiannya adalah sebesar 0,15. Ini dapat dilihat pada Tabel
3.7. Artinya bahwa tingkat kesalahan klasifikasi lahan usaha tambang bahan
galian industry di Kabupaten Sukabumi menurut hasil dari analisis latent class
cluster adalah 0,15


4 KESIMPULAN
36

Dari hasil analisis yang telah dilakukan, maka dapat disimpulkan bahwa :
1. Pengelompokan 80 lahan usaha tambang bahan galian industry di Kabupaten
Sukabumi menghasilkan model terbaik yaitu model 2- cluster dengan
klasifikasi lahan usaha tambang yang kurang potensial dan potensial.
2. Karakteristik yang dimiliki oleh masing-masing klaster adalah sebagai
berikut :
a. Klaster-1 merupakan lahan usaha tambang bahan galian industry yang
kurang potensial, karena pada umumnya mempunyai karakteristik : Nilai
bahan galian rendah, volume cadangan rendah, tingkat kedalaman efektif
tanah yang sulit ditambang, rawan bencana, serta jauh dari akses jalan.
b. Klaster-2 merupakan lahan usaha tambang bahan galian industry yang
potensial , pada umumnya mempunyai karakteristik : Nilai bahan galian
tinggi, volume cadangan tinggi, tingkat kedalaman efektif tanah yang
rendah sehingga mudah ditambang, tidak rawan bencana, serta dekat
dengan akses jalan.

Tabel 3.11. Klasifikasi Lahan Usaha Tambang Bahan Galian Industri

BHNG VOL KDALAM N KM IRINGN BENC JARAK ObsFr eq M odal Cl ust er 1 Cl ust er 2
Rendah Rendah Rendah M udah Raw an Jauh 9 1 0.9499 0.0501
Rendah Rendah Rendah M udah
Tdk
Raw an Jauh 3 1 0.7453 0.2547
Rendah Rendah Rendah Sul i t Raw an Jauh 7 1 0.5427 0.4573
Rendah Rendah Rendah M udah Raw an Jauh 11 1 0.897 0.103
Rendah Ti nggi Rendah M udah Raw an Jauh 3 1 0.8337 0.1663
Ti nggi Rendah Rendah M udah Raw an Jauh 7 1 0.9956 0.0044
Ti nggi Rendah Rendah M udah Raw an Dekat 1 1 0.9408 0.0592
Ti nggi Rendah Ti nggi M udah Raw an Jauh 4 1 0.9905 0.0095
Ti nggi Rendah Ti nggi Sul i t Raw an Jauh 2 1 0.8668 0.1332
Ti nggi Ti nggi Ti nggi M udah Raw an Jauh 1 1 0.9649 0.0351
Rendah Rendah Rendah Sul i t Raw an Dekat 1 2 0.0769 0.9231
Rendah Rendah Rendah Sul i t
Tdk
Raw an Dekat 3 2 0.0127 0.9873
Rendah Rendah Ti nggi M udah Raw an Dekat 2 2 0.3793 0.6207
Rendah Rendah Ti nggi M udah
Tdk
Raw an Dekat 1 2 0.0862 0.9138
Ti nggi Ti nggi Ti nggi M udah
Tdk
Raw an Dekat 9 2 0.3527 0.6473
Lanjutan Tabel 3.11
Rendah Rendah Ti nggi Sul i t Raw an Dekat 5 2 0.0368 0.9632
Rendah Ti nggi Rendah M udah Raw an Dekat 1 2 0.2603 0.7397
Rendah Ti nggi Rendah Sul i t Raw an Jauh 1 2 0.2388 0.7612
Rendah Ti nggi Rendah Sul i t Raw an Dekat 1 2 0.0215 0.9785
Rendah Ti nggi Ti nggi Sul i t Raw an Jauh 1 2 0.1259 0.8741
Rendah Ti nggi Ti nggi Sul i t Raw an Dekat 1 2 0.01 0.99
Rendah Ti nggi Ti nggi Sul i t
Tdk
Raw an Jauh 3 2 0.0217 0.9783
Rendah Ti nggi Ti nggi Sul i t
Tdk
Raw an Dekat 1 2 0.0016 0.9984
Ti nggi Rendah Ti nggi Sul i t Raw an Dekat 1 2 0.3136 0.6864
37



5. DAFTAR PUSTAKA

Hair, J. F, Rolph E. A, Ronald L. T, and William C.B, Multivariate Data Analysis,
Fifth Edition, Prentice Hall International, Inc, Upper Saddle River, New
Jersey.

Harison, Jimmie. 2004. Analisis latent Class Klaster Untuk Variabel Kontinu.
Skripsi Statistika FMIPA UNPAD.

Johnson, R.A, and D.W. Wichern, 1992, Applied Multivariate Statistical Analysis,
Prentice Hall, Inc., Englewood Cliffis, New Jersey.
Kaufman,L., and Rousseeuw.P.J.,1990. Finding groups in data : An Introduction
to cluster analysis.,New York; John Wiley and Sons, Incl.
Punj, Girish, and David W.S., 1983, Cluster Analysis in Marketing Research :
Review and Suggestions for Application, Journal of Marketing Research,
20 (May), 134-148
Rencher, Alvin, 2002, Method of Multivariate Analysis, John Willey & Sons. Inc.,
Publication, Canada
Sharma, Subhash, 1996, Applied Multivariate Techniques, Univ. Of South
California, John Wiley & Sons, Inc., New York
Vermunt , Jeroen K, and Jay Magidson (2000) , Latent class cluster analysis,
Chapter B1 in Hagenaars and Mc Cutcheon, eds, Advances in Latent Class
Models, Cambridge University Press, Related to Latent Gold Software .
_____________________________________, (2002), Latent Class Models for
clustering : A comparison with K-Means, Canadian Journal of Marketing
Research, 20, 37 - 44
_____________________________________, (2005 Technical Guide for latent
GOLD 4.0:),Basic and advance , Statistical Innovation Inc


38

BOOTSTRAPPING FOR
A STRUCTURAL EQUATION MODEL WITH A
NEARLY NON-POSITIVE DEFINITE FITTED
COVARAINCE MATRIX


YUSEP SUPARMAN

Yusep Suparman: Statistics Department, Padjadjaran University, Bandung, Indonesia.
yusep.suparman@unpad.ac.id


ABSTRACT

Structural equation modeling (SEM) has been widely adopted for measuring
causal relationship. Instead of fitting individual observations as in regression
analysis, SEM works in a different way by fitting a sample covariance matrix to
a model implied covariance matrix and producing a fitted covariance matrix.
One problem emerges when a fitted covariance matrix is nearly non-positive
definite. The estimated maximum likelihood standard errors in the model
become implausibly large which in turn jeopardize inferences. In this paper, we
show that bootstrapping can overcome this problem. We compare standard
errors from two equivalent SEM models, i.e. a discrete and a continuous time
hedonic price autoregression panel model. We find out that the bootstrap
standard errors obtained from the continuous time model, which suffers from
nearly non-positive definite fitted covariance matrix problem, are comparable to
the maximum likelihood standard errors obtained from the discrete time model
which is free from the problem.

Key words: autoregressive panel model, bootstrap, exact discrete time model,
fitted covariance matrix, hedonic price model, structural
equation modeling.


1. INTRODUCTION
Structural equation modeling (SEM) has been widely adopted in
behavior and life sciences for examining causal relationships. One of the reasons
is that SEM accommodates a wide range of statistical models, from simple linear
regression model to continuous time model with latent variables. In addition,
SEM ability in including measurement errors into the analysis overcomes
methodological obstacle which cannot be handle in a standard statistical
analysis. Furthermore, SEM allows latent constructs to be explicitly included in
the model which enhance the interpretations of analysis results.
Different from regression analysis which works based on individual
data, SEM works based on a covariance matrix. SEM fits a sample covariance
matrix to a model implied covariance matrix which is a function of parameters
in the model and produces a fitted covariance matrix (Jreskog, 1996). Among
39

estimation methods, the maximum likelihood has been the most often used.
Nevertheless, one problem arise when a fitted covariance matrix is non-positive
definite or nearly non-positive definite. In the former condition, we could not
estimate the standard error. In the later one, we obtain implausibly large
standard error. The two conditions jeopardize the parameter estimates inference.
This problem emerges due to the maximum likelihood standard error estimates
are a function of the inverse of fitted covariance matrix (Jreskog, 1973),
In this paper, we intend to show that under a nearly non-positive
definite fitted covariance matrix, the bootstrap procedure produces standard
errors which can be used in the parameter estimates inference.
To achieve this goal, we compare the maximum likelihood standard
errors obtained from a discrete time hedonic price model (Suparman et. al.,
2008) to the bootstrap standard error from an equivalent continuous time
hedonic price model whose fitted covariance matrix is nearly non-positive
definite. The specifications of the discrete time model are following Suparman
et al. (2008). The continuous time model specifications are adopted from the
exact discrete time structural equation model (EDM-SEM) proposed by Oud &
Jansen (2000).
The continuous time specifications applied to the discrete time hedonic
model results in a nearly non-positive definite fitted covariance matrix. This
condition indicated by a very small value of the matrix determinant, i.e.
5
10 51 . 2

. Consequently, we obtain very large maximum likelihood standard
error estimates. While the values of the parameter estimate are slightly different
from the discrete time parameter estimates, the standard error estimates are
much larger than the discrete time ones.
Accordingly, we estimated the continuous time standard errors
following a bootstrap procedure (Efron and Tibshirani, 1993). We generated two
thousand bootstrap samples of 1315 size. From the bootstrap procedure we
obtain much lower standard error estimates than the ones obtained from the
maximum likelihood procedure. In comparison to the discrete time standard
error estimates, although the values are generally larger, the differences are
minor.
Next, we organize the paper as the following. We discuss the SEM
model and the bootstrap procedure in section 2 and 3 respectively. Section 4
describes a case study. Section 5 concludes.


2. STRUCTURAL EQUATION MODEL
The structural equation modeling (SEM) is a procedure for showing
whether the causal assumptions embedded in a model match a sample of data. A
SEM allows to dealing with latent and observed continuous variables
simultaneously. For that purpose a SEM made up of a structural equation model,
(1), and two measurement models, (2) and (3).
+ + + = , (1)
y + + =
y y
, (2)
x + + =
x x
, (3)
40

where , , y , and x are vectors of latent endogenous, latent exogenous,
variables observed endogenous, and observed exogenous respectively. , , and
are vectors of error terms. ,
y
, and
x
are vectors of constant intercept
terms. Parameters in a SEM are defined in two structural parameter matrices
( ) , , two measurement parameter matrices ( )
x y
, , four covariance matrices
( ) ( ) ( ) ( ) ( )
o c
= = = = cov , cov , cov , cov , three vectors of constant
intercept terms ( )
x y
, , , and one mean vector of latent exogenous variables ( ) .
Further standard SEM specifications may be referred to Jreskog & Srbom
(1996).
The most widely used estimation method for SEM parameters is the
maximum likelihood procedure. Under the maximum likelihood procedure, we
minimize the fit function
( ) ( ) ( ) ( ) q p F +
'
+ + =

S z z S log tr log
1 1
,
where
( )
|
|
.
|

\
|
+ ' ' ' '
+ ' ' + '
=
x x y x
x y y y
A
A A A
with ( )
1
= B I A ,
( )
'
=
x y
, with ( ) A + + =
y y y
and
x x x
+ = ,
S is a sample covariance matrix,
z is a sample mean vector,
p is the number of observed endogenous variables, and
q is the number of observed exogenous variables.
Generally, we assume that and Sare positive-definite which means that they
are nonsingular. In addition, we assume that y and x have a multivariate normal
distribution.
The maximum likelihood procedure provides an asymptotic variance-
covariance matrix of the estimates as the inverse of the information matrix, i.e. the
expected second derivative of the maximum likelihood fit function multiplied by
the number of observations minus one. Jreskog (1976) shows that the second
derivative of the log likelihood function is a matrix linearly depending on the
inverse of the fitted covariance matrix. Since an inverse matrix is a function of the
matrix determinant, the second derivative is also a function of the determinant.
This condition also applies to the standard errors, which are in the main diagonal
of the variance-covariance matrix of the estimates.
Accordingly, a relatively large value of fitted covariance matrix
determinant results in a relatively small standard error estimates. And a relatively
small one results in relatively large standard error estimates. A special case of this
condition can be found in the regression analysis in which the latter condition is
called a multicollinearity problem due to the highly correlated independent
variables. In SEM, generally the problem may also be caused by model
specifications as we show it in section four.
To overcome the problem of implausibly large standard error due to a
small value fitted covariance matrix or we may call it nearly non-positive-definite
fitted covariance matrix, we adopt a bootstrap procedure for obtaining standard
error estimates.
41



3. BOOTSTRAP PROCEDURE
In overcoming the multicollinearity problem, researchers often search for
highly multicollinear independent variables and drop or replace one of the
variables. Alternatively, ones may get additional data if the sample size is
considered to be small. Basically, they form a new data set to be applied to the
model or re-specify the model. We may take this idea and apply it for the case of
nearly non-positive definite fitted covariance matrix in SEM. We can collect
additional data. But if the sample size is already large, the effect will be minor.
We can re-specify the model but we may results in a theoretically in consistent
model. Hence, we should find another way which will not end in these problems.
Effron and Tibshirani (1993) present an alternative procedure for
estimating a standard error and testing a hypothesis based on empirical
distribution by employing the frequentists idea of repeated sampling, called
bootstrap procedure. By means of the bootstrap, the SEM standard error estimates
will not be a function of the determinant of fitted covariance matrix. Instead, they
will be calculated as the standard deviation of their respective parameter estimates
from each bootstrap sample. The followings are the steps in obtaining standard
error estimates.
1. Form B independent samples,
B * 2 * 1 *
, , , Z Z Z , with size of n by a random
sampling with replacement from the n observation units.
2. Evaluate the bootstrap replication corresponding to each bootstrap sample,
( ) ( ) B b s b
b
, , 2 , 1

* *
= = Z .
3. Estimate the standard errors by the sample standard deviation of the B
replications
( ) ( ) | | ( )
2 1
1
2
* *
1

)
`

=

=
B b se
B
b
B
u u ,
where ( ) ( ) B b
B
b

=
=
1
* *

u u .
We use the procedure for estimating the standard error of the parameter estimates
in the SEM with nearly non-positive definite fitted covariance matrix in section 4.


4. CASE STUDY
To illustrate the use of the bootstrap for estimating standard errors of
SEM estimates under nearly non-positive definite fitted covariance matrix, we
compare two equivalent SEM models. The first model is the discrete time hedonic
price autoregressive panel model proposed by Suparman et al. (2008). The model
is intended for estimating the marginal price of house characteristics, particularly
piped water service. The autoregressive form is formulated for handling omitted
variable bias in a hedonic price model. The second model is the continuous time
version of the first model. To form the second model we integrate the exact
discrete time (EDM)-SEM (Oud & Jansen, 2000) specification into the first
model.
42

There is only one directly observed variable in the model, i.e. monthly
house rent. This implies an identity relationship between the latent and the
observed rent variable:
9 7
y = q . The dependent variables included in the model are
the latent variable household characteristics (
1
q ) measured by two observables,
viz. household size (
1
y ) and household monthly expenditure (
2
y ); the latent
variable house size (
2
q ) measured by the observables floor area (
3
y ) and number
of rooms(
4
y ). The other latent explanatory variables are identical to their
indicators. Specifically, house condition index (
5 3
y = q ), in house tap water (
6 4
y = q ), presence of well water (
7 5
y = q ), and finally, the neighborhood
characteristics median household monthly expenditure: (
8 6
y = q ).
The data used is a three-wave Indonesian Family Life Survey (IFLS)
panel dataset which is split into a rural and an urban dataset. The first, second and
third wave were done in 1993, 1997, and 2000 respectively. Here, we use only the
rural dataset which consists of 1315 unit observations.
Now we turn to the discrete time model specifications. For our study, we
focus only on the structural model. The specifications of the measurement models
can be referred to Suparman (2008). The structural model of the hedonic price
autoregressive panel model proposed by Suparman (2008) is formulated as
1 1 1 1
7
7
1
6
1
0 7

+ + + =

= =
i i i i i i i
t
j
jt jt
j
jt jt t t
, q q | | q for 2 , 1 = i . (4)
with 6 , , 2 , 1 ;
1 1 7
= =

j
jt t jt
| , (the constraint of omitted variable bias
correction). Moreover, they assume an economic constraint of equal preference
which is translated into the constraint of
2 1
0611 . 1
jt jt
| | = .
The specifications of the continuous time model are based on the EDM-
SEM specifications. An EDM is a continuous time model based on discrete time
observations. One of the reasons for adopting continuous time modeling is that it
is considered to be more realistic than a discrete time model and can solve many
problems in discrete time modeling (Bergstrom, 1988; Gandolfo, 1993; Oud,
2002). Oud and Jansen (2000) integrated the EDM into the SEM results in a
continuous time modeling which allows for the inclusion of latent concept
variables. We apply their EDM-SEM specification into (4), particularly the
dynamic part of the equation.
The EDM-SEM specifications applied to (4) are formulated as the
following constrains:
1
1
7

A
=
t
i
t
t
e
o
,
( )t o | 1
1
7
1
0
=

i i
t t
,
( ) ( ) o , 1
2
7
2
7
1 1
=

i i
t t
Var ,
with o , t , and are continuous time parameters. They are the EDM drift, mean
trajectory and error variance parameter respectively.
Furthermore, to account for the 1997 economic crisis that hit Indonesia
just after the second wave data collection was finished, Suparman et al. (2008)
specified the intercepts in (4) to be different for
1
t and
2
t , without any further
43

constraints. Here we assume that the crisis occurred right after
1
t , say
*
1
t . Hence
for 2 = i , we replace
1
t in (4) by
*
1
t . We furthermore assume that the crisis, on
average, reduced the household income by the proportion
m
e of the
1
t level.
Given the constant preference assumption, the income decrease due to the crisis
implies that the
1
jt
| s are reduced by the same proportion. Hence, at
*
1
t and at
1
t ,
the coefficients are related as follows:
1
*
1
jt m
jt
| e | = for 6 , , 2 , 1 = j . (5)
The other crisis effects, which cannot be explained by the variables in the model,
are aggregated in a parameter
a
e . We may interpret
a
e as the crisis shock to the
mean of monthly rent. Thus, at
*
1
t , the intercept is
a t
t
e | | + =
1
*
1
0
0
. (6)
We also apply the multiplicative effect to the error terms which gives:
1
*
1
7
7
t m
t
, e , = with ( ) ( )
1
*
1
7
2
7
var var
t m
t
, e , = . (7)
Accommodating the 1997 economic crisis effect by substituting (5)-(7) into (4)
we obtain for 2 = i ,
*
1
1
*
1
2 2
*
1
2 7
7
1
6
1
0
7
t
j
jt
jt
j
jt jt
t
t
, q q | | q + + + =

= =
(8)
We present the maximum likelihood marginal price estimates for the
discrete time and continuous time model produced by Mx program (Neal, et al.
2003) in table 1. The entries of the first raw for each parameter are the estimates.
Generally, the different between the continuous time estimates and their
respective discrete time are minor except for the well water. However, if we
compare the maximum likelihood standard errors, in the second raw of each
parameter, we will find that they are highly different. The continuous time
standard errors are almost ten times higher than the discrete time ones. The
estimates are highly inconsistent. After calculating the determinant of continuous
time fitted covariance matrix, obtain a value of
5
10 51 . 2

which is very small,
we conclude that the inconsistency occurs due to the nearly non-positive definite
fitted covariance matrix.
To overcome this problem, we conducted bootstrap procedure for
estimating standard errors. We generated two thousand bootstrap samples ( B ) of
1315 size ( n ). For each bootstrap sample we estimate the parameters in the
continuous time model by means of the maximum likelihood procedure. Next, for
each of the parameter we calculate the standard deviation of its estimates. We
present the estimates in the third raw of each variable. Most of the bootstrap
standard error estimates are higher than their respective maximum likelihood
standard error estimates, except for household characteristics. Nevertheless, the
different are minor. The bootstrap standard error estimates in the continuous time
model are consistent to their respective maximum likelihood standard error
estimates in the discrete time model.

Table 1. Marginal Price Estimates
Variable / Parameter Standard Discrete
Time Approach
EDM-SEM
44

Wave 1 Wave 2 Wave 1 Wave 2
Household
characteristics (
1
q )
0.0542 0.0511 0.0561 0.0529
(0.0136) (0.0128) (1.2980) (1.2221)
[0.0106] [0.0100]
house size (
2
q )
0.0444 0.0419 0.0675 0.0636
(0.0154) (0.0145 (1.3398) (1.2615)
[0.0236] [0.0222]
House conditions
index (
3
q )
0.1408 0.1327 0.1104 0.1041
(0.0264) (0.0247) (0.9579) (0.9019)
[0.0354] [0.0334]
Presence of in house
tap water (
4
q )
0.1540 0.1451 0.1178 0.1110
(0.0898) (0.0846) (0.6249) (0.5884)
[0.1069] [0.1008]
Presence of well
water (
5
q )
0.0102 0.0096 0.0047 0.0044
(0.0614) (0.0578) (0.6131) (0.5773)
[0.0713] [0.0671]
Neighborhood
characteristics (
6
q )
0.0898 0.0847 0.1401 0.1320
(0.0264) (0.0264) (0.9115) (0.8582)
[0.0415] [0.0391]


5. CONCLUDING REMARKS
In this paper we use bootstrap procedure for estimating standard
errors of SEM parameter estimates with a nearly non-positive definite fitted
covariance matrix indicated by a very small determinant. Under this
condition, the maximum likelihood standard error estimates become
implausibly large. The bootstrap procedure can overcome this problem. Its
estimates are consistent to the maximum likelihood standard error estimates
from an equivalent model. This comparison lends support to the use of
bootstrap procedure for estimating standard error of SEM with a nearly non-
positive definite fitted covariance matrix.


6. REFERENCES
Bergstrom, A. R. (1988). The history of continuous-time econometric models.
Econometric theory, 4, 365-383
Efron, B. & Tibshirani, R.J. (1993). An introduction to the bootstrap (pp. 224-
227). London: Chapman and Hall.
Gondolfo, G. (1993). Continuous-time econometrics has come of age. In G.
Gondolfo (ed.), Continuous time econometrics (pp. 1-11). London:
Chapman Hall
Jreskog, K. (1973). A General Method for Estimating a Linear Structural
Equation System. In A.S. Goldberger & O.D. Duncan (eds.), Structural
Equation Model in the Social Sciences (pp. 85-112). London: Seminar
Press.
Jreskog, K. and Srbom, D. (1996). LISREL 8: Users Reference Guide.
45

Chicago: Scientific Software International.
Neale, M.C., Boker, S.M., Xie, G., & Maes, H.H. (2003) Mx: Statistical
Modeling (6
th
ed.). Richmond: Department of Psychiatry.
Oud, J.H.L & Jansen, R.A.R.G. (2000). Continuous Time State Space Modeling
of Panel Data by Means of SEM. Psychometrika, 65, 199-215.
Oud, J.H.L. (2002). Continuous Time Modeling of the Cross-Lagged Panel
Design. Kwantitatieve Methoden, 69, 1-26
Suparman, Y., Folmer, H., Oud, J.H.L., & Resosudarmo, B.P. (2008). Eliciting
the Willingness to Pay for Piped Water from Self-Reported Rent Appraisals
in Indonesia: A SEM Autoregressive Panel Approach. A paper presented at
16
th
Annual Conference of the European Association of Environmental and
Resource Economist. Gothenburg University, Sweden

46

Analisis Korespondensi Multipel (Multiple Correpondence
Analysis (MCA)) untuk Skala Pengukuran Data yang Berbeda
(Kualitatif dan Kuantitatif)


Rahmat Hendrawan

Staff Seksi Data dan Informasi PPPPTK Pertanian Cianjur
rahmathendrawan@ymail.com



ABSTRACT
Multiple Correpondence Analysis (MCA) is a method designed to reduce the
dimension, it presents each category of variables together in a small dimensional
vector space optimally. MCA is an extension Correspondence Analysis (CA)
which is used to analyze the pattern of relationship of some categorical variables.
Technique of multiple correspondence analysis obtained by using the standard of
Correspondence Analysis the first, MCA change raw data into indicator martix,
namely the matrix with elements 0 and 1 (Herve and Domonique, 2007). Burt
Matrix is a symmetric matrix formed from multiplication of indicator matrix
(Yangchun and Kern II, 2003). However determination of coordinates in
correspondence analysis using Generalized Singular Value decomposition
(GSVD) of the residual matrix. The thesis will apply Multiple Correspondence
Analysis on the data of Vocational School (SMK) on Agriculture, Marine and
Chemical Industries Programe in which the results of the analysis will perform
plots and similarities from several categories of variables that are owned by SMK
as respondents.
Key words: Correpondence Analysis (CA), Multiple Correpondence Analysis
(MCA), Generalized Singular Value Decomposition (GSVD), Burt
Matrix


1. PENDAHULUAN
Pusat Pengembangan dan Pemberdayaan Pendidik dan Tenaga
Kependidikan (PPPPTK) Pertanian Cianjur sebagai lembaga pengembangan dan
pemberdayaan pendidik dan tenaga kependidikan (PTK) dalam melaksanakan tugas
pokok dan fungsinya PPPPTK Pertanian harus memberikan pelayanan yang up to
date dan mampu memberikan solusi terhadap permasalahan yang dihadapi pendidik
dan tenaga kependidikan dalam melaksanakan upaya peningkatan mutu dan
pemerataan pendidikan, khususnya Sekolah Menengah Kejuruan (SMK) Pertanian,
Kelautan dan Kimia Industri.
Sehubungan dengan hal di atas, PPPPTK Pertanian akan merumuskan dan
menentukkan suatu kebijakan, dimana salah satu kebijakan yang diambil adalah
berdasarkan data (kondisi real potensi atau sumber daya SMK) dengan pendekatan
suatu metode statistik, agar kebijakan yang diambil menjadi objektif. Variabel yang
satu dilihat korelasinya dengan variabel yang lain. misalnya: variabel kemudahan
47

akses SMK dihubungkan banyaknya program studi; jumlah pendidik dihubungkan
dengan banyaknya pendidik yang mengikuti pengembangan atau pelatihan profesi.
Dengan melihat hubungan dari kategori SMK maka akan diambil suatu kebijakan,
misalnya apakah perlu adanya perhatian khusus pada kategori tertentu dari SMK
agar lebih banyak pendidiknya yang mengikuti pengembangan atau pelatihan
profesi.
Proses analisis data dengan menghubungkan dua variabel belum dapat
memuaskan karena besar kemungkinan akan kehilangan informasi penting yang
terkandung didalam korelasi antar variabel sehingga akan memperoleh kesimpulan
yang kurang tepat, untuk itu data mengenai keterkaitan atau korelasi antar variabel
tentang kondisi SMK ini ingin dilihat secara bersamaan yang melibatkan semua
variabel dalam satu analisis dan upaya ini merupakan perluasan dari analisis korelasi
dua variabel yang sudah dilaksanakan sebelumnya.
Salah satu metode statistik yang dapat dipergunakan untuk mendapatkan
informasi yang dibutuhkan di atas adalah pemetaan persepsi (perceptual mapping).
Metode pemetaan persepsi dapat menghasilkan plot yang menampilkan posisi
kondisi real potensi / sumber daya SMK tertentu. Metode ini juga biasanya
dibutuhkan untuk mereduksi dan memberikan penjelasan tentang hubungan antara
dua variabel di dalam data yang berbentuk matriks berdimensi besar. Pemetaan
presepsi biasanya dilakukan melalui beberapa analisis statistik, dan analisis tersebut
kebanyakan memiliki asumsi diantaranya ialah jenis data harus dengan skala
pengukuran kuantitatif, hubungan antar variabel harus linier, menggunakan asumsi
tentang distribusi dan model harus dihipotesiskan.
Pada prakteknya asumsi-asumsi tersebut sulit terpenuhi, untuk mencapai
asumsi tersebut dibutuhkan biaya yang lebih besar dan menyita lebih banyak waktu.
Pada kenyataannya data yang sering ditemukan adalah data yang berbentuk tabel
kontingensi yang variabel-variabelnya kualitatif, dengan hubungan antar variabel
non-linier, tidak ada asumsi tentang distribusi dan model tidak dihipotesiskan.
Skala pengukuran data kondisi SMK berupa data mix (campuran), yaitu
data kategori dan metrik. (data kualitatif dan kuantitatif). Data kategori misalnya
SMK dibedakan antara yang mudah diakses dan sulit diakses, SMK lama dan baru,
SMK unggulan dan non unggulan, dan seterusnya. Sedangkan data kuantitatif
menyatakan jumlah potensi atau sumber daya yang ada di SMK misalnya jumlah
pendidik, jumlah program studi, jumlah pendidik yang mengikuti pengembangan
dan pelatihan profesi, dan seterusnya.
Struktur data kondisi SMK Pertanian, Kelautan dan Kimia Industri di atas
memerlukan analisis korespondensi yang melibatkan lebih dari dua variabel yang
merupakan perluasan dari analisis korespondensi sederhana (Correspondence
Analysis (CA)) yang dirancang untuk menganalisis pola keterkaitan dua atau lebih
variabel.
Identifikasi masalah yang akan diteliti yaitu mengenai analisis
korespondensi untuk data dengan variabel yang lebih dari dua dan skala pengukuran
data yang berbeda yaitu kualitatif dan kuantitatif. Tujuan dari penelitian ini adalah
untuk mengetahui analisis korespondensi untuk data dengan variabel yang lebih dari
dua yaitu analisis korespondensi multipel (Multiple Correspondence Analysis
(MCA)) dan penyelesaiannya untuk skala pengukuran data yang berbeda (kualitatif
dan kuantitatif).
48

Manfaat yang dihasilkan, melalui analisis korespondensi multipel untuk
skala pengukuran data yang berbeda (kualitatif dan kuantitatif) diharapkan akan
memberikan informasi yang tepat tentang keterkaitan beberapa kategori dari variabel
secara keseluruhan secara bersamaan dengan objektif dan tidak dilihat secara
parsial, dan pada akhirnya diharapkan akan memenuhi kebutuhan informasi yang
digunakan untuk berbagai keperluan dan pengambilan kebijakan


2. Analisis Korespondensi Multipel (Multiple Correspondence Analysis (MCA))
Analisis Korespondensi Multipel dan Analisis Korespondensi Bersama
merupakan perluasan tabulasi silang tunggal dari Analisis Koresponedensi
Sederhana untuk dua atau lebih variabel kategori (Nenadic dan Greenacre, 2007).
Analisis Korespondensi Multipel merupakan perluasan dari Analisis
Koresponedensi Sederhana untuk lebih dari dua variabel (Yangchun dan Kern II,
2003). Analisis Korespondensi Multipel (MCA) merupakan perluasan dari Analisis
Korespondensi Sederhana (CA) yang digunakan untuk menganalisis pola hubungan
beberapa variabel kategori yang dependen (Herve dan Domonique, 2007).
Analisis korespondensi multipel adalaha metode yang memvisualisasikan
gabungan dari dua atau lebih variabel kategori dengan tidak mengurangi analisis
korespondensi dua variabel. Teknik analisis korespondensi multipel diperoleh
dengan menggunakan standar analisis korespondensi dengan mengubah data mentah
ke dalam matiks indikator, yakni matriks dengan elemen 0 dan 1 (Herve dan
Domonique, 2007).
Matriks data dalam analisis korespondensi multipel diperoleh dengan
membentuk dan menyajikan data mentah (raw data) ke dalam matriks indikator
(Greenacre, 2005)
Z
I ]
= [ Z
1I ]1
Z
2I ]2
Z
I ]
]

Analisis korespondensi multipel pada awalnya menggunakan tabel data
mentah atau raw data yaitu tabel yang barisnya adalah responden atau case dan
kolomnya adalah variabel. Kategori-kategori dari variabel dituliskan langsung pada
sel-sel tabel.
Tabel indikator merupakan pengembangan dari tabel data mentah yang
merubah data kategorik menjadi data numerik. Tabel indikator dapat dibentuk dalam
suatu matriks yang disebut matriks indikator (Greenacre, 2005; Rencher, 2002).
Matriks indikator merupakan matriks yang menunjukkan presensi dari
kategori tiap-tiap responden atau case. Elemen dari matriks indikator merupakan
elemen biner yakni bernilai 0 dan 1, dengan 0 untuk menyatakan absent dan 1
menyatakan present. Matriks indikator biasanya dinotasikan dengan Z berorde I [
dengan I adalah total responden (case) dan J adalah total kategori.
Matriks indikator dengan Q variabel dinyatakan dalam bentuk partisi
matriks sebagai berikut :
Z = [ Z
1
Z
2
Z
Q
]
masing-masing partisi matriks Z
q
, untuk q = 1, 2, , mempunyai orde I [
q

dengan [
q
: jumlah kategori pada masing-masing variabel.


49

Secara umum massa kolom dari matriks indikator didefinisikan sebagai:
c
Z
=
1
QI
Z
T
1
I 1

Matriks Burt merupakan matriks simetrik yang terbentuk dari perkalian
matriks indikator Z
t
Z. (Yangchun dan Kern II, 2003)
Bentuk umum dari matriks Burt adalah :
B = Z
T
Z =

Z
1
T
Z
1
Z
1
T
Z
2
Z
1
T
Z
Q
Z
2
T
Z
1
Z
2
T
Z
2
Z
2
T
Z
Q

Z
Q
T
Z
1
Z
Q
T
Z
2
Z
Q
T
Z
Q


Karena matriks Burt simetrik maka hanya perlu dihitung massa kolom ( c
B
)
dan massa kolom pada matriks indikator ( c
Z
) bernilai sama. didefinisikan dengan :
c
B
=
1

2
I
B1
] 1


2
I adalah grand total dari matriks Burt
Koordinat dan Pemetaan Profil Kolom. GSVD (Generalized Singular Value
Decomposition) dari Matriks residual Burt merupakan matriks simetrik sehingga
akan memenuhi eigen values decomposition. Untuk menentukan GSVD dari
T ww
T
adalah dengan menentukan matriks standardized residual O
O = D
w
-
1
2
,
( T ww
T
) D
w
-
1
2
,

Singular Value Decomposition biasa dari O = FD
y
F
T
denga F
T
F = I
misalkan M= D
w
1
2
,
F dan D
2
= D
y
diidapat GSVD T ww
T
= MD
2
M
T
dengan
M
T
D
w
-1
M = I
Nilai eigen atau inersia utama pada analisis korespondensi multipel
dibedakan menjadi dua, yaitu inersia utama matriks indikator ( z
Z
) dan matriks Burt
( z
B
) . Nilai z
Z
merupakan nilai eigen hasil dari SVD
x
dengan z
1
Z
z
2
Z

z
K
Z
> 0 dengan K adalah banyaknya variabel kategori. Nilai z
B
adalah kuadrat dari
z
Z
atau z
B
= ( z
Z
)
2
. Nilai singular adalah akar dari inersia utama matriks indikator,
yaitu D
6
= D
2
1
2
,
. Nilai singular digunakan untuk menentukan koordinat profil
kolom.
Koordinat utama profil kolom untuk K dimensi didefinisikan sebagai:
H
] K
= D
w
-1
] ]
M
] K
D
2
1
2
,
K K

Kontribusi Inersia. Perhitungan inersia analisis korespondensi multipel,
jarak _
2
tidak digunakan karena jarak _
2
hanya tepat digunakan untuk perhitungan
inersia tabel kontingensi dua arah yakni pada analisis korespondensi sederhana.
Total inersia pada analisis korespondensi multipel hanya bisa diperoleh dari
matriks indikator yang dinotasikan sebagai :

2
( Z) = _
[

1]
Inersia profil kolom disebut dengan kontribusi titik-titik koordinat terhadap
inersia utama matriks indikator ( z
Z
) atau axis utama. Inersia profil kolom
50

menentukan seberapa besar kontribusi suatu titik koordinat dari kategori variabel
dalam mempresentasikan kategori tersebut pada suatu axis utama. Inersia relatif
digunakan untuk menentukan seberapa besar kontribusi suatu titik koordinat pada
ruang K dimensi. Kemudian dari inersia relatif ini dapat ditentukan kuadrat jarak
antara titik koordinat dengan titik origin. Kontribusi relatif adalah kontribusi axis
pada titik koordinat, dinotasikan dengan cos
2
0. Jika nilai cos
2
0 besar maka axis
dapat menjelaskan kategori dari variabel (titik koordinat) dengan baik. Kontribusi
relatif profil kolom dinotasikan sebagai :
cos
2
0( W)
] K
= (D
d
2)
-1
] ]
( H
2
)
] K



3. Analisis Korespondensi Multipel (Multiple Correspondence Analysis (MCA))
untuk Skala Pengukuran Data yang Berbeda (Kualitatif dan Kuantitatif)
Variabel penelitian dalam analisis korespondensi dijelaskan oleh beberapa
referensi memungkinkan untuk menggunakan variabel selain variabel kategori
(kualitatif), referensi yang dimaksudkan kutipannya adalah variabel dalam analisis
korespondensi memungkinkan juga merupakan variabel kuantitatif diskrit seperti
Jumlah anggota dalam keluarga atau jumlah kecelakaan yang dibayar oleh
perusahaan asuransi dalam satu tahun, dan lain lain. Jadi nilai yang mungkin dari
variabel di atas didefinisikan sebagai kategori baris atau kolom (Hardle dan Simar,
2007).
Analisis Korespondensi Multipel (MCA) juga mengakomodasi variabel
kuantitatif dengan memberikan kode yang dinyatakan sebagai bins sebagai contoh
skor pada interval -5 sampai +5, diberikan kode menjadi variabel kualitatif
(nominal) dengan tiga level: kurang dari 0, sama dengan 0 dan lebih dari 0. (Herve
dan Domonique, 2007). Variabel kualitatif seperti jenis kelamin dan warna rambut
dihubungkan dengan variabel kuantitatif seperti usia dan penghasilan per bulan
(Rencher, 2002). Jadi variabel kuantitaif tersebut akan diakomodasi dengan
memberikan kode menjadi beberapa level (kelompok) variabel kualitatif. Penentuan
level (kelompok) ini berdasarkan beberapa referensi yang mengacu pada ketentuan
yang berlaku atau pembagian secara proporsional dari banyaknya data.
Dasar pemikiran pembuatan matriks indikator ini adalah untuk
mendapatkan tabel kontingensi dalam Analisis korespondensi multipel didefinisikan
sebagai Matriks Burt yang merupakan hasil dari crosstabs atau perkalian silang
transpose matriks indikator dengan matriks indikator.
Algoritma Analisis Korespondensi Multipel (Multiple Correspondence
Analysis (MCA)) untuk Skala Pengukuran Data yang Berbeda (Kualitatif dan
Kuantitatif) adalah dengan mengidentifikasi data yaitu variabel kuantitatif dan
kualitatif. Variabel kuantitatif diakomodasi dengan memberikan kode variabel
kualitatif (nominal) dengan beberapa level (kelompok). Selanjutnya variabel
penelitian yang menyajikan data mentah membentuk matriks data (Matriks Indikator
dan Matriks Burt). Analisis dilanjutkan dengan menggunakan standar analisis
korespondensi yaitu Penentuan Profil Kolom, Koordinat dan Pemetaan Profil Kolom
dan terakhir adalah perhitungan Kontribusi Inersia yang meliputi: Total Inersia,
Inersia Profil Kolom, Inersia Relatif dan Kontribusi Relatif.

51

4. HASIL DAN PEMBAHASAN
4.1. Eksplorasi Data SMK Pertanian, Kelautan dan Kimia Industri
Data SMK Pertanian, Kelautan dan Kimia Industri dari 33 provinsi ini
meliputi data mengenai : Kemudahan akses yang dimiliki oleh SMK, Jumlah
Pendidik dan Jumlah Program Studi, dimana data tersebut didapatkan dari
Laporan Bulanan Sekolah yang secara berkala dikirim oleh sekolah ke PPPPTK
Pertanian Cianjur dan dari situs http://datapokok.ditpsmk.net/index.php Sedangkan
Jumlah TNA(Trainning Need Assesment) dan Jumlah Peserta Diklat diambil dari
database TNA Seksi Data dan Informasi PPPPTK Pertanian Cianjur.
Kemudahan akses SMK dibagi menjadi 2 kategori, yakni : SMK yang
mudah diakses ditandai dengan mempunyai telepon sekolah atau contact person
yang bisa dihubungi dan SMK yang sulit diakses ditandai dengan tidak mempunyai
telepon sekolah atau contact person yang bisa dihubungi. Ukuran variabel Penelitian
Kemudahan akses SMK adalah ada tidaknya nomor telepon atau contact person
yang bisa dihubungi, variabel kemudahan akses SMK sebagai berikut:



Gambar 1. pie chart Jumlah SMK
menurut Kemudahan Akses


Gambar 2. Grafik Jumlah SMK
menurut Jumlah Pendidik

dari diagram pie chart Gambar 1. terlihat bahwa sebagian besar yakni 71 % (637
SMK) adalah SMK yang mempunyai telepon sekolah atau contact person yang bisa
dihubungi, sedangkan SMK yang tidak mempunyai telepon sekolah atau contact
person sebesar 29 % (262 SMK).
Jumlah Pendidik adalah akumulasi dari jumlah pendidik yang mengajar
Mata Diklat Normatif, Adaptif, Produktif (Mata Diklat Program Studi Keahlian
Agribisnis Produksi Tanaman, Agribisnis Produksi Ternak, Agribisnis Produksi
Sumberdaya Perairan, Mekanisasi Pertanian, Agribisnis Hasil Pertanian, Penyuluhan
Pertanian, Kehutanan, Teknik Kimia dan Pelayaran). Jumlah SMK menurut Jumlah
Pendidik yang ada di sekolah (Gambar 2). Berdasarkan Gambar 2. didapatkan
Jumlah SMK menurut Jumlah Pendidik adalah 31 % (277 SMK) yang mempunyai
kurang dari 17 Pendidik, 30 % (272 SMK) yang mempunyai 18 28 Pendidik, 30 %
(272 SMK) yang mempunyai lebih dari 29 Pendidik, sedangkan 9 % (78 SMK) yang
tidak ada data pendidik.
Akses
mudah
637
SM K
71%
Akses
sulit
262
SM K
29%
277
272 272
78
0
50
100
150
200
250
300
Kur ang
dar i 17
Pendi di k
18 - 28
Pendi di k
Lebi h dar i
29
Pendi di k
Ti dak Ada
Dat a
Pendi di k
Juml ah SM K
52

Jumlah Peserta Diklat adalah banyaknya Pendidik di suatu SMK
berdasarkan Pemanggilan Peserta untuk mengikuti pendidikan dan pelatihan yang di
selenggarakan oleh PPPPTK Pertanian Cianjur. Ukuran variabel penelitian Jumlah
Peserta Diklat adalah banyaknya Pendidik di suatu SMK yang pernah mengikuti
diklat dan satuannya adalah orang. Jumlah SMK menurut Jumlah Peserta yang
pernah mengikuti diklat yang diselenggarakan oleh PPPPTK Pertanian Cianjur
(Gambar 3). Berdasarkan Gambar 3. didapatkan Jumlah SMK menurut Jumlah
Peserta Diklat adalah 22 % (194 SMK) yang mempunyai kurang dari 2 peserta
diklat, 23 % (205 SMK) yang mempunyai 3 5 peserta diklat, 24 % (220 SMK)
yang mempunyai lebih dari 6 peserta diklat, sedangkan 31 % (280 SMK) yang
belum ada peserta diklat.


Gambar 3. Grafik Jumlah SMK
menurut Jumlah Peserta Diklat

Gambar 4. Grafik Jumlah SMK
menurut Jumlah TNA

Jumlah TNA (Trainning Need Assesment) atau Penjaringan Kebutuhan
Diklat adalah Permintaan kebutuhan diklat yang dikirim oleh sekolah ke PPPPTK
Pertanian Cianjur, Ukuran variabel penelitian Jumlah TNA adalah banyaknya
permintaan kebutuhan diklat dan satuannya adalah berkas. Jumlah SMK menurut
Jumlah TNA (Training Needs Assesment/ Penjaringan Kebutuhan Diklat) Gambar4.
Berdasarkan Gambar 4. didapatkan Jumlah SMK menurut Jumlah TNA adalah 27
% (239 SMK) yang mempunyai kurang dari 7 TNA, 25 % (227 SMK) yang
mempunyai 8 - 20 TNA, 25 % (225 SMK) yang mempunyai lebih dari 21 TNA,
sedangkan 23 % (208 SMK) yang belum ada permintaan diklat masuk ke PPPPTK
Pertanian Cianjur.
Jumlah Program Studi adalah Jumlah Program Studi Keahlian (Agribisnis
Produksi Tanaman, Agribisnis Produksi Ternak, Agribisnis Produksi Sumberdaya
Perairan, Mekanisasi Pertanian, Agribisnis Hasil Pertanian, Penyuluhan Pertanian,
Kehutanan, Teknik Kimia dan Pelayaran) yang dihitung yang ada di sekolah.
Ukuran dan satuan variabel penelitian Jumlah Program Studi adalah Jumlah Program
Studi. Jumlah SMK menurut Jumlah Program Studi (Program Studi Pertanian,
Kelautan dan Kimia Industri yang dibuka di SMK) pada Gambar 5. Berdasarkan
Gambar 5. didapatkan Jumlah SMK menurut Jumlah Program Studi adalah 44 %
(396 SMK) yang mempunyai 1 Program Studi Pertanian, Kelautan dan Kimia
Industri, 30 % (264 SMK) yang mempunyai 2 Program Studi Pertanian, Kelautan
dan Kimia Industri, 22 % (200 SMK) yang mempunyai lebih 3 Program Studi
194
205
220
280
0
50
100
150
200
250
300
Kur ang
dar i 2
Peser t a
3 - 5
Peser t a
Lebi h
dar i 6
Peser t a
Bel um
Ada
Peser t a
Juml ah SM K
239
227
225
208
190
195
200
205
210
215
220
225
230
235
240
245
Kur ang
dar i 7 TNA
8 - 20 TNA Lebi h dar i
21 TNA
Bel um
Ada TNA
M asuk
Juml ah SM K
53

Pertanian, Kelautan dan Kimia Industri, sedangkan 4 % (39 SMK) yang belum ada
data membuka Program Studi Pertanian, Kelautan dan Kimia Industri.


Gambar 5. pie chart Jumlah SMK
menurut Jumlah Program Studi


Gambar 6. pie chart Jumlah SMK
menurut Status Sekolah

Sedangkan untuk Status Sekolah (Gambar 6) dibedakan menjadi 2 kategori
yakni Sekolah Negeri (sekolah yang dikelola oleh pemerintah) dan Sekolah Swasta
(sekolah yang dikelola oleh Yayasan Sosial atau pihak swasta). Berdasarkan Gambar
6. diatas terlihat bahwa sebagian besar yakni 74 % (668 SMK) adalah Sekolah
Negeri (sekolah yang dikelola oleh pemerintah), sedangkan 26 % (231 SMK) adalah
Sekolah Swasta (sekolah yang dikelola oleh Yayasan Sosial atau pihak swasta).

4.2. Analisis Korespondensi Multipel Data SMK Pertanian, Kelautan dan
Kimia Industri

Analisis Korespondensi Multipel Data SMK Pertanian, Kelautan dan Kimia
Industri untuk data penelitian variabel Jumlah SMK menurut kemudahan Akses
(akses mudah dan akses sulit), Jumlah SMK menurut Jumlah pendidik (kurang dari
17 Pendidik, 18 28 Pendidik, lebih dari 29 Pendidik, dan tidak ada data pendidik),
Jumlah SMK menurut Jumlah Peserta diklat (kurang dari 2 peserta diklat, 3 5
peserta diklat, lebih dari 6 peserta diklat, dan belum ada peserta diklat), Jumlah
SMK menurut Jumlah TNA (kurang dari 7 TNA, 8 - 20 TNA, lebih dari 21 TNA,
belum ada permintaan diklat yang masuk), Jumlah SMK menurut Jumlah Prodi (1
Program Studi Pertanian, Kelautan dan Kimia Industri; 2 Program Studi Pertanian,
Kelautan dan Kimia Industri; lebih 3 Program Studi Pertanian, Kelautan dan Kimia
Industri; belum ada data membuka Program Studi Pertanian, Kelautan dan Kimia
Industri), Jumlah SMK menurut status sekolah (Negeri dan Swasta).
Output Software Analisis Korespondensi Multipel sebagai berikut, Tabel 1.
Koodinat Profil Kolom dan Inersia Relatif, sedangkan Tabel 2. Konribusi Relatif:
Kolom Koordinat menunjukkan koordinat dari kategori, dari koordinat diatas untuk
plot 3 dimensi ternyata SMK dengan akses sulit mempunyai titik koordinat dimensi
1; dimensi 2; dimensi 3 berturut-turut adalah (0.614; -0.172; 0.011) sedangkan
untuk SMK yang mempunyai 18 28 TNA adalah (0.352; 0.637; 0.646).



1 Prodi
396
SM K
44%
2 Prodi
264
SM K
30%
3
Prodi
200
SM K
22%
Tidak
Ada
Dat a
Prodi
39
Negeri
668
SM K
74%
Sw ast a
231
SM K
26%
54

Tabel 1. Koodinat Profil Kolom dan Inersia Relatif
Kategori
Koordinat
Massa Kualitas
Inersia
Relatif Dim- 1 Dim- 2 Dim-3
Akses mudah -0.253 0.071 -0.005 0.118 0.167 0.021
Akses sulit 0.614 -0.172 0.011 0.049 0.167 0.051
< 17 Pendidik 0.262 0.541 0.448 0.051 0.250 0.049
18 - 28 Pendidik -0.073 0.138 0.401 0.050 0.080 0.050
29 Pendidik -0.699 -0.378 -0.623 0.050 0.443 0.050
Tidak Ada Data
Pendidik
1.760 -1.083 -0.815 0.014 0.469 0.065
< 2 Peserta 0.055 1.190 -1.074 0.036 0.708 0.056
3 - 5 Peserta -0.412 0.597 0.832 0.038 0.360 0.055
6 Peserta -1.085 -0.843 -0.051 0.041 0.613 0.054
Belum Ada Peserta 1.116 -0.599 0.174 0.052 0.739 0.049
< 7 TNA 0.143 0.899 -0.960 0.044 0.634 0.052
8 - 20 TNA -0.352 0.637 0.646 0.042 0.320 0.053
21 TNA -1.017 -0.828 0.092 0.042 0.577 0.054
Belum Ada TNA
Masuk
1.320 -0.832 0.298 0.039 0.760 0.055
1 Prodi 0.372 0.435 0.287 0.073 0.323 0.040
2 Prodi -0.083 -0.218 0.345 0.049 0.072 0.050
3 Prodi -0.949 -0.439 -0.639 0.037 0.430 0.056
Tidak Ada Data Prodi 1.646 -0.688 -1.969 0.007 0.320 0.068
Negeri -0.312 -0.067 0.030 0.124 0.298 0.018
Swasta 0.903 0.193 -0.087 0.043 0.298 0.053

Kolom massa menunjukkan besarnya proporsi tiap-tiap kategori terhadap
semua kategori yang ada (massa kolom), untuk SMK yang berstatus negeri mempunyai
massa sebesar 0,124 terhadap semua kategori yang ada. Kolom kualitas
mempresentasikan titik terhadap subruang tiga dimensi, SMK yang belum mengirimkan
TNA mempunyai kualitas sebesar 0,760 yang artinya 76% mempresentasikan titik
kategori SMK yang belum mengirimkan TNA terhadap subruang tiga dimensi.
Kolom Inersia Relatif menujukkan nilai inersia relatif tiap-tiap kategori dalam
bentuk proporsi terhadap total tabel Matriks Burt. Untuk SMK yang tidak ada data
pendidik mempunyai inersia relative sebesar 0.065 yang artinya proporsi SMK yang
tidak ada data pendidik terhadap total tabel Burt sebesar 0,065.
Kolom Cos menunjukkan kontribusi relatif yaitu kontribusi axis pada titik
koordinat, jika nilai Cos besar maka axis dapat menjelaskan kategori dari variabel
(titik koordinat) dengan baik. Untuk dimensi 1 yang dapat menjelaskan kategori dari
variabel paling besar adalah belum ada peserta (0,563), sedangkan yang paling kecil
adalah 18 28 pendidik (0,002). Untuk dimensi 2 yang dapat menjelaskan kategori dari
variabel paling besar adalah kurang dar1 2 peserta (0,390), sedangkan yang paling kecil
adalah 18 28 pendidik (0,008). Untuk dimensi 3 yang dapat menjelaskan kategori dari
variabel paling besar adalah kurang dari 7 TNA (0,334), sedangkan yang paling kecil
adalah SMK dengan akses mudah dan akses sulit (0,000). Pada Tabel 3. diperoleh
bahwa proporsi inersia utama terhadap total inersia (
2
) untuk pemetaan tiga dimensi
sebesar 0,416 atau 41,6%. Jadi kualitas keseluruhan dari representasi titik pada ruang
tiga dimensi sebesar 41,6%.
55



Tabel 2. Konribusi Relatif
Kategori
Cos
Dimensi 1 Dimensi 2
Dimensi
3
Akses mudah 0.155 0.012 0.000
Akses sulit 0.155 0.012 0.000
< 17 Pendidik 0.031 0.131 0.089
18 - 28 Pendidik 0.002 0.008 0.070
29 Pendidik 0.212 0.062 0.169
Tidak Ada Data
Pendidik
0.294 0.112 0.063
< 2 Peserta 0.001 0.390 0.317
3 - 5 Peserta 0.050 0.105 0.204
6 Peserta 0.381 0.231 0.001
Belum Ada Peserta 0.563 0.162 0.014
< 7 TNA 0.007 0.293 0.334
8 - 20 TNA 0.042 0.137 0.141
21 TNA 0.345 0.229 0.003
Belum Ada TNA
Masuk
0.525 0.208 0.027
1 Prodi 0.109 0.149 0.065
2 Prodi 0.003 0.020 0.049
3 Prodi 0.258 0.055 0.117
Tidak Ada Data Prodi 0.123 0.021 0.176
Negeri 0.282 0.013 0.003
Swasta 0.282 0.013 0.003

Tabel 3. Analisis Matrik Indikator
Axis Inersia Proporsi Kumulatif
1 0.445 0.191 0.191
2 0.291 0.125 0.316
3 0.235 0.101 0.416
4 0.205 0.088 0.504
5 0.178 0.076 0.580
6 0.176 0.075 0.656
7 0.147 0.063 0.719
8 0.138 0.059 0.778
9 0.132 0.057 0.834
10 0.113 0.048 0.882
11 0.093 0.040 0.922
12 0.088 0.038 0.960
13 0.067 0.029 0.989
14 0.026 0.011 1.000
Total 2.333
56

Tidak Ada Data Pendidik
Tidak Ada Data Prodi
Belum Ada TNA Masuk
Belum Ada Peserta
Swasta
Akses sulit
< 17 Pendidik
1 Prodi
< 2 Peserta
< 7 TNA
18 - 28 Pendidik
2 Prodi
3 - 5 Peserta
8 - 20 TNA
Akses mudah
Negeri
Lebih dari 29 Pendidik
Lebih dari 3 Prodi
Lebih dari 21 TNA
Lebih dari 6 Peserta
Tidak Ada Data Pendidik
Tidak Ada Data Prodi
Belum Ada TNA Masuk
Belum Ada Peserta
Swasta
Akses sulit
< 17 Pendidik
1 Prodi
< 2 Peserta
< 7 TNA
18 - 28 Pendidik
2 Prodi
3 - 5 Peserta
8 - 20 TNA
Akses mudah
Negeri
Lebih dari 29 Pendidik
Lebih dari 3 Prodi
Lebih dari 21 TNA
Lebih dari 6 Peserta


Berdasarkan Gambar 7. didapatkan bahwa: Kelompok 1 (SMK yang
tidak ada data pendidik dengan SMK tidak ada data prodi); Kelompok 2 (SMK
yang belum ada peserta diklat dengan SMK yang belum ada TNA); Kelompok 3
(SMK yang mempunyai lebih dari 21 TNA, Lebih dari 6 Peserta, Lebih dari 29
pendidik dan lebih dari 3 prodi); Kelompok 4 (SMK yang mempunyai kurang dari
7 TNA dengan SMK yang kurang dari 2 peserta diklat); Kelompok 5 (SMK
Negeri dengan akses mudah); Kelompok 6 (SMK Swasta dengan akses sulit);
Kelompok 7 (SMK yang mempunyai 8 -20 TNA dengan SMK yang mempunyai
3 -5 peserta diklat); Kelompok 8 (SMK yang membuka 1 prodi mempunyai
pendidik yang kurang dari 28- orang), terlihat bahwa kelompok 1, 2 dan 3 plot
kelompoknya jauh dari kelompok yang lain, yang artinya kelompok 1 yakni SMK
yang tidak ada data pendidik dengan SMK tidak ada data prodi mempunyai atribut
berbeda dengan atribut SMK yang lain, begitupun untuk kelompok 2 dan 3.
Sedangkan untuk kelompok 4 dekat sekali dengan kelompok 5, yang artinya SMK
yang mempunyai kurang dari 7 TNA dengan SMK yang kurang dari 2 peserta
diklat dekat dengan atribut SMK Negeri dengan akses mudah, dari kelompok 4
dan 6 bisa dilihat bahwa SMK Negeri cenderung adalah SMK yang memiliki
akses mudah, sedangkan SMK Swasta cenderung adalah SMK yang memiliki
akses sulit atau SMK Swasta lebih banyak tidak memiliki telepon sekolah atau
contact person yang mudah dihubungi, tetapi status sekolah tidak mempengaruhi
jumlah program studi yang dibuka, terlihat dari plot 1 prodi dan 2 prodi yang
hamper sama jaraknya dengan kelompok 4 dan 6.

3
6
5
7
2
8
1
4
Gambar 7. Plot Kolom Analisis Korepondensi Mutipel Data SMK Pertanian,
Kelautan dan Kimia Industri
57


5. KESIMPULAN
Teknik analisis korespondensi multipel diperoleh dengan menggunakan
standar analisis korespondensi sederhana dengan mengubah data mentah ke dalam
matiks indikator, yakni matriks dengan elemen 0 dan 1. perkalian matriks
indikator akan menghasilkan Matriks Burt yang merupakan matriks simetrik.
dimana peranan Matriks Burt ini sama halnya dengan tabel kontingensi dalam
analisis korespondensi sederhana.
Analisis Korespondensi Multipel (MCA) dapat menghasilkan plot dan
menampilkan posisi kondisi real kelompok-kelompok kategori SMK dari
beberapa variabel secara bersamaan dalam satu sistem atau gambar, dari plot yang
dihasilkan dapat diambil kesimpulan atau suatu kebijakan berkaitan dengan
kepentingan perbaikan atau pengembangan yang dibutuhkan, misalnya dengan
melihat plot Gambar 7 kategori SMK berstatus swasta dekat dengan kategori
akses sulit, sedangkan SMK yang berstatus negeri dekat dengan kategori akses
mudah, dari hasil plot tersebut mengindikasikan harus adanya perhatian khusus
atau suatu kebijakan untuk SMK dengan kategori swasta karena akses sulit ini
berhubungan dengan pengembanngan SMK itu sendiri.
Variabel dalam analisis korespondensi memungkinkan juga merupakan
variabel kuantitatif diskrit dimana nilai yang mungkin dari variabel di atas
dikelompokkan dan didefinisikan sebagai kategori. variabel kuantitatif diskrit
yang dimaksudkan adalah Jumlah SMK menurut Jumlah pendidik (kurang dari 17
Pendidik, 18 28 Pendidik, lebih dari 29 Pendidik, dan tidak ada data pendidik),
Jumlah SMK menurut Jumlah Peserta diklat (kurang dari 2 peserta diklat, 3 5
peserta diklat, lebih dari 6 peserta diklat, dan belum ada peserta diklat), Jumlah
SMK menurut Jumlah TNA (kurang dari 7 TNA, 8 - 20 TNA, lebih dari 21 TNA
dan belum ada TNA masuk)

6. DAFTAR PUSTAKA
Greenacre, M. (2005). From Correspondence Analysis to Multiple
Correspondence Analysis and Joint Correspondence Analysis. New York :
Academic Press, Inc. New York.
Hrdle, Wolfgang & Simar, Lopold (2007). Applied Multivariate Statistical
Analysis, Second Edition, Humboldt-Universitt zu Berlin. Germany
Herved, A. & Valentin, Domonique. (2007). Multiple Correspondence Analysis,
www.google.com/mca.pdf.
Nenadic, Oleg & Greenacre, M. (2007). Correspondence Analysis in R, with two
or three dimensional graphics : The CA Package, Journal of Statistic,
http://www.jstatsoft.org/
Rencher, A. C. (2002). Methods of Multivariate Analysis, Second Edition,
Brigham Young University, John Wiley & Sons. Inc
Yangchun, Du & Kern II, J. C (2003) Multiple Correspondence Analysis in
Marketing Research, Department of Mathematics and Computer Science
Duquesne University

También podría gustarte