Está en la página 1de 12

PERBANDINGAN KETEPATAN KLASIFIKASI TRAINING DAN TESTING PADA METODE

ANALISIS DISKRIMINAN

Agnisa Bhakti Persada (1) (1307100009)


Intan Puspita Rani (2) (1307100032)
(1)
agnisa_persada@yahoo.com ,(2)in_niez_muach@yahoo.com

Abstrak

Persaingan dalam bidang industri dan bisnis meningkat seiring dengan perkembangan teknologi,
untuk itu perusahaan senantiasa mempertahankan pelanggan yang telah menggunakan produk
ataupun jasa yang dihasilakan dalam produktivitas pabrik ataupun perusahaannya. Maka dari itu
perusahaan HBAT mencoba melakukan analisis statistika yaitu terkait dengan analisis diskriminan
guna mengetahui apakah pengelompokkan variabel-variabel yang ada dan kemudian dikelompokkan
kedalam tiga kelompok, yaitu identitas pelanggan, persepsi pelanggan, dan hubungan dengan
pelanggan telah sesuai berdasarkan kelompok variabel yang saling independent. Pengklasifikasian
dilakukan untuk mengetahui apakah kelompok-kelompok tersebut memang berbeda secara statistika.
Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan
variabel independen. Berdasarkan uji asumsi ternyata data pada perusahaan HBAT telah memenuhi
distribusi normal multivariate, baik untuk data training 1 maupun data training 2, selain itu juga
matrika varian-kovarian antar variabel dependent homogen. Namun, dari sekain banyak variabel
dependent yang ada, baik untuk data testing1 ataupun data training 1 maupun data testing2 ataupun
data training 2 hanya terdapat tiga variabel dependent yang signifikan, yaitu X6 (kualitas produk), X9
(resolusi keluhan) dan X12 (kesan tenaga pegawai). Tiga variabel tersebut digunakan untuk
memodelkan data yang ada. Permasalahan yang dihadapi tiap perusahaan perkebunan hampir sama
adanya persaingan berdasarkan analisis diskriminan, ternyata diperoleh kesimpulan bahwa terdapat
perbedaan antar kelompok data, sehingga dilakukan analisis lebih lanjut untuk mengetahui ketepatan
pengelompokan data. Dari perbandingan data yang digunakan sebanyak 70:30, diperoleh informasi
bahwa tingkat ketepatan untuk data testing yang berjumlah 30 data lebih kecil yaitu sebesar 73,3%
jika dibandingkan tingkat ketepatan pengklasifikasian data training dengan persentase sebesar
81,4%. Sedangkan dari perbandingan data yang digunakan sebanyak 55:45, diperoleh informasi
bahwa tingkat ketepatan untuk data testing yang berjumlah 45 data lebih kecil yaitu sebesar 66,7%
jika dibandingkan tingkat ketepatan pengklasifikasian data training dengan persentase sebesar
83,6%. Maka dari itu, model yang diperoleh dari perbandingan data 70:30 dan perbandingan data
55:45 kurang tepat dan kurang sesuai, tetapi jika dibandingkan perbandingan data 70:30 lebih baik
dari pada perbandingan data 55:45 .

Kata kunci: analisis diskriminan, normal multivariat,homogenitas, data HBAT.

1. Pendahuluan
Meningkatnya pertumbuhan penduduk di Indonesia seiring dengan berkembangnya berbagai
usaha guna memenuhi kebutuhan masyarakat tersebut. Seperti halnya aspek dalam bidang industri dan
bisnis yang meningkat guna memenuhi kebutuhan konsumen yang meningkat pula. Namun, dengan
semakin menjamurnya perusahaan dan pabrik di Indonesia harus diwaspadai oleh para pengusaha dan
pemilik pabrik, karena persaingan yang semakin ketat untuk mendapatkan konsumen. Secara umum,
para pengusaha dan pemilik pabrik selalu berusaha mempertahankan pelanggan, karena biaya untuk
mencari pelanggan baru jauh lebh mahal daripada mempertahankan pelanggan yang ada. Untuk
itu, perusahaan HBAT berusaha mengenal perilaku konsumen dengan melakukan pengelompokan
variabel-variabel yang ada kedalam tiga kategori, yaitu identitas pelanggan, persepsi pelanggan, dan
hubungan dengan pelanggan. Perusahaan HBAT menyadari betul bahwa mengenal perilaku pelanggan
menjadi hal yang tak kalah penting, mengingat banyak pesaing dalam jenis usaha yang sama. Maka
dari itu dalam praktikum kali ini, digunakan data HBAT yang kemudian dianalisis dengan analisis

1
diskriminan. Praktikum dengan menggunakan data HBAT dilakukan untuk mengetahui hasil
pemeriksaan multivariate normal, ta HBAT.
Dengan adanya praktikum ini diharapkan dapat diperoleh informasi mengenai hasil pemeriksaan
multivariate normal, hasil uji kesamaan matrik varian kovarian, analsis diskriminan pada data HBAT
1(70 data training dan 30 data testing) dan analsis diskriminan pada data HBAT 2(55 data training dan
45 data testing) yang selanjutnya akan dilakukan perbandingan data hasil analisis diskriminan pada
data HBAT perbandingan 1 dan data HBAT perbandingan 2, guna mengetahui model yang lebih bauk
dalam analsis diskriminan.

2. Landasan Teori
Dalam penyelesaian makalah ini tidak hanya dibutuhkan data mengenai variabel dependent dan
independent dari perusahaan HBAT, tetapi diperlukan pula metode yang tepat. Maka berikut ini akan
dijelaskan metode yang akan dipakai dalam penyelesaian makalah ini.
Analisis Diskriminan
Analisis diskriminan adalah teknik statistika untuk mengelompokkan individu-individu ke dalam
kelompok-kelompok yang saling bebas dengan tegas berdasarkan sekelompok variabel bebas.
Pengklasifikasian adalah salah satu analisis statistika yang diperlukan jika ada beberapa kelompok
kemudian ingin diketahui apakah kelompok-kelompok tersebut memang berbeda secara statsitika.
Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan
variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk suatu fungsi
diskriminan.
Dalam analisis diskriminan terdapat 2 metode berdasarkan jumlah kategori dari variabel
dependennya. Apabila terdapat 2 kategori yang terlibat da- lam pengklasifikasian, maka disebut
dengan two-group discriminant analysis. Sedangkan apabila terdapat 3 atau lebih kategori yang
terlibat dalam pengklasifikasian, maka disebut dengan multiple discriminant analysis.
Analisis diskriminan merupakan suatu analisis dengan tujuan membentuk sejumlah fungsi
diskriminan, yang dapat digunakan sebagai cara terbaik untuk memisahkan kelompok-kelompok.
Manfaat utama analisis diskriminan adalah
1. Cara terbaik untuk menyatakan perbedaan antar segmen tersebut (masalah diskriminan).
2. Cara untuk mengalokasikan suatu objek baru ke dalam salah satu kelompok tersebut.
Dalam buku Johnson, R. A. dan Wichern, D. W dijelaskan bahwa fungsi diskriminan pertama
kali diperkenalkan oleh Ronald A. Fisher (1936) dengan menggunakan beberapa kombinasi linier dari
pengamtan yang cukup mewakili populasi. Menurut Fisher, untuk mencari kombinasi linier dari p
variabel bebas tersebut dapat dilakukan dengan pemilihan koefisien-koefisiennya yang menghasilkan
hasil bagi maksimum antara matrik peragam antar kelompok (between-group) dan matrik peragam
dalam kelompok (within-group).
Adapun asumsi-asumsi yang harus dipenuhi sebelum melakukan analisis diskriminan, antara lain
yaitu:
• Variabel independen berdistribusi normal multivariat (multi variates normal distribution).
• Varians dalam setiap kelompok adalah sama (equal variances).
Analisis diskriminan dapat dilakukan bila terdapat perbedaan yang nyata antar kelompok,
sehingga pada tahap awal yang harus dilakukan adalah uji hipotesis nol bahwa tidak ada perbedaan
kelompok di antara individu yang dirumuskan dengan:
H0 : µ1 = µ2 = … = µk
H1 : µi ≠ µj ( minimal terdapat 2 kelompok yang berbeda)
Taraf signifikansi α = 0,05
Statistik uji yang digunakan adalah Wilks’Lamda (Λ”):

2
Wilks’Lamda (Λ”) =
dengan : = pengamatan ke-j pada kelompok ke-l
= vektor rata-rata kelompok ke-l
= jumlah individu kelompok pada kelompok ke-l
= semua vektor rata-rata pada kelompok ke-l
Daerah Kritis : tolak H0 jika Wilk’s lambda > α.
Distribusi Normal Multivariat
Distribusi normal multivariat merupakan distribusi yang dibentuk dari perluasan distribusi normal
univariat untuk data multivariat. Pengujian ini dilakukan untuk memperkuat dugaan bahwa distribusi
data yang terkumpul telah berdistribusi normal multivariat.
Variabel X i , X 2 ,..., X p dikatakan berditribusi normal multivariat dengan parameter dan
jika mempunyai probability density function :
1
1 − ( X −µ)' Σ−1 ( X −µ)
f ( Xi , X 2 ,..., X p ) = p/2
e 2
( 2π) p / 2 Σ
Jika X i , X 2 ,..., X p berdistribusi normal multivariat maka ( X −µ)' Σ−1 ( X −µ) berditribusi
χp2 . Berdasarkan sifat ini maka pemeriksaan distribusi normal multivariat dapat dilakukan dengan
(
cara membuat q-q plot dari nilai d i2 = X i − X)' S −1 ( X i − X , i = 1,..., n . )
Tahapan dari pembuatan q-q plot ini adalah sebagai berikut.
1. Mulai
2. Tentukan nilai vektor rata-rata : X
3. Tentukan nilai matriks varians-kovarians : S
4. Tentukan nilai jarak Mahalanobis setiap titik pengamatan dengan vektor rata-ratanya
(
d i = X i − X)' S −1 ( X i − X , i = 1,..., n
2
)
2 2 2 2 2
5. Urutkan nilai d i dari kecil ke besar : d (1) ≤ d ( 2) ≤ d (3) ≤ ... ≤ d ( n )
i −1 / 2
6. Tentukan nilai p i = , i =1,..., n
n
qi
2 2
7. Tentukan nilai q i sedemikian hingga ∫ f ( χ )dχ = pi
−∞
2
8. Buat scatter-plot d (i ) dengan q i

9. Jika scatter-plot ini cenderung membentuk garis lurus dan lebih dari 50 % nilai
d i2 ≤ χ 2p , 0.50
10. Selesai.

3
Kehomogenan Matriks Varians-Kovarians
Beberapa analisis statistika multivariate seperti discriminant analysis dan MANOVA
membutuhkan syarat matriks varians-kovarians yang homogen. Untuk menguji syarat ini dapat
dipergunakan statistik uji Box-M, dengan hipotesis sebagai berikut.
Ho : Σ1 = Σ2 = ... = Σk
H1 : Σi ≠ Σj untuk i ≠ j
Statistik uji:
2 1 k 1 k 
χ hitung = −2(1 − c1 )  ∑ v i ln S i − ln S pool ∑ v i 
 2 i =1 2 ii =1 
dan
k
 
∑ vi S i k 1  2 p 2 +3 p −1 
i =1 1
S pool = c1 = ∑ − k   v i = ni −1
k i =1 v i 6( p +1)( k −1) 
 
∑ vi  ∑v i 
 i =1 
i =1
Terima hipotesis nol yang berarti matriks varians-kovarians bersifat homogen jika
χhitung
2
≤ χ12
( k −1) p ( p +1
2

3. Metodologi Penelitian
Data yang digunakan adalah data HBAT, dimana terdiri atas variabel dependen dan variabel
independen. Variabel dependen adalah customer intention yang memiliki 2 kategori yaitu tidak
melanjutkan kerjasama (0) dan melanjutkan kerjasama (1) di waktu yang akan datang. Sedangkan
variabel independennya adalah kelompok persepsi pelanggan terhadap produk yang memiliki 13
variabel. Variabel-variabel yang termasuk kelompok persepsi pelanggan terhadap produk antara lain
Kualitas produk (X6), Aktivitas perdagangan online/website (X7), Pendukung teknis (X8), Resolusi
keluhan (X9), Periklanan (X10), Macam produk (X11), Kesan tenaga pegawai (X12), Persaingan harga
(X13), Jaminan dan tuntutan (X14), Produk baru (X15), Pemesanan dan penagihan (X16), Fleksibilitas
harga (X17), Kecepatan pengiriman (X18). Dalam makalah ini dilakukan dua perbandingan data, yang
pertama adalah perbandingan data training sebanyak 70 data, dan testing sebanyak 30 data.
Sedangkan perbandingan kedua data training sebanyak 55 data, dan testing sebanyak 45 data.
Untuk melakukan analisis diskriminan dalam makalah ini, diharuskan untuk menempuh langkah-
langkah yang sudah dibuat. Langkah-langkah tersebut adalah seperti berikut.
a. Mengacak (random) data yang telah disiapkan.
b. Membagi data menjadi 2 perbandingan yaitu 70 data (training 1) dan 30 data (testing 1), serta 55
data (training 2) dan 45 data (testing 2).
c. Melakukan uji normal multivariat terhadap variabel independen dari kedua data training dengan
bantuan macro MINITAB.
d. Menguji kehomogenan matriks varians-kovarians terhadap variabel dependen kedua data training
dengan bantuan SPSS.
e. Melakukan analisis dengan analisis diskriminan terhadap kedua data perbandingan dengan bantuan
SPSS.
f. Membandingkan hasil analisis diskriminan perbandingan data 1 dengan perbandingan data 2.
g. Membuat kesimpulan dari hasil analisis.

4
Adapun alur dari pengerjaan makalah ini adalah sebagai berikut :

Mulai

Data

Random Data

Data Testing Data Training

Tidak

Apakah data mengikuti


sebaran distribusi normal?

Ya

Tidak
Apakah matriks varian-
kovarian dari variabel
dependen homogen?

Ya

Analisis Diskriminan

Membandingkan hasil analisis dari data HBAT


1 dengan data HBAT 2

Kesimpulan

Selesai

5
Gambar.1 Diagram Alur Analisis Diskriminan
4. Analisis Data dan Pembahasan
Uji Normal Multivariat
Asumsi yang diperlukan di dalam discriminant analysis salah satunya adalah data mengikuti
sebaran normal multivariat. Hal ini dilakukan karena pengujian dengan menggunakan statistik uji
Wilk Lambda. Kesimpulan yang diambil berdasarkan statistik ini dikatakan sahih (valid), jika syarat
distribusi multinormal dipenuhi.
Hipotesis:
H0 : data berdistribusi normal multivariat
H1 : data tidak berdistribusi normal multivariat
Taraf Signifikansi: α = 0,5
Daerah Kritis : tolak H 0 , jika t < α
Statistik Uji : t = 0,542857, nilai t diperoleh dari tabel 1dengan menggunakan macro minitab seperti
berikut.
Tabel 1. Uji Normal Multivariat Data Training

Data t
Training 1 0.542857
Training 2 0.527273
Berdasarkan tabel. 1 dapat diketahui nilai t untuk data training 1 dan training 2 berturut-turut
adalah 0,542857 dan 0.527273. nilai statistik uji dari kedua data (training 1 dan training 2) lebih
besar dari nilai signifikansi yang ditetapkan, sehingga dapat diambil keputusan untuk gagal menolak
H 0 . Hal Berarti baik pada data training 1 maupun data training 2, mengikuti sebaran distribusi
norma multivariat.
Secara visual untuk mengetahui data berdistribusi normal multivariat, dapat dilihat dari scatter
plot antara pasangan (d2j = qj) berikut.

Scatterplot of q vs dd Scatterplot of q vs dd
30 30

25
25

20
20
q

15
q

15
10

10
5

0 5 10 15 20 25 30
5
dd

5 10 15 20 25 30
dd
a. Data Training 1 b. Data Training 2

Gambar 2. Scatterplot Data HBAT Training


Berdasarkan scatter plot secara visual terlihat bahwa sebaran titik-titik dari data baik pada data
training 1 maupun data training 2, berada disekitar garis normal. Sehingga baik secara perhitungan

6
maupun secara visual dapat disimpulkan bahwa data HBAT training 1 dan training 2 untuk semua
variabel independen (kelompok persepsi pelanggan terhadap produk) berdistribusi normal multivariat.

Uji Homogenitas
Asumsi yang harus dipenuhi dalam analisis varians multivariat dan analisis kovariansi multivariat
adalah bahwa matriks varians kovariansnya adalah homogen. Maka berikut ini adalah pengujian
matriks varians-kovarians terhadap variabel dependen customer intention.
Hipotesis:
H0 : matriks varians kovarians dari variabel dependen pada data training homogen
H1 : matriks varians kovarians dari variabel dependen pada data training tidak homogen

Statistik Uji :

Taraf Signifikansi :α = 0,05


Daerah Kritis :
tolak H 0 , jika Sig. < α
Berdasarkan analisis dengan SPSS untuk uji homogenitas variabel dependen, diperoleh output
sebagai berikut :

Tabel 2. Box's Test of Equality of Covariance Matricesa

Data Sig.
Training 1 0.162
Training 2 0,058678

Dari tabel Tabel 2. Box's Test of Equality of Covariance Matricesa diperoleh Pvalue untuk
masing-masing data training lebih besar dari nilai α yang ditetapkan, sehingga dapat diambil
keputusan untuk gagal menolak H0. Maka dapat disimpulkan bahwa matriks varians kovarians untuk
variabel dependen pada data training 1 dan training 2 adalah homogen.
Uji Signifikansi Variabel
Uji signifikansi variabel digunakan untuk mengetahui variabel mana yang paling signifikan
bermakna dari berbagai variabel independent yang ada. Variabel yang signifikan nantinya akan
digunakan untuk memodelkan data dalam bentuk persamaan regresi.
Dengan bantuan software SPSS, uji signifikansi dapat dilakukan. Berdasarkan hasil output dari
uji tersebut diperoleh informasi mengenai beberapa variabel independent yang signifikan bermakna
yang nantinya dapat digunakan dalam memodelkan data tersebut. Penentuan variabel mana saja yang
dianggap signifikan ini adalah dengan melihat nilai sig. pada tabel Tests of Equality of Group Means.
Jika nilai sig. lebih kecil dari nilai α , maka variabel tersebut termasuk variabel yang signifikan.
Sedangkan jika nilai sig. lebih besar dari nilai α, maka variabel tersebut tidak termasuk dalam
kategori yang signifikan, sehingga variabel tersebut jelas tidak boleh dipakai untuk membuat model
persamaan analisis diskriminan. Variabel independent yang signifikan untuk data training 1 antara
lain X6 (kualitas produk) , X7 (aktivitas perdagangan online/website) , X9 (resolusi keluhan) , X11
(macam produk) , X12 (kesan tenaga pegawai) , X16 (pemesanan dan penagihan) dan X18 (kecepatan
pengiriman). Sedangkan pada data training 2 variabel yang termasuk dalam kategori signifikan tidak
lain halnya dengan data training 1, hanya saja pada data training 2, variabel X17 (fleksibilitas harga)
juga termasuk dalam kategori variabel signifikan. Untuk lebih jelas mengetahui hal ini, dapat dilihat
tabel 3 yang ada di bawah ini.

7
Tabel 3. Tests of Equality of Group Means

Wilks' Lambda Sig.


Variabel
Training 1 Training 2 Training 1 Training 2
X6 .888 .902 .005 .020
X7 .854 .919 .001 .035
X8 1.000 .999 .951 .812
X9 .739 .649 .000 .000
X10 .963 .932 .110 .055
X11 .862 .840 .002 .002
X12 .820 .816 .000 .001
X13 1.000 .990 .973 .468
X14 .992 .997 .467 .681
X15 .993 .999 .477 .806
X16 .844 .783 .001 .000
X17 .974 .914 .181 .030
X18 .773 .671 .000 .000
Dari variabel-variabel yang signifikan yang telah disebutkan di paragraf sebelunya, ada beberapa
diantaranya terdapat variabel yang paling signifikan bermakna yang selanjutnya digunakan untuk memodelkan
data. Sedangkan variabel yang lain yang bukan termasuk variabel paling signifikan dibuang. Hal ini akan
dipertegas oleh output berdasarkan metode Wilk’s Lambda yang memperlihatkan variabel mana saja yang paling
signifikan untuk dimodelkan.
Tabel 4. Variables Entered/Removed

Entered Sig.
Step
Training 1 Training 2 Training 1 Training 2
1 X9 X9 .000 .000
2 X6 X6 .000 .000
3 X12 X12 .000 .000

Berdasarkan tabel Variables Entered/Removed diatas, terdapat 3 variabel independent yang


paling signifikan dari tujuh variabel dari training 1 dan 3 variabel independent yang paling signifikan
dari dan delapan variabel dari data training 2. Ketiga variabel tersebut dianggap signifikan
berdasarkan tabel Tests of Equality of Group Means pada tabel 5. Tiga variabel yang ternyata paling
signifikan dari data training 1 dan data training 2 adalah sama, yaitu variabel X6 (kualitas produk), X9
(resolusi keluhan) dan X12 (kesan tenaga pegawai). Sehingga variabel yang akan digunakan untuk
memodelkan data adalah variabel kualitas produk, resolusi keluhan dan kesan tenaga pegawai. Adapun
koefisien uantuk variabel tersebut dapat dilihat pada tabel dibawah ini.

8
Tabel 5. Standardized Canonical Discriminant
Function Coefficients

Function 1
Variabel
Training 1 Training 2
X6 .653 .606
X9 .694 .741
X12 .629 .663

Tabel 5 diatas menunjukkan koefisien untuk masig-masing variabel signifikan yang digunakan
untuk permodelan data. Berdasarkan tabel 5, diperoleh model persamaan untuk data training 1 yaitu :
Y= 0,653 X6 + 0,694 X9 + 0,629 X12 . sedangkan model persamaan untuk data training 2 yaitu Y =
0,606X6 + 0,471X9 + 0,663X12.
Model persamaan yang diperoleh dapat mewakili model data dengan variabel independent yang
digunakan adalah variabel yang dianggap paling signifikan berdasarkan metode Wilk’s Lambda.
Analisis Diskriminan
Pada dasarnya Analisis diskriminan adalah teknik statistika untuk mengelompokkan individu-
individu ke dalam kelompok-kelompok yang saling bebas dengan tegas berdasarkan sekelompok
variabel bebas. Analisis diskriminan dapat dilakukan bila terdapat perbedaan yang nyata antar
kelompok, sehingga pada tahap awal yang harus dilakukan adalah uji hipotesis nol bahwa tidak ada
perbedaan kelompok di antara individu yang dirumuskan dengan:
Hipotesis:
H0 :
H1 :
α = 0,05
Statistik uji yang digunakan adalah Wilks’Lambda. Output hasil SPSS ditampilkan pada tabel 6.

Tabel 6. Wilks' Lambda


Test of Wilks' Lambda Sig.
Function(s) Training 1 Training 2 Training 1 Training 2
1 .531 .471 .000 .000

Berdasarkan tabel Wilks' Lambda, nilai Pvalue untuk analisis diskriminan pada data training 1
dan training 2 sama-sama bernilai 0,000, dimana nilai Pvalue tersebut < nilai α= 0,05, maka tolak H 0.
Jadi dapat disimpulkan bahwa minimal terdapat dua kelompok data yang berbeda secara signifikan
atau dengan kata lain terdapar perbedaan yang nyata antar kelompok. Karena terdapat perbedaan yang
nyata antar kelompok, maka dapat dilanjutkan dengan menggunakan analisis diskriminan untuk
mengelompokkan individu-individu ke dalam kelompok-kelompok yang saling bebas dengan tegas
berdasarkan sekelompok variabel bebas. Untuk mengetahui apakah kelompok-kelompok data memang
berbeda secara statistik karena kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih
variabel lain yang merupakan variabel independen, dapat dilihat output hasil klasifikasi kelompok data
sebagai berikut :

9
Tabel 7. Classification Results Data Training

Predicted Group Membership Total


X23 Y Training 1 Training 2 Trainin Trainin
0 1 0 1 g1 g2
0 38 4 23 5 42 28
Count
1 9 19 4 23 28 27
Original
0 90.5 9.5 82,1 17,9 100.0 100
%
1 32.1 67.9 14,8 85,2 100.0 100
a. 81.4% of original grouped cases correctly classified (training 1)
b. 83,6% of original grouped cases correctly classified (training 2)

Berdasarkan tabel hasil klasifikasi, untuk data training 1, dapat dikatakan bahwa jumlah data
yang diprediksi berada pada klasifikasi pertama (kelompok 0) dan seharusnya berada pada klasifikasi
pertama adalah sebanyak 38 data, sedangkan yang tidak berada pada klasifikasi pertama adalah
sebanyak 4 data. Jumlah data yang seharusnya masuk pada klasifikasi kedua (kelompok 1) dan
ternyata tidak masuk pada klasifikasi kedua adalah sebanyak 9 data, sedangkan jumlah data yang
diprediksi berada pada klasifikasi kedua dan ternyata masuk pada klasifikasi kedua adalah sebanyak
19 data.
Sedangkan untuk data training 2, dapat dikatakan bahwa jumlah data yang diprediksi berada
pada klasifikasi pertama (kelompok 0) dan seharusnya berada pada klasifikasi pertama adalah
sebanyak 23 data, sedangkan yang tidak berada pada klasifikasi pertama adalah sebanyak 5 data.
Jumlah data yang seharusnya masuk pada klasifikasi kedua (kelompok 1) dan ternyata tidak masuk
pada klasifikasi kedua adalah sebanyak 4 data, sedangkan jumlah data yang diprediksi berada pada
klasifikasi kedua dan ternyata masuk pada klasifikasi kedua adalah sebanyak 23 data.
Ketepatan klasifikasi untuk kelompok data training 1 dan data training 2 berturut-turut adalah
sebesar 81,4 % dan 83,6%. Tingkat persentase ketepatan pada data masing-masing data training ini
akan dibandingkan dengan persentase ketepatan untuk data testing seperti yang terdapat di tabel
berikut.

Tabel 8. Output SPSS Classification Result Data Testing

Predicted Group Membership Total


X23 Testing 1 Testing 2 Testing Testing
Y 0 1 0 1 1 2
0 12 5 20 7 17 27
Count
1 3 10 8 10 13 18
Original
0 70.6 29.4 74,1 25,9 100.0 100.0
%
1 23.1 76.9 44,4 55,6 100.0 100.0
a. 73,3% of original grouped cases correctly classified (testing 1).
b. 66,7% of original grouped cases correctly classified (testing 2).

Berdasarkan tabel klasifikasi untuk data training dan data testing diperoleh tingkat ketepatan
klasifikasi untuk data training lebih besar daripada tingkat ketepatan klasifikasi pada data testing,
dimana untuk data training 1 diperoleh tingkat ketepatan klasifikasi sebesar 81,4 %, sedangkan tingkat

10
ketepatan klasifikasi untuk data testing 2 sebesar 73,3 % dengan perbandingan jumlah data adalah 70 :
30. Jumlah data yang digunakan sebagai data training sebanyak 70 data dan untuk data testing
sebanyak 30 data. Untuk data training 2 diperoleh tingkat ketepatan klasifikasi sebesar 83,6 %,
sedangkan tingkat ketepatan klasifikasi untuk data testing 2 sebesar 66,7 % dengan perbandingan
jumlah data adalah 55 : 45. Jumlah data yang digunakan sebagai data training sebanyak 55 data dan
untuk data testing sebanyak 45 data. Karena persentase ketepatan klasifikasi pada data testing <
persentase ketepatan kalsifikasi pada data training, maka dapat disimpulkan bahwa model yang
dihasilkan belum tepat dan kurang bagus. Untuk itu perlu dilakukan perbaikan jumlah perbandingan
data training dan testing.
Perbandingan Antara Perbandingan Data 1 Dan Perbandingan Data 2
Berikut ini akan dilakukan perbandingan antara perbandingan data 1 dan perbandingan data 2,
yang dapat dilihat dari nilai ketepatan klasifikasi. Berikut ini akan ditampilkan perbandingan unuk
kedua data tersebut.
Tabel 9. Perbandingan Data 1 Dan Perbandingan Data 2

Perbandingan Data Nilai Ketepatan Klasifikasi


Trainin
81,40%
1 g
Testing 73,70%
Trainin
83,60%
2 g
Testing 66,70%
Dari tabel di atas dapat diketahui bahwa nilai ketepatan data testing dari masing-masing
perbandingan lebih rendah dari nilai ketepatan data training. Akan tetapi jika dibandingkan antara nilai
ketepatan klasifikasi data testing 1 lebih baik dari nilai ketepatan klasifikasi data testing 2. Selain itu
selisih antara nilai ketepatan klasifikasi data training 1 dengan data testing 1 lebih kecil dari nilai
ketepatan klasifikasi data training 2 dengan nilai ketepatan klasifikasi data testing 2. Maka dapat
disimpulkan bahwa baik dengan perbandingan jumlah data training sebanyak 70 data dan testing
sebanyak 30 data menghasilkan model persamaan analisis diskrimanan yang lebih baik dari pada
dengan perbandingan jumlah data training sebanyak 55 data dan testing sebanyak 45 data.

5. Kesimpulan dan Saran


Berdasarkan pembahasan yang ada mengenai data di perusahaan HBAT yang dikategorikan
menjadi tiga ketgori, yaitu identitas pelanggan, persepsi pelanggan, dan hubungan dengan pelanggan,
dapat ditarik kesimpulan bahwa semua asumsi dalam analisis diskriminan terpenuhi, dimana asumsi
tersebut adalah data telah berdistribusi normal multivariat yang ditunjukkan dengan nilai t > 0,5, serta
matrik varian kovarians variabel dependen telah homogen sehingga analisis diskriminan dapat
dilanjutkan. Adapun hasil analisis diskriminan menunjukkan bahwa terdapat perbedaan yang nyata
antar kelompok data. Dalam uji signifikansi variabel, baik pada data perbandingan 1 dan
perbandingan 2, terdapat tiga variabel yang dianggap paling signifikan bermakna berdasarkan metode
regresi stepwise, variabel tersebut adalah kualitas produk, resolusi keluhan dan kesan tenaga pegawai.
Dari tiga variabel yang signifkan tersebut, diperoleh bentuk persamaan untuk memodelkan data. Untuk
perbandingan data 1 ( training = 70) yaitu : Y= 0,653 X6 + 0,694 X9 + 0,629 X12. Sedangkan untuk
perbandingan data 2( training = 55) yaitu : 0,606X6 + 0,471X9 + 0,663X12.
Berdasarkan analisis diskriminan yang dilakukan terdapat perbedaan tingkat ketepatan klasifikasi
data training 1 dan training 2, yaitu 81,4% dan 83,6 %. Sedangkan ketepatan klasifikasi untuk data
testing 1 dan testing 2 yang bernilai 73,3% dan 66,7 %. Jelas sekali bahwa nilai ketepatan data testing
dari masing-masing perbandingan lebih rendah dari nilai ketepatan klasifikasi data training. Akan
tetapi, nilai ketepatan klasifikasi data testing 1 lebih baik dari nilai ketepatan klasifikasi testing 2, serta

11
selisih antara nilai ketepatan klasifikasi data training 1 dengan data testing 1 lebih baik kecil dari
selisih antara nilai ketepatan klasifikasi data training 2 dengan data testing 2. Maka dapat disimpulkan
bahwa model yang diperoleh untuk analisis diskriminan dengan perbandingan jumlah data training 1
dan testing 1 sebesar 70:30 dari pada dengan perbandingan jumlah data training sebanyak 55 data dan
testing sebanyak 45 data.
Dengan kesimpulan yang telah diperoleh, maka dapat disarankan untuk menyelesaikan makalah
ini, dibutuhkan pemahaman konsep tentang analisis diskriminan agar dapat menginterpretasikan data
yang diperoleh dengan detail, sehingga permasalahan yang dihadapi dapat terbantu penyeleasaiannya
dengan analisis diskriminan. Selain itu untuk menghasilkan model persamaan diskriminan yang baik,
perlu banyak melakukan percobaan dalam perbandingan data.
6. Daftar Pustaka
Iriawan, Nur dan Septin Puji Astutik. (2006). Mengolah Data Statistik Dengan Mudah Menggunakan
Minitab 14. Andi, Yogyakarta.
Johnson, R. A. dan Wichern, D. W. 1992. Applied Multivariate Statistical Analysis. New Jersey:
Prentice Hall
Santoso, Singgih. Buku Latihan SPSS Statistik Multivariate. Jakarta: Penerbit PT Elex Media
Komputindo Kelompok Gramedia

12

También podría gustarte