KlasifikasidanKlasteringPenjurusanSiswa PDF

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/294085772
Klasiﬁkasi dan Klastering Penjurusan Siswa SMA Negeri 3 Boyolali
Article · December 2015

DOI: 10.23917/khif.v1i1.1175
CITATIONS READS
7 3,225
1 author:
Yusuf Sulistyo Nugroho

Nara Institute of Science and Technology
20 PUBLICATIONS 18 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Augmented Reality Educational Game View project
Performance Comparison of Classification Algorithms View project
All content following this page was uploaded by Yusuf Sulistyo Nugroho on 12 February 2016.
The user has requested enhancement of the downloaded file.

1
khazanah Jurnal Ilmu Komputer dan Informatika

informatika
.ODVLÀNDVLGDQ.ODVWHULQJ3HQMXUXVDQ6LVZD
60$1HJHUL%R\RODOL
<XVXI 61XJURKR1*6\DULIDK1+DU\DWL1
1
Program studi Informatika
Universitas Muhammadiyah Surakarta
Surakarta
*Yusuf.Nugroho@ums.ac.id
$%675$.
SMA N 3 Boyolali merupakan salah satu sekolah menengah di kota Boyolali yang saat ini telah memiliki 2 jurusan yaitu IPA
dan IPS. Penjurusan siswa ini dapat mengarahkan peserta didik agar lebih fokus dalam mengembangkan kemampuan diri
dan minat yang dimiliki. Pemilihan jurusan yang tidak tepat bisa sangat merugikan siswa terhadap minat dan karir mereka di
masa mendatang. Dengan penjurusan tersebut diharapkan dapat memaksimalkan potensi, bakat atau talenta individu, sehingga
dapat memaksimalkan nilai akademisnya. Berdasarkan latar belakang tersebut, maka dengan menerapkan teknik data mining
diharapkan dapat membantu siswa untuk menentukan jurusan yang tepat sesuai dengan kriteria yang ditetapkan. Adapaun teknik
data mining yang digunakan dalam penentuan jurusan ini menggunakan 3 buah metode yaitu Algoritma C4.5, Naive Bayes dan
Algoritma K-Means. Sedangkan atribut yang digunakan terdiri dari Gender, Minat, Rata-rata nilai IPA, Rata-rata nilai IPS, nilai
Psikotest IPA, nilai Psikotest IPS, Asal Sekolah dan Jurusan. Analisis dilakukan dengan bantuan aplikasi RapidMiner 5 untuk
mengetahui nilai-nilai perbandingan terhadap metode yang digunakan. Hasil penelitian menggunakan perbandingan 3 metode
menunjukkan bahwa berdasarkan nilai precision, metode naive bayes lebih baik dibandingkan dengan metode yang lain dengan
nilai 77,51%. Sedangkan berdasarkan nilai recall dan accuracy, decision tree lebih baik dibandingkan dengan metode yang lain
dengan nilai recall sebesar 90,80% dan nilai accuracy sebesar 79,14%. Variabel yang paling berpengaruh dalam menentukan
penjurusan yaitu rata-rata nilai IPA sehingga perlu dijadikan pertimbangan bagi pihak sekolah untuk menentukan jurusan siswa.
.DWDNXQFLalgoritma C4.5, algoritma K-Means, data mining, jurusan SMA, naïve bayes
1. PENDAHULUAN dua jurusan yaitu IPA dan IPS. Penjurusan siswa ini
bertujuan untuk mengarahkan peserta didik agar lebih
Kemajuan teknologi informasi telah menyebabkan fokus mengembangkan kemampuan diri dan minat yang
banyak orang dapat memperoleh data dengan mudah dimiliki. Jurusan yang tidak tepat bisa sangat merugikan
bahkan cenderung berlebihan. Data tersebut semakin lama siswa dan karirnya di masa mendatang. Dengan
semakin banyak dan terakumulasi, akibatnya pemanfaatan penjurusan tersebut diharapkan dapat memaksimalkan
data yang terakumulasi tersebut menjadi tidak optimal [1]. potensi, bakat atau talenta individu, sehingga juga akan
Sebagai contoh perusahaan retail yang akan memberikan memaksimalkan nilai akademisnya. Penentuan jurusan ini
brosur penawaran barang-barang yang dijual ke pelanggan akan berdampak terhadap kegiatan akademik selanjutnya
sesuai basis data pelanggan yang mereka punya. Jika dan mempengaruhi pemilihan bidang ilmu atau studi bagi
perusahaan retail tersebut mempunyai satu juta data siswa-siswi yang ingin melanjutkan ke perguruan tinggi
pelanggan dan masing-masing pelanggan tersebut nantinya. Penentuan jurusan yang dilakukan selama ini
dikirimkan sebuah brosur penawaran dimana biaya mempunyai banyak kelemahan, antara lain berdasarkan
pengiriman brosur tersebut adalah dua ribu rupiah, maka keinginan siswa tanpa melihat latar belakang nilai
biaya yang akan dikeluarkan oleh perusahaan tersebut akademisnya saja. Sehingga jurusan yang dipilih terkadang
adalah dua juta rupiah per bulan. Dari penggunaan dana menjadi masalah bagi siswa di kemudian hari, sebagai
tersebut mungkin hanya sepertiganya atau bahkan 8% saja contoh nilai akademik yang tidak maksimal, pemilihan
yang secara efektif membeli penawaran tersebut [2]. program studi saat melanjutkan ke jenjang perguruan
SMAN 3 Boyolali yang berdiri sejak tahun 1989 tinggi yang terkendala akibat jurusan SMA yang tidak
merupakan salah satu Sekolah Menengah Atas di Kota sesuai, dan lain-lain.
Boyolali yang terletak di Jalan Perintis Kemerdekaan, 'HQJDQPHQHUDSNDQWHNQLNNODVLÀNDVLGDQNODVWHULQJ
Pulisen, Boyolali. Saat ini SMA tersebut telah memiliki dalam data mining (DM), dapat digali suatu informasi
Vol. I No. 1 | Desember 2015 KHAZANAH INFORMATIKA | Online ISSN: 2477-698X

2 .ODVLÀNDVLGDQ.ODVWHULQJ3HQMXUXVDQ6LVZD60$1HJHUL%R\RODOL
strategis yang dapat digunakan untuk menentukan 7DEHO Keterangan atribut yang digunakan
penjurusan siswa. Informasi hasil analisis dapat
digunakan untuk menemukan peluang-peluang yang $WULEXW -HQLV9DULDEOH
baru serta menemukan rencana strategis dalam proses
Jurusan Y
SHQJNODVLÀNDVLDQMXUXVDQWHUKDGDSVLVZD
1DPXQ NHJLDWDQ NODVLÀNDVL GDQ NODVWHULQJ MLND Gender X1
dilakukan oleh manusia masih memiliki keterbatasan,
Minat X2
terutama pada kemampuan manusia dalam menampung
jumlah data yang ingin diolah. Selain itu bisa juga terjadi Rata-rata IPA X3
kesalahan akibat ketidaktelitian yang dilakukan. Salah satu Rata-rata IPS X4
cara mengatasi masalah ini adalah dengan menggunakan
teknik data mining yang bisa digunakan untuk pengolahan Psikotes IPA X5
data menjadi sumber informasi strategis dengan metode Psikotes IPS X6
NODVLÀNDVL GDQ NODVWHULQJ 'DWD PLQLQJ GDSDW PHPEDQWX
sebuah organisasi yang memiliki data melimpah Asal sekolah X7
untuk memberikan informasi yang dapat mendukung
pengambilan keputusan [3].
Dalam bidang analisis perusahaan dan manajemen 2.2 PENENTUAN JUMLAH SAMPLE
resiko, data mining digunakan untuk merencanakan Untuk mendapatkan sampel yang dapat
keuangan dan evaluasi aset, merencanakan sumber daya menggambarkan dan mewakili jumlah populasi
(resources planning) dan memonitor persaingan [4]. menggunakan bantuan metode slovin dengan nilai
Berdasarkan permasalahan tersebut, maka dalam maksimal e = 5%. Metode slovin dalam [5] ditunjukkan
penelitian ini dilakukan perbandingan 3 metode untuk pada persamaan 1.
penjurusan siswa menggunakan teknik data mining, yaitu
metode decision tree dengan algoritma C.4.5, naive bayes dan N
clustering dengan algoritma k-means. Hasil yang diperoleh
n=
dapat memberikan informasi strategis bagi siswa yang 1 + ne 2
dapat mendukung keputusan untuk menentukan jurusan
serta memudahkan bagi pihak sekolah untuk mengarahkan Keterangan:
siswa dalam hal penjurusan tersebut. n = jumlah sampel
N = jumlah keseluruhan data / populasi
e = galat kesalahan (ditentukan sebesar 5%)
2. METODE
2.3 PENGUMPULAN DATA
Jumlah data siswa SMAN 3 Boyolali selama 5 tahun
2.1 PENENTUAN ATRIBUTE diketahui sebanyak 1240 siswa. Dengan menggunakan
Atribut-atribut yang digunakan untuk perbandingan persamaan 1, maka dapat dihitung jumlah sampel yang
metode dalam data mining ini ditentukan sesuai dengan diambil yaitu sebanyak 302 siswa yang digunakan data
kebutuhan analisis. Adapun daftar atribut yang digunakan sampling.
dapat dilihat pada tabel 1. Ada dua jenis variabel dalam
proses ini, yaitu: 2.4 ANALISIS DATA
a) Variabel dependen (Y) Tahap perbandingan metode data mining dilakukan
Variabel dependen (Y) adalah variabel yang dengan melakukan perhitungan menggunakan 3 algoritma
nilainya tergantung atau terikat berdasarkan nilai-nilai yaitu algoritma C4.5, Naïve Bayes, dan K-Means. Algoritma
variabel lainnya. C4.5 merupakan salah satu algoritma dalam metode
b) Variabel independen (X) decision tree yang dihitung dengan penentuan atributnya
Variabel independen (X) adalah variabel yang menggunakan information gain berdasarkan entropi dari
nilainya tidak tergantung dari nilai-nilai variabel masing-masing atribut yang telah ditentukan dengan
lainnya. persamaan 2 dan 3 [6].
Entropy ( y ) = − p1 log 2 p1 − p 2 log 2 p 2 − ... − pn log 2 pn (2)

yc
gain( y, A) = entropy ( y ) − ∑
c∈nilai ( A ) y
entropy ( yc) (3)
Sementara itu, algoritma naive bayes merupakan

SHQJNODVLÀNDVLDQGHQJDQPHWRGHSUREDELOLWDVGDQVWDWLVWLN
untuk memprediksi peluang di masa depan [7]. Adapun
algoritma ini dapat dihitung menggunakan persamaan 4.
P( X | H ).P( H )
P( S | X )
P( X )
Sedangkan algoritma K-Means merupakan salah satu

metode clustering non-hirarki yang mengelompokkan data

.ODVLÀNDVLGDQ.ODVWHULQJ3HQMXUXVDQ6LVZD60$1HJHUL%R\RODOL
dalam bentuk satu atau lebih klaster [8]. Menurut [1], 3.2 DISTRIBUSI PROBABILITAS PENJURUSAN
metode K-Means dapat mempartisi data ke dalam cluster SISWA
sehingga data yang memiliki karakteristik yang sama 'LVWULEXVL GDWD NODVLÀNDVL SHQMXUXVDQ VLVZD
dikelompokkan ke dalam satu cluster yang sama dan data menggunakan naïve bayes berdasarkan nilai rata-rata IPA
yang mempunyai karateristik yang berbeda dikelompokan dan IPS ditunjukkan pada gambar 2. Gambar tersebut
ke dalam cluster yang lain. menunjukkan bahwa distribusi terbanyak untuk jurusan
Pembagian kelompok klaster menggunakan IPS berasal dari siswa yang memiliki nilai rata-rata IPA
persamaan Euclidean distance space (persamaan 5) yang sering QLODLGDQQLODLUDWDUDWD,36QLODL
digunakan dalam perhitungan jarak, hal ini dikarenakan
hasil yang diperoleh merupakan jarak terpendek antara
dua titik yang diperhitungkan.
p
du = ∑ (x
k =1
ik − xjk ) 2 (5)
*DPEDU3RKRQNHSXWXVDQXQWXNNODVLÀNDVLSHQMXUXVDQVLVZD
*DPEDU3RKRQNHSXWXVDQXQWXNNODVLÀNDVLSHQMXUXVDQVLVZD
3. HASIL
3.1 POHON KEPUTUSAN PENJURUSAN

SISWA
+DVLO SURVHV NODVLÀNDVL SHQMXUXVDQ VLVZD GHQJDQ
algoritma C4.5 ditunjukkan pada gambar 1. Berdasarkan
hasil pohon keputusan pada gambar 1, dapat dilihat
bahwa atribut yang memiliki pengaruh paling tinggi untuk
PHQHQWXNDQNODVLÀNDVLSHQMXUXVDQVLVZDDGDODKQLODLUDWD
rata IPA. Hal ini ditunjukkan dengan variabel tersebut
yang menempati sebagai simpul akar (root node).
*DPEDUProbabilitas penjurusan siswa menggunakan Naive

Bayes
3.3 KLASTERING PENJURUSAN SISWA

Hasil klastering menunjukkan bahwa kelompok
penjurusan siswa berjumlah 5 klaster dengan masing-
masing jumlah data berbeda antara satu klaster dengan
klaster yang lainnya seperti ditunjukkan pada gambar 3.
Berdasarkan pembagian klaster tersebut dapat dilihat
9RO,1R_'HVHPEHU .+$=$1$+,1)250$7,.$_2QOLQH,661;
bahwa klaster yang memiliki anggota terbanyak adalah 2) Menentukan internal node pertama
klaster 3 yaitu sebanyak 109 dari 302 data, sedangkan Penentuan internal node pada cabang rata-rata
yang memiliki anggota paling sedikit adalah klaster 2 yaitu ,3$QLODL GLGDSDWNDQ QLODL information gain
sebanyak 16 dari 302 data. seperti pada tabel 3. Atribut yang memiliki nilai
information gain yang tertinggi dipilih sebagai internal
node.
7DEHONilai information gain penentuan atribut sebagai
internal node pertama
1LODL,QIRUPDWLRQ*DLQ
$WULEXW
&DEDQJ5DWDUDWD,3$QLODL
Gender 0,170
Minat 0,063
Rata-rata IPS 0,220
Psikotes IPA 0,029
Psikotes IPS 0,034
Asal sekolah 0,040
*DPEDUCluster Model Text View menggunakan K-Means
Hasil perhitungan dalam tabel 3 dapat
disimpulkan bahwa atribut Rata-rata IPS merupakan
4. DISKUSI internal node SDGD UDWDUDWD ,3$ QLODL NDUHQD
memiliki nilai gain yang tertinggi dibandingkan dengan
atribut yang lain.
4.1 PERHITUNGAN ALGORITMA C4.5
Berdasarkan hasil pohon keputusan pada gambar 1
3) Menentukan internal node kedua
dapat diketahui bahwa rata-rata IPA memiliki memiliki
Menentukan internal node kedua pada rata-rata
pengaruh paling tinggi untuk menentukan jurusan di SMA
,3$ QLODL GDQ UDWDUDWD ,36 QLODL
tersebut. Hal ini ditunjukkan dengan atribut rata-rata IPA
didapatkan nilai information gain seperti pada tabel 4.
menempati sebagai root node. Adapun rata-rata IPS sebagai
Nilai information gain dalam tabel 4 menunjukkan
internal root SHUWDPD SDGD UDWDUDWD ,3$ QLODL
bahwa atribut Gender merupakan internal node pada
gender sebagai internal root pertama pada rata-rata IPA
FDEDQJ UDWDUDWD ,3$ GDQ UDWDUDWD ,36 QLODL
QLODL! VHGDQJNDQ SDGD UDWDUDWD ,3$ QLODL WLGDN
karena memiliki nilai gain yang tertinggi dibandingkan
terdapat internal node dikarenakan hasil entropi dari variabel
dengan atribut yang lain.
tersebut adalah 0, sehingga menghasilkan leaf node yaitu
IPS. 7DEHONilai information gain penentuan atribut sebagai
1) Menentukan simpul akar (Root Node) internal node kedua
Perhitungan nilai entrophy dan information 1LODL,QIRUPDWLRQ*DLQ
gain setiap atribut untuk menentukan simpul akar &DEDQJ5DWDUDWD,3$
dihitung menggunakan persamaan 2 dan 3. Atribut $WULEXW
QLODL
yang memiliki nilai information gain paling tinggi dipilih GDQ5DWDUDWD,36QLODL
sebagai simpul akar.
Gender 0,386
7DEHOKeterangan atribut yang digunakan Minat 0,245
$WULEXW 1LODL,QIRUPDWLRQ*DLQ Psikotes IPA 0,065
Gender 0,172 Psikotes IPS 0,060
Minat 0,054 Asal sekolah 0,114
Rata-rata IPA 0,207 4) Menentukan leaf node

Rata-rata IPS 0,023 Menentukan leaf node pada rata-rata IPA dan IPS
QLODLGHQJDQgender laki-laki.
Psikotes IPA 0,003
Psikotes IPS 0,009
Asal sekolah 0,011
Berdasarkan tabel 2 dapat diketahui bahwa

atribut Rata-rata IPA memiliki nilai gain yang tertinggi.
Sehingga dipilih sebagai simpul akar.

.ODVLÀNDVLGDQ.ODVWHULQJ3HQMXUXVDQ6LVZD60$1HJHUL%R\RODOL
7DEHO Nilai information gain penentuan atribut sebagai i Pada metode ini, pengelompokan data penjurusan
nternal node berikutnya siswa dilakukan perhitungan dengan beberapa tahap yaitu:
1LODL,QIRUPDWLRQ*DLQ a. Menentukan jumlah klaster
&DEDQJ5DWDUDWD,3$ Klaster yang diinginkan dalam proses ini
$WULEXW QLODL ditentukan sebanyak 5 klaster (nilai k).
GDQ5DWDUDWD,36QLODL b. Menentukan nilai centroid
GDQ*HQGHU/DNLODNL Tabel 6 adalah nilai centroid dari masing-masing
variabel independen pada masing-masing kelompok
Minat 0,000
data.
Psikotes IPA 0,000
7DEHONilai centroid tiap klaster
Psikotes IPS 0,000
1LODL&HQWURLG7LDS9DULDEHO
&OXVWHU
Asal sekolah 0,000 ; ; ; ; ; ; ;
1-60 7 9,2 10 11,6 12,4 18 7,2
Dari hasil dalam tabel 5 dapat disimpulkan bahwa
gender laki-laki menghasilkan leaf node jurusan IPS, 61-120 7,2 10,2 10,6 11,6 11,8 19 12,2
dikarenakan hasil dari semua information gain bernilai 121-180 6,8 9,2 9,2 11 14,6 21,2 13,2
0, sementara probabilitas siswa jurusan IPA dalam
data tidak ada. 181-240 7,2 9,4 9,8 12 12,6 17,4 10,4
241-302 8,8 10 7,2 11 13,6 18,6 8,8
4.2 PERHITUNGAN ALGORITMA NAÏVE
BAYES Tahap berikutnya adalah mencari jarak antar data untuk
Menggunakan data pelatihan yang ada dan dengan melakukan pengelompokan data dengan menggunakan
menerapkan metode naïve bayes maka dapat dilakukan persamaan 5. Hasil perhitungan digunakan untuk mencari
prediksi terhadap data uji. Sebagai contoh adalah jika nilai jarak Euclidean. Suatu data yang memiliki jarak terdekat
terdapat siswa dengan data sebagai berikut: gender laki- dengan data lain maka dapat dikelompokkan menjadi satu
ODNLPLQDW,36QLODLUDWDUDWD,3$QLODLQLODLUDWD klaster. Sehingga pada tahap ini menghasilkan sebuah
UDWD ,36 QLODL QLODL SVLNRWHVW ,3$ VNRU model klaster (cluster model) untuk mengetahui kelompok-
nilai psikotest IPS skor>65, asal sekolah wilayah II, kelompok jurusan siswa berdasarkan variabel-variabel
maka jurusan siswa tersebut dapat diprediksi. Tabel 6 bebas yang diajukan. Gambar 3 adalah model klaster yang
menunjukkan nilai FRQÀGHQFH atau nilai HMAP (Hypothesis terbentuk.
Maximum Apriori Probability) yang dapat digunakan sebagai
dasar melakukan prediksi jurusan siswa. 4.4 PERBANDINGAN TIGA METODE DI ATAS
Perbandingan ketiga metode diperlukan dalam
7DEHO Nilai FRQÀGHQFHHMAP terhadap data uji penelitian ini untuk mengetahui metode yang paling baik
1LODL&RQÀGHQFH berdasarkan kriteria nilai Accuracy, Precision dan Recall.
3UREDELOLW\ Tabel 8 adalah nilai masing-masing kriteria pada 3 metode
+0$3
yang digunakan.
P (X1 = Laki-laki, X2 = IPS, X3 = Berdasarkan hasil perbandingan pada tabel 8 dapat
QLODL ; QLODL ;
0,000 disimpulkan bahwa metode Decision Tree lebih baik
6NRU; 6NRU!; digunakan untuk penelitian ini dikarenakan memiliki nilai
Wilayah II | Y = IPA) accuracy dan recall yang lebih tinggi dibandingkan dengan
P (X1 = Laki-laki, X2 = IPS, X3 = metode lainnya. Sedangkan metode naive bayes memiliki
QLODL ; QLODL ;
0,000 nilai precision yang lebih tinggi dibandingkan dengan
6NRU; 6NRU!; metode yang lain.
Wilayah II | Y = IPS)
7DEHO Perbandingan 3 metode berdasarkan accuracy, precision
Berdasarkan nilai HMAP yang ditunjukkan pada dan recall
tabel 6 untuk masing-masing probability terhadap jurusan, 1LODL 1LODL 1LODL
maka dapat dihasilkan nilai prediksi adalah jurusan IPS. .RPSRQHQ
$FFXUDF\ 3UHFLVLRQ 5HFDOO
Hal ini dapat diketahui berdasarkan nilai HMAP untuk
Decision Tree 79,14% 75,51% 90,80%
jurusan IPS yaitu sebesar 0,0000542 yang lebih besar
dibandingkan dengan nilai HMAP untuk jurusan IPA Naive Bayes 76,82% 77,51% 80,37%
yaitu sebesar 0,000000117.
K-Means 36,40% 64,25% 25,40%
4.3 PERHITUNGAN ALGORITMA K-MEANS

Algoritma K-Means digunakan untuk mengetahui
5. KESIMPULAN
pola pengelompokan jurusan siswa berdasarkan nilai
Distance Performance terhadap variabel-variabel yang
diajukan. Distance performance dalam metode klastering Berdasarkan hasil penelitian yang dilakukan maka
dapat dihitung jika nilai pada setiap variabel memiliki tipe GDSDW GLVLPSXONDQ WHODK GLSHUROHK NODVLÀNDVL SHQMXUXVDQ
numerik. Sehingga data yang digunakan dalam proses ini siswa menggunakan metode decision tree +DVLO NODVLÀNDVL
adalah data numerik. menunjukkan bahwa variabel yang paling tinggi
9RO,1R_'HVHPEHU .+$=$1$+,1)250$7,.$_2QOLQH,661;
pengaruhnya terhadap penjurusan siswa adalah nilai rata- [2] P. Bühlman and B. Yu, Analyzing Bagging, The
rata IPA. Hal ini dibuktikan dengan variabel nilai rata-rata Annals of Statistics, Vol. 30 no. 4, hal 927-961, 2002.
IPA menempati sebagai simpul akar pada diagram pohon [3] D. Kiron, R. Shockley, N. Kruschwitz, G. Finch, and
keputusan. M. Haydock, Analytics: The Widening Divide, MIT
Proses klastering telah menghasilkan 5 kelompok Sloan Management Review, 53(2), 1-22, 2012.
klaster yang terdiri dari klaster 0 sampai dengan klaster 4 [4] D. Anggraini, Analisis Perubahan Kelompok
yang masing-masing terdiri dari 24, 53, 16, 109, dan 100 Berdasarkan Perubahan Nilai Jual Pada Bloomberg
siswa dengan total 302 data siswa. Klaster yang memiliki Market Data dengan Menggunakan Formal Concept
anggota terbanyak adalah klaster 3, sedangkan yang Analysis, Report Paper, 2009.
memiliki anggota paling sedikit adalah klaster 2. [5] Y. S. Nugroho, Analisis Faktor-Faktor Yang
Berdasarkan nilai accuracy dan recall, metode decision Mempengaruhi Tingkat Daya Beli Konsumen
tree lebih baik dibandingkan dengan metode yang lain Terhadap Listrik Pada Sektor Rumah Tangga: Studi
dengan nilai accuracy sebesar 79,14% dan nilai recall sebesar Kasus Kota Salatiga. Thesis, Universitas Gadjah
90,80%. Berdasarkan nilai precision, metode naive bayes Mada, 2009.
lebih baik dibandingkan dengan metode yang lain dengan [6] Ranny dan Budi, Pemilihan Diet Nutrien bagi
nilai 77,51%. Penderita Hipertensi Menggunakan Metode
.ODVLÀNDVL'HFLVLRQ7UHH-XUQDO7HNQLN,769RO
No.1, 2012.
DAFTAR PUSTAKA [7] Bustami, Penerapan Algoritma Naive Bayes untuk
0HQJNODVLÀNDVL 'DWD 1DVDEDK $VXUDQVL -XUQDO
>@ <61XJURKRDQG6HW\DZDQ.ODVLÀNDVL0DVD6WXGL Penelitian Teknik Informatika, 2013.
Mahasiswa Fakultas Komunikasi dan Informatika, [8] Y. Agusta, K-Means: Penerapan Permasalahan dan
Jurnal Komunikasi dan Teknologi Informasi Metode Terkait, Jurnal Sistem dan Informatika Vol.3
(KomuniTi) ISSN: 2087-085X, Volume VI No. I hal : 47-60, 2007.
Maret, 2014.
View publication stats

KlasifikasidanKlasteringPenjurusanSiswa PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

KlasifikasidanKlasteringPenjurusanSiswa PDF

Uploaded by

Copyright:

Available Formats

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

Klasiﬁkasi dan Klastering Penjurusan Siswa SMA Negeri 3 Boyolali

Article · December 2015

Yusuf Sulistyo Nugroho

Augmented Reality Educational Game View project

Performance Comparison of Classification Algorithms View project

The user has requested enhancement of the downloaded file.

khazanah Jurnal Ilmu Komputer dan Informatika

Vol. I No. 1 | Desember 2015 KHAZANAH INFORMATIKA | Online ISSN: 2477-698X

Entropy ( y ) = − p1 log 2 p1 − p 2 log 2 p 2 − ... − pn log 2 pn (2)

Sementara itu, algoritma naive bayes merupakan

Sedangkan algoritma K-Means merupakan salah satu

Vol. I No. 1 | Desember 2015 KHAZANAH INFORMATIKA | Online ISSN: 2477-698X

3.1 POHON KEPUTUSAN PENJURUSAN

*DPEDUProbabilitas penjurusan siswa menggunakan Naive

3.3 KLASTERING PENJURUSAN SISWA

Gender 0,172 Psikotes IPS 0,060

Minat 0,054 Asal sekolah 0,114

Rata-rata IPA 0,207 4) Menentukan leaf node

Berdasarkan tabel 2 dapat diketahui bahwa

Vol. I No. 1 | Desember 2015 KHAZANAH INFORMATIKA | Online ISSN: 2477-698X

4.3 PERHITUNGAN ALGORITMA K-MEANS

Vol. I No. 1 | Desember 2015 KHAZANAH INFORMATIKA | Online ISSN: 2477-698X

View publication stats

You might also like

*DPEDUProbabilitas penjurusan siswa menggunakan Naive