You are on page 1of 1

Dalam bab ini kita lanjutkan pengamatan kita tentang metode klasifikasi untuk da ta mining.

Salah satu metode klasifikasi yang attraktif melibatkan pembangunan s ebuah pohon keputusan,banyak node keputusan, terhubung oleh cabang-cabang, memb entang ke bawah dari simpul akar sampai berakhir di node daun.Dimulai pada node root, yang ditempatkan di bagian atas diagram pohon keputusan, atribut diuji pad a node keputusan, dengan setiap hasil yang mungkin mengakibatkan cabang. Setiap cabang kemudian mengarah baik ke node keputusan lain atau berakhir di node daun . Gambar 1 memberikan conoth dari pohon keputusan sederhana Variabel target untuk pohon keputusan pada Gambar 6.1 adalah risiko kredit, deng an pelanggan potensial yang diklasifikasikan sebagai risiko kredit baik atau bur uk. Variabel prediktor adalah tabungan (rendah, sedang, dan tinggi), aset (renda h atau tidak rendah), dan pendapatan (= $ 50.000 atau> $ 50.000). Di sini, node akar merupakan node keputusan, menguji apakah setiap record memiliki sedang, ren dah, atau tinggi tingkat tabungan (seperti yang didefinisikan oleh analis ). Kum pulan data dipartisi, atau dibelah, menurut nilai-nilai atribut ini. Catatan-catatan dengan tabungan rendah dikirimkan melalui cabang paling kiri (ta bungan = rendah) ke node lain keputusan. Catatan dengan tabungan tinggi dikirim melalui cabang paling kanan ke node keputusan yang berbeda. Catatan dengan tabungan sedang dikirim melalui cabang tengah langsung ke node da un, menunjukkan berakhirnya cabang ini. Mengapa node daun dan tidak node keputus an lain? Sebab, di data set (tidak ditampilkan), semua catatan dengan tingkat ta bungan sedang telah diklasifikasikan sebagai risiko kredit yang baik. Tidak ada kebutuhan untuk node keputusan lain, karena pengetahuan kita bahwa pelanggan mem iliki tabungan sedang memprediksi kredit yang baik dengan akurasi 100% dalam kum pulan data. Untuk customer dengan tabungan rendah, node keputusan berikutnya mengetes apakah customer mempunyai asset rendah. Customer yang mempunyai asset rendah kemudian diklasifikasikan sebagai risiko kredit buruk; sedang yang lain diklasifikasikan sebagai risiko kredit baik. Untuk customer dengan tabungan tinggi

You might also like