Thursday, April 2, 2015
Sekilas teori data mining
Data mining merupakan suatu proses pengambilan pola dari sekumpulan data/ banyak data yang dianalisis. Data mining sangat penting dalam menelusuri sebuah informasi dari sekumpulan data.
Pada umumnya data mining banyak digunakan di dalam bidang-bidang Profiling seperti :
Macam-macam model data mining
Data Classification
Klasifikasi adalah fungsi pembelajaran yang memetakan
(mengklasifikasi) sebuah unsur (item) data ke dalam salah satu
daribeberapa kelas yang sudah idefinisikan. Gambar 1 menunjukkan
pembagian sederhana pada data peminjaman menjadi dua ruang kelas
(punya dan tidak punya peminjaman). Pada gambar tersebut x
merepresentasikan peminjaman yang bermasalah dan o peminjaman yang
pengembaliannya lancar. (Sebagai solusi 3.e, 3.d dan 3.g).
Gambar 1.Batas klasifikasi linier sederhana pada himpunan data peminjaman .
Data Clustering
Pengelompokan (clustering) merupakan tugas deskripsi yang
banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas pada
kategori atau cluster untuk mendeskripsikan data yang ditelaah. Kategori-
kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau
mengandung representasi yang lebih kaya seperti kategori yang hirarkis
atau saling menumpu (overlapping). Gambar 4 menunjukkan pembagian
himpunan data peminjaman menjadi 3 cluster. Di sini, cluster - cluster
dapat saling menumpu, sehingga titik-titik data dapat menjadi anggota
lebih dari satu cluster. (Label x dan o pada gambar sebelumnya diubah
menjadi + untuk mengindikasikan bahwa keanggotaan kelas diasumsikan
belum diketahui.) (Solusi 3.e).
Contoh Aplikasi data Classsificataion & Clustering
A. Contoh Aplikasi (classification)
Pemakaian Kartu Kredit secara Ilegal
Tujuan :
Mendeteksi adanya penggunaan kartu kredit secara ilegal
Pendekatan :
Data transaksi sebelumnya (lokasi & waktu transaksi, jenis barang yang dibeli, besar transaksi)
Label data-data tersebut dengan Curang atau Aman
DM mencari model klasiļ¬kasi Curang atau Aman berdasarkan atribut transaksi
Menerapkan model tersebut jika ada transaksi baru untuk mempercepat / tepat tindakan preventif
B. Contoh Aplikasi ( Clustering )
Web-Document Clustering
Tujuan:
Mencari gugus dokumen-dokumen Web yang mirip berdasarkan kemunculan istilah penting
Pendekatan:
Mengidentiļ¬kasi istilah yang sering muncul pada setiap dokumen, mengukur kemiripan berdasarkan frekuensi kemunculan istilah pada dokumen lainnya
Hasil:
Web search engine memunculkan dokumen-dokumen yang mirip (dalam 1 gugus) berdasarkan istilah yang dicari
Sumber :
http://fitrianijanius.blogspot.com/2011/08/metode-data-mining.html
http://repository.usu.ac.id/bitstream/123456789/31270/3/Chapter%20II.pdf
dm05-gambaran-umum-metode-data-mining.pdf
maaf, ada sumber yang belum dicantumkan. Karena lupa alamatnya. :D
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment