Thursday, April 2, 2015

Sekilas teori data mining Data mining merupakan suatu proses pengambilan pola dari sekumpulan data/ banyak data yang dianalisis. Data mining sangat penting dalam menelusuri sebuah informasi dari sekumpulan data. Pada umumnya data mining banyak digunakan di dalam bidang-bidang Profiling seperti : Macam-macam model data mining Data Classification Klasifikasi adalah fungsi pembelajaran yang memetakan (mengklasifikasi) sebuah unsur (item) data ke dalam salah satu daribeberapa kelas yang sudah idefinisikan. Gambar 1 menunjukkan pembagian sederhana pada data peminjaman menjadi dua ruang kelas (punya dan tidak punya peminjaman). Pada gambar tersebut x merepresentasikan peminjaman yang bermasalah dan o peminjaman yang pengembaliannya lancar. (Sebagai solusi 3.e, 3.d dan 3.g). Gambar 1.Batas klasifikasi linier sederhana pada himpunan data peminjaman . Data Clustering Pengelompokan (clustering) merupakan tugas deskripsi yang banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster untuk mendeskripsikan data yang ditelaah. Kategori- kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau mengandung representasi yang lebih kaya seperti kategori yang hirarkis atau saling menumpu (overlapping). Gambar 4 menunjukkan pembagian himpunan data peminjaman menjadi 3 cluster. Di sini, cluster - cluster dapat saling menumpu, sehingga titik-titik data dapat menjadi anggota lebih dari satu cluster. (Label x dan o pada gambar sebelumnya diubah menjadi + untuk mengindikasikan bahwa keanggotaan kelas diasumsikan belum diketahui.) (Solusi 3.e). Contoh Aplikasi data Classsificataion & Clustering A. Contoh Aplikasi (classification) Pemakaian Kartu Kredit secara Ilegal Tujuan : Mendeteksi adanya penggunaan kartu kredit secara ilegal Pendekatan : Data transaksi sebelumnya (lokasi & waktu transaksi, jenis barang yang dibeli, besar transaksi) Label data-data tersebut dengan Curang atau Aman DM mencari model klasifikasi Curang atau Aman berdasarkan atribut transaksi Menerapkan model tersebut jika ada transaksi baru untuk mempercepat / tepat tindakan preventif B. Contoh Aplikasi ( Clustering ) Web-Document Clustering Tujuan: Mencari gugus dokumen-dokumen Web yang mirip berdasarkan kemunculan istilah penting Pendekatan: Mengidentifikasi istilah yang sering muncul pada setiap dokumen, mengukur kemiripan berdasarkan frekuensi kemunculan istilah pada dokumen lainnya Hasil: Web search engine memunculkan dokumen-dokumen yang mirip (dalam 1 gugus) berdasarkan istilah yang dicari Sumber : http://fitrianijanius.blogspot.com/2011/08/metode-data-mining.html http://repository.usu.ac.id/bitstream/123456789/31270/3/Chapter%20II.pdf dm05-gambaran-umum-metode-data-mining.pdf maaf, ada sumber yang belum dicantumkan. Karena lupa alamatnya. :D

No comments:

Post a Comment