" Data Mining "
Pengertian Data Mining
Penggalian data (bahasa Inggris: data mining) adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tetapi tidak tahu pola apa yang bisa didapatkan.
Proses Pencarian Pola :
Penggalian data adalah salah satu bagian dari proses pencarian pola. Berikut ini urutan proses pencarian pola:
- Pembersihan Data: yaitu menghapus data pengganggu (noise) dan mengisi data yang hilang.
- Integrasi Data: yaitu menggabungkan berbagai sumber data.
- Pemilihan Data: yaitu memilih data yang relevan.
- Transformasi Data: yaitu mentransformasi data ke dalam format untuk diproses dalam penggalian data.
- Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola.
- Evaluasi pola: yaitu mengenali pola-pola yang menarik saja.
- Penyajian pola: yaitu memvisualisasi pola ke pengguna.
Teknik Penggalian Data :
Pada dasarnya penggalian data dibedakan menjadi dua fungsionalitas, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsionalitas penggalian data yang sering digunakan:
- Karakterisasi dan Diskriminasi: yaitu menggeneralisasi, merangkum, dan mengkontraskan karakteristik data.
- Penggalian pola berulang: yaitu pencarian pola asosiasi (association rule) atau pola intra-transaksi, atau pola pembelian yang terjadi dalam satu kali transaksi.
- Klasifikasi: yaitu membangun suatu model yang bisa mengklasifikasikan suatu objek berdasar atribut-atributnya. Kelas target sudah tersedia dalam data sebelumnya, sehingga fokusnya adalah bagaimana mempelajari data yang ada agar klasifikator bisa mengklasifikasikan sendiri.
- Prediksi: yaitu memprediksi nilai yang tidak diketahui atau nilai yang hilang, menggunakan model dari klasifikasi.
- Penggugusan/Cluster analysis: yaitu mengelompokkan sekumpulan objek data berdasarkan kemiripannya. Kelas target tidak tersedia dalam data sebelumnya, sehingga fokusnya adalah memaksimalkan kemiripan intrakelas dan meminimalkan kemiripan antarkelas.
- Analisis outlier: yaitu proses pengenalan data yang tidak sesuai dengan perilaku umum dari data lainnya. Contoh: mengenali noise dan pengecualian dalam data.
- Analisis trend dan evolusi: meliputi analisis regresi, penggalian pola sekuensial, analisis periodisitas, dan analisis berbasis kemiripan.
Menurut Yusuf W dkk (2006) dikutip oleh (Citra, 2015) data mining dapat menjalankan fungsi-fungsi sebagai berikut :
1. Deskripsi
Deskripsi dapat membantu dalam menjelaskan pola dan trend yang terjadi, pola dan trend data sering dideskripsikan. Model data mining harus transparan, sehingga hasilnya dapat mendeskripsikan pola dengan jelas.
2. Estimasi
Estimasi sama dengan deskripsi kecuali variabel targetnya numerik ketimbang kategorikal. Model yang dibuat menggunakan record yang lengkap, yang telah menyediakan nilai variabel target prediktor.
3. Prediksi
Prediksi sama dengan klasifikasi dan estimasi yang membedakannya hanya hasil dalam prediksi yang terjadi dimas yang akan datang.
4. Klasifikasi
Variabel target dalam kasifikasi adalah kategorikal. Mode Data Mining memeriksa set record yang besar, dimana setiap record memiliki informasi variabel target dan set input.
5. Clustering
Pengelompokan record, observasi atau kasus ke dalam objek-objek yang mirip disebut dengan clustering, didalam clustering tidak terdapat variabel target, clustering mencoba menfregmentasi seluruh set data kedalam subgroup yang relatif homogen, dimana kemiripan antar record luar cluster diminimasikan sedangkan kemiripan di dalam record dimaksimalkan.
6. Asosiasi
Asosiasi adalah suatu tugas untuk menemukan atribut-atribut yang terjadi bersamaan yang mencoba menemukan aturan untuk mrngkuantifikasi hubungan antara dua atau lebih atribut.
Manfaat Data Mining :
1. Segmentasi PasarMengidentifikasi karakteristik umum dari pelanggan yang membeli produk yang sama
2. Analisis keranjang penjualan
Memahami produk atau servis yang pada umumnya dijual bersama-sama.
3. Analisis kecenderungan
Menyatakan perbedaan antara tipe pelanggan bulan ini dan yang lalu.
4. Intelligence Marketing
Kebanyakan aplikasi data mining tujuan utamanya adalah membuat prediksi dan deskripsi.
Prediksi menggunakan beberapa variable atau field-field basis data untuk memprediksi nilai- nilai variable masa mendatang yang diperlukan yang belum diketahui saat ini.
Deskripsi berfokus pada penemuan pola-pola tersembunyi dari data yang ditelaah.
Tujuan Data Mining :
a. Explanatory
Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick up meningkat di colorado.
b. Confirmatory
Untuk mempertegas hipotesis, seperti halnya 2 kali pendapatan keluarga lebih suka di pakai untuk membeli peralatan keluarga, di bandingkan dengan satu kali pendapatan keluarga.
c. Exploratory
Menganalisis data untuk hubungan yang baru yang tidak di harapkan, seperti halnya pola apa yang cocok untuk kasus penggelapan kartu kredit.
Implementasi Data Mining
Salah satu contoh kasus yang dapat diambil dalam penerapan data mining yaitu misalnya pada toko buku. Misalnya toko buku tersebut memiliki database pembelian buku-buku yang telah dibeli. Penjual dapat memanfaatkan database tersebut menggunakan data mining. Dengan menggunakan data mining penjual dapat mengetahui buku-buku dengan kategori apa saja yang paling banyak terjual, yang kurang banyak terjual, atau tidak pernah terjual. Selain itu penjual dapat mengetahui pada waktu-waktu kapan saja buku tertentu terjual paling banyak. Misalnya berdasarkan database penjualan, pada tahun ajaran baru, buku-buku pelajaran SD, SMP, dan SMA adalah yang paling banyak terjual. Penjual dapat menyiasatinya untuk meningkatkan pendapatan dengan cara menempatkan buku-buku pelajaran SD, SMP, dan SMA ke rak buku bagian belakang karena barang tersebut pasti dicari dan menempatkan buku-buku yang kurang banyak terjual atau tidak pernah terjual di rak buku bagian depan. Selain itu penjual dapat menambah stok buku pelajaran SD,SMP, dan SMAnya dan menambah barang-barang lain yang kemungkinan besar terjual laris manis pada tahun ajaran baru. Misalnya pupen, buku tulis, tas, dll. Sehingga yang dijualnya bukan hanya buku-buku saja tetapi juga barang-barang lain yang juga kemungkinan besar juga ikut terjual pada tahun ajaran baru. Penjual juga dapat meningkatkan penjualannya dengan memudahkan pembeli mencari buku yang diinginkan yaitu dengan memberi label untuk setiap rak kelompok buku. Misalnya buku-buku komputer dikelompokkan dalam satu rak dan rak tersebut diberi label komputer sehingga pembeli mudah menemukannya meskipun diletakkan di rak buku bagian belakang. Demikianlah contoh kasus penerapan data mining.
Daftar Pustaka :
https://id.wikipedia.org/wiki/Penggalian_data
http://duniawebhouse.blogspot.co.id/2013/01/manfaat-data-mining.html
http://ramadhanroby.blogspot.co.id/2016/05/data-mining-dan-fungsi-data-mining.html
https://datamining10041.wordpress.com/2012/03/11/contoh-kasus-penerapan-data-mining/
======================================================
Kelas : 2KA29
NPM : 17115192
Tugas Softskill 3 Arbi Pramana


Posting Komentar