Data warehouse dan Data Mining
-
1.
1
-
2.
Referensi :
2
•The Data Warehouse Toolkit by Ralph Kimball (John Wiley and Sons, 1996)
•Building the Data Warehouse by William Inmon (John Wiley and Sons, 1996)
• Building the Data Warehouse Bill Inmon, 1992
•The Data Warehousing, Institute profit organization, 1995
• Releases the Data Vault, Daniel Linstedf, 2000
• Budi Santoso, Data Mining, ( Graha Ilmu, 2007 )
-
3.
TUJUAN MATAKULIAH
3
1. Memahami Perbedaan data Warehouse dan data
Mining.
2. Menguasai metode penggunaan Data Warehouse
dan Data Mining.
3. Menguasai metode pengolahan data yang benar.
4. Mampu mengcluster data dengan methode clustering
data mining.
5. Menyediakan alat dan metodologi untuk
mengekplorasi pola dan makna dalam sejumlah data
yang besar.
6. Diharapkan mampu menciptakan knowledge
Information.
-
4.
Beda Data Warehouse dan Data Minning
4
1. Data Mining
Data mining adalah metode analisis
data menggunakan pola pengenalan
logika (pattern recognition logic) untuk
mengidentifikasikan trend di dalam
sebuah set sampel data dan
meramalkan kemungkinan informasi
tersebut terhadap data yang lebih
besar.
-
5.
Beda Data Warehouse dan Data Minning
5
Penggunaan data mining pada umumnya
untuk :
a.Membuat program marketing yang
ditargetkan secara khusus
b.Mengidentifikasikan financial fraud
c.Menandai pola-pola yang tidak biasa
pada sudut pandang keamanan.
d.Mengcluster suatu data dengan pola
acak secara cepat.
-
6.
Beda Data Warehouse dan Data Minning
6
2. Data Warehouse
Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data
yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat
tetap dari koleksi data dalam mendukung proses pengambilan keputusan
management.
Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan
read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.
Menurut Paul Lane, data warehouse merupakan database relasional yang didesain
lebih kepada query dan analisa dari pada proses transaksi, biasanya
mengandung history data dari proses transaksi dan bisa juga data dari sumber
lainnya. Data warehouse memisahkan beban kerja analisis dari beban kerja
transaksi dan memungkinkan organisasi menggabung/konsolidasi data dari
berbagai macam sumber.
-
7.
Beda Data Warehouse dan Data Minning
7
Jadi, data warehouse merupakan metode dalam
perancangan database, yang menunjang
DSS(Decission Support System) dan EIS (Executive
Information System).
Secara fisik data warehouse adalah database, tapi
perancangan data warehouse dan database sangat
berbeda. Dalam perancangan database tradisional
menggunakan normalisasi, sedangkan pada data
warehouse normalisasi bukanlah cara yang terbaik.
-
8.
Beda Data Warehouse dan Data Minning
8
Sebuah data warehouse merupakan sebuah
produk software yang digunakan untuk
menyimpan data berukuran besar dan
menjalankan query dan report yang dirancang
khusus.
Mis : SQL, ORACLE, UNIX
-
9.
DATA WAREHOUSE CONCEPT
9
-
10.
DATA WAREHOUSE CONCEPT
10
Data Warehouse merupakan tempat
menampung berbagai jenis data dari Proses,
Extract, Laporan, Sistem Operasi, Data
murni, Analisa dll.
3 Kelompok Data warehouse :
a.Data mentah ( Raw data )
b.Data Ringkasan laporan
c.Data pengelompokan / extract
-
11.
DATA WAREHOUSE CONCEPT
11
Ada empat tugas yang bisa dilakukan dengan adanya data warehouse :
1. Pembuatan Laporan / Report Create
Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum
dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari,
perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.
2. On-Line Analytical Processing (OLAP)
OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai
menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini
dimungkinkan karena pada konsep multi dimensi, maka data yang berupa fakta yang
sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada
pada sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down adalah
kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah kebalikannya.
-
12.
DATA WAREHOUSE CONCEPT
12
3. Data mining
Data mining merupakan proses untuk menggali pengetahuan dan informasi baru dari
data yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan
buatan (Artificial Intelegence), statistik dan matematika. Data mining merupakan
teknologi yang diharapkan dapat menjembatani komunikasi antara data dan
pemakainya.
4. Proses informasi executive
Data warehouse dapat membuat ringkasan informasi yang penting dengan tujuan
membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan
menggunakan data warehouse segala laporan telah diringkas dan dapat pula
mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses
pengambilan keputusan. Informasi dan data pada laporan data warehouse menjadi
target informative bagi user
-
13.
DATA MINING CONCEPT
13
Data mining muncul setelah banyak dari pemilik data
baik perorangan maupun organisasi mengalami
penumpukan data yang telah terkumpul selama
beberapa tahun, misalnya data pembelian, data
penjualan, data nasabah, data transaksi, email dan
sebagainya. Kemudian muncul pertanyaan dari
pemilik data tersebut, apa yang harus dilakukan
terhadap tumpukan data tersebut.
-
14.
DATA MINING CONCEPT
14
Beberapa solusi yang diberikan data mining antara
lain :
1. Menebak Target Pasar
Data mining dapat mengelompokkan (clustering)
model-model pembeli dan melakukan klasifikasi
terhadap setiap pembeli dan melakukan klasifikasi
terhadap setiap pembeli sesuai dengan karakteristik
yang diinginkan.
2. Melihat Pola Beli dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli
dari waktu ke waktu.
-
15.
DATA MINING CONCEPT
15
3. Cross-Market analysis
Data mining dapat dimanfaatkan untuk melihat
hubungan antara satu produk dengan produk lainnya.
4. Profil pelanggan
Data mining bisa membantu pengguna untuk melihat
profil pembeli sehingga dapat diketahui kelompok
pembeli tertentu cenderung kepada suatu produk apa
saja.
-
16.
DATA MINING CONCEPT
16
5. Informasi Summary
Data mining dapat membuat laporan summary yang
bersifat multi dimensi dan dilengkapi dengan
informasi statistik lainnya.
Share this:
✚