Pengertian Data, Informasi dan Database
Sebelum
kita membahas tentang data warehouse, hal yang harus dipahami terlebih dahulu
yaitu pengertian tentang data,informasi dan database.
Menurut
Steven Alter, data merupakan fakta,gambar atau suara yang mungkin atau tidak
berhubungan atau berguna bagi tugas tertentu.
Menurut
McLeod, data terdiri dari fakta-fakta dan angka yang secara relatif tidak
berarti bagi pemakai. Sedangkan informasi adalah data yang sudah diproses atau data
yang memiliki arti.
Disini
kita dapat melihat bahwa data merupakan suatu bentuk keterangan-keterangan yang
belum diolah atau dimanipulasi sehingga belum begitu berarti bagi sebagian
pemakai. Sedangkan informasi merupakan data yang sudah di olah sehingga
memiliki arti.
Menurut
James A. O’Brien Database adalah suatu koleksi terintegrasi dimana secara
logika berhubungan dengan record dari file.
Menurut
Fatansyah, Database adalah kumpulan data yang saling berhubungan yang disimpan
secara bersama sedemikian rupa dan tanpa pengulangan(redudansi) yang tidak
perlu, untuk memenuhi berbagai kebutuhan.
Jadi
Database adalah tempat penyimpanan data yang saling berhubungan secara logika,
sehingga bisa digunakan untuk mendapatkan suatu informasi yang diperlukan oleh
suatu organisasi atau perusahaan.
Sedangkan
data yang diperoleh suatu organisasi atau perusahaan umumnya didapat dari
kegiatan operasional sehari-hari atau hasil dari transaksi.
Dari
perkembangan model database, muncullah apa yang disebut dengan data warehouse.
Pengertian Data Warehouse
Pengertian
Data Warehouse dapat bermacam-macam namun mempunyai inti yang sama, seperti
pendapat beberapa ahli berikut ini :
Menurut
W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang
mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat
tetap dari koleksi data dalam mendukung proses pengambilan keputusan
management.
Menurut
Vidette Poe, data warehouse merupakan database yang bersifat analisis
dan read only yang digunakan sebagai fondasi dari sistem penunjang
keputusan.
Menurut
Paul Lane, data warehouse merupakan database relasional yang didesain
lebih kepada query dan analisa dari pada proses transaksi, biasanya
mengandung history data dari proses transaksi dan bisa juga data dari
sumber lainnya. Data warehouse memisahkan beban kerja analisis dari
beban kerja transaksi dan memungkinkan organisasi menggabung/konsolidasi data
dari berbagai macam sumber.
Jadi,
data warehouse merupakan metode dalam perancangan database, yang
menunjang DSS(Decission Support System) dan EIS (Executive Information System).
Secara fisik data warehouse adalah database, tapi perancangan data
warehouse dan database sangat berbeda. Dalam perancangan database tradisional
menggunakan normalisasi, sedangkan pada data warehouse normalisasi
bukanlah cara yang terbaik.
Dari
definisi-definisi yang dijelaskan tadi, dapat disimpulkan data warehouse
adalah database yang saling bereaksi yang dapat digunakan untuk query
dan analisisis, bersifat orientasi subjek, terintegrasi, time-variant,tidak
berubah yang digunakan untuk membantu para pengambil keputusan.
Istilah-istilah yang berhubungan dengan data warehouse
Istilah-istilah
yang berkaitan dengan data warehouse :
- Data Mart
Adalah
suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa
data pada suatu unit, bagian atau operasi pada suatu perusahaan.
- On-Line Analytical Processing(OLAP)
Merupakan
suatu pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat
menampilkan berbagai macam bentuk laporan, analisis, query dari data yang
berukuran besar.
- On-Line Transaction Processing(OLTP)
Merupakan
suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi
sehari-hari.
- Dimension Table
Tabel
yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan.
Seperti laporan laba pada tabel fakta
dapat dilaporkan sebagai dimensi waktu(yang berupa perbulan, perkwartal
dan pertahun).
- Fact Table
Merupakan
tabel yang umumnya mengandung angka dan data history dimana key (kunci)
yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign
key(kunci asing) yang merupakan primary key (kunci utama) dari
beberapa dimension table yang berhubungan.
- DSS
Merupkan
sistem yang menyediakan informasi kepada pengguna yang menjelaskan bagaimana
sistem ini dapat menganalisa situasi dan mendukung suatu keputusan yang baik.
Karakteristik Data Warehouse
Karakteristik
data warehouse menurut Inmon, yaitu :
- Subject Oriented (Berorientasi subject)
Data warehouse berorientasi subject artinya data warehouse didesain
untuk menganalisa data berdasarkan subject-subject tertentu dalam
organisasi,bukan pada proses atau fungsi aplikasi tertentu.
Data
warehouse diorganisasikan disekitar subjek-subjek utama dari
perusahaan(customers,products dan sales) dan tidak diorganisasikan pada area-area aplikasi
utama(customer invoicing,stock control dan product sales). Hal ini dikarenakan
kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai
penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data.
Jadi
dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan
terhadap proses. Secara garis besar perbedaan antara data operasional dan data
warehouse yaitu :
Data Operasional |
Data Warehouse |
Dirancang
berorientasi hanya pada aplikasi dan fungsi tertentu
|
Dirancang berdasar
pada subjek-subjek tertentu(utama)
|
Focusnya pada desain
database dan proses
|
Focusnya pada pemodelan
data dan desain data
|
Berisi rincian atau
detail data
|
Berisi data-data
history yang akan dipakai dalam proses analisis
|
Relasi antar table
berdasar aturan terkini(selalu mengikuti rule(aturan) terbaru)
|
Banyak aturan bisnis
dapat tersaji antara tabel-tabel
|
- Integrated (Terintegrasi)
Data Warehouse dapat menyimpan data-data yang berasal dari
sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling
terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah
karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep
data warehouse itu sendiri.
Syarat
integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten
dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam
struktur pengkodean dan konsisten dalam atribut fisik dari data.
Contoh
pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula
dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam
aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi
nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama
yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi
kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data
tersebut bisa dikategorikan sebagai data yang terintegrasi karena
kekonsistenannya.
- Time-variant (Rentang Waktu)
Seluruh
data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu
tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan
suatu data warehouse, kita dapat menggunakan cara antara lain :
Ø Cara yang
paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu,
misalnya antara 5 sampai 10 tahun ke depan.
Ø Cara yang
kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data
warehouse baik implicit maupun explicit secara explicit dengan unsur waktu
dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut
diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan
tetap ada secara implisit didalam data tersebut.
Ø Cara yang
ketiga,variasi waktu yang disajikan data warehouse melalui serangkaian snapshot
yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai
keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
4. Non-Volatile
4. Non-Volatile
Karakteristik
keempat dari data warehouse adalah non-volatile,maksudnya data pada data
warehouse tidak di-update secara real time tetapi di refresh
dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database
itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara
kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan
data sebelumnya.
Berbeda
dengan database operasional yang dapat melakukan update,insert dan delete
terhadap data yang mengubah isi dari database sedangkan pada data warehouse
hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data)
dan akses data (mengakses data warehouse seperti melakukan query atau
menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).
Tidak ada komentar:
Posting Komentar