Arsitektur dan Infrastruktur Data Warehouse
1. Arsitekur Data Warehouse
Menurut Poe, arsitektur adalah sekumpulan atau struktur
yang memberikan kerangka untuk keseluruhan rancangan suatu sistem atau produk. Ada arsitektur client-server,arsitektur
networking dan masih banyak
arsitektur lainnya. Arsitektur data menyediakan kerangka dengan
mengidentifikasikan dan memahami bagaimana data akan pindah melalui sistem dan
digunakan dalam perusahaan. Arsitektur data untuk data warehouse mempunyai
komponen utama yaitu read-only database.
Karakterisitik arsitektur data warehouse (Poe) :
1.
Data diambil dari sistem asal (sistem informasi yang
ada), database dan file.
2.
Data dari sistem asal diintegrasikan dan ditransformasi
sebelum disimpan ke dalam Database Management System (DBMS) seperti
Oracle,Ms SQL Server, Sybase dan masih banyak yang lainnya.
3.
Data warehouse merupakan sebuah
database terpisah bersifat hanya dapat dibaca
yang dibuat khusus untuk mendukung pengambilan keputusan
4.
Pemakai mengakses data warehouse melalui aplikasi front
end tool
Arsitektur dan komponen utama dari data warehouse dapat
dilihat pada gambar berikut ini :
Sumber :
Conolly,T.M.,Begg
a. Operational
Data
Sumber data dari data warehouse dapat diambil
langsung dari mainframe, basis data relasional seperti Oracle, Ms SQL
server dan sebagainya. Selain itu dapat melaluo Operational Data Source(ODS).
ODS menampung data yang diekstrak dari sistem utama atau sumber-sumber data
yang ada dan kemudian data hasil ekstrasi tersebut dibersihkan.
b.
Load manager
Load manager juga
disebut sebagai komponen front-end yang bertugas melakukan seluruh operasi yang
berhubungan dengan ekstrasi dan me-load data ke warehouse.
c.
Warehouse Manager
Warehouse manager melakukan seluruh
operasi-operasi yang berhubungan dengan kegiatan manajemen data di dalam warehouse.
Operasi-operasi tersebut meliputi :
Ø Analisis
terhadap data untuk memastikan konsistensi
Ø Transformasi
dan penggabungan sumber data dari tempat penyimpanan sementara menjadi
tabel-tabel data warehouse.
Ø Penciptaan
indeks-indeks dan view berdasarkan tabel-tabel dasar
Ø Melakukan
denormalisasi dan agregasi jika diperlukan
Ø Backing-Up dan
mengarsipkan data
d.
Query manager
Query manager juga disebut komponen back-end, melakukan
operasi-operasi yang berhubungan dengan manajemen user queries. Operasi-operasi
yang dilakukan oleh komponen ini termasuk mengarahkan query kepada
tabel-tabel yang tepat dan menjadwalkan eksekusi dari query tersebut.
e.
End-user Access Tools
Prinsip atau tujuan utama dari dibangunnya data
warehouse adalah untuk menyediakan informasi bisnis kepada user-user untuk dapat melakukan pengambilan keputusan
secara cepat dan tepat.User ini
berinteraksi dengan warehouse melalui end-user access tools. Data
warehouse harus secara efisien
mendukung secara khusus kebutuhan user serta secara rutin melakukan
analisis. Performa yang baik dapat dicapai dengan merencanakan dahulu
keperluan-keperluan untuk melakukan joins,summations dan laporan-laporan
per periode dengan end-users.
Berdasarkan kategori yang
dikemukakan oleh Berson dan Smith terdapat lima grup utama dari tools tersebut,
antara lain :
1. Reporting and
query tools
2.
Application development tools
3. Executive
information System (EIS) tools
4. Online
Analytical Processing (OLAP) tools
5. Data mining
tools
Arsitektur dan infrastruktur dari data warehouse sangat
erat hubungannya dan satu dengan lainnya saling berkaitan.
2. Infrastruktur Data Warehouse
Infrastruktur data warehouse adalah software,
hardware, pelatihan dan komponen-komponen lainnya yang memberikan dukungan yang
dibutuhkan untuk mengimplementasikan data warehouse(Poe).
Salah satu instrumen yang mempengaruhi keberhasilan
pengembangan data warehouse adalah pengidentifikasian arsitektur mana
yang terbaik dan infrasruktur apa yang dibutuhkan. Arsitektur yang sama,
mungkin memerlukan infrastruktur yang berbeda, tergantung pada lingkunan
perusahaan ataupun organisasi.
Struktur Data Warehouse
Seperti yang kita lihat sebelumnya pada arsitektur data
warehouse, ada beberapa struktur yang spesifik terdapat pada bagian warehouse
manager. Bagian tersebut merupakan struktur data warehouse.
Menurut Poe, Vidette, data warehouse memiliki struktur
yang spesifik dan mempunyai perbedaan
dalam tingkatan detail data dan
umur data.
Komponen dari struktur data warehouse adalah:
Ø Current detail
data
Current detail data merupakan data detil
yang aktif saat ini,mencerminkan keadaan yang sedang berjalan dan merupakan
level terendah dalam data warehouse. Didalam area ini warehouse
menyimpan seluruh detail data yang terdapat pada skema basis data. Jumlah data
sangat besar sehingga memerlukan storage yang besar pula dan dapat
diakses secara cepat. Dampak negatif yang ditimbulkan adalah kerumitan untuk
mengatur data menjadi meningkat dan biaya yang diperlukan menjadi mahal.
Berikut ini beberapa alasan mengapa current detail
data menjadi perhatian utama :
1.
Menggambarkan kejadian yang baru terjadi dan selalu
menjadi perhatian utama
2.
Sangat banyak jumlahnya dan disimpan pada tingkat
penyimpanan terendah.
3.
Hampir selalu disimpan dalam storage karena cepat
di akses tetapi mahal dan kompleks dalam
pengaturannya.
4.
Bisa digunakan dalam membuat rekapitulasi sehingga current
detail data harus akurat.
Ø Older detail
data
Data ini merupakan data historis dari current detail
data, dapat berupa hasil cadangan atau archive data yang disimpan dalam storage
terpisah. Karena bersifat back-up(cadangan), maka biasanya data
disimpan dalam storage alternatif seperti tape-desk.
Data ini biasanya memilki tingkat frekuensi akses yang
rendah. Penyusunan file atau directory dari data ini di susun
berdasarkan umur dari data yang bertujuan mempermudah untuk pencarian atau
pengaksesan kembali.
Ø Lighlty
summarized data
Data ini merupakan ringkasan atau rangkuman dari current
detail data. Data ini dirangkum berdasar periode atau dimensi lainnya
sesuai dengan kebutuhan.
Ringkasan dari current detail data belum bersifat total summary.Data-data
ini memiliki detil tingkatan yang lebih tinggi dan mendukung kebutuhan warehouse
pada tingkat departemen. Tingkatan data ini di sebut juga dengan data
mart. Akses terhadap data jenis ini banyak
digunakan untuk view suatu kondisi yang sedang atau sudah berjalan.
Ø Highly
summarized data
Data ini merupakan tingkat lanjutan dari Lightly
summarized data, merupakan hasil ringkasan yang bersifat totalitas, dapat
di akses misal untuk melakukan analisis perbandingan data berdasarkan urutan
waktu tertentu dan analisis menggunakan data multidimensi.
Ø Metadata
Metadata bukan merupakan data hasil kegiatan
seperti keempat jenis data diatas. Menurut Poe, metadata adalah ‘data tentang
data’ dan menyediakan informasi tentang struktur data dan hubungan antara
struktur data di dalam atau antara storage(tempat penyimpanan data).
Metadata berisikan data yang menyimpan proses
perpindahan data meliputi database structure,contents,detail data dan summary
data, matrics,versioning, aging criteria,versioning, transformation criteria.
Metadata khusus dan memegang peranan yang sangat penting dalam data warehouse.
Metadata sendiri mengandung :
Ø Struktur data
Sebuah
direktori yang membantu user untuk melakukan analisis Decission Support
System dalam pencarian letak/lokasi dalam data warehouse.
Ø Algoritma
Algoritma
digunakan untuk summary data. Metadata sendiri merupakan panduan untuk
algoritma dalam melakukan pemrosesan summary data antara current
detail data dengan lightly summarized data dan antara lightly
summarized data dengan hightly summaried data.
Ø Mapping
Sebagai
panduan pemetaan(mapping) data pada saat data di transform/diubah dari
lingkup operasional menjadi lingkup data warehouse.
Tidak ada komentar:
Posting Komentar