Arsitektur Data Warehouse
Nama : Dina Wahyuni Puteri
NIM :1805551016
Dosen Pengampu : I Putu Agus Eka Pratama, S.T., M.T.
Mata Kuliah : Data Warehouse
Program Studi : Teknologi Informasi, Fakultas Teknik, Universitas Udayana
Perbandingan Data Warehouse (Bill Inmon dan Ralph Kimball)
Bill Inmon dan juga Ralph Kimball merupakan dua tokoh yang mengemukakan
pendapat terkait dengan teknologi data warehouse, yang mana pendapat
dari kedua tokoh tersebut paling banyak digunakan sampai saat ini, hal tersebut
jugalah yang menjadikan Bill Inmon serta Ralph Kimball sebagai founder dari
teknologi data warehouse. Bill Inmon mendefinisikan data warehouse sebagai
sekumpulan data yang memiliki enam karakterisitik berupa berorientasi subject
(Subject Oriented), terintegrasi (Integrated), berorientasi
kepada proses (Process Oriented), Time Variant, dapat diakses
dengan mudah (Accesible), dan bersifat Non Volatile. Sedangkan Ralph Kimball mengartikan data warehouse sebagai sebuah sistem
untuk proses pengumpulan suatu data transaksional dari berbagai sumber data,
yang mengutamakan adanya dua hal yaitu query dan juga analisa data. Kedua pendapat yang dikemukakan oleh Bill Inmon dan juga Ralph
Kimball saling melengkapi satu sama lain sehingga berdasarkan dari kedua
definisi tersebut, secara garis besar data warehouse dapat diartikan sebagai
sekumpulan data yang memiliki karakteristik baik itu berorientasi subject (Subject
Oriented), terintegrasi (Integrated), berorientasi kepada proses (Process
Oriented), Time Variant, dapat diakses dengan mudah (Accesible),
dan bersifat Non Volatile yang mana sekumpulan data tersebut dikumpulkan
dari berbagai sumber yang memiliki konsep OLTP (On Line Transactional
Processing) untuk kebutuhan query dan juga analisa data yang
kemudian nantinya akan dianalisa menggunakan OLAP (On Line Analytical
Processing).
Perbandingan Data Warehouse dan Database
Data warehouse lebih menekankan pada konsep query dan juga analisis dengan menggunakan OLAP dimana hal tersebut tentunya membedakan data warehouse dengan database, dikarenakan pada database hal yang difokuskan yaitu pada konsep data transaksional yang menggunakan OLTP. Contoh yang dapat diambil dengan berkaca pada perbedaan kedua konsep tersebut yaitu, pada database apabila terjadi perubahan maka akan dilakukan proses penumpukan dimana setiap entri yang ada pada tabel tersebut akan ditimpa dengan data baru hasil dari proses update. Sedangkan, pada data warehouse lebih memfokuskan pada history data, dimana jika terjadi perubahan data akan dibuatkan entri baru, maka entri data awal atau data ke n akan disimpan sebagai entri ke n+1 yang disertai dengan catatan waktu, proses, dan juga subjeknya.
Arsitektur pada Data Warehouse
Arsitektur data warehouse diperkenalkan oleh vendor
Oracle, dimana seperti yang sudah diketahui jika Oracle adalah perusahaan
yang sudah berkecimpung dalam dunia DBMS sejak tahun 1960-1970. Arsitektur
data warehouse yang dikemukakan oleh Oracle ada tiga jenisnya,
diantaranya yaitu.
1. Basic Architecture
Basic Architecture merupakan salah satu
arsitektur dari data warehouse yang diperkenalkan oleh Oracle, dimana
arsitektur ini merupakan arsitektur dasar atau yang paling sederhana. Basic
Architecture terdiri dari tiga bagian, diantaranya yaitu sebagai berikut.
a. Data Source (Sumber Data)
Data
Source atau sumber data pada Basic Architecture yaitu beragam data digital
dari berbagai sumber data yang nantinya diambil kemudian dikumpulkan pada warehouse.
Contohnya data dari transaksional sistem, file, flat file,
berkas, dokumen yang di digitalkan (dengan cara di-scan atau diketik
ulang), dan lain sebagainya.
b. Warehouse (Tempat Data
Digudangkan)
Warehouse
merupakan suatu tempat penyimpanan yang digunakan untuk proses penggudangan
data, dimana data yang digudangkan berasal dari data digital dari berbagai
sumber data dengan beragam format data. Data yang diambil biasanya dalam bentuk
metadata, summary data, atau raw data. Warehouse juga
menjadi bagian dari proses pengubahan data, yang mana dari data transaksional dirubah
menjadi analitikal melalui proses OLTP ke OLAP. Metadata, summary data,
atau raw data nantinya akan digunakan untuk membantu pada proses perubahan
data transaksional menjadi bentuk data historis.
c. User (Pengguna)
User
dalam Basic Architecture terbagi menjadi tiga bagian, yaitu analyst,
mining, dan reporting. Ketiga bagian tersebut tentunya memiliki
peran masing-masing, analyst bertugas untuk menganalisa data, kemudian mining
bertugas untuk memperoleh knowledge dari data sesuai dengan pola,
dan yang terakhir reporting bertugas untuk menyampaikan laporan
berdasarkan dengan hasil analisa dan juga mining.
2. Staging Area Architecture
Konsep dasar dari Staging Area Architecture yaitu penambahan Staging Area yang
digunakan untuk menampung data dari sumber data transaksional sebelum nantinya
akan diteruskan ke warehouse. Data transaksional yang sementara
ditampung pada staging area akan dirapikan, dibersihkan serta
disesuaikan dengan kebutuhan, proses tersebutlah yang dikenal dengan data
cleansing. Proses pembersihan tentunya juga memerlukan penyesuaian, dimana
data yang relevan dengan kebutuhan pengguna yang formatnya akan dirapikan.
3. Staging Area dan Data Mart Architecture
Konsep dasar dari Staging Area dan Data Mart
Architecture yaitu terjadinya penambahan data mart yang difungsikan
untuk dikombinasikan dengan staging area. Data mart merupakan
bagian terkecil dari data warehouse yang salah satunya bertujuan untuk
proses analisa marketing. Staging Area dan Data Mart
Architecture merupakan arsitektur ketiga yang diperkenalkan oleh Oracle dan
menjadi arsitektur paling banyak digunakan karena mampu untuk memilah data
sesuai kebutuhan dan juga mampu untuk kostumisasi sesuai dengan kebutuhan.
Sumber Data pada Data
Warehouse
Sumber data pada data warehouse dibedakan
menjadi 2 jenis sesuai dengan asalnya. Kedua sumber data tersebut yaitu sebagai
berikut.
1. Sumber Internal
Sumber data internal merupakan sumber dari data sistem
transaksional pada internal organisasi. Sumber data internal diantaranya yaitu file
scan, document office, file text, flat file dan sebagainya.
Contoh dari sumber data internal pada kampus yaitu data dosen, data pegawai,
data mahasiswa, dan lain-lain.
2. Sumber Eksternal
Sumber data eksternal merupakan sumber data yang berasal
dari komputer atau server yang terhubung melalui jaringan publik
(internet) yang kemudian digudangkan ke dalam sistem data warehouse di
jaringan lokal (intranet) pada setiap instansi. Contoh dari sumber data
eksternal pada kampus yaitu data dari setiap surat-surat edaran, riwayat
pembayaran UKT, riwayat beasiswa, dan lain-lain.
Referensi
I Putu Agus Eka Pratama.
Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017.
Komentar
Posting Komentar