Arsitektur Data Warehouse

Nama : Dina Wahyuni Puteri
NIM :1805551016
Dosen Pengampu : I Putu Agus Eka Pratama, S.T., M.T.
Mata Kuliah : Data Warehouse
Program Studi : Teknologi Informasi, Fakultas Teknik, Universitas Udayana

Perbandingan Data Warehouse (Bill Inmon dan Ralph Kimball)
Bill Inmon dan juga Ralph Kimball merupakan dua tokoh yang mengemukakan pendapat terkait dengan teknologi data warehouse, yang mana pendapat dari kedua tokoh tersebut paling banyak digunakan sampai saat ini, hal tersebut jugalah yang menjadikan Bill Inmon serta Ralph Kimball sebagai founder dari teknologi data warehouse. Bill Inmon mendefinisikan data warehouse sebagai sekumpulan data yang memiliki enam karakterisitik berupa berorientasi subject (Subject Oriented), terintegrasi (Integrated), berorientasi kepada proses (Process Oriented), Time Variant, dapat diakses dengan mudah (Accesible), dan bersifat Non Volatile. Sedangkan Ralph Kimball mengartikan data warehouse sebagai sebuah sistem untuk proses pengumpulan suatu data transaksional dari berbagai sumber data, yang mengutamakan adanya dua hal yaitu query dan juga analisa data. Kedua pendapat yang dikemukakan oleh Bill Inmon dan juga Ralph Kimball saling melengkapi satu sama lain sehingga berdasarkan dari kedua definisi tersebut, secara garis besar data warehouse dapat diartikan sebagai sekumpulan data yang memiliki karakteristik baik itu berorientasi subject (Subject Oriented), terintegrasi (Integrated), berorientasi kepada proses (Process Oriented), Time Variant, dapat diakses dengan mudah (Accesible), dan bersifat Non Volatile yang mana sekumpulan data tersebut dikumpulkan dari berbagai sumber yang memiliki konsep OLTP (On Line Transactional Processing) untuk kebutuhan query dan juga analisa data yang kemudian nantinya akan dianalisa menggunakan OLAP (On Line Analytical Processing).

Perbandingan Data Warehouse dan Database
            Data warehouse lebih menekankan pada konsep query dan juga analisis dengan menggunakan OLAP dimana hal tersebut tentunya membedakan data warehouse dengan database, dikarenakan pada database hal yang difokuskan yaitu pada konsep data transaksional yang menggunakan OLTP.  Contoh yang dapat diambil dengan berkaca pada perbedaan kedua konsep tersebut yaitu, pada database apabila terjadi perubahan maka akan dilakukan proses penumpukan dimana setiap entri yang ada pada tabel tersebut akan ditimpa dengan data baru hasil dari proses update. Sedangkan, pada data warehouse lebih memfokuskan pada history data, dimana jika terjadi perubahan data akan dibuatkan entri baru, maka entri data awal atau data ke n akan disimpan sebagai entri ke n+1 yang disertai dengan catatan waktu, proses, dan juga subjeknya.

Arsitektur pada Data Warehouse
         Arsitektur data warehouse diperkenalkan oleh vendor Oracle, dimana seperti yang sudah diketahui jika Oracle adalah perusahaan yang sudah berkecimpung dalam dunia DBMS sejak tahun 1960-1970. Arsitektur data warehouse yang dikemukakan oleh Oracle ada tiga jenisnya, diantaranya yaitu.
1.         Basic Architecture



           Basic Architecture merupakan salah satu arsitektur dari data warehouse yang diperkenalkan oleh Oracle, dimana arsitektur ini merupakan arsitektur dasar atau yang paling sederhana. Basic Architecture terdiri dari tiga bagian, diantaranya yaitu sebagai berikut.
a.         Data Source (Sumber Data)
Data Source atau sumber data pada Basic Architecture yaitu beragam data digital dari berbagai sumber data yang nantinya diambil kemudian dikumpulkan pada warehouse. Contohnya data dari transaksional sistem, file, flat file, berkas, dokumen yang di digitalkan (dengan cara di-scan atau diketik ulang), dan lain sebagainya.
b.         Warehouse (Tempat Data Digudangkan)
          Warehouse merupakan suatu tempat penyimpanan yang digunakan untuk proses penggudangan data, dimana data yang digudangkan berasal dari data digital dari berbagai sumber data dengan beragam format data. Data yang diambil biasanya dalam bentuk metadata, summary data, atau raw data. Warehouse juga menjadi bagian dari proses pengubahan data, yang mana dari data transaksional dirubah menjadi analitikal melalui proses OLTP ke OLAP. Metadata, summary data, atau raw data nantinya akan digunakan untuk membantu pada proses perubahan data transaksional menjadi bentuk data historis.
c.          User (Pengguna)
User dalam Basic Architecture terbagi menjadi tiga bagian, yaitu analyst, mining, dan reporting. Ketiga bagian tersebut tentunya memiliki peran masing-masing, analyst bertugas untuk menganalisa data, kemudian mining bertugas untuk memperoleh knowledge dari data sesuai dengan pola, dan yang terakhir reporting bertugas untuk menyampaikan laporan berdasarkan dengan hasil analisa dan juga mining.

2.         Staging Area Architecture


         Konsep dasar dari Staging Area Architecture  yaitu penambahan Staging Area yang digunakan untuk menampung data dari sumber data transaksional sebelum nantinya akan diteruskan ke warehouse. Data transaksional yang sementara ditampung pada staging area akan dirapikan, dibersihkan serta disesuaikan dengan kebutuhan, proses tersebutlah yang dikenal dengan data cleansing. Proses pembersihan tentunya juga memerlukan penyesuaian, dimana data yang relevan dengan kebutuhan pengguna yang formatnya akan dirapikan.
 
3.         Staging Area dan Data Mart Architecture



          Konsep dasar dari Staging Area dan Data Mart Architecture yaitu terjadinya penambahan data mart yang difungsikan untuk dikombinasikan dengan staging area. Data mart merupakan bagian terkecil dari data warehouse yang salah satunya bertujuan untuk proses analisa marketing. Staging Area dan Data Mart Architecture merupakan arsitektur ketiga yang diperkenalkan oleh Oracle dan menjadi arsitektur paling banyak digunakan karena mampu untuk memilah data sesuai kebutuhan dan juga mampu untuk kostumisasi sesuai dengan kebutuhan.

Sumber Data pada Data Warehouse
        Sumber data pada data warehouse dibedakan menjadi 2 jenis sesuai dengan asalnya. Kedua sumber data tersebut yaitu sebagai berikut.
1.      Sumber Internal
Sumber data internal merupakan sumber dari data sistem transaksional pada internal organisasi. Sumber data internal diantaranya yaitu file scan, document office, file text, flat file dan sebagainya. Contoh dari sumber data internal pada kampus yaitu data dosen, data pegawai, data mahasiswa, dan lain-lain.
2.      Sumber Eksternal
Sumber data eksternal merupakan sumber data yang berasal dari komputer atau server yang terhubung melalui jaringan publik (internet) yang kemudian digudangkan ke dalam sistem data warehouse di jaringan lokal (intranet) pada setiap instansi. Contoh dari sumber data eksternal pada kampus yaitu data dari setiap surat-surat edaran, riwayat pembayaran UKT, riwayat beasiswa, dan lain-lain.


Referensi
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017.

Komentar