Data Multidimensi pada Data Warehouse
Nama : Dina Wahyuni Puteri
NIM : 1805551016
Dosen Pengampu : I Putu Agus Eka Pratama, S.T., M.T.
Mata Kuliah : Data Warehouse
Program Studi : Teknologi Informasi, Fakultas Teknik, Universitas Udayana
Data warehouse memegang peranan penting terkait dengan proses penyimpanan data, seperti dimudahkannya proses akses data dari berbagai sumber, proses analisa data, dan juga proses pelaporan. Data warehouse dan juga database secara konvesional jika dibandingkan tentunya memiliki perbedaan, apabila ditelisik secara umum, perbedaan mendasar dari data warehouse dan juga database konvesional yaitu terletak pada data yang terdapat di dalamnya. Database konvesional memuat data transaksional, yang mana data transaksional ini mengutamakan perubahan data di dalamnya. Sedangkan dalam data warehouse memuat data historis yang mana data historis ini difokuskan dengan tujuan untuk analisa data.
Data warehouse memudahkan berbagai kebutuhan karena mencakup kebutuhan pengguna dalam memperoleh data dari setiap bidang atau unit yang ada dalam suatu instansi. Manajemen dan pengambilan data yang sangat kompleks tentunya akan sedikit mempersulit pencarian data dan analisis data dalam skala kecil, untuk itulah diperlukannya data mart untuk mempermudah kebutuhan akan analisis data dalam skala kecil sesuai dengan kebutuhan dari unit atau bidang yang bersangkutan.
Pengertian Data Mart
Data mart didefinisikan sebagai suatu sub bagian dari data warehouse secara keseluruhan sebagai sebuah struktur data, yang di dalamnya memuat data guna memudahkan pengguna akhir dalam mengakses data dari data warehouse sesuai kebutuhan apapun untuk analisis data. Tak hanya itu, data mart juga diartikan sebagai bagian dari data warehouse secara keseluruhan yang berbeda pada layer akses (Access Layer) yang berorientasikan kepada spesifik proses bisnis dan kebutuhan dari unit organisasi tempat di mana data warehouse tersebut diimplementasikan. Jika dianalogikan sebagai sebuah himpunan, maka data mart dapat dikategorikan sebagai bagian dari himpunan pada himpunan semesta yang bernama data warehouse. Maka dari itu, apabila data warehouse memuat semua data sesuai dengan kebutuhan dari keseluruhan organisasi yang bersangkutan, maka data mart hanya memuat spesifik data sesuai dengan kebutuhan per-unitnya saja. Salah satu contoh dari data mart dan data warehouse jika diambil dalam case lingkungan Unud yaitu data warehouse dari Unud itu terpusat di USDI, yang tentunya USDI memuat seluruh data dari Unud, sedangkan data mart pada lingkungan Unud terdiri dari setiap Fakultas dimana nantinya setiap Fakultas kembali membagi bagian dari setiap Program Studi yang ada.
Model Pengembangan untuk Data
Warehouse dan Data Mart
Ada beberapa jenis model pengembangan untuk data warehouse dan data mart. Penjabaran dari masing-masing bagian model tersebut akan disajikan sebagai berikut.
1. Model Top Down tanpa User Feedback
Model top down tanpa user feedback merupakan model pengembangan yang paling sederhana dalam data warehouse karena alur dari model tersebut berawal dari sumber-sumber data (data source) yang kemudian diteruskan ke data warehouse, dan selanjutnya dari data warehouse akan dipecah atau dibagi ke dalam beberapa buah data mart. Proses awal dari model ini yaitu dengan mengintegrasikan semua data yang berasal dari sumber data ke dalam data warehouse untuk digudangkan. Semua data diintegrasikan serta digudangkan dengan menggunakan format umum dan dalam lingkup perangkat lunak yang umum digunakan oleh semua format data dan sumber data tersebut. Pada tahap integrasi dilakukan tiga proses yang disebut dengan ETT (Extraction, Transformation, Transporation). Proses ETT difungsikan sebagai proses untuk mengekstraksi data, kemudian mentransformasikannya ke dalam format yang telah disesuaikan, dan terakhir membawakan atau mengirimkannya ke data warehouse. Setelah dalam proses ETT, maka dilanjutkan dengan mendistribusikan data dari data warehouse ke dalam data mart dengan menggunakan proses ETT. Ilustrasi dari model pengembangan model top down tanpa user feedback yaitu sebagai berikut.
2. Model Bottom Up tanpa User Feedback
Model bottom up tanpa user feedback merupakan model pengembangan kebalikan dari model top down tanpa user feedback. Proses dari model ini dimulai dari bawah dimana dua buah data mart atau lebih akan dibentuk berdasarkan dari data source, dimana nantinya dilakukan proses ETT (Extraction, Transformation, Transporation) pada data source ke dalam data mart. Tahapan selanjutnya yaitu dengan melakukan proses ETT pada data mart ke dalam data warehouse yang mana akan diikuti dengan penghilangan redudancy pada data yang berasal dari sejumlah data mart tersebut. Ilustrasi dari model pengembangan model buttom up tanpa user feedback yaitu sebagai berikut.
3. Model Parallel tanpa User Feedback
Model parallel tanpa user feedback merupakan modifikasi dari model top down dan juga model bottom up. Pembedanya terletak pada data mart yang tidak sepenuhnya bergantung pada data warehouse melainkan berdiri secara mandiri (independen). Proses pertama dari model ini yaitu dengan membangun data warehouse dari sekumpulan data source. Data warehouse memuat data model yang nantinya dijadikan acuan bagi model data untuk membentuk data mart. Selanjutnya ketika data mart telah terbentuk, maka nantinya data mart akan berperan dalam membangun data warehouse. Data model juga dijadikan acuan agar nantinya baik data warehouse dan data mart memiliki kesamaan format data untuk kelangsungan life cycle. Proses ETT juga digunakan dalam model parallel tanpa user feedback. Ilustrasi dari model pengembangan model parallel tanpa user feedback yaitu sebagai berikut
.
4. Model Top Down beserta User Feedback
Model top down beserta user feedback dimulai dengan tahap membentuk data warehouse dari sejumlah data source yang tentu saja melalui proses integrasi ETT untuk memudahkan proses menyamakan data dari berbagai format sesuai dengan format yang sudah disesuaikan. Selanjutnya dari data warehouse akan dibentuk sejumlah data mart sesuai dengan kebutuhan pengguna. Indikator penting dari model ini terletak pada user feedback. User feedback mempengaruhi data mart yang secara otomatis tentunya akan memperngaruhi data warehouse. Ilustrasi dari model pengembangan model top down beserta user feedback yaitu sebagai berikut.
5. Model Bottom Up beserta User Feedback
Model bottom up beserta user feedback dimulai pada tahapan pembentukan dua buah data mart atau lebih dengan menggunakan data yang berasal dari data source. Tahapan pembentukan tersebut dilakukan dengan proses ETT untuk membantu dalam pengempulan data, ekstraksi data, dan mentransformasikan ke format dengan kesesuaian yang sama sesuai dengan yang telah disepakati. Setelah data mart dibentuk maka selanjutnya akan dilanjutkan dengan pembentukan data warehouse dari sejumlah data mart yang sebelumnya telah dibentuk. Proses pembentukan data warehouse juga tentunya menggunakan proses ETT untuk mengintegrasikan sejumlah data mart ke dalam data warehouse. Tentunya model bottom up melibatkan user feedback, namun terdapat kelemahan pada permasalahan redudancy data yang terjadi ketika proses penyusunan data warehouse dari sejumlah data mart. Ilustrasi dari model pengembangan model bottom up beserta user feedback yaitu sebagai berikut.
6. Model Parallel beserta User Feedback
Model parallel beserta user feedback dimulai dengan tahapan penentuan aturan model data dari data warehouse ke data mart. Data yang berasal dari berbagai data source kemudian nantinya dapat masuk ke dalam data mart dan juga data warehouse, namun yang membedakannya adalah hanya data dari data source menuju ke data mart saja yang akan melalui proses ETT, sedangkan proses dari data source menuju data warehouse tidak mengalami proses ETT, melainkan akan menuju ke data model terlebih dahulu untuk menyeragamkan format. Proses ETT tidak terjadi di data warehouse dikarenakan data warehouse menjadi pusat untuk model data enterprise yang digunakan sebagai acuan bagi data mart lainnya. Model ini tentunya meliputi user feedback, dimana model ini dipengaruhi oleh empat hal diantaranya yaitu data yang berasal dari sumber data, user feedback, data warehouse, dan juga data model pada data warehouse. Ilustrasi dari model pengembangan model parallel beserta user feedback yaitu sebagai berikut.
Perbedaan Data Relasional dan Data Multidimensi
Data relasional merupakan konsep dasar dari pengembangan data multidimensi. Perbedaan dari data relasional dan data multidimensi terletak pada sudut pandang yang digunakan. Penjabaran dari dari data relasional dan data multidimensi akan diuraikan sebagai berikut.
1. Data Relasional
Data Relasional atau Relational Data Modelling (RDM) merupakan suatu data yang memiliki konsep keterhubungan atau relasi antar data di dalam tabel pada suatu database yang memuat konsep dua dimensi dimana ini tentunya mencakup tabel dan kolom. Sistem dan aplikasi Database Management System (DBMS) yang menangani tabel-tabel di dalam database menggunakan model relasional yang disebut dengan Relational Database Management System (RDBMS). Beberapa contoh dari RDBMS yaitu ada MySQL, Oracle, dan juga SQL Server. Penggambaran atau pengimplementasian dalam bentuk diagram pada data relasional ini menggunakan ERD (Entity Relational Diagram). ERD digunakan untuk menggambarkan relasi yang ada pada setiap tabel dalam database. Relasi atau keterhubungan dari data relasional ini dibedakan menjadi 3 jenis relasi, diantaranya yaitu sebagai berikut.
a. One to one, merupakan suatu bentuk relasi satu baris pada sebuah tabel dengan satu baris pada tabel lainnya.
b. One to many, merupakan suatu bentuk relasi satu bari pada sebuah tabel dengan lebih dari satu baris pada tabel lainnya.
c. Many to many, merupakan suatu bentuk relasi dari banyak baris pada sebuah tabel dengan banyak baris pada tabel lainnya.
2. Data Multidimensi
Data multidimensi atau Multidimensial Data (MDD) merupakan suatu model data fisik atau Physical Data Model (PDM) yang strukturnya dapat dilihat dari berbagai sudut pandang (dimensi) dimana memuat tiga bagian (Record atau baris, Field atau kolom, dan Layer) dengan objek-objek data multidimensi di dalamnya. Atribut dalam data multidimensi ini kemudian dibedakan menjadi atribut dimensi dan juga atribut pengukuran
Apabila direpresentasikan ke dalam bentuk koordinat maka dapat ditunjukkan ke dalam tiga buah sumbu yaitu sumbu X, Y, dan Z. Jika dianalogikan dengan gambar bangun, maka data multidimensi dapat diibaratkan dengan bangun ruang yang memiliki tiga buah dimensi yaitu panjang, lebar, dan juga tinggi. Salah satu contoh data multidimensi apabila diibaratkan dengan koordinat yaitu dengan menggunakan data mahasiswa, dimana untuk melihat data mahasiswa dalam sudut pandang dimensi maka akan didapatkan dimensi kelulusan, dimensi sidang TA, dan juga dimensi wisuda yang mana masing-masing dimensi tersebut akan membentuk suatu tabel, baik itu Tabel Kelulusan, Tabel Sidang TA, dan juga Tabel Wisuda yang tentunya setiap tabel memiliki atribut masing-masing. Ketiga dimensi tersebut nantinya dapat digunakan untuk melihat data mahasiswa pada Tabel Mahasiswa, ilustrasi dalam bentuk koordinat dapat dilihat sebagai berikut.
Data multidimensi pada data warehouse tidak bisa terlepas dari kebutuhan untuk mempermudah proses analisa data. OLTP (On Line Transactional Data) dan OLAP (On Line Analytical Data) berperan dalam data warehouse. OLTP berfungsi untuk mencatat, memproses, mengolah, dan menghasilkan data serta informasi mengenai transaksi pada suatu event secara berkala dengan memanfaatkan query sederhana. OLTP hanya digunakan untuk kebutuhan data dan informasi karena pada OLTP tidak ada historical data, yang ada hanya data transaksional, selain itu juga pada OLTP data hanya dilihat terstruktur dalam 2 dimensi yaitu baris dan kolom. Tools yang dapat digunakan untuk melakukan analisa data secara dinamis pada skala perusahaan yaitu OLAP. OLAP memiliki kemampuan agregasi data, kemudian query yang lebih kompleks, memiliki historical data, serta memungkinan proses penyimpanan data ke dalam skema data multidimensi. OLAP ini tidak terlepas dari peran OLTP, karena berasal dari data transaksional pada OLTP yang mana OLAP ini mengutamakan historis data, sehingga nantinya data dapat dilihat dari tiga dimensi atau lebih yang dapat mempermudah proses analisa data.
Referensi
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017.
Komentar
Posting Komentar