Penjelasan Data Warehouse Serta Pembahasan Dari Beberapa Tema - andyusuf-informatika

New Post

Senin, 02 September 2019

Penjelasan Data Warehouse Serta Pembahasan Dari Beberapa Tema

TENTANG DATA WAREHOUSE


Latar Belakang
 
Data warehouse adalah suatu konsep dan kombinasi teknologi yang memfasilitasi organisasi untuk mengelola dan memelihara data historis yang diperoleh dari sistem atau aplikasi operasional.  Pemakaian teknologi data warehouse hampir dibutuhkan oleh semua organisasi, tidak terkecuali Perpustakaan. Data warehouse memungkinkan integrasi berbagai macam jenis data dari berbagai macam aplikasi atau sistem. Hal ini menjamin mekanisme akses “satu pintu bagi manajemen untuk memperoleh informasi, dan menganalisisnya untuk pengambilan keputusan”.
Memahami Data Warehouse dapat bervariasi tetapi memiliki inti yang sama, beberapa pengertian dari para ahli berikut :

1.    Menurut W.H. Inmon dan Richard DH, data warehouse adalah kumpulan data yang memiliki sifat subjek berorientasi, terpadu, waktu-varian, dan tetap pada pengumpulan data untuk mendukung proses pengambilan keputusan manajemen .

2.    Menurut Vidette Poe, data warehouse adalah database yang read-only analisis dan digunakan sebagai dasar sistem pendukung keputusan.

3.    Menurut Paul Lane, data warehouse merupakan database relasional yang dirancang lebih untuk query dan analisis proses transaksi, biasanya mengandung sejarah data transaksi dan mungkin juga data dari sumber lain. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi untuk menggabungkan / konsolidasi data dari berbagai sumber.
   
Karakteristik Data Warehouse
 
Sistem basis data ini memiliki karakteristik yang membuatnya berbeda dari database lain. Ada empat karakteristik yang menjadi ciri khas database ini, yaitu:

a. Berorientasi kepada subjek (subjek-oriented)
Artinya data warehouse berorientasi subjek  dirancang untuk menganalisis data berdasarkan subjek-subjek tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan seperti (pelanggan, produk dan penjualan) dan tidak terorganisir dalam area aplikasi utama (customer faktur, kontrol stok dan penjualan produk). Hal ini karena kebutuhan data warehouse untuk menyimpan data yang mendukung keputusan, daripada aplikasi berorientasi data. Jadi dengan kata lain, data yang disimpan tidak berorientasi pada subjek proses.

b. Data yang dimiliki terintegrasi (Data Integrated)
Data Warehouse dapat menyimpan data dari sumber yang terpisah ke dalam format yang konsisten dan terintegrasi satu sama lain. Dengan demikian, data tidak dapat rusak karena data merupakan entitas yang mendukung konsep keseluruhan data warehouse itu sendiri.
Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara peti konsisten dalam penamaan variabel, konsisten dalam variabel ukuran, konsisten dalam coding dan struktur yang konsisten dalam atribut fisik dari data.
Contoh lingkungan operasional ada banyak aplikasi yang juga dapat dilakukan oleh pengembang yang berbeda. Oleh karena itu, mungkin dalam aplikasi ini terdapat variabel yang memiliki tujuan yang sama tetapi nama dan format yang berbeda.
Variabel ini harus dikonversi ke nama yang sama dan format yang telah disepakati. Dengan demikian tidak ada kebingungan karena perbedaan nama, format, dan sebagainya. Kemudian data dapat dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.

c. Dibuat dalam rentang waktu tertentu (Timeline)
Semua data dalam data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan untuk mengukur keakuratan data warehouse, kita dapat menggunakan cara berikut :

•    Cara termudah adalah untuk menyajikan data warehouse pada rentang waktu tertentu, misalnya, antara 5 sampai 10 tahun ke depan.

•    Cara kedua, dengan menggunakan variasi perbedaan waktu / disajikan dalam data warehouse adalah baik secara implisit maupun eksplisit, eksplisit dengan unsur waktu dalam sehari, seminggu, sebulan dll Secara implisit misalnya, saat data diduplikasi pada setiap akhir bulan, atau kuartalan. Unsur waktu akan tetap tersirat dalam data.

•    Cara ketiga, variasi waktu dari data warehouse yang disajikan melalui serangkaian foto-foto yang lama. Snapshot adalah pandangan sebagian besar data yang spesifik yang sesuai keinginan pengguna dari semua data yang ada adalah read-only.

d. Data yang disimpan bersifat tetap (Non-Volatile)
Karakteristik keempat dari data warehouse adalah non-volatile, artinya data dalam gudang data tidak diperbarui secara real time tetapi dalam refresh sistem operasi secara teratur. Data baru yang ditambahkan sebagai suplemen untuk database itu sendiri bukan sebagai perubahan.

Database ini terus menyerap data baru, maka secara bertahap bersama-sama dengan data sebelumnya. Berbeda dengan database operasional yang dapat melakukan update, insert, dan menghapus data yang mengubah isi dari database data warehouse, sementara hanya ada dua peristiwa untuk memanipulasi data yang memuat data (mengambil data) dan akses data (akses ke gudang data seperti melakukan query atau menampilkan laporan yang diperlukan, tidak ada aktivitas memperbarui data).

Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber data yang heterogen (yang biasanya tersebar di beberapa basis data OLTP) bermigrasi ke penyimpanan data dan terpisah homogen. Keuntungan yang diperoleh dengan menggunakan data warehouse berikut (Ramelho).
Sedangkan kombinasi data mining dan verifikasi penemuan adalah pengembangan dari data mining di masa depan akan menggabungkan hipotesis dan penemuan pendekatan.

Perkembangan ini menggunakan alasan yang sama yang mendasari konsep Sistem Pendukung Keputusan (Decision Support System – DSS). Konsep ini memungkinkan pengguna dan komputer bekerja sama untuk memecahkan masalah.
Pengguna menerapkan keahliannya dalam hal masalah, dan komputer melakukan analisis data yang canggih untuk memilih data yang tepat dan menempatkannya dalam format yang sesuai untuk pengambilan keputusan. Menurut Usama Fayyad (1996),
 
Proses KDD (Knowledge Discovery in Database) dapat secara luas digambarkan sebagai berikut :

1. Data Selection
Kumpulan data operasional Seleksi (Selection) Data darurat perlu dilakukan sebelum langkah penggalian informasi di KDD dimulai. Hasil seleksi data yang akan digunakan untuk proses data mining, disimpan dalam file terpisah dari database operasional.

2. Pre-processing / Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan pada proses pembersihan data menjadi fokus KDD.

Proses pembersihan meliputi, antara lain, menghilangkan duplikasi data, memeriksa inkonsistensi data, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
Juga membuat proses pengayaan, yaitu proses “memperkaya” data dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal yang ada.

3. Transformation
Coding adalah proses transformasi data yang telah, sehingga data tersebut sesuai untuk proses data mining. Coding dalam proses KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam database

4. Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode. Teknik, metode, algoritma didalam sebuah data mining sangat varian. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretation/ Evaluation
Informasi Pola yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretasi. Fase ini termasuk memeriksa apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada.
KDD proses garis terdiri dari lima tahap seperti yang dijelaskan sebelumnya. Namun, dalam proses KDD nyata, hanya dapat terjadi iterasi atau pengulangan pada tahap tahap. Pada setiap langkah dalam proses KDD, seorang analis dapat kembali ke tahap sebelumnya.
Sebagai contoh, pada saat proses coding atau data mining, analis menyadari pembersihan tidak dilakukan dengan sempurna, atau mungkin analis menemukan data atau informasi baru untuk “memperkaya” data yang sudah ada.
KDD mencakup seluruh proses mencari pola atau informasi dalam database, mulai dari pemilihan dan penyusunan data ke representasi pola yang ditemukan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Data mining merupakan salah satu komponen dalam KDD difokuskan pada penggalian pola tersembunyi dalam data base.

 
PEMBAHASAN DARI BEBERAPA TEMA YANG DIPILIH
 
1. PERANCANGAN DATA WAREHOUSE UNTUK MENDUKUNG PERENCANAAN PEMASARAN PERGURUAN TINGGI

Jurnal Oleh :
1. Agung Prasetyo
2. Bambang Soedijono W
3. Armadyah Amborowati

Link : Jurnal

    Salah satu indikasi perguruan tinggi yang besar adalah dilihat dari jumlah mahasiswa di perguruan tinggi tersebut. Karena mahasiswa baru merupakan salah satu sumber daya yang menentukan berjalannya sebuah perguruan tinggi. Setiap tahunnya STMIK AMIKOM Purwokerto selalu melakukan penerimaan calon mahasiswa. Data calon mahasiswa baru tersebut disimpan dalam suatu aplikasi SIA PMB dalam bentuk data SQL server. Selama ini, data calon mahasiswa baru tersebut tidak terkelola dengan baik. Padahal data calon mahasiswa baru tersebut sangat berguna bagi bagian pemasaran sebagai informasi untuk evaluasi kegiatan pemasaran berikutnya.
    Manajemen di STMIK AMIKOM Purwokerto bisa mengambil beberapa informasi misalnya; seberapa luas sebaran asal kota calon mahasiswa dilihat dari asal sekolahnya, seberapa banyak jumlah pendaftar perperiode/gelombang dilihat dari sumber asal informasi yang diperoleh calon mahasiswa baru tentang STMIK AMIKOM Purwokerto, tren minat terhadap jurusan yang dipilih oleh calon mahasiswa baru berdasarkan informasi dari mahasiswa.
    Berdasarkan hal tersebut, maka di manajemen STMIK AMIKOM Purwokerto merasa perlu peningkatan penggunaan teknologi informasi untuk menganalisa data historikal mahasiswa baru. Salah satu penerapan penggunaan teknologi informasi tersebut menggunakan data warehouse yang terintegrasi dengan (On-Line Analytical Processing) OLAP yang dapat digunakan untuk menganalisis informasi yang berpotensi menunjang strategi pemasaran yang efektif dan efisien. Data warehouse memiliki kemampuan untuk melakukan analisa terhadap data transaksi yang telah lalu dan juga bisa memberikan laporan yang Jurnal Telematika Vol. 10 No. 1 Februari 2017

METODE PENELITIAN
A. Lokasi Penelitian
Penelitian dilakukan di STMIK Amikom Purwokerto. Data diperoleh dari bagian pemasaran STMIK Amikom Purwokerto 

B. Alur Penelitian
Adapun tahapan proses penelitian dapat dilihat pada diagram alur proses
Gambar 1 berikut ini:
Perumusan Masalah
Studi Literatur
Pengumpulan Data
Wawancar
Observasi
Studi
Analisis sistem
Perancangan/Desain/ETL
Data Warehouse
Implementasi OLAP
Load Data
Perancangan
Pengujian Sistem
Gambar 1. Alur Penelitian
 
C. Metode Penelitian Metode penelitian yang digunakan termasuk dalam kategori riset terapan (Applied Research), dimana penelitian dilakukan dengan mengambil permasalahan yang terdapat di STMIK Amikom Purwokerto.
 
D. Metodologi Penelitian
Menurut Kimball ada sembilan tahap metodologi dalam perancangan database untuk data warehouse, yaitu:
a. Langkah 1: Pemilihan proses
Data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan bisnis yang penting 

b. Langkah 2: Pemilihan sumber
Untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh sebuah tabel fakta.
 
c. Langkah 3: Mengidentifikasi dimensi
Set dimensi yang dibangun dengan baik, memberikan kemudahan untuk memahami dan menggunakan data mart, Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat pada tabel fakta.
 
d. Langkah 4: Pemilihan fakta
Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa digunakan dalam data mart. Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber
 
e. Langkah 5: Menyimpan pre-kalkulasi di tabel fakta, Hal ini terjadi apabila fakta kehilangan statement
 
f. Langkah 6: Melengkapi tabel dimensi Pada tahap ini ditambahkan keterangan yang lengkap pada tabel dimensi. Keterangannya harus bersifat intuitif dan mudah dipahami oleh pengguna
 
g. Langkah 7: Pemilihan durasi database, Misalnya pada suatu perusahaan asuransi, mengharuskan data disimpan selama 10 tahun atau lebih
 
h. Langkah 8: Menelusuri perubahan dimensi yang perlahan. Ada tiga tipe perubahan dimensi yang perlahan, yaitu:
1. Tipe 1. Atribut dimensi yang telah berubah tertulis ulang
2. Tipe 2. Atribut dimensi yang telah berubah menimbulkan sebuah dimensi baru
3. Tipe 3. Atribut dimensi yang telah berubah menimbulkan alternatif sehingga nilai atribut lama dan baru dapat diakses secara bersama pada dimensi yang sama.
 
i. Langkah 9: Menentukan prioritas dan mode query, Pada tahap ini digunakan
perancangan fisik.

 
E. Pengujian Sistem
Untuk mengetahui kinerja sistem dilakukan uji produk yang dilakukan oleh karyawan Bagian Marketing, Bagian Customer Service, panitia penerimaan mahasiswa baru, bagian IT, dan pimpinan. Atribut Uji Produk yang digunakan berdasarkan ISO 9126 yang mengidentifikasi enam karakteristik kualitas software utama yaitu, Fungsi (functionality), Keandalan (reliability), Kemudahan (usability), Efisien, (efficiency), Maintainability, Portability.

Kesimpulan
Kesimpulan yang dapat dikemukakan antara lain sebagai berikut.
1. Dengan dibangunnya data warehouse Pemasaran di STMIK Amikom Purwokerto, maka penelusuran informasi yang berkaitan dengan penerimaan mahasiswa baru dapat dilakukan dengan mudah dan lebih fleksibel.
2. Informasi yang disajikan dari data warehouse Pemasaran dapat dipergunakan untuk hal-hal sebagai berikut ini.
3. Membantu Pimpinan STMIK Amikom Purwokerto dalam proses evaluasi dan perencanaan promosi ke daerah-daerah dan sekolah-sekolah asal calon mahasiswa yang potensial bagi STMIK Amikom Purwokerto.
4. Membantu Pimpinan STMIK Amikom Purwokerto dalam proses evaluasi dan perencanaan penggunaan media promosi yang digunakan dimasing-masing daerah.
5. Membantu Pimpinan STMIK Amikom Purwokerto saat mencermati trend pilihan calon mahasiswa baru pada tiap-tiap program studi di setiap periode sehingga Pimpinan STMIK Amikom Purwokerto dapat dengan segera melakukan langkah-langkah preventive terhadap trend yang sedang berjalan.
6. Membantu Pimpinan STMIK Amikom Purwokerto dalam proses evaluasi kinerja bagian pemasaran.

 
2. PERANCANGAN DAN PEMBUATAN DATA WAREHOUSE DAN APLIKASI ONLINE ANALYTICAL PROCESSING UNTUK BANK “X”

Jurnal Oleh :
1. Silvia Rostianingsih
2. Gregorius Satia Budhi
3. Benny Candra Gunawan  

Link : Jurnal

   Dalam industri perbankan, data warehousing merupakan sesuatu yang sangat penting keberadaannya, karena dengan data warehousing ini, analisis kinerja suatu bank akan jauh lebih mudah untuk dilakukan. Dengan kata lain, data warehousing dapat membantu pihak manajemen bank dalam mempercepat pengambilan keputusan untuk pemecahan masalahnya.
    Saat ini ini Bank ”X” menggunakan program yang berbasis DOS untuk melakukan seluruh transaksi, baik tabungan maupun pengajuan dan pembayaran kredit, beserta segala prosesnya. Program yang digunakan tersebut hanya dapat menampilkan beberapa laporan. Dari hasil laporan tersebut, pihak manajemen masih harus melakukan beberapa perhitungan lagi dengan aplikasi yang terpisah untuk dapat dianalisa. Oleh karena itu, bank tersebut membutuhkan suatu sistem data warehousing untuk membantu pihak manajemen dalam menganalisa kinerja banknya. 
    Data Warehouse Data warehouse adalah koleksi data yang bersifat subject-oriented, terintegrasi, time-variant, dan non- volatile yang digunakan untuk mendukung proses pengambilan keputusan yang strategis untuk perusahaan (Inmon, 2002). Data warehouse merupakan salah satu konsep penyediaan solusi ke organisasi, dimana memiliki database yang distrukturkan secara khusus untuk dilakukan proses query dan analisis. Data warehouse umumnya berisi data yang mempresentasikan histori organisasi.
    Data warehouse memungkinkan pengguna untuk melakukan pemeriksaan terhadap data historis utuk melakukan analisis terhadap data dalam beragam cara dan membuat keputusan yang didasarkan pada hasil analisis. Untuk pembuatan data warehouse, dilakukan dengan melakukan beberapa langkah yang ada, antara lain (Ponniah, 2001):
1. Data extraction Fungsi ini biasanya berhadapan dengan bermacam data source, dan menggunakan teknik yang sesuai dengan setiap data source. Sumber data mungkin berasal dari source machine yang berbeda dalam format data yang berbeda pula.
2. Data transformation Data ransformation melibatkan berbagai bentuk dalam mengkombinasikan bagian dari data yang berasal dari sumber yang berbeda. Kombinasi data dilakukan dari sumber record tunggal, atau dapat juga dilakukan dari elemen data yang berelasi dengan banyak sumber record. Proses cleaning mungkin dilakukan dalam data transformation, dimana proses cleaning memiliki fungsi untuk melakukan koreksi terhadap kesalahan pengejaan, atau untuk melakukan eliminasi terhadap duplikat data.
3. Data loading Setelah selesai melakukan desain dan konstruksi dari data warehouse dan aplikasi digunakan untuk pertama kalinya, akan dilakukan pengisian awal data ke dalam media penyimpanan data warehouse. Dalam pengisian awal, dilakukan pemindahan data dalam jumlah yang besar. Star Schema Star schema merupakan paradigma modeling yang paling banyak digunakan dimana di dalamnya mengandung antara lain sebuah tabel pusat yang besar tanpa adanya data redundancy di dalamnya, yang biasa disebut dengan tabel fakta. Selain itu, di dalam star schema juga mengandung satu set tabel yang lebih kecil, yang biasa disebut dengan tabel dimensi.
Berikut adalah beberapa karakteristik utama dari star schema antara lain (Hermawan, 2005):
1. Pusat dari star schema adalah tabel fakta.
2. Tabel fakta berisi indikator-indikator kinerja pokok.
3. Obyek-obyek informasi dan waktu adalah kunci utama tabel fakta.
4. Tabel-tabel yang ada di sekeliling tabel fakta adalah tabel dimensi.
5. Tabel dimensi berisi data mengenai obyek-obyek informasi atau waktu.
6. Tabel fakta dan tabel dimensi direlasikan dengan key yang ada.
7. Star scheme diimplementasikan menggunakan teknologi relational database.
 
KESIMPULAN
Kesimpulan yang dapat diambil dari penelitian ini adalah:
1. Data dan laporan yang sebelumnya ditampilkan dalam bentuk tabel dengan sifat yang statis dapat ditampilkan dalam beberapa sudut pandang yang ada.
2. Data dan laporan dapat ditampilkan dalam bentuk grafik yang bersifat tiga dimensi, sehingga user bisa mengatur sudut pandang sesuai dengan keinginan user.
3. User dapat menambahkan formula atau rumus perhitungan baru apabila ada perhitungan dari analisis yang diinginkan tidak terdapat dalam menu yang ada. Untuk pengembangan lebih lanjut, dapat dilakukan pembuatan aplikasi peramalan atau forecasting terhadap analisis
Liquidity Ratio dan Cash Ratio.


3. SISTEM ANALISIS DATA MAHASISWA MENGGUNAKAN APLIKASI ONLINE ANALYTICAL PROCESSING (OLAP) DATA WAREHOUSE

Jurnal Oleh :
1. Adi Supriyatna

Link : Jurnal

    Seiring dengan perkembangan zaman dan teknologi maka tingkat pendidikan masyarakat mengalami peningkatan, hal ini dibuktikan dengan semakin meningkatnya minat lulusan SMA yang mau melanjutkan jenjang pendidikan ke perguruan tinggi. Perkembangan suatu perguruan tinggi dapat dilihat dengan bertambahnya jumlah mahasiswa dari tahun ke tahun.
    Pada saat ini pimpinan puncak perguruan tinggi kesulitan menerima informasi terkait jumlah mahasiswa yang sesuai dengan keinginan dikarenakan masih ketergantungan terhadap bagian yang melakukan pengolahan data mahasiswa, akibatnya harus menunggu untuk
mendapatkan informasi terkait data mahasiswa.
    Kumpulan data mahasiswa yang sedemikian berlimpah sebenarnya mengandung informasi atau pengetahuan yang dapat digali atau dianalisis, sehingga dari kumpulan data tersebut dapat diperoleh pola atau pengetahuan yang dapat digunakan oleh perguruan tinggi untuk lebih memahami kondisi jumlah mahasiswa. Berdasarkan pengetahuan yang diperoleh dari analisis data mahasiswa, pimpinan perguruan tinggi dapat membuat rencana strategis yang lebih baik untuk direalisasikan dalam program kerjanya ke depan.
    Pembangunan aplikasi OnLine Analytical Processing (OLAP) Data Warehouse merupakan salah satu cara untuk mengekstrak informasi penting dari beberapa sistem informasi yang berbeda. Dimana data yang sudah terintegrasi dapat dimanfaatkan untuk kegiatan penyampaian informasi yang dapat di tinjau dari berbagai sudut pandang atau dimensi dan dapat diatur tingkatan rincian datanya. Data warehouse adalah suatu konsep dan kombinasi teknologi yang memfasilitasi organisasi untuk mengelola dan memelihara data historis yang diperoleh dari sistem atau aplikasi operasional.
    Pemakaian teknologi data warehouse hampir dibutuhkan oleh semua organisasi karena data warehouse memungkinkan integrasi berbagai macam jenis data dari berbagai macam aplikasi atau sistem. Hal ini menjamin mekanisme akses satu pintu bagi manajemen untuk memperoleh informasi, dan menganalisisnya untuk pengambilan keputusan. Tujuan dan Manfaat Penelitian Tujuan penelitian ini adalah menciptakan sebuah aplikasi OnLine Analytical Processing (OLAP) data warehouse untuk digunakan dalam menganalisa data mahasiswa serta dapat dijadikan pangkalan data yang berisi mengenai informasi data mahasiswa, dimana informasi-informasi tersebut dapat digunakan sebagai dasar dalam proses pengambilan keputusan strategis selanjutnya yang mampu menyajikan laporan secara multi dimensi yang tepat, cepat dan akurat. Sedangkan manfaat yang dapat diambil dari aplikasi OLAP data mahasiswa ini adalah sebagai berikut :
1. Pimpinan dapat memperoleh kemudahan dalam melakukan analisa data pada beberapa sudut pandang atau dimensi yang berbeda dalam waktu yang cepat.
2. Tersedianya pangkalan data yang dapat digunakan untuk menganalisa proses
pengolahan data transaksi data mahasiswa yang dilakukan oleh pimpinan.
 
BAHAN DAN METODE
Data Mart
Data Mart adalah data yang diambil dari ringkasan data warehouse kedalam informasi
yang relevan untuk membuat keputusanm, dalam bentuk kubus multi dimensional yang secara khusus di query-kan oleh OLAP dan reporting front-ends (Golfarelli dan Rizzi, 2009). Terdapat beberapa perbedaan karakteristik antara data mart dengan data warehouse yaitu, data mart berfokus pada kebutuhan pengguna yang berhubungan dengan satu bagian departemen atau fungsi bisnis, data mart tidak berisi data operasional yang bersifat rinci, dan data mart lebih mudah dipahami dan digunakan karena berisi data yang lebih sedikit dibandingkan data warehouse.
    Data Warehouse Data warehouse adalah sebuah sistem yang mengambil dan menyatukan data secara periodik dari sistem sumber menuju ke penyimpanan data dimensional atau penyimpanan data normalisasi (Rainardi, 2008). Biasanya data yang tersimpan didalamnya merupakan data sejarah (history data) yang digunakan untuk melakukan analisa untuk mendukung proses pengambilan keputusan. Selain itu data diperbarui secara berkelompok bukan setiap saat ketika proses transaksi berjalan pada sistem sumber.
    Menurut Han dan Kamber (2008), suatu basis data dapat digolongkan sebagai data warehouse jika memiliki karakteristik sebagai berikut :
1. Berorientasi Subjek Data diorganisasikan oleh subjek secara rinci, misalnya : berdasarkan pelanggan, jenis, dan lain-lain.
2. Terintegrasi Basis data mencakup data dari kebanyakan atau semua aplikasi operasional organisasi dan data tersebut dibuat secara konsisten.
3. Time-Variant Data tidak menyediakan status saat ini, data tersebut disimpan untuk periode lima atau sepuluh tahun bahkan lebih dan digunakan untuk tren, peramalan, dan perbandingan. Waktu merupakan dimensi penting yang harus didukung oleh semua data warehouse.
4. NonVolatile Data yang dimasukkan ke dalam data warehouse adalah data yang read-only, yang tidak dapat dirubah. Data yang sudah lama dihapus dan perubahan direkam sebagai data yang baru.
5. Ringkas. Jika diperlukan, data operasional dimasukkan kedalam ringkasan. Data dalam data warehouse biasanya tidak dinormalisasi sehingga masih terjadi redudansi atau duplikasi data.
6. Sumber. Semua sumber data tersedia dalam data warehouse, baik internal maupun eksternal.
7. Metadata Metadata mengacu pada data tentang data yang menguraikan struktur dan beberapa arti tentang data, dengan demikian mendukung penggunaan yang efektif atau tidak efektif dari data.
    Arsitektur Data Warehouse Dalam sistem data warehouse memiliki dua arsitektur utama, yaitu arsitektur arus data dan arsitektur sistem data warehouse. Arsitektur arus data menerangkan tentang bagaimana penyimpanan data disusun dalam data warehouse dan bagaimana data mengalir dari sumber sistem ke pengguna melalui penyimpanan data ini. Sedangkan arsitektur sistem menerangkan tentang bagaimana konfigurasi fisik server, jaringan, perangkat lunak, media penyimpanan, dan klien. Namun sebelumnya akan dibahas terlebih dahulu tentang komponen yang terdapat dalam sistem data warehouse (Rainardi, 2008). Jenis arsitektur data warehouse yang digunakan dalam penelitian ini adalah Normalized Data Store (NDS) + Dimensional Data Store (DDS). Arsitektur ini terdiri dari tiga media penyimpanan yaitu, stage, Normalized Data Store (NDS) dan Dimensional Data Store (DDS). Arsitektur ini memiliki penyimpanan yang dinormalisasi sebelum DDS. NDS disini sudah dalam bentuk normal ketiga (3NF) atau lebih tinggi. Dalam arsitektur ini terdapat dua NDS, yang pertaman digunakan untuk mengintegrasikan data dari beberapa sistem sumber, dan yang kedua digunakan untuk memuat data ke beberapa DDS. Model Dimensional Model data yang digunakan pada data warehouse bersifat dimensional. Model ini memberikan kemudahan dan fleksibilitas untuk melakukan analisis dari berbagai sudut pandang bisnis (multiple point of view). Menurut Silvers (2008) terdapat dua konsep model data pada data warehouse, antara lain :
1. Fakta (Fact). Facts are also known as Events or Transactions. A Fact is something that happened. Yang berarti Fakta dikenal sebagai suatu kejadian atau transaksi. Fakta adalah sesuatu yang terjadi. Sebuah tabel fakta menggabungkan entitas yang diidentifikasi dalam logical data model.
2. Dimensi (Dimensions) Dimensions are data that qualify or describe enterprise entities involved in a Fact. Dimensi adalah data yang menggambarkan kualifikasi entitas perusahaan yang terlibat dalam fakta. Basis Data Basis data adalah kumpulan data yang terbagi dan terhubung secara logikal dan deskripsi dari data yang dirancang untuk memenuhi kebutuhan informasi suatu organisasi (Connolly dan Begg, 2010). Konsep dasar dari basis data adalah kumpulan dari catatan-catatan, atau potongan dari pengetahuan. Sebuah basis data memiliki penjelasan terstruktur dari jenis fakta yang tersimpan di dalamnya: penjelasan ini disebut skema. Skema menggambarkan obyek yang diwakili suatu basis data, dan hubungan di antara obyek tersebut.
 
KESIMPULAN
Berdasarkan hasil penelitian dan perancangan aplikasi OLAP data warehouse mahasiswa yang telah dilakukan, maka dapat diambil kesimpulan sebagai berikut :
a. Aplikasi OLAP data warehouse mahasiswa dapat memberikan kemudahan kepada pimpinan untuk melakukan proses analisis terhadap data mahasiswa pada subjek-subjek tertentu dalam waktu yang lebih cepat.
b. Aplikasi OLAP data warehouse memberikan kemandirian dan kemudahan kepada pimpinan untuk dapat memilih bentuk laporan yang diinginkan.
c. Aplikasi OLAP data warehouse dapat dijadikan sebagai pendukung sistem penunjang keputusan.
d. Elemen data yang dimasukkan kedalam database data warehouse harus disesuaikan dengan kebutuhan pimpinan.
e. Perlunya dilakukan pemantauan terhadap aplikasi OLAP agar informasi yang dihasilkan tepat dan akurat.


4. PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE UNTUK MENDUKUNG SISTEM AKADEMIK (STUDI KASUS PADA STKIP MUHAMMADIYAH KOTABUMI)

Jurnal Oleh :
1. Khusnul Khotimah
2. Sriyanto
 
Link : Jurnal

    Bagian akademik merupakan salah satu unsur bagian terpenting pada suatu Perguruan Tinggi, karena pada bagian inilah segala informasi tetang akademik diperoleh seperti informasi data mahasiswa, perkuliahan, dan informasi data kelulusan mahasiswa. Pada setiap semester bagian akademik akan selalu diminta oleh ketua STKIP untuk menyajikan laporan yang akan digunakan sebagai bahan evaluasi untuk analisis pengambilan keputusan penentuan stategi bisnis selanjutnya, namun terkadang bagian akademik membutuhkan waktu cukup lama dan mengalami kesulitan dalam hal mengolah data menjadi sebuah informasi berkualitas disebabkan data yang dibutuhkan sebagai bahan evaluasi tersebar dalam beberapa bentuk media penyimpanan yang belum terintegrasi dengan baik dalam sebuah basis data.    
    Pengolahan data akademik sebagian menggunakan aplikasi desktop Borland Delphi 7 dan SQL Server 2000 sebagai basis data yang mulai diimplementasikan pada tahun ajaran 2011/2012 sedangkan data di tahun ajaran sebelumnya dan beberapa data transaksi seperti satus mahasiswa masih dikelola secara manual menggunakan paket office dan tersimpan dalam bentuk sheet file, oleh karena itu perlu dirancang suatu arsitektur data berupa data warehouse yang dapat mengintegrasikan data-data transaksi dari berbagai sumber penyimpanan menjadi sekumpulan data historis yang dapat diolah menjadi informasi berkualitas yang siap digunakan dan tentunya tidak memerlukan waktu lama. Informasi akademik yang dihasilkan merupakan salah satu dasar bagi pihak manajemen eksekutif, khususnya ketua STKIP untuk melakukan analisis dan evaluasi guna proses pengambilan keputusan.
    Sistem Informasi akademik merupakan sistem yang digunakan untuk mengelola data akademik, didalam sistem inilah komponen–komponen yang ada dapat saling berinteraksi. Sebuah sistem informasi akademik yang baik harus mampu mengelola semua hal yang berkaitan dengan penyelenggaraan kegiatan akademik dan hal–hal spesifik lainnya, semua komponen kegiatan dipermudah dengan adanya sistem ini, semua kegiatan akan berjalan dengan baik jika aturan–aturannya sudah masuk kedalam sistem. Sistem Informasi Akademik STKIP Muhammadiyah adalah sistem informasi yang berisi pangkalan data mahasiswa, pengelolaan administrasi perkuliahan, nilai mahasiswa, dosen mengajar dan lain sebagainya.
    Data Warehouse Data warehouse adalah koleksi data yang mempunyai sifat subject-oriented, Integrated, nonvolatile, dan time-variant untuk mendukung proses pengambilan keputusan dalam manajemen. Menurut Mannino, data warehouse adalah tempat penyimpanan data terpusat, dimana data dari basis data operasional dan sumber lainnya diintegrasikan, dibersihkan dan diarsipkan untuk mendukung pengambilan keputusan. Menurut McLeod, data warehouse adalah sebuah sistem penyimpanan data yang berkapasitas besar, dimana data dikumpulkan dengan menambahkan record baru daripada meng-update record yang sudah ada dengan informasi baru. Data jenis ini digunakan hanya untuk proses pengambilan keputusan dan bukan untuk kegiatan operasional perusahaan sehari-hari.  (Indrajani, 2011).

METODOLOGI PENELITIAN
1. Tahapan penelitian
Ada beberapa tahapan penelitian yang ditempuh dalam perancangan data warehouse
2. Tahapan Persiapan
Tahapan persiapan ini merupakan tahapan awal dalam penelitian yaitu dengan menentukan latar belakang masalah, ruang lingkup penelitian yang merupakan batasan dari pembahasan, kemudian dilakukan perumusan masalah, menentukan tujuan dan manfaat penelitian serta sistematika dari penulisan.
3 Tahapan Landasan Teori
    Pada tahap ini dilakukan kajian teori-teori yang berhubungan dengan penelitian yang dilakukan, teori-teori pendukung dalam penelitian seperti teori dasar sistem informasi akademik, teori dasar perancangan dan implementasi data warehouse, review jurnal penelitian serupa dan teori pendukung lainnya.
4 Tahapan Pengumpulan Data
Pada tahapan ini hal yang dilakukan meliputi :
a. Observasi
b. Wawancara
c. Studi Literatur
5 Tahapan Analisis Kebutuhan Informasi Bisnis
Adapun informasi bisnis hasil analisis yaitu:
    Kebutuhan informasi tentang data jumlah mahasiswa baru pada setiap tahun, sebagai bahan evaluasi untuk mengetahui tren peminatan pada 3 program studi. Kebutuhan informasi data mahasiswa berdasarkan status akademik pada setiap semester sebagai bahan evaluasi untuk penyelenggaraan perkuliahan di semester berikutnya. Kebutuhan informasi kelulusan untuk mengetahui jumlah lulusan berdasarkan program studi dalam satu periode tertentu, berdasarkan masa studinya dan berdasarkan IPK yang diperoleh, semakin banyak mahasiswa yang lulus tepat waktu akan semakin baik penilaian untuk program studi tersebut Kebutuhan informasi kualitas dari mahasiswa lulusan berdasarkan IPK akhir yang diperolehnya, sebagai analisis upaya perbaikan dan peningkatan mutu pembelajaran. Peningkatan IPK yang diperoleh maka akan memberikan penilaian mutu yang baik untuk program studi tersebut.
6 Tahapan Perancangan dan Implementasi Data Warehouse
    Pada tahapan ini hal yang dilakukan adalah diawali dengan mendesain sebuah arsitektur fisik dan logic dari data warehouse. Data yang bersumber dari berbagai interface yang ada dan yang tersimpan dalam media penyimpanan database operasional akademik maupun dalam bentuk sheet file akan diproses untuk supaya menjadi informasi yang berkualitas dan sesuai dengan kebutuhan. Metode dalam membangun data warehouse akan dilakukan dalam 9 tahapan, yang dikenal dengan nine-step methodology Proses mengintegrasikan data dilakukan dengan konsep ETL (Extracts, Tranformasi, Loading) Data yang telah terintegrasi dan tersimpan dalam format yang sama untuk selanjutnya di kelompokkan kedalam bentuk tabel dimensi dan tabel fakta.
7. Tahapan Penarikan Kesimpulan dan Saran
Setelah data warehouse terbentuk langkah selanjutnya dapat dilakukan presentasi implementasi data warehouse sesuai dengan kebutuhan manajemen. Dari hasil perancangan dan implementasi yang telah dilakukan maka hasil akhir dari penelitian ini merupakan penarikan kesimpulan dan saran laporan tesis.
 
HASIL PENELITIAN
Rancangan Arsitektur Data Warehouse Arsitektur yang akan digunakan dalam perancangan ini merupakan arsitektur data warehouse terpusat. Arsitektur data terpusat yang dipilih karena untuk memudahkan dalam proses pemeliharaan dan pengawasan. Berikut rancangan arsitektur fisik dan logic data warehouse akademik:
 
KESIMPULAN
Berdasarkan hasil rancang bangun data warehouse STKIP Muhammadiyah Kotabumi- Lampung, maka penulis dapat mengambil kesimpulan sebagai berikut:
a. Rancang bangun data warehouse yang dibuat terkait dengan jumlah mahasiwa baru, tatus mahasiswa, dan lulusan dapat dijadikan dasar untuk menyajikan data yang erintegrasi sebagai data pendukung dalam proses evaluasi bidang akademik dan sebagai dasar proses pengambilan keputusan bagi manajemen.
b. Integrasi data dilakukan dengan melakukan ekstraksi dari beberapa sumber data dengan mengambil item data yang diperlukan. Sumber data diperoleh dari sistem informasi mahasiwa baru, status mahasiswa, dan lulusan.
c. Prosesi integrasi data dimulai dengan ekstraksi (extraction) kemudian dilakukan penyeragaman (transformation) sehingga sesuai dengan format yang digunakan untuk kepentingan analisis. Data dalam format yang telah sesuai untuk keperluan evaluasi dan analisis kemudian disimpan dalam data warehouse (loading).

 
5. PENGEMBANGAN SISTEM ANALISIS AKADEMIS MENGGUNAKAN OLAP DAN DATA CLUSTERING STUDI KASUS : AKADEMIK UNIVERSITAS SEBELAS MARET SURAKARTA

Jurnal Oleh :
1. BAKHARUDIN YUSUF BAKHTIAR
 
Link : Jurnal

    Menurut Prof. Dr. Ravik Karsidi, M.S sebagai rektor dari Universitas Sebelas Maret (UNS) periode 2011-2015 menyatakan bahwa keberhasilan UNS yang lebih utama terlihat dari semakin meningkatnya kulitas lulusan yang ditandai dengan semakin meningkatnya rata-rata Indeks Prestasi Kumulatif (IPK), Angka Efisiensi Edukasi (AEE), lulusan berpredikat cumlaude serta semakin singkatnya masa studi.
    Salah satu cara yang digunakan UNS untuk meningkatkan keberhasilan tersebut adalah dengan melengkapi dan memanfaatkan sistem informasi. Namun sistem informasi yang ada di UNS sampai saat ini masih besifat departemental karena beberapa dibangun dengan menggunakan framework dan database yang berbeda. Dengan sistem yang masih bersifat departemental ini akan menyulitkan civitas akademik dalam mengolah data dan menganalisis data-data tersebut karena harus dihimpun dari berbagai unit yang sulit untuk didapatkan secara cepat dan terkadang terdapat data yang tidak valid. Seperti kesulitan dalam pembuatan laporan, penyusunan borang akreditasi, menentukan segmentasi pasar promosi SMA dan lain sebagainya.

Model Data Multidimensional
Pembuatan data warehouse didasarkan pada model data multidimensi yang berbentuk kubus. Data multidimensi adalah ketika sebuah data dapat dipandang dari berbagai sudut. Pusat dari objek pada multidimensional adalah cube atau kubus yang mengandung hubungan struktur dimensi, hirarki, level dan anggota. Menurut Prasetyo [8], komponen model multidimensional yang secara umum ditemukan dalam perancangan data warehouse adalah :
a. Dimensi merupakan kategori yang independen dari multidimensional database. Tipe dari dimensi ini mengandung item yang digunakan sebagai kriteria query untuk ukuran database.
b. Tabel fakta
Tabel fakta merupakan pusat dari schema pada OLAP yang didalmnya mempunyai dua tipe kolom, yaitu kolom measure yang menyimpan nilai-nilai numerik dan kolom yang menyimpan foreign key yang mengacu ke tabel dimensi.
c. Measure Measure juga cerminan dari fakta dan juga mengandung data yang akan dianalisis. OLAP memerlukan informasi kolom bertipe numerik yang akan dijadikan measure
d. Hirarki Hirarki merupakan bentuk kesatuan dari dimensi. Hirarki didefinisikan bagaimana hubungan antar level.
e. Level Level merepresentasikan sebuah posisi pada hirarki. Level mengumpulkan data untuk agregasi dan digunakan untuk proses komputasi.
f. Attribut
Attribute merepresentasikan informasi tambahan pada sebuah level tertentu.
g. Cube
Cube adalah obyek OLAP yang tersusun dari measure, dimensi dan attribute. Sisi-sisi pada cube ditentukan oleh masing-masing dimensi yang terlibat dalam cube itu.
 
HASIL DAN PEMBAHASAN
Pembangunan data warehouse dan OLAP Setelah dilakukan analisis terhadap sumber data untuk mengetahui apa saja informasi yang harus disediakan oleh sistem. Fungsi-fungsi yang dapat ditangani sistem adalah :
a. Melihat jumlah mahasiswa, jumlah lulusan, jumlah mahasiswa yang diwisuda, jumlah calon mahasiswa baru dari berbagai dimensi.
b. Melihat jumlah calon mahasiswa baru untuk setiap prodi.
c. Melihat profil IPK dan lama studi lulusan.
d. Melihat profil beban sks dosen.
e. Melihat jumlah mahasiswa tiap kelas.
f. Melihat presentase pemakaian gedung.
g. Melakukan pengelompokkan data

KESIMPULAN DAN SARAN
Pada penelitian ini berhasil mengembangkan sistem OLAP dan clustering untuk memenuhi fungsionalitas sistem yaitu sistem dapat melakukan drill up dan drill down untuk membantu merekap data jumlah mahasiswa, jumlah calon mahasiswa baru, jumlah lulusan, mencari nilai maksimum, minimum, rata-rata dan presentase profil ipk lulusan, mencari nilai maksimum, minimum, rata-rata dan presentase profil lama studi lulusan, beban sks dosen, presentase pemakaian ruang dari berbagai dimensi. Pada pengujian SSE clustering iterasi 1 adalah 0.398 sedangkan pada iterasi 2 nilai SSE clustering adalah 0.357. Penurunan nilai SSE ini menunjukkan bahwa jumlah selisih jarak setiap data ke pusat cluster semakin sedikit yang berarti semakin bagus. Hasil dari pengelompokkan ini, setiap data lulusan akan dikelompokan berdasarkan kualitas lulusan yang dinilai berdasarkan IPK dan lama studi.


Terima Kasih dan Semoga Bermanfaat.

Tidak ada komentar:

Posting Komentar