Pages

Minggu, 27 Januari 2013

Terminologi Data Warehouse, Data Mart, Data Mining, OLAP (On-Line Analytical Processing), MOLAP, ROLAP, HOLAP, Business Intelligence


DATA WAREHOUSE
data warehouse merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda.

Keuntungan Data Warehouse

                Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini (Ramelho).
Ø  Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
Ø  Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
Ø  Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.
Ø  Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
Membangun data warehouse tentu saja memberikan keuntungan lebih bagi suatu perusahaan, karena data warehouse dapat memberikan keuntungan strategis pada perusahaan tersebut melebihi pesaing-pesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber (Sean Nolan,Tom Huguelet):
Ø  Kemampuan untuk mengakses data yang besar
Ø  Kemampuan untuk memiliki data yang konsistent
Ø  Kemampuan kinerja analisa yang cepat
Ø  Mengetahui adanya hasil yang berulang-ulang
Ø  Menemukan adanya celah pada business knowledge atau business process.
Ø  Mengurangi biaya administrasi
Memberi wewenang pada semua anggota dari perusaahan dengan menyediakan kepada mereka informasi yang dibutuhkan agar kinerja bisa lebih efektif. 

DATA MART

data mart adalah fasilitas penyimpanan yang berorientasi pada subject tertentu atau berorientasi pada departemen tertentu dari suatu organisasi, fokus pada kebutuhan departemen tertentu seperti sales, merketing, operation atau collection, sehingga suatu oerganisais bisa mempunyai lebih dari datu data mart.
perbedaan data mart dan data warehouse
keuntungan data mart, sebagai berikut :
1. akses mudah ke data yang sering digunakan
2. penciptaan pandang kolektif untuk sekelompok pengguna
3. peningkatan respon time dari pengguna akhir
4. fleksibel dan mudah cara pembuatan
5. lebih hemat biaya daripada data warehouse
6. dafinisi pengguna lebih jelas dari sebuah gudang data.
kelemahan data mart, sebagai berikut :
1. memiliki nilai yang terbatas karena tidak dapat melihat organisasi secara keseluruhan dan pelap[oran serta analisa potensi terbatas.

DATA MINING

Data mining adalah kegiatan mengekstraksi atau menambang pengetahuan  dari data yang berukuran/berjumlah besar, informasi inilah yang nantinya sangat berguna untuk pengembangan. Dimana langkah-langkah untuk melakukan data mining adalah sebagai berikut :



Arsitektur data mining
1.  Database, data warehouse, atau tempat penyimpanan informasi lainnya.
2.  Server database atau data warehouse.
3.  Knowledge base
4.  Data mining engine.
5.  Pattern evolution module.
6.  Graphical user interface.

Meskipun gaungnya mungkin tidak seramai seperti ketika  Client/Server Database  muncul, tetapi industri-industri seperti IBM, Microsoft, SAS, SGI, dan SPSS terus gencar melakukan penelitian-penelitian di bidang  data mining  dan telah menghasilkan berbagai  software untuk melakukan data mining:
Intelligent Miner dari IBM. Berjalan di atas sistem operasi AIX,  OS/390,
OS/400, Solaris dan Windows NT. Dijual dengan harga sekitar US$60.000.
Selain untuk data IBM juga mengeluarkan produk Intelligent Miner untuk
teks. Web site:
www.software.ibm.com/data/iminer/fortext
www-4.inm.com/software/data/iminer/fordata/index.html
Microsoft juga telah menambahkan fasilitas  data mining  di Microsoft SQL
Server 2000. Web site: www.microsoft.com/sql/productinfo/feaover.htm
Enterprise Miner dari SAS. Berjalan di atas sistem operasi AIX/6000, CMS,
Compaq Tru64 UNIX, HP-UX, IRIX, Intel ABI, MVS, OS/2, Open VMS Alpha,
Open VMS Vax, Solaris, dan Windows. Web site: www.sas.com
MineSet dari Silicon Graphics. Berjalan di atas sistem operasi Windows
9x/NT dan IRIX. Dijual per  seat  seharga US$995, server (Windows NT)
seharga US$35.000 dan untuk IRIX dijual US$50.000.  Web site:
www.sgi.com/software/mineset
Clementine dari SPSS. Berjalan di atas sistem operasi UNIX dan Windows
NT. Web site: www.spss.com/software/clementine 



DATA OLAP

OLAP merupakan terminologi yang  menerangkan teknologi yang menggunakan view multidimensi penge-lompokkan data untuk menyedia-kan akses cepat terhadap informasi strategis untuk keperluan analisa lebih lanjut(Coddet al.,1995).
KeuntunganOLAP
• Meningkatkan produktifitas pemakai akhir bisnis, pengembang IT, dan keseluruhan organisasi. Pengawasan yang lebih dan akses tepat Waktu terhadap informasi strategis dapat membuat pengambilan keputusan lebih efektif.
• Mengurangi “backlog”pengembangan aplikasi bagi staf IT dengan membuat pemakai akhir dapat merubah schema dan membangun model sendiri.
• Penyimpanan pengawasan organisasi melalui integritas data koorporasi sebagai aplikasi OLAP  tergantung pada data warehouse dan sistem OLTP untuk memperbaharui sumber tingkatan data mereka.
• Mengurangi aktifitas query dan lalulintas jaringan pada sistem OLTP atau pada data warehouse
• Meningkatkan hasil dan keuntung-an secara potensial dengan meng-izinkan organisas iuntuk merespon permintaan pasar lebih cepat.

DATA MOLAP (Multi Dimensional OLAP) 

MOLAP adalah tipe OLAP yang memiliki  storage  sendiri, yang isinya merupakan  precomputed agregasi data - sum, count, min, max, dan sebagainya - yang terlibat pada berbagai level detil. Storage ini berupa format yang hanya dikenali oleh MOLAP server tersebut dan telah khusus dioptimalkan untuk penggunaan oleh aplikasi tersebut.





Cara kerja MOLAP secara umum dibagi ke dalam dua tahap sebagai berikut :
  • Tahap konstruksi dan populasi data, pada tahap ini sumber data akan dibaca, dilakukan perhitungan agegrasi (summary group) pada berbagai level dimensi, dan hasilnya akan disimpan di storage MOLAP. Jika objek data diperumpamakan dengantable, maka untuk satu cube akan banyak fragmen table yang isinya adalah detil agregasi dari level tertentu.
  • Tahap query atau layanan permintaan data analisis, pada tahap ini OLAP Server akan melayani permintaan query dari client dan membaca data dari storage MOLAP. Table yang akan dibaca adalah suatu fragmen yang akan disesuaikan dengan permintaan dari client. Pada fase query ini, jika OLAP Server terputus dengan data source tidak apa-apa karena sudah tidak ada kaitannya.
Keuntungan dari MOLAP ini yang paling jelas adalah performa kecepatan akses yang sangat baik. Namun kelemahannya adalah jika kombinasi agregasi data yang dihasilkan untuk semua level, maka ukuran penyimpanan akan bisa lebih besar daripada sumbernya sendiri.


ROLAP (Relational online analitycal processing

ROLAP (Relational online analitycal processing ) menggunakan tabel pada database relasional datawarehouse untuk menyimpan detil data dan aggregasi kubus. Berbeda dengan MOLAP, ROLAP tidak menyimpan salinan database, ia mengakses langsung pada tabel fact ketika membutuhkan jawaban sebuah query. Sehingga query pada ROLAP mempunyai response time yang lebih lambat dibandingkan ROLAP maupun HOLAP. Karakteristik model ini digunakan untuk menyimpan data yang besar dan jarang dilakukannya proses query. Misalkan, data histori dalam jumlah besar dari beberapa tahun yang sebelumnya.
Keuntungan dari ROLAP ini adalah tidak memerlukan storage tambahan. Namun kelemahannya adalah  jika data untuk suatu cube sangat besar (masif) maka performa pengambilan data akan cukup buruk.

HOLAP (Hibrid online analitycal processing)

Gabungan model MOLAP dan ROLAP dapat kita peoleh dari HOLAP (Hibrid online analitycal processing) Detil data tersmpan pada tabel relasional tapi aggregasi data disimpan dalam format multidimensi. Misalkan proses drill down dilakukan pada sebuah tabel fakta, maka retrive data akan dilakukan dari tabel database relasional sehingga query tidak secepat MOLAP. Kubus HOLAP lebih kecil daripada kubus MOLAP tapi response time query masih lebih cepat jika dibandingkan dengan ROLAP. Model penyimpanan HOLAP ini biasanya sesuai untuk kubus yang membutuhkan performa query yang bagus dengan jumlah data yang besar.


Business Intelligence

Secara umum Business Intelligence (BI) merupakan sebuah proses untuk melakukan ekstraksi data-data operasional perusahaan dan mengumpulkannya dalam sebuah data warehouse. Selanjutnya data di data warehouse diproses menggunakan berbagai analisis statistik dalam proses data mining, sehingga didapat berbagai kecenderungan atau pattern dari data. Hasil penyederhanaan dan peringkasan ini disajikan kepada end user yang biasanya merupakan pengambil keputusan bisnis. Dengan demikian manajemen dapat mengambil keputusan berdasarkan fakta-fakta aktual, dan tidak hanya mengandalkan intuisi dan pengalaman kuantitatif saja.

Menurut Nadia Branon[1], Business Intelligence merupakan kategori yang umum digunakan untuk aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisa, dan menyediakan akses pada data agar dapat membantu pengguna dari kalangan perusahaan agar dapat mengambil keputusan dengan lebih baik dan tepat. Pada umumnya solusi yang disediakan oleh BI berupa sumber-sumber data dimana data yang sifatnya transaksional dikumpulkan, data warehouses/data marts, reporting dan alat visualisasi, seperti analisis prediksi dan modelling.

Kegunaan BI

Perusahaan menggunakan BI untuk memperoleh lebih dalam lagi mengenai segala informasi yang berhubungan dengan kinerja bisnis. Hal ini digunakan untuk memahami, meningkatkan kinerja, penganggaran biaya yang lebih efisien dan mengidentifikasi peluang bisnis baru. Beberapa hal kegunaan BI, antara lain:
  • Analisa dalam perilaku konsumen, pola pembelian dan trend penjualan
  • Mengukur, melacak dan memprediksi penjualan dan kinerja keuangan
  • Penganggaran, perencanaan keuangan dan peramalan
  • Mengetahui kinerja kegiatan pemasaran
  • Optimalisasi proses dan kinerja operasional
  • Meningkatkan efektifitaspengiriman dan pasokan
  • Analisa CRM (Customer Relationship Management)
  • Analisa Resiko
  • Analisa nilai strategis
  • Analisa social media

SAP juga telah menawarkan solusi ERP sejak tahun 70an, terkenal dengan sebutan SAP BIW (Business Warehouse Information System), yang kemudian terus ber evolusi menjadi SAP BW (Business Warehouse) produk solusi SAP yang dirilis dari awal sudah mendukung realtime processing, dapat dikenali dengan SAP R1 – R3. Kali ini SAP BW telah ber evolusi lagi menjadi SAP BI (Business Intelligence) berkembang bersamaan dengan jajaran produk baru sap Netweaver yang sudah mendukung teknologi portal dan web application. SAP juga memiliki berbagai jenis varian solusi BI yang dapat disesuaikan berdasarkan jenis Industri bisnis yang ada. Selain itu jika sudah menggunakan SAP ERP, mengintegrasikan SAP BI akan menjadi sangat mudah dan seamless karena berasal vendor yang sama.
Dengan kemampuan nya yang multi platform dan multi database, SAP sangat mudah untuk mengadaptasi platform yang digunakan oleh berbagai perusahaan, apakah database anda SQL Server, ORacle, DB2 dapat didukung dengan mudah, platform OS seperti  dan Unix/Linux varian juga dapat diimplementasikan oleh SAP. Kali ini SAP BI menjadi salah satu portofolio solusi produk dari SAP BusinessObject.

nama : fitriani fauzia sundari
kelas : 3E / Teknik Informatika
npm : 1103196