DATA WAREHOUSE
Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan. Sedangkan data mining muncul setelah banyak dari pemilik data baik perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama beberapa tahun, misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus dilakukan terhadap tumpukan data tersebut. Data warehouse adalah database yang berisi data dari beberapa system operasional yang terintegrasi dan terstruktur sehingga dapat digunakan untuk mendukung analisa dan proses pengambilan keputusan dalam bisnis. Data warehouse didesain untuk kita bisa melakukan query secara cepat. Informasi diturunkan dari data lain, dilakukan rolling up untuk dijadikan ringkasan, dilakukan operasi drilling down untuk mendapatkan informasi lebih detail, atau melihat pola yang menarik atau melihat trend (kecenderungan).
Karakteristik Data Warehouse:
1. Subject Oriented (Berorientasi subject)
Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak diorganisasikan pada area-area aplikasi utama(customer invoicing,stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data.
Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses. Secara garis besar perbedaan antara data operasional dan data warehouse yaitu :
|
Data Operasional
|
Data Warehouse
|
|
Dirancang berorientasi
hanya pada aplikasi dan fungsi tertentu
|
Dirancang berdasar pada
subjek-subjek tertentu(utama)
|
|
Focusnya pada desain
database dan proses
|
Focusnya pada pemodelan
data dan desain data
|
|
Berisi rincian atau
detail data
|
Berisi data-data
history yang akan dipakai dalam proses analisis
|
|
Relasi antar table
berdasar aturan terkini(selalu mengikuti rule(aturan) terbaru)
|
Banyak aturan bisnis
dapat tersaji antara tabel-tabel
|
2. Integrated (Terintegrasi)
Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.
Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.
3. Time-variant (Rentang Waktu)
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :
- Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
- Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
- Cara yang ketiga,variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
4. Non-Volatile
Karakteristik keempat dari data warehouse adalah non-volatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.
Berbeda dengan database operasional yang dapat melakukan update,insert dan delete terhadap data yang mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).
DATA MART
Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam beberapa implementasi data warehouse, data mart adalah miniature data warehouse. Data mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi.
Arsitektur Data Mart
- Dependent data mart
Dependent Data Mart
Dependent Data Mart (Inmon advocated) berlaku sebagai
komponen atau suatu bagian dari enterprise Data Warehouse, Data Mart dibangun
dengan cara extract data dari Data Warehouse.
- Independent Mart
Independent Data Mart
Independent Data Mart tidak tergantung pada pusat penyimpan
data seperti Data Warehouse arsitektur ini biasa juga disebut sebagai “Data
Warehouse Bus structure”.
Karakteristik data mart
◦ Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis.
◦ Data mart biasanya tidak mengandung data operasional yang rinci seperti pada data warehouse.
◦ Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami.
◦ Data marts bisa bersifat dependent atau independent.
◦ Kubus
◦ Aggregation
Perbedaan data mart dan data warehouse
DATA CENTER
Data center atau dalam bahasa Indonesia disebut pusat data adalah suatu fasilitas tempat yang digunakan untuk meletakkan system computer beserta komponen-komponennya, system ini meliputi system komunikasi dan penyimpanan data. Keberadaan data center sangat diperlukan oleh sebuah perusahaan bisnis, karena memiliki banyak manfaat untuk kinerja sebuah perusahaan yang profesional. Keberadaan data center akan sangat besar manfaatnya manakala ada hal tak terduga yang melanda sebuah perusahaan.
Berikut beberapa vendor database:
a. ORACLE
Basis data Oracle adalah basis data relasional yang terdiri dari kumpulan data dalam suatu sistem manajemen basis data RDBMS. Perusahaan perangkat lunak. Oracle memasarkan jenis basis data ini untuk bermacam-macam aplikasi yang bisa berjalan pada banyak jenis dan merk perangkat keras komputer (platform).
Kelebihannya :
- Client-Server Environmetn. Terdapat fasilitas klien-server, sehingga dapat diakses oleh banyak user dalam suatu waktu secara bersamaan.
- Ukuran Database besar dan terdapat pengaturan space. Umumnya, perusahaan besar biasanya menggunakan media penyimpanan besar untuk menampung trafik data yang besar.
- Database Clusters, dengan menggunakan teknologi Real Application Clusters (RAC). Salah satu fungsi dari RAC adalah memberikan perlindungan terhadap kelangsungan data dalam perusahaan sehingga apabila terjadi crash pada salah satu server database, maka tidak akan mempengaruhi kinerja perusahaan. Hal ini disebabkan karena teknologi RAC memungkinkan untuk membuat beberapa database server menjadi seolah-olah satu database server, sehingga apabila ada database server yang down, kinerja database server tersebut akan di-take over oleh server-server yang lain.
- Row-Level Locking, fitur ini dapat melakukan lock tidak hanya pada table-level saja, akan tetapi dimungkinkan untuk melakukan lock lebih jauh lagi sampai pada row-level. Sehingga user-user dapat melakukan akses data dalam suatu tabel secara bersamaan, lebih cepat dan lebih akurat.
- High Transaction Processing Performance. Meskipun trafik data sangat besar, tapi proses manipulasi data dapat berjalan dengan lancar.
- Oracle Data Mining & Data Warehousing, fitur ini memberikan kemudahan bagi perusahaan yang ingin men-develop aplikasi Business Intellegent yang bertujuan untuk membantu eksekutif perusahaan dalam menentuksan strategi perusahaan berdasarkan analisis data yang di-generate oleh Oracle Data Mining.
- Virtual Private Database, fitur ini memberikan dan meningkatkan fleksibilitas jaminan security sampai pada row-level security. Hal ini akan membuat aplikasi kita menjadi semakin aman sewaktu kita melakukan transaksi melalui Internet.
- Flashback Query, fitur ini memungkinkan kita untuk melihat status data kita mundur beberapa waktu (flash back) sampai batas yang kita tentukan, sehingga apabila terjadi kesalahaan data pada waktu yang lalu, maka kita dapat melakukan koreksi tanpa harus melakukan database recovery.
Kukurangannya :
- Membutuhkan spesifikasi hardware yang tinggi untuk dapat menjalankan software DMBS Oracle supaya berjalan dengan stabil.
- Data yang bertambah ukurannya akan mengalami kelambatan proses, jadi harus ada database management.
- Merupakan software DMBS yang paling mahal, paling rumit, dan paling sulit untuk dipelajari.
MySQL
MySQL adalah sebuah perangkat lunak sistem manajemen basis data SQL (database management system) atau DBMS yang multithread, multi-user,dengan sekitar 6 juta instalasi di seluruh dunia. MySQL AB membuat MySQL tersedia sebagai perangkat lunak gratis dibawah lisensi GNU General Public License (GPL), tetapi mereka juga menjual dibawah lisensi komersial untuk kasus-kasus dimana penggunaannya tidak cocok dengan penggunaan GPL.
MySQL sebenarnya merupakan turunan salah satu konsep utama dalam database sejak lama, yaitu SQL (Structured Query Language). SQL adalah sebuah konsep pengoperasian database, terutama untuk pemilihan atau seleksi dan pemasukan data, yang memungkinkan pengoperasian data dikerjakan dengan mudah secara otomastis.
MySQL juga memiliki beberapa kelebihan, antara lain :
1. Portability : MySQL dapat berjalan stabil pada berbagai sistem operasi seperti windows, Linux, FreeBSD, Solaris dan lain-lain.
2. Open Source : MySQL didistribusikan secara open source (gratis), dibawah lisensi GPL sehingga dapat digunakan cuma-Cuma.
3. Multi User : MySQL dapat digunakan oleh beberapa user dalam waktu yang bersamaan tanpa mengalami masalah atau konflik.
4. Performance Tuning : MySQL memiliki kecepatan yang menakjubkan dalam menangani query sederhana, dengan kata lain dapat memproses lebih banyak SQL per satuan waktu.
5. Coloumn Types : MySQL memiliki tipe kolom yang sangat kompleks, seperti integer, double, char, text, datedan lain-lain.
6. Command and Function : MySQL memiliki operator dan fungsi secara penuh yang mendukung perintah select danwhere dalam query.
7. Security : MySQL memiliki beberapa lapisan sekuritas seperti level subnetmask, nama host, dan izin akses user dengan sistem perizinan yang mendetail serta password terenkripsi.
8. Scability and Limits : MySQL mampu menangani database dalam skala besar, dengan jumlah records lebih dari 50 juta dan 60 ribu tabel serta 5 milyar baris. Selain itu batas indeks yang dapat ditampung mencapai 32 indeks pada tiap tabelnya.
9. Connectivity : MySQL dapat melakukan koneksi dengan clients menggunakan protokol TCP/IP, Unix socket (UNIX) atau Named Pipes (NT).
10. Localisation : MySQL dapat mendeteksi pesan kesalahan pada client dengan menggunakan lebih dari dua puluh bahasa. Meskipun demikian, bahasa Indonesia belum termasuk didalamnya.
11. Interface : MySQL memiliki interface (antar muka) terhadap berbagai aplikasi dan bahasa pemograman dengan menggunakan fungsi API (Aplication Programming Interface).
12. Clients and Tools : MySQL dilengkapi dengan berbagai tools yang dapat digunakan untuk administrasi database dan pada setiap tool yang ada disertakan petunjuk online.
13. Struktur Tabel : MySQL memiliki struktur tabel yang lebih fleksibel dalam menangani ALTER TABLE, dibandingkan database lainnya semacam PosgreeSQL ataupun Oracle.
Kelemahan MySQL dari dulu sampai saat ini adalah feature-creep artinya MySQL berusaha kompatibel dengan beberapa standar serta berusaha memenuhinya namun jika itu diungkapkan kenyataannya bahwa fitur-fitur tersebut belum lengkap dan belum berperilaku sesuai standar. Contoh fitur SUB-SELECT (nesting SELECT dalam SELECT) yang tidak optimal dan sering salah parsing query SQL dan jalan keluarnya dengan memecah menjadi beberapa query.
IBM
International Business Machines (IBM) (NYSE: IBM) adalah
teknologi multinasional Amerika dan perusahaan konsultan yang berkantor pusat
di Armonk, New York. IBM memproduksi dan menjual hardware dan software
komputer, dan menawarkan infrastruktur, hosting dan jasa konsultasi mulai dari
bidang komputer mainframe ke nanoteknologi.International Business Machines (IBM) (NYSE: IBM) adalah
teknologi multinasional Amerika dan perusahaan konsultan yang berkantor pusat
di Armonk, New York. IBM memproduksi dan menjual hardware dan software
komputer, dan menawarkan infrastruktur, hosting dan jasa konsultasi mulai dari
bidang komputer mainframe ke nanoteknologi.
SYBASE
Sybase adalah sebuah perusahaan perangkat lunak komputer yang mengembangkan dan menjual sistem manajemen database (DBMS) dan produk middleware. Perusahaan ini didirikan pada tahun 1984, dan kantor kantor pusat di Emeryville, CA. Sybase adalah DBMS perusahaan pertamauntuk sistem operasi Linux.
Produk Sybase telah menemukan aplikasi luas, terutama dalam sistem komunikasikomersial, industri, dan militer. Operator telekomunikasi Spanyol Airtel menggunakan SybaseAdaptive Server IQ Multiplex (ASIQ) untuk standarisasi informasi bisnisnya. Telstra, penyediatelekomunikasi Australia, menggunakan data-visualisasi software didukung oleh Sybase ASIQMultiplex untuk mengoptimalkan kapasitas manajemen jaringan telepon mobile. Primarkmenggunakan Sybase MQSeries Integrator untuk memaksimalkan tingkat transaksi, mengoptimalkankehandalan, dan memungkinkan kustomisasi input dan output. Sybase mengklaim bahwa yangMQSeries Integrator memungkinkan untuk menambahkan format data baru untuk memenuhikebutuhan klien, dan untuk mengakomodasi arsitektur sistem yang beragam di lokasi klien. SybaseSQL Anywhere, tertanam dalam Geodyn FxView, digunakan dalam komunikasi dua arah antara pusat komando militer dan tentara di lapangan.
Kesimpulannya jadi, menurut pendapat saya vendor database
berkemampuan bisnis intellegent yang memiliki kualitas yang paling powerfull
adalah oracle karena pengerjaan data Oracle lah yang dapat mengerjakan data
dalam kala yang lebih besar karena memiliki kapasitas ruang memory yang
lebih besar.



