Star Schema: Olah Data yang Dibutuhkan Business Intelligence
Saat ini perusahaan semakin bergantung pada informasi yang dihasilkan dari kehebatan teknologi. Memahami cara memindahkan, menyimpan, dan menangani data dengan benar menjadi semakin penting setiap tahunnya. Jika perusahaan Anda telah mengetahui cara yang lebih baik untuk mengatur dan memproses data perusahaan, maka Anda juga perlu mempelajari lebih lanjut tentang Star Schema (skema bintang) vs Snowflake Schema (skema kepingan salju), dan susunan relasional antara kedua jenis skema Data Warehouse ini. Kali ini kita akan membahas tentang Star Scheme.
Apa itu Star Schema?
Star Schema atau skema bintang menawarkan struktur paling sederhana untuk mengatur data ke dalam Data Warehouse. Pusat skema bintang terdiri dari satu atau beberapa " tabel fakta " yang mengindeks serangkaian " tabel dimensi ." Untuk memahami skema bintang penting untuk melihat secara mendalam pada dua tabel terpisah dari tabel fakta dan tabel dimensi .
Tujuan skema bintang adalah untuk menyisihkan data "fakta" numerik yang berkaitan dengan bisnis dan memisahkannya dari data deskriptif, atau "dimensi". Data fakta akan mencakup informasi seperti harga, berat, kecepatan, dan kuantitas—yaitu, data dalam format numerik. Data dimensi akan mencakup hal-hal yang tak terhitung seperti warna, nama model, lokasi geografis, nama karyawan, nama penjual, dll.
Data fakta akan diatur ke dalam tabel fakta dan data dimensi ke dalam tabel dimensi . Tabel fakta adalah titik integrasi di pusat Star Scheme di Data Warehouse. Mereka memungkinkan tools Machine Learning menganalisis data sebagai satu unit, dan juga memungkinkan sistem bisnis lain untuk mengakses data bersama-sama. Tabel dimensi menyimpan dan mengelola data—numerik dan nonnumerik—yang menyatu melalui tabel fakta yang membentuk Data Warehouse.
Karakteristik Star Schema
Dalam membuat star schema, kita harus memahami karakteristiknya juga. Beberapa karakteristik utama skema bentuk bintang ini adalah:
- Struktur yang sederhana dan mudah dipahami.
- Jumlah tabel tidak begitu banyak.
- Semua dimensi dalam skema bentuk bintang direpresentasikan hanya menggunakan tabel satu dimensi.
- Dapat digunakan oleh beragam business intelligence tools.
Kelebihan Star Schema
Dengan karakteristik seperti itu pastinya memberikan kelebihan yang memudahkan banyak penggunanya.
- Query lebih sederhana
Menurut Global Knowledge Management Center (GKMC) dari David Eccles School of Business University of Utah, star schema adalah model yang memiliki jumlah tabel sedikit serta join path yang jelas. Oleh karena itu, query bisa dijalankan lebih cepat dibanding sistem online analytical processing (OLTP).
Untuk query kecil, proses bisa dijalankan secara instan. Sementara, query besar yang membutuhkan pengolahan beberapa tabel hanya membutuhkan beberapa detik atau menit.
- Waktu Loading
Karena memiliki struktur yang sederhana, salah satu keutamaan star schema merupakan kecepatan load-nya. Meskipun satu skema memuat data yang banyak, kamu bisa memangkas waktu banyak dibanding menggunakan database lainnya.
- Referential integrity
Skema ini memiliki referential integrity yaitu keakuratan dan konsistensi data yang baik ketika di-load.
- Mudah dimengerti
Navigasi dan pemahaman menggunakan star schema tidaklah sulit dan lebih mudah dibanding yang lainnya. Oleh karena itu, skema ini sering digunakan.
Kekurangan Star Schema
Dibalik kelebihan itu tentunya ada kekurangan juga pada skema berbentuk bintang seperti berikut ini:
- Integritas data
Salah satu kekurangan yang paling utama dari star schema adalah mengenai integritas data. Banyak yang setuju bahwa skema ini kurang memiliki integritas data yang kurang baik, karena data yang diolah biasanya belum dinormalisasi.
- Kurang fleksibel
Selain integritas data, kekurangan lainnya yaitu fleksibilitasnya. Skema ini lebih cocok untuk melihat data saja. Oleh karena itu, analisis yang terlalu kompleks tidak bisa dilakukan.
Itulah pembahasan mengenai skema bintang, skema yang terkenal mudah terutama untuk Data Warehouse. Jika Anda tertarik mempelajari data lebih jauh lagi, Anda dapat bergabung bersama Algoritma dengan mengikuti Training Data Science sesuai kebutuhan Anda.