Grammar of Graphics dalam ggplot2 dan Cara Kerjanya

Mengenal package ggplot2 yang dirancang berdasarkan grammar of graphics. Benarkah dapat digunakan untuk visualisasi data? Bagaimana cara kerjanya? Simak selengkapnya disini!

Bunga Dea Laraswati
Bunga Dea Laraswati

Table of Contents

ggplot2 adalah salah satu package yang terdapat dalam bahasa pemrograman R. Package yang satu ini identik dengan grafik statistik. Berbeda dari kebanyakan package, ggplot2 memiliki tata bahasa yang mendasarinya. Ini memungkinkan Anda untuk bisa membuat grafik dengan menggabungkan beberapa komponen independen. Lalu, bagaimanakah penggunaannya dalam data science? Untuk menjawab pertanyaan tersebut, mari simak penjelasan berikut.

Apa Itu ggplot2?

ggplot2 adalah package yang digunakan untuk menghasilkan grafik statistik. Package ini dapat digunakan untuk membuat grafik baru yang disesuaikan dengan kebutuhan tertentu. Sebab, ggplot2 memiliki tata bahasa yang mendasarinya, yaitu grammar of graphics.

ggplot2 menghasilkan grafik yang indah dan mampu menangani detail rumit seperti menggambar legenda. Hanya dengan pengaturan default, Anda bahkan sudah dapat menghasilkan visualisasi data berkualitas dalam hitungan detik saja. Namun, jika memang memerlukan pemformatan khusus, ggplot2 memiliki sistem tema yang komprehensif. Hasilnya, grafik tidak sekadar menarik, tapi juga mampu menyampaikan pesan dengan baik.

Cara Kerja ggplot2

ggplot2 bekerja dalam beberapa lapisan. Pekerjaan dimulai dengan lapisan yang menunjukkan data mentah, kemudian ditambah dengan lapisan anotasi dan ringkasan statistik. Ini memungkinkan Anda menghasilkan grafik dengan pemikiran terstruktur yang juga digunakan ketika merancang analisis pada tahap selanjutnya.

Metode penambahan lapisan ini membuat ggplot memiliki fleksibilitas tinggi karena Anda bisa selalu menyesuaikan plot. Selain itu, perlu diingat bahwa plot ggplot2 bekerja paling baik dengan data mentah dalam format “panjang”, yaitu format kolom untuk tiap variabel dan format baris untuk tiap pengamatan.

Data yang terstruktur dengan baik akan menghemat banyak waktu Anda saat menggunakan ggplot2. Berikut adalah template paling dasar untuk membangun plot (bisa digunakan untuk berbagai tipe plot):

ggplot(data = <DATA>, mapping = aes(<MAPPINGS>)) +  <GEOM_FUNCTION>()

Mengenal Grammar of Graphics dalam ggplot2

Poin sebelumnya telah sedikit menyinggung tentang grammar of graphics sebagai tata bahasa yang mendasari ggplot2. Namun, sebenarnya apa itu grammar of graphics? Istilah ini pertama kali diperkenalkan oleh Leland Wilkinson, seorang ahli statistik dan komputer.

Wilkinson menciptakan grammar of graphics untuk menggambarkan fitur dasar yang mendasari semua grafik statistik. ggplot2 dibangun di atas tata bahasa Wilkinson dengan berfokus pada keunggulan lapisan dan mengadaptasinya dalam bahasa R. Singkatnya, tata bahasa ini menunjukkan bahwa grafik memetakan data ke atribut estetika (warna, bentuk, ukuran) dari objek geometris (titik, garis, batang).

Plot yang ada di dalamnya dapat mencakup transformasi statistik dari data dan informasi tentang sistem koordinat plot. Untuk menentukan plot subset data yang berbeda, Anda bisa menggunakan fitur faceting. Kombinasi dari komponen-komponen independen inilah yang nantinya akan membentuk sebuah grafik.

Apa Fungsi ggplot2 dalam Data Science?

Package suatu bahasa pemrograman pada dasarnya merupakan kumpulan fungsi serta datasets yang dibuat dan diulang oleh pengguna bahasa. Dalam bahasa pemrograman R, ada banyak sekali package yang punya kegunaannya masing-masing. Di CRAN (Comprehensive R Archive Network) saja, Anda bisa menemukan lebih dari 10.000 packages yang siap untuk diunduh.

Package ggplot2 sendiri digunakan untuk meningkatkan fungsionalitas visualisasi data. Sebenarnya, Anda sudah bisa memvisualisasikan data dengan basis R, namun ggplot2 menghadirkan lebih banyak fleksibilitas dan kontrol atas visualisasi mereka.

Namun, perlu diingat, package yang dibuat oleh Hadley Wickham pada tahun 2005 ini tidak menggambarkan grafik interaktif atau dengan kata lain, hanya grafik statis saja. Pada dasarnya, tidak ada perbedaan antara grafik ggplot2 di layar komputer dan versi cetaknya di selembar kertas.

Kesimpulan

ggplot2 merupakan suatu package dari bahasa pemrograman R yang disusun berdasarkan grammar of graphics dari Leland Wilkinson. Package ini sendiri diperkenalkan oleh Hadley Wickham pada tahun 2005. Fungsi ggplot2 dalam data science secara garis besar adalah untuk visualisasi data. Jika dibandingkan dengan basis R, ggplot2 menawarkan fleksibilitas yang jauh lebih baik.

Tertarik untuk mempelajari lebih jauh tentang bahasa pemrograman R dan packages yang ada di dalamnya? Mempelajari bahasa pemrograman adalah fondasi yang baik untuk mendalami data science. Algoritma Data Science School menawarkan kelas mengenai data science dan tentunya materi mengenai bahasa pemrograman. Kami menyediakan kelas individual maupun pelatihan untuk perusahaan. Untuk informasi selengkapnya, silakan klik di sini!

Referensi:

  • Algoritma Data Science School on Instagram – ggplot2 dan Fungsinya (diakses 4 Agustus 2022)
  • ggplot2 Bookdown – ggplot2: Elegant Graphics for Data Analysis (diakses 4 Agustus 2022)
  • Data Carpentry – Data visualization with ggplot2 (diakses 4 Agustus 2022)
  • ggplot2 R Studio – Create Elegant Data Visualisations Using the Grammar (diakses 4 Agustus 2022)
  • Data Novia – Data Visualization using ggplot2 (diakses 4 Agustus 2022)

Get Free Learning Resources

* indicates required
Insights

Bunga Dea Laraswati

Sr. Writer Algoritma Data Science School


Upcoming Workshop