Dapatkan Tiket Liburan Murah dengan Dashboard Airlines Fare Prediction
Yuk, kenalan dengan Calvin, salah satu alumni Algoritma Data Science School dari Batch Phoenix. Dengan Background yang sejalan dengan Data Science, yaitu Jurusan Mathematics and Computer Science di BINUS University, Calvin sangat bersemangat mewujudkan Dashboard yang dapat bermanfaat untuk hobi jalan-jalannya. Calvin memberi nama Dashboard-nya dengan Airlines Fare Prediction with Random Forest.
Siapa disini yang tidak suka jalan-jalan? rasanya hampir semua dari kita pasti suka jalan-jalan atau liburan. The Amazing Race, sebuah reality show terkenal asal Amerika, nampaknya cukup menginspirasi Calvin hingga akhirnya memiliki hobi traveling. Hanya saja, tidak jarang hobinya cukup menguras kantong terutama dalam biaya transportasi atau harga tiket yang kerap kali membuat budget traveling-nya membengkak, hingga terpikirkanlah untuk memanfaatkan teknologi machine learning dan mencoba memprediksikan pengeluaran dalam jalan-jalannya supaya lebih efektif lagi.
Hal ini didukung dengan survei yang dilakukan valuepinguin.com, yang mengungkapkan bahwa transportasi adalah salah satu pengeluaran terbesar para traveler saat berlibur, selain akomodasi. Dari berbagai moda transportasi, Calvin memilih untuk meneliti tiket pesawat dibandingkan moda transportasi lain, karena tiket pesawat biasanya memiliki harga yang lebih malah dibanding yang lain.
Dataset Penerbangan Jerman dan Random Forest
Calvin menggunakan Dataset yang berasal dari data-data 84 penerbangan di Jerman, yang diambil pada tahun 2019 sampai tahun 2020. Di dalamnya terdiri dari keberangkatan, kedatangan (tanggal, hari, dan waktu) kota tujuan, Airline, pemberhentian destinasi, harga tiket, dan additional info. Dataset ini dipastikan akan lebih relevan lagi saat ini, setelah pandemi lebih stabil.
Sedangkan Algoritma Machine Learning yang Calvin gunakan adalah Random Forest. Sebenarnya ada beberapa algoritma yang menjadi pertimbangannya, namun setelah diuji lebih jauh ternyata tingkat error dari Algoritma Random Forest paling sedikit diantara yang lain, yaitu hanya sebesar 12,9%, bahkan setelah menggunakan metode yang kompleks dan beberapa Decision Tree yang dirata-ratakan membutuhkan waktu training sekitar 4-7 jam.
Berikut beberapa Algoritma yang gagal diterapkan dalam Dashboard Calvin beserta alasannya:
- Time-series: Data tanggalnya terlalu menyebar dan kurang lengkap.
- Multiple Regression: Meski menggunakan rumus-rumus matematika statistik, tingkat errornya mencapai 35%.
- Neural Network: Meski mampu meniru sistem saraf manusia dengan berbagai parameternya, sayang sekali errornya masih di atas 50%.
Cara Memprediksi Tiket Pesawat Murah dengan Dashboard Airline Fare Prediction
Sebelum melihat bagaimana cara kerja dashboard buatan Calvin, mari kita lihat amunisi yang Calvin gunakan untuk membuat Dashboardnya menjadi powerfull. Amunisi yang digunakan oleh Calvin adalah Bahasa pemrograman R dan beberapa Package (tidyverse, readxl, lubridate, ggplot2, dan plotly).
Cara menggunakan Dashboard ini cukup gampang, hanya dengan lima langkah Anda langsung mendapatkan hasil rekomendasi terbaik:
- Buka halaman Airline Fare Prediction,
- Masukkan periode tanggal keberangkatan,
- Tentukan Jam keberangkatan yang diinginkan,
- Masukkan kota keberangkatan dan kota tujuan,
- Tentukan maskapai yang diinginkan, jika tidak diisi, dashboard akan menampilkan semua kombinasi airline yang tersedia,
- Masukkan Budget Range, angka minimal hingga maksimal,
- Output akan muncul
Output Dashboard Airline Fare Prediction
Hebatnya, tidak hanya satu Output yang diberikan Dashboard ini melainkan ada tiga Output yang akan semakin memudahkan Anda dalam memilih tiket pesawat terbaik.
- Top 3 Recommendations
Output ini berisi tiga harga terbaik, tanggal keberangkatan terbaik, dan Airline Carrier mana yang menyediakan tiket pesawat tersebut. Jika Anda tidak menyukai beberapa Airline Carrier yang telah direkomendasikan, Anda dapat melihat di plot selanjutnya.
- Best Airlines in Terms of Average Prices
Output ini berisi maksimal lima Airline terbaik dari segi harga rata-rata tiketnya. Sehingga Anda bisa membandingkan beberapa Airline tersebut hingga menemukan yang sesuai dengan keinginan Anda. Jika, rekomendasi Airline terbaik tadi masih belum cocok, Anda dapat melihat di plot selanjutnya.
- Top 10 Best Prices
Output ini berisi rekomendasi Airline dengan harga terbaik diantara seluruh Airline yang tersedia dari tanggal, jam, dan tujuan keberangkatan yang telah Anda pilih.
Interactive Plots untuk Bandingkan Harga Tiket dengan Variabel Lainnya
Selain dari Prediksi tiket pesawat, dari dashboard ini Anda dapat menemukan beberapa interaktif plotting yang dapat Anda gunakan untuk menggali insight lebih, melalui variabel-variabel seperti rute, Airline dan Time Seasonality yang nantinya dapat Anda bandingkan dengan harga tiket pesawat.
- Rute
Pada variabel ini Anda akan melihat Airline mana yang memiliki rute paling panjang untuk menuju lokasi tujuan Anda, misalnya apakah sebuah maskapai yang memiliki rute panjang adalah maskapai premium yang tentunya memasang harga tinggi untuk satu tiketnya. Anda dapat menggali insight lebih jauh melalui dashboard ini.
- Airline
Pada variabel ini Anda akan melihat detail maskapai yang Anda akan pilih, misalnya Anda dapat melihat maskapai mana yang hanya menyediakan business class saja atau maskapai dengan low budget mana yang paling banyak diminati penumpang sehingga dapat sesuai dengan budget range Anda.
- Time Seasonality
Pada variabel ini Anda dapat melihat pola musiman, dari sini Anda akan melihat di hari dan jam mana saja yang biasanya padat penumpang dan mematok harga tiket yang lebih tinggi dari biasanya.
Harapannya Dashboard ini dapat bermanfaat tidak hanya untuk dirinya dan para traveller atau penumpang pesawat, tetapi juga dapat digunakan untuk jasa penyedia layanan travel, seperti traveloka atau tiket.com yang menjadi perantara antara konsumen dan penyedia jasa penerbangan untuk memprediksi time seasonality dan menentukan harga, promo, dan diskon.
Nah, itulah dashboard yang dibuat oleh Calvin pada student project-nya setelah mengikuti program pembelajaran bersama Algoritma Data Science School. Jika Anda ingin mengetahui lebih lanjut project yang Reynaldi buat Anda bisa mengunjungi Github dan LinkedIn Reynaldi dan jika Anda tertarik mengikuti jejak Reynaldi, let’s start your data science journey with Algoritma!