Mengenal Data Science dari Data Scientist Gojek

Jendela Data kali ini mengangkat tema “The Role of Data Scientists at Gojek” simak keseruan webinar yang penuh dengan insight menarik dan bermanfaat bersama Hendra Hadhil Choiri, Data Scientist Gojek dan Dwi Gustin Nurdialit, Instruktur Data Science.

Bunga Dea Laraswati
Bunga Dea Laraswati

Table of Contents

Apakah saat ini Anda sedang mempertanyakan apakah prospek kerja data science semakin menjanjikan di tahun 2022? Jawabannya adalah iya. Bukan hanya menjanjikan tetapi juga kian diminati dan dibutuhkan oleh perusahaan. Saat ini, banyak perusahaan berbasis data membutuhkan lebih banyak talenta data. Linkedin mencatat, lowongan pekerjaan data science meningkat 46% sejak 2019 dan diperkirakan akan ada lebih dari 11 juta lowongan pekerjaan data scientist pada tahun 2026.

Demi memenuhi kebutuhan tersebut, diperlukan data scientist andal yang mampu memberikan banyak manfaat bagi perusahaan. Salah satu caranya dengan memberikan literasi data yang lebih baik lagi di seluruh Indonesia. Hal ini sejalan dengan visi Algoritma Data Science School, yaitu mendemokratisasi pembelajaran data science di Indonesia, Algoritma menjadi salah satu lembaga edukasi yang terus berkomitmen untuk menyebarkan ilmu data science dengan kualitas yang tinggi kepada sebanyak mungkin masyarakat di luar sana.

Jendela Data: “The Role of Data Scientists at Gojek”

Kali ini, Algoritma Data Science School bekerja sama dengan Gojek, mengadakan webinar untuk meningkatkan kesadaran organisasi dan individu akan manfaat memiliki keterampilan data science dan bagaimana menjadi data scientist yang sukses.

Webinar yang rutin diadakan Algoritma ini, biasa disebut dengan Jendela Data, mengangkat tema “The Role of Data Scientists at Gojek”. Gojek sebagai salah satu startup decacorn di indonesia telah berkontribusi terhadap ekonomi Indonesia mencapai Rp 249 triliun di tahun 2021. Tentunya SDM Gojek, termasuk data scientist, memiliki andil dalam kesuksesan ini. Mempelajari bagaimana peran data scientist di startup sekelas Gojek menjadi tema menarik dalam webinar, maka tak heran jika tercatat lebih dari 1300 peserta yang antusias untuk mengikuti webinar ini.

Panelis pada Jendela Data kali ini pun tidak main-main, Hendra Hadhil Choiri, data scientist Gojek yang telah berkecimpung di dunia data kurang lebih 7 tahun, dan salah satu instruktur data science terbaik Algoritma Data Science School, Dwi Gustin Nurdialit dengan lebih dari 200 jam pengalaman mengajar dan telah banyak terlibat dalam training data science untuk lembaga pemerintahan dan BUMN.

Materi Webinar yang Menarik

Materi yang disampaikan pada webinar kali ini sangat menarik, banyak sekali insight baru dari Dwi dan Hendra yang berguna dalam Data Science. Dari sini kita jadi semakin paham tentang gambaran data science dan penggunaan data science di perusahaan besar sekelas Gojek.

Kedua panelis tak sungkan berbagi tips untuk memulai karir sebagai data scientist sukses. Bahkan Hendra membocorkan skill apa saja yang dibutuhkan untuk menjadi talenta data di Gojek.

Instruktur Data Science Algoritma berbagi kunci sukses menjadi Data Scientist

Dwi berkesempatan untuk menyampaikan lebih dulu materinya, sebagai instruktur data science berpengalaman Dwi sangat tahu bagaimana cara membuat materi yang disampaikannya diterima dengan baik oleh para peserta, sehingga materi tentang data science ini jadi lebih mudah dimengerti.

Presentasi Dwi dibuka dengan menampilkan sebuah data dari tiap aplikasi yang seringkali digunakan dalam kehidupan sehari-hari. Ternyata setiap menitnya aplikasi-aplikasi tersebut menghasilkan banyak sekali data dengan berbagai macam tipe nya, contohnya Netflix dalam satu menit ada 28.000 subscriber yang sedang menonton netflix, pada instagram ada 695,000 story yang di share tiap menitnya, dan dalam satu menit juga ada 69 juta pesan yang terkirim melalui aplikasi whatsapp, itu hanyalah beberapa contoh dari banyaknya data yang tercipta di setiap menitnya. Kemudian Dwi menjelaskan bahwa dari sanalah tercipta yang namanya big data.

Sekata dengan Clive Humby, Dwi menjelaskan bahwa data sama berharganya dengan “Oil” jika kita mampu mengolahnya dengan baik maka data ini dapat bermanfaat untuk kehidupan layaknya oil.

Banyak stigma yang beredar bahwa data scientist hanya bisa mengorek data, menurut Dwi itu tidak benar, dari data yang dikumpulkan kemudian diolah akan ada banyak sekali output-output yang bermanfaat bagi kehidupan. Maka tak heran jika data science bisa masuk kedalam industri apapun. Dwi mencontohkan bagaimana implementasi data science di beberapa industri salah satunya industri travel, data science dapat digunakan mulai dari memprediksi harga tiket, hingga memprediksi apakah pesawat akan delay atau tidak.

Di penghujung presentasi Dwi berbagi tips mengenai bagaimana cara memulai karir sebagai data scientist sukses. Menurut Dwi Ada 5 hal penting yang harus dilakukan jika ingin menjadi data scientist:

  • Pelajari skill dasar data science, seperti ilmu komputer, matematika-statistika, dan business knowledge
  • Pelajari bahasa pemrograman, seperti Python, R, dan SQL untuk query data.
  • Buat project yang menarik dan bermanfaat
  • Buat portofolio dari project terbaik Anda
  • Apply for the job!

Dwi juga berpesan, jika saat proses belajar data science mengalami kendala jangan patah semangat, tetap semangat dan terus mencoba hingga akhirnya tercapai apa yang kita inginkan.

Data Scientist Gojek beberkan penggunaan Data Science pada Aplikasi Gojek

Bergabung bersama Gojek hampir 3 tahun banyak sekali hal menarik yang bisa Hendra bagikan dalam webinar. Dalam presentasinya Hendra memulai dengan menceritakan perjalanan karirnya. Selepas lulus dari ITB jurusan Teknik Informatika Hendra sudah memiliki basic programming dan database, sehingga untuk mengawali karirnya sebagai IT Analyst di PT Telekomunikasi Seluler (Telkomsel) tidaklah sulit.

“Sekarang ini jamannya data, kalo mau masa depan kamu cerah jadilah seorang Data Scientist. Belajarlah Data Science” ujar petinggi Telkomsel kepada Hendra.

Terinspirasi dari ucapan tersebut, Hendra semakin yakin mendalami data science hingga kini berlabuh sebagai data scientist di Gojek.

Sejak berdirinya Gojek, banyak sekali produk Gojek yang memudahkan kehidupan banyak orang. Dari ketiga produk utama Gojek (mobility, food delivery, logistics) menghasilkan banyak sekali data yang nantinya data tersebut diolah oleh Tim Data untuk menjadi suatu hal yang lebih bermanfaat untuk perkembangan perusahaan.

Hendra menyampaikan bahwa di Gojek, data scientist tidaklah berdiri sendiri, terdapat beberapa profesi lainnya yang menunjang keberhasilan dari Tim Data, yaitu BI atau Data Analyst, Decision Scientist, Data Scientist, Data Warehouse Engineer, Data Science Platform Engineer, dan Machine Learning Engineer.

Dalam proses pembuatan machine learning model di Gojek tidak terlalu jauh berbeda daripada umumnya. Hendra turut membagikan bagaimana proses pembuatannya beserta tools apa saja yang seringkali digunakan oleh Gojek

  • Sourcing data: Google BigQuery, Apache Kafka
  • Exploration & analysis: Python, Jupyter, Kubeflow
  • Data preprocessing & data cleansing: Python, Jupyter, Kubeflow
  • Scheduling & automation: Clockwork
  • Feature management & storage: Feast
  • Model training & evaluation: scikit learning
  • Model management & deployment: Merlin
  • Model serving & mentoring: Merlin
  • Experimentation: Turing

Selanjutnya Hendra menjelaskan implementasi data science di Gojek, ini menjadi part paling menarik dalam presentasi Hendra. Dari setiap project yang Hendra kerjakan, selalu diawali dari problem yang ada kemudian dicarikan solusinya dengan berbagai teknik, bukan sebaliknya, menemukan tekniknya terlebih dahulu padahal masalahnya sendiri sebenarnya tidak ada.

Implementasi Data Science di Aplikasi Gojek

Seperti 3 implementasi data science yang dijelaskan oleh Hendra, ketiganya diawali dengan sebuah problem dan kemudian  Hendra dan tim membuat penyelesaian masalahnya.

- Driver Allocation

Bagaimana memilihkan driver go-ride atau go-car yang tepat untuk penumpang, sehingga meminimalisir terjadinya cancel order dari driver dan tidak mendominasi pada satu driver tertentu atau tidak memprioritaskan driver lainnya. Sehingga order didapatkan secara adil.

Berawal dari permasalahan tersebut lahirlah Jaeger, Jaeger adalah Sistem untuk menentukan peringkat driver terdekat berdasarkan tujuannya. Jadi ketika ada pesanan, akan dideteksi siapa saja driver yang ada disekitar penumpang, kemudian dilakukan machine learning prediction, lalu dari skor yang dimiliki oleh driver akan diurutkan dari skor tertinggi hingga terendah, driver dengan skor tertinggi itulah yang nantinya akan lebih dulu mendapatkan order.

Dengan adanya model ini maka berdampak baik, seperti waktu penjemputan yang lebih cepat, potensi cancel order lebih kecil, order diberikan secara adil, dan pendapatan driver pun bertambah.

- Food Recommendations

Kita pasti seringkali bingung saat ingin memesan makanan, sehingga banyak waktu terbuang untuk memilih makanan dari sekian banyak pilihan makanan yang ada dalam aplikasi GoFood.

Berawal dari sana dibuatlah food recommendation, sehingga saat membuka aplikasi GoFood sudah tersedia beberapa rekomendasi menu makanan, sehingga lebih menghemat waktu dan membantu penjual untuk lebih mudah ditemukan dan meningkatkan pembelian dan pendapatan.

Caranya dengan mengubah setiap menu menjadi feature vector, melihat history pembelian untuk melihat makanan seperti apalagi yang akan membuat user tertarik, dan yang terakhir mencari penjual makanan yang serupa dengan riwayat user yang berada disekitar user.

- Inappropriate Menu Detection

Project yang terakhir ini cukup spesial karena ini adalah project yang langsung ditangani oleh Hendra. Inappropriate Menu Detection di GoFood untuk menghindari adanya menu yang tidak sesuai dan mencegah menu yang berpotensi menjadi viral.

Jika dulu ada tim yang bertugas melakukan cek satu per satu menu yang telah diupload oleh penjual dan me-remove secara manual inappropriate menu jika ditemukan. Kini dengan adanya INCA, Inappropriate Menu dapat di remove secara otomatis setelah dilakukan deteksi oleh INCA.

INCA terdiri dari dua model, yaitu INCA image dan INCA text. INCA image untuk mendeteksi berdasarkan gambar menunya, sedangkan INCA text untuk mendeteksi berdasarkan nama dan deskripsi menunya. Lalu dari 2 output (image dan text) tersebut akan digabungkan dan jika model merasa menu ini aman maka akan dilakukan auto approve, jika sebaliknya maka akan auto reject. Namun jika masih “abu-abu” maka akan diserahkan kepada tim terkait untuk dilakukan pengecekan manual.

Itulah tiga dari banyaknya implementasi yang telah dilakukan Gojek, pada kesempatan kali ini Hendra hanya membagikan tiga, namun dari tiga implementasi tersebut saja sudah sangat membuka mata bahwa betapa berpengaruh dan bermanfaatnya data science di dalam kehidupan kita.

Tentunya keinginan untuk menjadi data scientist seperti Hendra semakin memuncak, di penghujung presentasinya Hendra membagikan tips menjadi data scientist di Gojek dan skillset apa saja yang dibutuhkan, loh!

Bagi Hendra ada 4 poin penting untuk mewujudkan impian menjadi data scientist, ini tidak hanya berlaku bagi Anda yang baru saja switch career ke ranah data tapi berguna juga bagi Anda yang ingin naik level ke jenjang karir selanjutnya.

  • Tentukan tujuan. Gunakan Metode SMART (Specific, Measurable, Achievable, Relevant dan Timebound) untuk mencapai tujuanmu.
  • Catat apa yang harus dilakukan. Cari tahu langkah-langkah menjadi data scientist, pelajari skill apa saja yang dibutuhkan untuk menjadi data scientist.
  • Usahakan untuk memiliki mentor. Tidak harus mentor yang mahir dalam data science, carilah mentor yang sudah berpengalaman. Dari pengalamannya mentor akan membantu untuk mencapai tujuanmu.
  • Mengevaluasi target. Apakah yang sudah dilakukan semakin mendekatkan pada tujuan atau sebaliknya.

Tentunya 4 poin diatas akan semakin lengkap jika dibarengi dengan skillset yang terpenuhi, Hendra membagikan skillset apa saja yang dibutuhkan jika Anda ingin berkarir di Gojek, terutama untuk profesi data analyst, decision scientist dan data scientist

  • Data Analyst: Business Acumen, Business Agility, Data Wrangling, Storytelling
  • Decision Scientist: Business Acumen, Storytelling, Statistics, Behavioral Modeling
  • Data Scientist: Python, Machine Learning, Scale & Optimisation

Testimoni Peserta Webinar

Webinar yang diadakan pada tanggal 22 Juni 2022 silam ini memberikan banyak manfaat bagi para peserta. Banyak dari peserta yang mengaku mendapatkan wawasan baru seputar data science dan tertarik untuk mempelajari data science lebih dalam lagi setelah mengikuti Jendela Data: “The Role of Data Scientists at Gojek”

“Acara webinar sangat bagus, bermanfaat sekali dan sangat luar biasa acaranya karena pemaparan materi dari narasumber, terima kasih buat narasumber dan panitia”  ujar Irwandi

“Sangat tertarik mengenal bahkan berkecimpung lebih jauh di dunia data science” ujar Ikhromi.

Bagi Anda yang tidak sempat mengikuti Jendela Data kemarin, tidak perlu khawatir karena Algoritma Data Science School akan terus mengadakan webinar dengan para panelis yang ahli di bidang data dari berbagai industri. Nantikan informasi selengkapnya di sini!

Get Free Learning Resources

* indicates required
Highlights

Bunga Dea Laraswati

Sr. Writer Algoritma Data Science School