Mengenal Regresi Logistik dan Penggunaannya di Berbagai Sektor Pekerjaan

Untuk memprediksi data dengan outcome ya/tidak, logistic regression dapat menjadi salah satu tool yang tepat.

Bunga Dea Laraswati
Bunga Dea Laraswati

Table of Contents

Ketika bekerja dalam dunia data analytics, ada banyak tools dan teknik yang mungkin Anda pakai. Salah satu tipe analisis yang umum digunakan dalam data analytics adalah regresi logistik atau logistic regression.

Logistic regression adalah bagian dari regression analysis, yakni sebuah tipe teknik modeling prediktif yang digunakan untuk menemukan hubungan antara satu variabel dependen dengan satu variabel independen lain atau serangkaian variabel independen. Tipe analisis ini umumnya dipakai untuk memprediksi berbagai hal. Lalu, apa itu logistic regression? Bagaimana penggunaannya di berbagai sektor pekerjaan?

Apa Itu Regresi Logistik?

Logistic regression adalah algoritma klasifikasi yang digunakan untuk memprediksi binary outcome berdasarkan set variabel independen. Artinya, hanya akan ada dua skenario yang terjadi, baik terjadi (1) atau tidak terjadi (0). Variabel independen sendiri merupakan variabel atau faktor yang mungkin memengaruhi outcome.

Regresi logistik umumnya digunakan saat mengolah dengan data biner. Ciri-ciri data biner adalah data yang outputnya merupakan jawaban ya atau tidak, lulus atau gagal, dan sebagainya.

Tipe-tipe Regresi Logistik

Logistic regression sendiri sebenarnya tidak hanya berhenti pada data biner meskipun lebih sering digunakan untuk itu. Ada tiga tipe logistic regression yang mungkin Anda perlu ketahui.

1. Binary logistic regression

Tipe logistic regression ini merupakan teknik yang digunakan untuk memprediksi hubungan antara variabel dependen (Y) dan variabel independen (X), dengan variabel dependen berupa data biner. Hasil analisis berupa hasil biner seperti Sukses/Gagal, 0/1, Benar/Salah, atau Ya/Tidak.

2. Multinomial logistic regression

Berikutnya adalah tipe logistic regression yang digunakan ketika Anda memiliki satu kategori variabel dependen dan dua atau lebih level yang tidak terurut. Tipe ini sangat mirip dengan logistic regression tipe biner. Bedanya, dengan tipe ini Anda dapat memiliki lebih dari dua outcome.

Misalnya, Anda ingin memprediksi tipe transportasi yang paling sering dipakai pada tahun 2030. Tipe transportasi berperan sebagai variabel dependen, sedangkan output yang mungkin muncul bisa berupa kereta api, bis, sepeda motor, atau lainnya.

3. Ordinal logistic regression

Tipe terakhir ini digunakan ketika variabel dependen berupa data urutan (ordinal). Variabel dependen memiliki urutan dengan lebih dari dua kategori atau tingkatan. Contoh variabelnya adalah ukuran kaos (XS/S/M/L/SL), jawaban dalam sebuah survei (Setuju, Tidak Setuju, Netral), atau skor sebuah tes (Buruk, Rata-rata, Baik).

Mengapa Regresi Logistik Itu Penting?

Seperti yang sudah disebut sebelumnya, regresi logistik umumnya digunakan untuk memprediksi apa yang terjadi dengan outcome ya/tidak. Pada dasarnya, ada sejumlah alasan mengapa logistic regression itu penting dan hal tersebut tergantung dari kasus yang dihadapinya. Logistic regression mampu mendeteksi data anomali, prediksi penyakit, hingga kinerja karyawan selama bekerja di satu tempat.

Penggunaan Regresi Logistik dalam Berbagai Sektor Pekerjaan

Logistic regression ternyata banyak dipakai di beberapa sektor perusahaan. Berikut ini adalah beberapa contoh kasus penggunaan logistic regression dalam berbagai sektor.

1. Bank/Financial Entity

Binary logistic regression dapat membantu bankir untuk melakukan penilaian risiko kredit. Bankir biasanya butuh untuk mengidentifikasi bagaimana sikap seseorang terhadap pinjaman. Sikap tersebut akan dikenali untuk mengidentifikasi risiko kredit baik atau buruk.

Misalkan Anda punya 850 data pelanggan, 700 di antaranya sudah menerima pinjaman. Data dari 700 pelanggan ini dapat Anda gunakan untuk membuat model logistic regression dan mengklasifikasi 150 pelanggan lain sebagai pelanggan dengan risiko baik atau buruk.

2. Medis

Dalam dunia medis, pendekatan analisis ini dapat digunakan untuk memprediksi hubungan suatu penyakit dalam satu populasi. Organisasi kesehatan dapat mengatur perawatan preventif untuk masing-masing individu yang menunjukkan risiko terpapar lebih besar untuk penyakit tertentu.

3. Keamanan

Logistic regression juga dapat digunakan untuk mengidentifikasi anomali data yang menjadi dasar penilaian suatu tindak penipuan. Sejumlah kebiasaan atau karakter yang memiliki kaitan erat dengan tindak penipuan dapat segera diantisipasi, sehingga sangat berguna bagi tim keamanan untuk melindungi nasabah. Perusahaan berbasis SaaS bahkan mulai banyak yang mengadopsi praktik ini untuk mengeliminasi akun palsu dalam dataset mereka ketika melakukan analisis data.

Kesimpulan

Regresi logistik atau logistic regression digunakan untuk mengklasifikasi masalah-masalah yang memiliki output biner. Logistic regression memiliki tiga tipe analisis berbeda, sehingga penting bagi Anda untuk menentukan tipe yang tepat untuk data yang Anda miliki. Ia dapat diterapkan di berbagai bidang sebagai cara untuk memprediksi sebuah kejadian penting, baik diharapkan maupun tidak.

Tentu masih banyak contoh penerapan lain dari kegunaan regresi logistik. Untuk mendalaminya, Anda bisa bergabung dengan Algoritma Data Science School. Tersedia berbagai kelas data science yang dapat Anda pilih sesuai kebutuhan maupun level keahlian. Mari gabung sekarang juga!

Get Free Learning Resources

* indicates required
Insights

Bunga Dea Laraswati

Sr. Writer Algoritma Data Science School