Mengenal Kelemahan dan Kelebihan Naive Bayes
Apa saja kelemahan dan kelebihan Naive Bayes? Naive Bayes adalah algoritma machine learning (ML) yang dapat dimanfaatkan untuk menyelesaikan masalah klasifikasi. Disebut dengan Naive Bayes karena prinsip kerjanya menerapkan Teorema Bayes. Ini merupakan salah satu algoritma ML paling sederhana, namun juga terkuat, yang digunakan untuk menemukan aplikasi di banyak industri. Lantas, bagaimana cara kerja, kelemahan, dan kelebihan Naive Bayes ini?
Mengenal Apa Itu Naive Bayes
Naive Bayes menerapkan Teorema Bayes. Algoritma ini tergolong simpel, namun kuat, bahkan disaat machine learning (ML) berkembang pesat seperti sekarang ini. Naive Bayes terbukti menjadi solusi yang cepat, akurat, dan andal.
Membangun model Naive Bayes tidaklah rumit, tapi dapat diterapkan pada kumpulan data yang luas. Selain itu, algoritma ini populer untuk mengalahkan banyak teknik klasifikasi tingkat lanjut dalam hal performa, terutama jika Anda menerapkannya pada masalah NLP (natural language processing).
Cara Kerja Naive Bayes
Seperti yang telah disebutkan, Naive Bayes menerapkan Teorema Bayes, sebuah formula matematika sederhana yang digunakan untuk probabilitas bersyarat (conditional probability). Nah, probabilitas bersyarat adalah ukuran probabilitas suatu peristiwa yang akan terjadi karena peristiwa lain telah terjadi. Ini bisa berupa asumsi, praduga, pernyataan, maupun bukti. Berikut adalah formulanya:
Formula di atas memberi tahu bahwa seberapa sering A terjadi jika B terjadi, sehingga ditulis P(A|B) disebut juga probabilitas posterior. Jadi, saat diketahui seberapa sering B terjadi jika A terjadi, akan ditulis P(B|A) dan seberapa besar kemungkinan A itu sendiri, ditulis P(A) dan seberapa kemungkinan B ditulis P(B). Dalam istilah yang lebih sederhana, Teorema Bayes adalah cara untuk menemukan probabilitas ketika Anda sudah mengetahui probabilitas tertentu lainnya.
Sebagai algoritma, Naive Bayes bisa dijadikan alat untuk mengasumsikan sesuatu. Katakanlah sistem Anda akan menganggap sebuah benda adalah bantal jika berbentuk persegi dan bertekstur empuk. Diasumsikan bahwa setiap fitur adalah independen. Misalnya, bentuk persegi benda tidak ada hubungannya dengan tekstur.
Hal ini memberi setiap fitur tingkat kepentingan yang sama. Artinya, jika fitur-fitur yang ada saling membutuhkan, mereka semua berkontribusi secara independen terhadap asumsi Anda.
Kelemahan dan Kelebihan Naive Bayes
Lalu, apa saja kelebihan dan kelemahan dari algoritma Naive Bayes ini? Pertama-tama, mari membahas kelebihannya terlebih dulu.
- Kelebihan Naive Bayes
kelebihan utama dari Naive Bayes adalah model yang sederhana, namun dapat bersaing dengan model algoritma lainnya. Implementasinya pun tidak terlalu rumit, cocok untuk mengevaluasi probabilitas bersyarat.
Selain itu, penerapannya pun sangat cepat dan ada iterasi. Sebab, probabilitas dapat langsung dihitung. Jadi, algoritma ini berguna saat Anda membutuhkan kecepatan pelatihan yang tinggi. Terlebih jika asumsi independensi bersyarat berlaku, bisa dipastikan akan memberi hasil yang bagus.
- Kelemahan Naive Bayes
Sekarang, mari membahas tentang kelemahan Naive Bayes. Algoritma ini menerapkan asumsi independensi bersyarat, sayangnya hal ini tidak selalu berlaku. Dalam kebanyakan situasi, fitur yang ada justru menunjukkan beberapa bentuk dependensi.
Kelemahan lainnya terletak pada masalah probabilitas. Naive Bayes memiliki masalah probabilitas nol, terutama saat Anda menemukan kata-kata dalam data pengujian untuk kelas tertentu yang tidak ada dalam data pelatihan. Kemungkinan besar Anda akan berakhir dengan probabilitas “Zero Frequency”. Meski begitu, probabilitas nol ini dapat diatasi dengan smoothing (teknik penghalusan). Tambahkan faktor penghalusan pada pembilang dan penyebut setiap probabilitas untuk menghindari munculnya nilai nol.
Algoritma ini juga terkenal sebagai estimator yang buruk. Jadi, Anda tidak bisa menganggap hasil probabilitas 'predict_proba' terlalu serius. Sebab, semua fitur yang ada diasumsikan sebagai fitur independen. Namun, dalam situasi nyata, rangkaian fitur independen ini sulit ditemukan.
Kesimpulan
Algoritma Naive Bayes sebagian besar digunakan dalam analisis sentimen, penyaringan spam, hingga sistem rekomendasi. Model algoritma ini cepat dan mudah untuk diimplementasikan, tapi kelemahan terbesarnya adalah memerlukan persyaratan prediktor untuk independen. Namun, dalam sebagian besar kasus nyata, prediktor bergantung bisa menghambat kinerja pengklasifikasi.
Bagi Anda yang tertarik untuk mempelajari mengenai Naive Bayes dan model algoritma lainnya, bisa mengambil kelas data science di Algoritma Data Science School. Kami menawarkan pembelajaran data science, baik untuk individu maupun perusahaan dan karyawannya. Ini memungkinkan Anda untuk dapat meraih keuntungan yang lebih baik dari data serta terhubung dengan data scientist yang telah berpengalaman dalam industri.
Referensi:
- upGrad - Naive Bayes Explained: Function, Advantages & Disadvantages, Applications in 2022 (diakses pada 23 Juni 2022)
- Machine Learning Interviews - Naive Bayes Classifier: Advantages and Disadvantages (diakses pada 23 Juni 2022)
- KDnuggets - Naïve Bayes Algorithm: Everything You Need to Know (diakses pada 23 Juni 2022)
- Towards Data Science - Naive Bayes Classifier. What is a classifier? (diakses pada 23 Juni 2022)