Algoritma Naive Bayes
Algoritma Naive Bayes adalah kumpulan algoritma pembeda berdasarkan teorema Bayes dengan prinsip probabilitas bersyarat.
data-analytics
Apa itu Algoritma Naive Bayes?
Dikutip dari Geeks for Geeks, algoritma Naive Bayes atau disebut juga dengan Naive Bayes Classifiers adalah kumpulan algoritma pembeda berdasarkan teorema Bayes.
Sebelum membahas lebih lanjut mengenai algoritma Naive Bayes, ada dua hal yang perlu diketahui terlebih dahulu yaitu apa itu algoritma dan teorema Bayes.
Dikutip dari Indicative, algoritma adalah prosedur atau formula yang disusun secara sistematis untuk membantu komputer memecahkan masalah. Naive Bayes adalah salah satu algoritma yang digunakan komputer untuk melakukan tugas tertentu.
Cara kerja algoritma Naive Bayes diatur teorema Bayes yang bekerja sesuai prinsip probabilitas bersyarat (conditional probability). Probabilitas bersyarat merepresentasikan suatu probabilitas atau peluang dari suatu peristiwa, yang mengacu pada peristiwa terkait yang telah terjadi.
Salah satu contoh konsep probabilitas bersyarat sederhana adalah pelemparan dua buah koin. Setiap koin memiliki dua sisi, yaitu angka dan gambar. Jadi ketika dua koin dilempar bersamaan, ada kemungkinan keduanya menunjukkan sisi yang sama atau berbeda.
Diketahui ruang sampelnya adalah sebagai berikut:
- Koin 1 = angka; Koin 2 = gambar
- Koin 1 = angka; Koin 2 = angka
- Koin 1 = gambar; Koin 2 = angka
- Koin 1 = gambar; Koin 2 = gambar
Jika menghitung probabilitasnya, maka probabilitas (P) kedua koin yaitu:
- Peluang kedua koin menunjukkan dua gambar = 1/4
- Peluang salah satu koin menunjukkan angka = 3/4
- Peluang koin kedua menunjukkan angka, dan koin pertama adalah gambar= ½
- Peluang koin kedua menunjukkan gambar, dan koin pertama adalah angka = ½
Kemudian untuk mengetahui berapa peluang koin pertama menunjukkan angka (kejadian A), dan koin kedua menunjukkan gambar (kejadian B), maka bisa menggunakan rumus probabilitas bersyarat berikut ini:
P(A|B) = [ P(Koin pertama angka dan koin kedua adalah gambar) * P(Koin kedua gambar) ] / P(Koin pertama angka)
P(A|B) = [ (1/2) * (1/2) ] / (1/2)
P(A|B) = 1/2 = 0,5
Berdasarkan penghitungan, maka probabilitas bersyaratnya adalah ½ atau jika didesimalkan menjadi 0,5.
Manfaat Algoritma Naive Bayes
Naive Bayes termasuk dalam keluarga algoritma penambangan data, yang mengubah kumpulan data yang sangat besar menjadi informasi yang berguna.
Berikut ini beberapa kegunaan algoritma Naive Bayes:
- Mengidentifikasi wajah dan fitur-fitur wajah, seperti mata, hidung, mulut, dan alis.
- Memprediksi cuaca.
- Membantu dokter mendiagnosis risiko penyakit pasien, seperti kanker atau penyakit jantung.
- Digunakan pada Google News untuk mengelompokkan suatu berita, misalnya berita tentang politik, hiburan, gaming, atau edukasi.
- Pada e-mail, algoritma Naive Bayes digunakan untuk mengklasifikasikan apakah pesan yang masuk adalah spam atau tidak.
- Menggunakan data fMRI, algoritma Naive Bayes dapat memprediksi berbagai kondisi kognitif manusia dan menemukan cedera otak.
Tipe Algoritma Naive Bayes
Dirangkum dari IBM, ada berbagai macam algoritma Naive Bayes yang dibedakan berdasarkan distribusi nilai. Tiga tipe algoritma Naive Bayes yang populer yaitu:
- Gaussian Naive Bayes (GaussianNB)
Varian algoritma Naive Bayes yang menggunakan distribusi Gaussian (distribusi normal) dan variabel kontinu. Model ini digunakan untuk mencari rata-rata dan standar deviasi dari masing-masing kelas.
- Multinomial Naive Bayes (MultinomialNB)
Jenis algoritma ini mengasumsikan bahwa fitur berasal dari distribusi multinomial.
Varian ini berguna saat menggunakan data diskrit, seperti jumlah frekuensi, dan biasanya diterapkan dalam kasus penggunaan pemrosesan bahasa alami (natural language processing/NLP), seperti klasifikasi spam pada e-mail.
- Bernoulli Naive Bayes (BernoulliNB)
Varian ini menggunakan variabel Boolean, yaitu variabel dengan dua nilai, seperti Benar dan Salah atau 1 dan 0.
Contoh Penerapan Algoritma Naive Bayes
Contoh penerapan algoritma Naive Bayes adalah untuk memprediksi keputusan pembelian seseorang dengan kombinasi hari, diskon, dan promo gratis ongkir. Kategori hari dibagi menjadi tiga yaitu weekday, weekend, dan hari besar atau hari libur nasional.
Katakanlah ada 30 orang yang menjadi sample dalam penghitungan ini. Berdasarkan data, ditemukan informasi seperti pada gambar berikut:
- 19 partisipan memutuskan untuk membeli jika ada diskon, dan 5 orang tetap membeli walau tidak ada diskon.
- 1 partisipan memutuskan untuk tidak membeli walaupun ada diskon, dan 5 orang tidak membeli jika tidak ada diskon.
- 21 orang memutuskan untuk membeli jika ada gratis ongkir, dan 3 orang tetap membeli walau tidak ada gratis ongkir.
- 2 partisipan memutuskan untuk tidak membeli walaupun ada gratis ongkir, dan 4 orang tidak membeli jika tidak ada gratis ongkir.
- Jumlah partisipan yang membeli di weekday lebih banyak dibandingkan di hari libur dan weekend.
Dengan informasi di atas, pemilik bisnis bisa menggunakan algoritma Naive Bayes untuk mengetahui peluang pembeli jika ada penawaran diskon dan gratis ongkir pada ketiga hari tersebut, dan mana hari yang paling banyak pembelinya.
FAQ (Frequently Asked Question)
Kapan Naive Bayes Digunakan?
Algoritma Naive Bayes dianggap sebagai salah satu algoritma pengklasifikasi yang sederhana, cepat, dan bekerja secara efisien.
Dengan prinsip probabilitas bersyaratnya, Naive Bayes paling cocok digunakan untuk memecahkan masalah multi-kelas dengan variabel input kategori daripada numerik, seperti pada contoh kasus yang telah dibahas sebelumnya.
Mulai karirmu dalam
data-analytics
Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!