KLASIFIKASI TEKS BERITA BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES MELALUI KOMBINASI LAVENSTEIN DISTANCE DAN TERJEMAHAN KATA BAHASA INGGRIS-INDONESIA

Kusuma, Wira (2020) KLASIFIKASI TEKS BERITA BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES MELALUI KOMBINASI LAVENSTEIN DISTANCE DAN TERJEMAHAN KATA BAHASA INGGRIS-INDONESIA. Masters thesis, Universitas Pendidikan Ganesha.

[img] Text (COVER)
1729101029-COVER.pdf

Download (311kB)
[img] Text (ABSTRAK)
1729101029-ABSTRAK.pdf

Download (225kB)
[img] Text (BAB 1 PENDAHULUAN)
1729101029-BAB 1 PENDAHULUAN.pdf

Download (151kB)
[img] Text (BAB 2 KAJIAN TEORI)
1729101029-BAB 2 KAJIAN TEORI.pdf
Restricted to Repository staff only

Download (412kB) | Request a copy
[img] Text (BAB 3 METODELOGI PENELITIAN)
1729101029-BAB 3 METODELOGI PENELITIAN.pdf
Restricted to Repository staff only

Download (345kB) | Request a copy
[img] Text (BAB 4 HASIL DAN PEMBAHASAN)
1729101029-BAB 4 HASIL DAN PEMBAHASAN.pdf
Restricted to Repository staff only

Download (507kB) | Request a copy
[img] Text (BAB 5 PENUTUP)
1729101029-BAB 5 PENUTUP.pdf
Restricted to Repository staff only

Download (117kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
1729101029-DAFTAR PUSTAKA.pdf

Download (202kB)
[img] Text (LAMPIRAN)
1729101029-LAMPIRAN.pdf

Download (1MB)

Abstract

Penelitian ini bertujuan membandingkan tingkat akurasi dan kecepata proses klasifikasi antara algoritma Naive Bayes dan algoritma Naive Bayes dengan beberapa modifikasi. Modifikasi yang dimaksud adalah dengan penambahan proses perubahan kata menggunakan algoritma Levenhstein Distance dan terjemahan kata dalam bahasa Inggris ke dalam kata dasar berbahasa Indonesia yang dilakukan pada tahap preprosesnya. Data latih dan data uji yang digunakan diambil dari sebuah situs berita online yang terdiri dari 7 kategori berita yang telah ditentukan, kemudian dilakukan preproses teks sebelum dilakukannya tahap klasifikasi teks. Untuk mengukur tingkat akurasi, precision dan recall, digunakan sebuah metode yang bernama confusion matrix. Secara berturut-turut dalam lima kali percobaan yang telah dilakukan, rata-rata algoritma Naive Bayes setiap kategori adalah Fenomena (76,46%), Film (71,04%), Internet (69,92%), Keuangan (65,67%), Musik (58,29%), Olahraga (97,54%), Otomotif (88,88%), dan sedangkan algoritma Naive Bayes Modifikasi adalah sebesar Fenomena (98,50%), Film (95,04%), Internet (98,25%), Keuangan (94,79%), Musik (87,08%), Olahraga (95,29%), Otomotif (95,29%). Hasil rata-rata yang diperoleh untuk akurasi klasifikasi Naive Bayes adalah 75,40% sedangkan untuk algoritma Naive Bayes Modifikasi adalah 94,95%. Kecepatan proses untuk klasifikasi Naive Bayes sebesar 0,16870 detik dan Naive Bayes Modifikasi adalah 0,13512 detik. Peningkatan waktu proses terjadi hanya 19,91%, hal ini dipengaruhi oleh jumlah kata yang digunakan dan pengukuran kecepatan proses dilakukan saat klasifikasi saja dan bukan saat preproses berlangsung. Penelitian selanjutnya dapat dikembangkan dengan mencoba algoritma perubahan kata lainnya dan pembaharuan kamus data kata asing atau kata tertentu yang tidak diubah karena telah memiliki makna tersendiri.

Item Type: Thesis (Masters)
Uncontrolled Keywords: algoritma naive bayes, modifikasi algoritma, klasifikasi teks
Subjects: Q Science > QA Mathematics > QA76 Computer software
Divisions: Pascasarjana > Program Studi Ilmu Komputer (S2)
Depositing User: I Gede Wira Kusuma Jaya
Date Deposited: 23 Oct 2020 02:15
Last Modified: 23 Oct 2020 02:15
URI: http://repo.undiksha.ac.id/id/eprint/3941

Actions (login required)

View Item View Item