Kusuma, Wira (2020) KLASIFIKASI TEKS BERITA BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES MELALUI KOMBINASI LAVENSTEIN DISTANCE DAN TERJEMAHAN KATA BAHASA INGGRIS-INDONESIA. Masters thesis, Universitas Pendidikan Ganesha.
Text (COVER)
1729101029-COVER.pdf Download (311kB) |
|
Text (ABSTRAK)
1729101029-ABSTRAK.pdf Download (225kB) |
|
Text (BAB 1 PENDAHULUAN)
1729101029-BAB 1 PENDAHULUAN.pdf Download (151kB) |
|
Text (BAB 2 KAJIAN TEORI)
1729101029-BAB 2 KAJIAN TEORI.pdf Restricted to Repository staff only Download (412kB) | Request a copy |
|
Text (BAB 3 METODELOGI PENELITIAN)
1729101029-BAB 3 METODELOGI PENELITIAN.pdf Restricted to Repository staff only Download (345kB) | Request a copy |
|
Text (BAB 4 HASIL DAN PEMBAHASAN)
1729101029-BAB 4 HASIL DAN PEMBAHASAN.pdf Restricted to Repository staff only Download (507kB) | Request a copy |
|
Text (BAB 5 PENUTUP)
1729101029-BAB 5 PENUTUP.pdf Restricted to Repository staff only Download (117kB) | Request a copy |
|
Text (DAFTAR PUSTAKA)
1729101029-DAFTAR PUSTAKA.pdf Download (202kB) |
|
Text (LAMPIRAN)
1729101029-LAMPIRAN.pdf Download (1MB) |
Abstract
Penelitian ini bertujuan membandingkan tingkat akurasi dan kecepata proses klasifikasi antara algoritma Naive Bayes dan algoritma Naive Bayes dengan beberapa modifikasi. Modifikasi yang dimaksud adalah dengan penambahan proses perubahan kata menggunakan algoritma Levenhstein Distance dan terjemahan kata dalam bahasa Inggris ke dalam kata dasar berbahasa Indonesia yang dilakukan pada tahap preprosesnya. Data latih dan data uji yang digunakan diambil dari sebuah situs berita online yang terdiri dari 7 kategori berita yang telah ditentukan, kemudian dilakukan preproses teks sebelum dilakukannya tahap klasifikasi teks. Untuk mengukur tingkat akurasi, precision dan recall, digunakan sebuah metode yang bernama confusion matrix. Secara berturut-turut dalam lima kali percobaan yang telah dilakukan, rata-rata algoritma Naive Bayes setiap kategori adalah Fenomena (76,46%), Film (71,04%), Internet (69,92%), Keuangan (65,67%), Musik (58,29%), Olahraga (97,54%), Otomotif (88,88%), dan sedangkan algoritma Naive Bayes Modifikasi adalah sebesar Fenomena (98,50%), Film (95,04%), Internet (98,25%), Keuangan (94,79%), Musik (87,08%), Olahraga (95,29%), Otomotif (95,29%). Hasil rata-rata yang diperoleh untuk akurasi klasifikasi Naive Bayes adalah 75,40% sedangkan untuk algoritma Naive Bayes Modifikasi adalah 94,95%. Kecepatan proses untuk klasifikasi Naive Bayes sebesar 0,16870 detik dan Naive Bayes Modifikasi adalah 0,13512 detik. Peningkatan waktu proses terjadi hanya 19,91%, hal ini dipengaruhi oleh jumlah kata yang digunakan dan pengukuran kecepatan proses dilakukan saat klasifikasi saja dan bukan saat preproses berlangsung. Penelitian selanjutnya dapat dikembangkan dengan mencoba algoritma perubahan kata lainnya dan pembaharuan kamus data kata asing atau kata tertentu yang tidak diubah karena telah memiliki makna tersendiri.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | algoritma naive bayes, modifikasi algoritma, klasifikasi teks |
Subjects: | Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Pascasarjana > Program Studi Ilmu Komputer (S2) |
Depositing User: | I Gede Wira Kusuma Jaya |
Date Deposited: | 23 Oct 2020 02:15 |
Last Modified: | 23 Oct 2020 02:15 |
URI: | http://repo.undiksha.ac.id/id/eprint/3941 |
Actions (login required)
View Item |