Sweta, I Nyoman (2025) STUDI KOMPARASI METODE SUPPORT VECTOR MACHINES DAN RANDOM FOREST UNTUK KLASIFIKASI KATA KERJA BAHASA JEPANG. Masters thesis, Universitas Pendidikan Ganesha.
![]() |
Text (2129101005-COVER)
2129101005-Cover.pdf Download (662kB) |
![]() |
Text (2129101005-ABSTRAK)
2129101005-Abstrak.pdf Download (211kB) |
![]() |
Text (2129101005-BAB 1 PENDAHULUAN)
2129101005-Bab 1 Pendahuluan.pdf Download (353kB) |
![]() |
Text (2129101005-BAB 2 KAJIAN TEORI)
2129101005-Bab 2 Kajian Teori.pdf Restricted to Repository staff only Download (490kB) | Request a copy |
![]() |
Text (2129101005-BAB 3 METODELOGI PENELITIAN)
2129101005-Bab 3 Metodelogi Penelitian.pdf Restricted to Repository staff only Download (577kB) | Request a copy |
![]() |
Text (2129101005-BAB 4 HASIL DAN PEMBAHASAN)
2129101005-Bab 4 Hasil dan Pembahasan.pdf Restricted to Repository staff only Download (664kB) | Request a copy |
![]() |
Text (2129101005-BAB 5 PENUTUP)
2129101005-Bab 5 Penutup.pdf Restricted to Repository staff only Download (228kB) | Request a copy |
![]() |
Text (2129101005-DAFTAR PUSTAKA)
2129101005-Daftar Pustaka.pdf Download (217kB) |
![]() |
Text (2129101005-LAMPIRAN)
2129101005-Lampiran.pdf Download (174kB) |
Abstract
Bahasa Jepang memiliki sistem konjugasi kata kerja yang kompleks, di mana akhiran -ru dapat muncul pada semua kelompok konjugasi (K1, K2, K3), sehingga menimbulkan ambiguitas, khususnya pada kata kerja baru hasil serapan atau pembentukan kreatif. Proses pelabelan kelompok kata kerja ini umumnya dilakukan oleh anotator, namun tingkat kesepakatan antar anotator (inter-annotator agreement) dilaporkan relatif rendah (κ ≈ 0,68) dan berpotensi menghasilkan label yang tidak konsisten. Penelitian ini bertujuan mengembangkan model klasifikasi kata kerja bahasa Jepang berbasis machine learning yang dapat dimanfaatkan sebagai alat rekomendasi label untuk membantu anotator meningkatkan konsistensi dan efisiensi pelabelan. Data yang digunakan berupa kata kerja dalam bentuk dasar (dictionary form) yang dipetakan ke tiga kelompok konjugasi utama (K1, K2, K3). Fitur yang digunakan adalah ciri morfologis sederhana, yaitu keberadaan akhiran -ru (ContainRU), satu huruf sebelum -ru (OcbRU), dan dua huruf sebelum -ru (TcbRU). Dua algoritma dibandingkan, yaitu Support Vector Machines (SVM) dan Random Forest (RF), dengan evaluasi menggunakan akurasi, precision, recall, F1-score, ROC-AUC, Log Loss, serta waktu pelatihan dan prediksi. Hasil penelitian menunjukkan bahwa kedua algoritma mencapai akurasi, precision, recall, dan F1-score sebesar 0,95. RF sedikit unggul pada ROC-AUC (0,9809 vs 0,9758), sedangkan SVM unggul pada Log Loss (0,2098 vs 0,3658), waktu pelatihan (0,1273 detik vs 0,147 detik), dan waktu prediksi (0,0068 detik vs 0,0077 detik). Berdasarkan kombinasi akurasi, reliabilitas probabilitas, dan efisiensi komputasi, SVM direkomendasikan sebagai algoritma yang lebih sesuai untuk mendasari alat rekomendasi label bagi anotator.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | Bahasa Jepang, Konjugasi Kata Kerja, Machine Learning, Support Vector Machines, Random Forest, Rekomendasi Label, Anotator |
Subjects: | L Education > L Education (General) |
Divisions: | Pascasarjana > Program Studi Ilmu Komputer (S2) |
Depositing User: | I Nyoman Sweta |
Date Deposited: | 12 Aug 2025 09:56 |
Last Modified: | 12 Aug 2025 09:56 |
URI: | http://repo.undiksha.ac.id/id/eprint/26893 |
Actions (login required)
![]() |
View Item |