Sentiment Analysis of Bali's Rapid Tourism Growth: Comparing IndoBERT Performance with InSet Lexicon and Manual Label Integration

Artalia, Ni Ketut Artini (2026) Sentiment Analysis of Bali's Rapid Tourism Growth: Comparing IndoBERT Performance with InSet Lexicon and Manual Label Integration. Undergraduate thesis, Universitas Pendidikan Ganesha.

[img] Text (COVER)
2215091072-COVER.pdf

Download (12MB)
[img] Text (ABSTRAK)
2215091072-ABSTRAK.pdf

Download (250kB)
[img] Text (BAB I PENDAHULUAN)
2215091072-BAB 1 PENDAHULUAN.pdf

Download (416kB)
[img] Text (BAB 2 KAJIAN TEORI)
2215091072-BAB 2 KAJIAN TEORI.pdf
Restricted to Repository staff only

Download (455kB) | Request a copy
[img] Text (BAB 3 METODELOGI PENELITIAN)
2215091072-BAB 3 METODELOGI PENELITIAN.pdf
Restricted to Repository staff only

Download (4MB) | Request a copy
[img] Text (BAB 4 HASIL DAN PEMBAHASAN)
2215091072-BAB 4 HASIL DAN PEMBAHASAN.pdf
Restricted to Repository staff only

Download (1MB) | Request a copy
[img] Text (BAB 5 PENUTUP)
2215091072-BAB 5 PENUTUP.pdf
Restricted to Repository staff only

Download (195kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
2215091072-DAFTAR PUSTAKA.pdf

Download (256kB)
[img] Text (LAMPIRAN)
2215091072-LAMPIRAN.pdf

Download (1MB)

Abstract

Pertumbuhan pesat pariwisata di Bali memicu beragam opini publik, khususnya di TikTok, yang sering kali menampilkan perdebatan intens dan berpotensi memengaruhi citra Bali sebagai destinasi pariwisata berkelanjutan. Untuk memahami fenomena ini, penelitian ini melakukan analisis sentimen terhadap opini publik di TikTok dengan menggunakan metode Bidirectional Encoder Representations from Transformers, khususnya IndoBERT yang dirancang untuk data berbahasa Indonesia. Proses pelabelan data dilakukan melalui dua pendekatan, yaitu pelabelan manual oleh ahli dan pelabelan otomatis berbasis leksikon menggunakan InSet Lexicon, guna mengevaluasi pengaruh kualitas label terhadap performa model serta efisiensi waktu dan sumber daya. Penelitian ini menerapkan empat skenario pengujian, yaitu: (1) pelabelan manual dengan IndoBERT, (2) pelabelan InSet Lexicon dengan IndoBERT, (3) pelabelan manual dengan Random Over Sampling (ROS) dan IndoBERT, serta (4) pelabelan InSet Lexicon dengan ROS dan IndoBERT. Hasil penelitian menunjukkan bahwa skenario keempat menghasilkan performa terbaik dengan akurasi sebesar 75,06%, dan meningkat menjadi 81,83% setelah dilakukan proof of concept dengan menghapus kata slang. Selain itu, hasil analisis sentimen menunjukkan bahwa opini masyarakat cenderung bersifat netral. Temuan ini mengindikasikan bahwa pelabelan otomatis berbasis InSet Lexicon yang dikombinasikan dengan teknik penyeimbangan data efektif dalam meningkatkan kinerja model sekaligus efisien dalam proses anotasi. Kata Kunci: Analisis Sentiment, IndoBERT, InSet Lexicon, Random Over Sampling, Bali, TikTok.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Analisis Sentiment, IndoBERT, InSet Lexicon, Random Over Sampling, Bali, TikTok
Subjects: L Education > L Education (General)
T Technology > T Technology (General)
Divisions: Fakultas Teknik dan Kejuruan > Jurusan Teknik Informatika > Program Studi Sistem Informasi (S1)
Depositing User: NI KETUT ARTINI ARTALIA
Date Deposited: 27 Apr 2026 04:56
Last Modified: 27 Apr 2026 04:56
URI: http://repo.undiksha.ac.id/id/eprint/29058

Actions (login required)

View Item View Item