Indrajid, Fransesko (2026) Implementasi Normalisasi Teks Integratif Berbasis Leksikon dan Word Embedding FastText pada Pemodelan Topik Isu IndonesiaGelap di Platform X. Undergraduate thesis, Universitas Pendidikan Ganesha.
|
Text (COVER)
2115091048-COVER.pdf Download (507kB) |
|
|
Text (ABSTRAK)
2115091048-ABSTRAK.pdf Download (18MB) |
|
|
Text (BAB 1 PENDAHULUAN)
2115091048-BAB 1 PENDAHULUAN.pdf Download (18MB) |
|
|
Text (BAB 2 KAJIA N PUSTAKA DAN LANDASAN TEORI)
2115091048-BAB 2 KAJIAN PUSTAKA DAN LANDASAN TEORI.pdf Restricted to Repository staff only Download (18MB) | Request a copy |
|
|
Text (BAB 3 METODE PENELITIAN)
2115091048-BAB 3 METODE PENELITIAN.pdf Restricted to Repository staff only Download (18MB) | Request a copy |
|
|
Text (BAB 4 HASIL DAN PEMBAHASAN)
2115091048-BAB 4 HASIL DAN PEMBAHASAN.pdf Restricted to Repository staff only Download (18MB) | Request a copy |
|
|
Text (BAB 5 PENUTUP)
2115091048-BAB 5 PENUTUP.pdf Restricted to Repository staff only Download (18MB) | Request a copy |
|
|
Text (DAFTAR PUSTAKA)
2115091048-DAFTAR PUSTAKA.pdf Download (18MB) |
|
|
Text (LAMPIRAN)
2115091048-LAMPIRAN.pdf Download (18MB) |
Abstract
Fenomena "IndonesiaGelap" mencuat pada awal tahun 2025 sebagai respons publik terhadap Instruksi Presiden Nomor 1 Tahun 2025 dan menjadi simbol keresahan kolektif masyarakat terhadap kondisi sosial-politik nasional di platform X. Tingginya intensitas percakapan yang dinamis dan penggunaan bahasa tidak baku (slang) menjadi tantangan utama dalam mengekstraksi informasi dari data media sosial tersebut. Penelitian ini bertujuan untuk memodelkan topik isu "IndonesiaGelap" menggunakan algoritma Latent Dirichlet Allocation (LDA) dengan menerapkan strategi normalisasi teks integratif. Pendekatan ini menggabungkan leksikon gabungan dan word embedding FastText untuk menangani permasalahan sparsity dan kata-kata out-of-vocabulary (OOV). Dari total 57.533 data mentah yang dikumpulkan, sebanyak 48.735 tweet digunakan dalam pemodelan setelah melalui tahap prapemrosesan. Hasil penelitian berhasil mengidentifikasi enam topik dominan, yaitu: (1) Kebijakan, Program, dan Revisi UU, (2) Sumber Daya, Korupsi, Pajak, dan Penderitaan Rakyat, (3) Pemilu, Pemimpin, Kekuasaan, dan Demokrasi, (4) Aksi Mahasiswa dan Wacana Publik, (5) Dukungan Moral dan Solidaritas Massa, serta (6) Kecaman Moral dan Religius terhadap Aparat. Evaluasi model menunjukkan bahwa skenario normalisasi integratif menghasilkan kinerja terbaik dengan skor Topic Coherence tertinggi sebesar 0.4770 dan Perplexity yang stabil pada 1388.25. Validitas hasil diperkuat melalui evaluasi berbasis manusia (human-centered evaluation), yang mencatatkan akurasi Word Intrusion sebesar 92.22% dan Topic Intrusion sebesar 86.67%. Capaian ini membuktikan bahwa integrasi leksikon dan FastText efektif dalam meningkatkan kualitas representasi topik pada data informal, menghasilkan wacana yang koheren, distinktif, dan dapat diinterpretasikan secara logis sesuai konteks isu yang sebenarnya.
| Item Type: | Thesis (Undergraduate) |
|---|---|
| Uncontrolled Keywords: | IndonesiaGelap, Latent Dirichlet Allocation, Topic Modeling, Normalisasi Teks, FastText, Leksikon |
| Subjects: | T Technology > T Technology (General) |
| Divisions: | Fakultas Teknik dan Kejuruan > Jurusan Teknik Informatika > Program Studi Sistem Informasi (S1) |
| Depositing User: | FRANSESKO INDRAJID |
| Date Deposited: | 28 Jan 2026 00:06 |
| Last Modified: | 28 Jan 2026 00:06 |
| URI: | http://repo.undiksha.ac.id/id/eprint/27831 |
Actions (login required)
![]() |
View Item |
