PERBANDINGAN KINERJA EKSTRAKSI FITUR TF-IDF DAN BOW DALAM SENTIMEN ANALISIS BPJS KESEHATAN DENGAN ALGORITMA XGBOOST

Maharani, Made Donita (2026) PERBANDINGAN KINERJA EKSTRAKSI FITUR TF-IDF DAN BOW DALAM SENTIMEN ANALISIS BPJS KESEHATAN DENGAN ALGORITMA XGBOOST. Undergraduate thesis, Universitas Pendidikan Ganesha.

[img] Text (COVER)
2115091065-COVER.pdf

Download (457kB)
[img] Text (ABSTRAK)
2115091065-ABSTRAK.pdf

Download (303kB)
[img] Text (BAB 1 PENDAHULUAN)
2115091065-BAB 1 PENDAHULUAN.pdf

Download (338kB)
[img] Text (BAB 2 KAJIAN TEORI)
2115091065-BAB 2 KAJIAN TEORI.pdf
Restricted to Repository staff only

Download (470kB) | Request a copy
[img] Text (BAB 3 METODELOGI PENELITIAN)
2115091065-BAB 3 METODELOGI PENELITIAN.pdf
Restricted to Repository staff only

Download (564kB) | Request a copy
[img] Text (BAB 4 HASIL DAN PEMBAHASAN)
2115091065-BAB 4 HASIL DAN PEMBAHASAN.pdf
Restricted to Repository staff only

Download (2MB) | Request a copy
[img] Text (BAB 5 PENUTUP)
2115091065-BAB 5 PENUTUP.pdf
Restricted to Repository staff only

Download (313kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
2115091065-DAFTAR PUSTAKA.pdf

Download (272kB)
[img] Text (LAMPIRAN)
2115091065-LAMPIRAN.pdf

Download (5MB)

Abstract

BPJS Kesehatan merupakan salah satu layanan publik terbesar di Indonesia dan sering menjadi topik pembahasan masyarakat di platform media sosial. Berbagai opini yang muncul, baik berupa apresiasi maupun keluhan, mencerminkan persepsi pengguna terhadap kualitas layanan yang diberikan. Oleh karena itu, analisis sentimen diperlukan untuk memahami kecenderungan opini masyarakat tersebut. Penelitian ini bertujuan untuk melakukan klasifikasi sentimen terhadap opini pengguna BPJS Kesehatan yang diambil dari platform X (Twitter), serta membandingkan kinerja dua metode ekstraksi fitur, yaitu Term Frequency–Inverse Document Frequency (TF-IDF) dan Bag of Words (BoW) menggunakan algoritma XGBoost. Data dikumpulkan melalui proses scraping data, dilanjutkan dengan pelabelan manual oleh validator ahli, serta preprocessing. Pembobotan kata dilakukan menggunakan TF-IDF dan BoW sebelum data dianalisis menggunakan model XGBoost pada tujuh skenario pengujian. Hasil pengujian menunjukkan bahwa metode TF-IDF unggul pada metrik akurasi dan presisi dengan nilai masing-masing 78,63% dan 70,30%, sedangkan BoW lebih unggul pada recall dan F1-score dengan nilai 70,23% dan 69,14%. Hal ini menunjukkan bahwa TF-IDF lebih efektif dalam meningkatkan ketepatan prediksi melalui pembobotan kata yang selektif, sementara BoW lebih mampu menangkap variasi data sentimen secara lebih luas. Dengan demikian, kedua metode memiliki keunggulan masing-masing sesuai dengan karakteristik evaluasi yang digunakan.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Analisis sentimen, BPJS Kesehatan, TF-IDF, BoW, XGBoost
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
T Technology > T Technology (General)
Divisions: Fakultas Teknik dan Kejuruan > Jurusan Teknik Informatika > Program Studi Sistem Informasi (S1)
Depositing User: Made Donita Maharani
Date Deposited: 26 Jan 2026 09:12
Last Modified: 26 Jan 2026 09:12
URI: http://repo.undiksha.ac.id/id/eprint/27756

Actions (login required)

View Item View Item