ANALISIS KARAKTERISTIK RESAMPLING SMOTE, SMOTE-ENN, DAN BORDERLINE-SMOTE BERDASARKAN NILAI SILHOUETTE COEFFICIENT

Ardiansyah, Dede (2024) ANALISIS KARAKTERISTIK RESAMPLING SMOTE, SMOTE-ENN, DAN BORDERLINE-SMOTE BERDASARKAN NILAI SILHOUETTE COEFFICIENT. Masters thesis, Universitas Pendidikan Ganesha.

[img] Text (COVER)
2229101054-COVER.pdf

Download (1MB)
[img] Text (ABSTRAK)
2229101054-ABSTRAK.pdf

Download (262kB)
[img] Text (BAB 1 PENDAHULUAN)
2229101054-BAB 1 PENDAHULUAN.pdf

Download (591kB)
[img] Text (BAB 2 KAJIAN TEORI)
2229101054-BAB 2 KAJIAN TEORI.pdf
Restricted to Repository staff only

Download (3MB) | Request a copy
[img] Text (BAB 3 METODELOGI PENELITIAN)
2229101054-BAB 3 METODELOGI PENELITIAN.pdf
Restricted to Repository staff only

Download (892kB) | Request a copy
[img] Text (BAB 4 HASIL DAN PEMBAHASAN)
2229101054-BAB 4 HASIL DAN PEMBAHASAN.pdf
Restricted to Repository staff only

Download (3MB) | Request a copy
[img] Text (BAB 5 PENUTUP)
2229101054-BAB 5 PENUTUP.pdf
Restricted to Repository staff only

Download (355kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
2229101054-DAFTAR PUSTAKA.pdf

Download (382kB)
[img] Text (LAMPIRAN)
2229101054-LAMPIRAN.pdf

Download (1MB)

Abstract

Penelitian ini berfokus pada permasalahan ketidakseimbangan data dalam pembelajaran mesin, yang dapat menyebabkan model bias terhadap kelas yang lebih umum dan menurunkan akurasi untuk kelas yang kurang umum. Hal ini dapat mengakibatkan hasil yang tidak akurat dan tidak dapat diandalkan. Tujuan penelitian ini adalah untuk menganalisis karakteristik metode resampling SMOTE, SMOTE-ENN, dan Borderline-SMOTE berdasarkan nilai Silhouette Coefficient. Silhouette Coefficient adalah metrik yang digunakan untuk mengevaluasi kualitas pembentukan kelas yang sering digunakan untuk mengevaluasi hasil klasterisasi, menentukan jumlah klaster optimal, dan membandingkan algoritma klasterisasi. Penelitian ini menggunakan dataset yang telah dimodifikasi menjadi distribusi kelas yang tidak seimbang, yang kemudian di-resampling menggunakan ketiga metode tersebut. Resampling yang baik adalah meningkatkan kelas minoritas, menjaga Silhouette Coefficient tinggi, mengurangi outlier, dan memastikan akurasi model stabil. Hasil penelitian menunjukkan bahwa metode SMOTE-ENN, yang menggabungkan teknik SMOTE dengan Edited Nearest Neighbor (ENN), menghasilkan kelas yang lebih seimbang berdasarkan jumlah outlier, nilai shillouette yang dihasilkan. Metode ini lebih unggul dibandingkan SMOTE, yang meningkatkan jumlah sampel kelas minoritas melalui interpolasi tetapi cenderung menciptakan kelas yang terlalu ketat dan kurang bervariasi, serta Borderline-SMOTE, yang efektif dalam menangani kasus di perbatasan kelas namun kadang meningkatkan risiko overfitting pada dataset yang sangat bervariasi.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Pembelajaran mesin, Ketidakseimbangan data, Resampling data, SMOTE, SMOTE-ENN, Borderline-SMOTE, Silhouette Coefficient
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions: Pascasarjana > Program Studi Ilmu Komputer (S2)
Depositing User: Dede Ardiansyah
Date Deposited: 26 Dec 2024 13:33
Last Modified: 26 Dec 2024 13:33
URI: http://repo.undiksha.ac.id/id/eprint/22665

Actions (login required)

View Item View Item