Ardiansyah, Dede (2024) ANALISIS KARAKTERISTIK RESAMPLING SMOTE, SMOTE-ENN, DAN BORDERLINE-SMOTE BERDASARKAN NILAI SILHOUETTE COEFFICIENT. Masters thesis, Universitas Pendidikan Ganesha.
Text (COVER)
2229101054-COVER.pdf Download (1MB) |
|
Text (ABSTRAK)
2229101054-ABSTRAK.pdf Download (262kB) |
|
Text (BAB 1 PENDAHULUAN)
2229101054-BAB 1 PENDAHULUAN.pdf Download (591kB) |
|
Text (BAB 2 KAJIAN TEORI)
2229101054-BAB 2 KAJIAN TEORI.pdf Restricted to Repository staff only Download (3MB) | Request a copy |
|
Text (BAB 3 METODELOGI PENELITIAN)
2229101054-BAB 3 METODELOGI PENELITIAN.pdf Restricted to Repository staff only Download (892kB) | Request a copy |
|
Text (BAB 4 HASIL DAN PEMBAHASAN)
2229101054-BAB 4 HASIL DAN PEMBAHASAN.pdf Restricted to Repository staff only Download (3MB) | Request a copy |
|
Text (BAB 5 PENUTUP)
2229101054-BAB 5 PENUTUP.pdf Restricted to Repository staff only Download (355kB) | Request a copy |
|
Text (DAFTAR PUSTAKA)
2229101054-DAFTAR PUSTAKA.pdf Download (382kB) |
|
Text (LAMPIRAN)
2229101054-LAMPIRAN.pdf Download (1MB) |
Abstract
Penelitian ini berfokus pada permasalahan ketidakseimbangan data dalam pembelajaran mesin, yang dapat menyebabkan model bias terhadap kelas yang lebih umum dan menurunkan akurasi untuk kelas yang kurang umum. Hal ini dapat mengakibatkan hasil yang tidak akurat dan tidak dapat diandalkan. Tujuan penelitian ini adalah untuk menganalisis karakteristik metode resampling SMOTE, SMOTE-ENN, dan Borderline-SMOTE berdasarkan nilai Silhouette Coefficient. Silhouette Coefficient adalah metrik yang digunakan untuk mengevaluasi kualitas pembentukan kelas yang sering digunakan untuk mengevaluasi hasil klasterisasi, menentukan jumlah klaster optimal, dan membandingkan algoritma klasterisasi. Penelitian ini menggunakan dataset yang telah dimodifikasi menjadi distribusi kelas yang tidak seimbang, yang kemudian di-resampling menggunakan ketiga metode tersebut. Resampling yang baik adalah meningkatkan kelas minoritas, menjaga Silhouette Coefficient tinggi, mengurangi outlier, dan memastikan akurasi model stabil. Hasil penelitian menunjukkan bahwa metode SMOTE-ENN, yang menggabungkan teknik SMOTE dengan Edited Nearest Neighbor (ENN), menghasilkan kelas yang lebih seimbang berdasarkan jumlah outlier, nilai shillouette yang dihasilkan. Metode ini lebih unggul dibandingkan SMOTE, yang meningkatkan jumlah sampel kelas minoritas melalui interpolasi tetapi cenderung menciptakan kelas yang terlalu ketat dan kurang bervariasi, serta Borderline-SMOTE, yang efektif dalam menangani kasus di perbatasan kelas namun kadang meningkatkan risiko overfitting pada dataset yang sangat bervariasi.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | Pembelajaran mesin, Ketidakseimbangan data, Resampling data, SMOTE, SMOTE-ENN, Borderline-SMOTE, Silhouette Coefficient |
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Pascasarjana > Program Studi Ilmu Komputer (S2) |
Depositing User: | Dede Ardiansyah |
Date Deposited: | 26 Dec 2024 13:33 |
Last Modified: | 26 Dec 2024 13:33 |
URI: | http://repo.undiksha.ac.id/id/eprint/22665 |
Actions (login required)
View Item |