Dharmana, I Wayan (2024) Klasifikasi Transaksi Fraud Kartu Kredit Menggunakan Oversampling ADASYN dan Seleksi Fitur SVM-RFECV. Masters thesis, Universitas Pendidikan Ganesha.
Text (COVER)
2029101007-COVER.pdf Download (861kB) |
|
Text (ABSTRAK)
2029101007-ABSTRAK.pdf Download (83kB) |
|
Text (BAB 1 PENDAHULUAN)
2029101007-BAB 1 PENDAHULUAN.pdf Download (234kB) |
|
Text (BAB 2 KAJIAN TEORI)
2029101007-BAB 2 KAJIAN TEORI.pdf Restricted to Repository staff only Download (483kB) | Request a copy |
|
Text (BAB 3 METODELOGI PENELITIAN)
2029101007-BAB 3 METODELOGI PENELITIAN.pdf Restricted to Repository staff only Download (707kB) | Request a copy |
|
Text (BAB 4 HASIL DAN PEMBAHASAN)
2029101007-BAB 4 HASIL DAN PEMBAHASAN.pdf Restricted to Repository staff only Download (2MB) | Request a copy |
|
Text (BAB 5 PENUTUP)
2029101007-BAB 5 PENUTUP.pdf Restricted to Repository staff only Download (95kB) | Request a copy |
|
Text (DAFTAR PUSTAKA)
2029101007-DAFTAR PUSTAKA.pdf Download (222kB) |
|
Text (LAMPIRAN)
2029101007-LAMPIRAN.pdf Download (78kB) |
Abstract
Perkembangan kejahatan transaksi fraud kartu kredit memberikan dampak kerugian finansial bagi pemegang kartu. Pengembangan model prediksi transaksi fraud menggunakan machine learning telah dilakukan namun memiliki beberapa tantangan meliputi ketidakseimbangan data serta dimensi dataset yang cukup besar. Penelitian ini mengusulkan pendekatan dengan seleksi fitur dengan SVM-RFECV dan metode oversampling menggunakan ADASYN. Pembagian data latih dilakukan dengan beberapa rasio data latih meliputi 70%, 80% dan 90%. Data latih yang telah dibagi dilakukan seleksi fitur untuk mendapatkan sejumlah variabel paling optimal sesuai kontribusi terhadap variabel dependen (isFraud). Seleksi fitur menghasilkan variabel optimal dengan rincian 390 variabel pada data latih 70%, 400 variabel pada data latih 80%, dan 390 variabel pada data latih 90%. Tahapan oversampling dengan ADASYN dilakukan pada strategi oversampling 100%, 50% dan 25%. Data latih yang telah dilakukan oversampling dilakukan analisis uji kualitas data menggunakan histogram distribusi dan silhouette index. Uji klasifikasi dilakukan menggunakan algoritma AdaBoost dan LGBM dengan metrik kinerja AUC, precision, recall dan f1 score. Berdasarkan analisis dan evaluasi strategi oversampling, strategi dengan data latih 80%, data uji 20%, rasio oversampling 100% dengan algoritma LGBM menjadi strategi yang direkomendasikan berdasarkan analisis kualitas data dan kinerja AUC yang optimal sejumlah 86,27%.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | kartu kredit, klasifikasi fraud, machine learning, imbalanced dataset |
Subjects: | Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Pascasarjana > Program Studi Ilmu Komputer (S2) |
Depositing User: | I Wayan Dharmana |
Date Deposited: | 16 Feb 2024 07:28 |
Last Modified: | 16 Feb 2024 07:28 |
URI: | http://repo.undiksha.ac.id/id/eprint/18597 |
Actions (login required)
View Item |