Klasifikasi Transaksi Fraud Kartu Kredit Menggunakan Oversampling ADASYN dan Seleksi Fitur SVM-RFECV

Dharmana, I Wayan (2024) Klasifikasi Transaksi Fraud Kartu Kredit Menggunakan Oversampling ADASYN dan Seleksi Fitur SVM-RFECV. Masters thesis, Universitas Pendidikan Ganesha.

[img] Text (COVER)
2029101007-COVER.pdf

Download (861kB)
[img] Text (ABSTRAK)
2029101007-ABSTRAK.pdf

Download (83kB)
[img] Text (BAB 1 PENDAHULUAN)
2029101007-BAB 1 PENDAHULUAN.pdf

Download (234kB)
[img] Text (BAB 2 KAJIAN TEORI)
2029101007-BAB 2 KAJIAN TEORI.pdf
Restricted to Repository staff only

Download (483kB) | Request a copy
[img] Text (BAB 3 METODELOGI PENELITIAN)
2029101007-BAB 3 METODELOGI PENELITIAN.pdf
Restricted to Repository staff only

Download (707kB) | Request a copy
[img] Text (BAB 4 HASIL DAN PEMBAHASAN)
2029101007-BAB 4 HASIL DAN PEMBAHASAN.pdf
Restricted to Repository staff only

Download (2MB) | Request a copy
[img] Text (BAB 5 PENUTUP)
2029101007-BAB 5 PENUTUP.pdf
Restricted to Repository staff only

Download (95kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
2029101007-DAFTAR PUSTAKA.pdf

Download (222kB)
[img] Text (LAMPIRAN)
2029101007-LAMPIRAN.pdf

Download (78kB)

Abstract

Perkembangan kejahatan transaksi fraud kartu kredit memberikan dampak kerugian finansial bagi pemegang kartu. Pengembangan model prediksi transaksi fraud menggunakan machine learning telah dilakukan namun memiliki beberapa tantangan meliputi ketidakseimbangan data serta dimensi dataset yang cukup besar. Penelitian ini mengusulkan pendekatan dengan seleksi fitur dengan SVM-RFECV dan metode oversampling menggunakan ADASYN. Pembagian data latih dilakukan dengan beberapa rasio data latih meliputi 70%, 80% dan 90%. Data latih yang telah dibagi dilakukan seleksi fitur untuk mendapatkan sejumlah variabel paling optimal sesuai kontribusi terhadap variabel dependen (isFraud). Seleksi fitur menghasilkan variabel optimal dengan rincian 390 variabel pada data latih 70%, 400 variabel pada data latih 80%, dan 390 variabel pada data latih 90%. Tahapan oversampling dengan ADASYN dilakukan pada strategi oversampling 100%, 50% dan 25%. Data latih yang telah dilakukan oversampling dilakukan analisis uji kualitas data menggunakan histogram distribusi dan silhouette index. Uji klasifikasi dilakukan menggunakan algoritma AdaBoost dan LGBM dengan metrik kinerja AUC, precision, recall dan f1 score. Berdasarkan analisis dan evaluasi strategi oversampling, strategi dengan data latih 80%, data uji 20%, rasio oversampling 100% dengan algoritma LGBM menjadi strategi yang direkomendasikan berdasarkan analisis kualitas data dan kinerja AUC yang optimal sejumlah 86,27%.

Item Type: Thesis (Masters)
Uncontrolled Keywords: kartu kredit, klasifikasi fraud, machine learning, imbalanced dataset
Subjects: Q Science > QA Mathematics > QA76 Computer software
Divisions: Pascasarjana > Program Studi Ilmu Komputer (S2)
Depositing User: I Wayan Dharmana
Date Deposited: 16 Feb 2024 07:28
Last Modified: 16 Feb 2024 07:28
URI: http://repo.undiksha.ac.id/id/eprint/18597

Actions (login required)

View Item View Item