Analisis Transaksi Bank

Analisis Machine Learning Lanjutan untuk Segmentasi Pelanggan dan Deteksi Fraud

Analisis komprehensif dari 2.182 transaksi bank menggunakan algoritma clustering dan klasifikasi untuk memahami pola perilaku pelanggan dan meningkatkan keamanan finansial.

2,182 Transaksi
15 Fitur
7 Model ML
Segmentasi Pelanggan
Deteksi Penipuan
Analisis ML

Ringkasan Proyek

Memahami ruang lingkup dan metodologi analisis saya

Informasi Dataset

Dataset transaksi bank komprehensif dengan demografi pelanggan dan pola transaksi yang detail.

  • 2,182 rekord transaksi
  • 15 fitur detail
  • Berbagai jenis transaksi
  • Distribusi geografis di kota-kota AS

Pemrosesan Data

Pipeline pemrosesan data komprehensif untuk performa model yang optimal.

  • Scaling MinMax untuk fitur numerik
  • Label encoding untuk data kategorikal
  • Penanganan data yang hilang
  • Deteksi dan penanganan outlier

Machine Learning

Teknik ML lanjutan untuk segmentasi pelanggan dan pemodelan prediktif.

  • Analisis clustering K-Means
  • Berbagai algoritma klasifikasi
  • Perbandingan dan evaluasi model
  • Optimasi performa

Fitur Utama Dataset

Detail Transaksi

ID, Jumlah, Tanggal, Jenis, Durasi

Lokasi & Saluran

Lokasi geografis, saluran transaksi

Profil Pelanggan

Usia, pekerjaan, saldo rekening

Metrik Keamanan

Percobaan login, ID perangkat, alamat IP

Analisis Clustering

Segmentasi pelanggan menggunakan algoritma clustering K-Means

Segmentasi Pelanggan

4 Kluster Optimal
85% Skor Silhouette

Distribusi Kluster

Dokter Profesional (554 nasabah - 25.4%)
Mahasiswa Aktif (571 nasabah - 26.2%)
Digital Savvy ATM (522 nasabah - 23.9%)
Konservatif Matang (535 nasabah - 24.5%)

Metodologi Clustering

Metode Elbow

Menentukan jumlah kluster optimal menggunakan visualizer K-Elbow dan analisis inersia

Algoritma K-Means

Menerapkan clustering K-Means dengan parameter yang dioptimalkan untuk segmentasi pelanggan

Feature Engineering

Scaling fitur numerik dan encoding variabel kategorikal untuk clustering yang lebih baik

Visualisasi

Membuat visualisasi komprehensif termasuk matriks korelasi dan pairplot

Analisis Klasifikasi

Pemodelan prediktif menggunakan berbagai algoritma machine learning

Perbandingan Performa Model

Decision Tree

100.0%
Presisi: 1.000
Recall: 1.000
F1-Score: 1.000

Random Forest

100.0%
Presisi: 1.000
Recall: 1.000
F1-Score: 1.000

SVM

100.0%
Presisi: 1.000
Recall: 1.000
F1-Score: 1.000

K-Nearest Neighbors

99.77%
Presisi: 0.998
Recall: 0.998
F1-Score: 0.998

Wawasan Utama & Hasil

Temuan strategis dari analisis komprehensif saya

Performa Model Luar Biasa

Model mencapai akurasi perfect 100.0% (Decision Tree, Random Forest, SVM) dan 99.77% (KNN). Catatan Penting: Akurasi sempurna ini mengindikasikan data leakage dari fitur Location yang memiliki perfect mapping dengan target cluster. Dalam implementasi real-world, akurasi realistis berkisar 25-30% untuk 4-class classification setelah menghapus fitur yang menyebabkan overfitting.

Segmentasi Pelanggan

Berhasil mengidentifikasi 4 segmen pelanggan berbeda berdasarkan pola transaksi, memungkinkan strategi pemasaran yang tepat sasaran.

Potensi Deteksi Fraud

Analisis mengungkapkan pola yang dapat dimanfaatkan untuk deteksi anomali dan sistem pencegahan fraud.

Kualitas Data

Dataset berkualitas tinggi dengan nilai hilang minimal dan korelasi fitur yang kuat menghasilkan performa model yang robust.

Implementasi Teknis

Python
Scikit-learn
Pandas
NumPy
Matplotlib
Seaborn

Sertifikasi

Kredensial profesional dan pencapaian pembelajaran

Belajar Machine Learning untuk Pemula

Dicoding Indonesia

Program BMLP 2025

Certified

Sertifikasi komprehensif dalam machine learning yang mencakup:

  • Fundamental Machine Learning
  • Supervised & Unsupervised Learning
  • Data Preprocessing & Feature Engineering
  • Model Evaluation & Validation
  • Python & Scikit-learn Implementation

Machine Learning Expertise

Menguasai algoritma clustering dan klasifikasi dengan implementasi praktis

Data Analysis Skills

Kemampuan analisis data komprehensif untuk business intelligence

Python Programming

Profisiensi dalam Python untuk machine learning dan data science

Project Implementation

Pengalaman hands-on dalam proyek machine learning end-to-end

Dafis Nadhif Saputra

Data Scientist & Insinyur Machine Learning

Bersemangat memanfaatkan machine learning untuk memecahkan masalah dunia nyata dalam bidang keuangan dan analitik bisnis.