Notebook Bab 6 ini punya dua bagian. Bagian Demo tinggal Anda jalankan lalu amati keluarannya; bagian Mini Project berisi soal dan data yang Anda kerjakan sendiri.
Fitur turunan (rasio, encoding waktu, interaksi) sering mengekspos pola yang tak tertangkap model dari kolom mentah.
Risiko gagal bayar ditentukan oleh rasio pengeluaran terhadap pendapatan dan oleh jam transaksi (larut malam lebih berisiko). Keduanya tidak eksplisit di kolom mentah.
🔎 Amati. Menambahkan rasio pengeluaran dan encoding siklik jam (sin/cos) menaikkan akurasi. Model linear tidak bisa membentuk rasio dari dua kolom terpisah, dan jam sebagai angka 0-23 menyesatkan karena jam 23 dan jam 0 sebenarnya berdekatan; encoding siklik memperbaiki keduanya.
Section 2 - Mini Project
Soal
Anda diberi data transaksi dengan kolom tanggal (hari ke-0..364), jumlah_item, total_belanja, dan poin_loyalitas. Targetnya pakai_promo (1/0).
Tugas:
Buat minimal 5 fitur turunan (misalnya harga rata-rata per item, fitur musiman dari tanggal via sin/cos, rasio poin terhadap belanja).
Bandingkan model pada fitur mentah vs fitur mentah + turunan.
Tunjukkan mana fitur turunan yang paling menaikkan skor.
Luaran: kode pembentukan fitur, perbandingan skor, dan 2-3 kalimat kesimpulan.
Kriteria penilaian: (a) minimal 5 fitur turunan; (b) encoding waktu yang benar (siklik); (c) evaluasi CV yang adil.