Notebook Bab 6 ini punya dua bagian. Bagian Demo tinggal Anda jalankan lalu amati keluarannya; bagian Mini Project berisi soal dan data yang Anda kerjakan sendiri.Fitur turunan (rasio, encoding waktu, interaksi) sering mengekspos pola yang tak tertangkap model dari kolom mentah.
25 Section 1 - Demo: Fitur Turunan Menaikkan Sinyal
25.1 Data mentah
Risiko gagal bayar ditentukan oleh rasio pengeluaran terhadap pendapatan dan oleh jam transaksi (larut malam lebih berisiko). Keduanya tidak eksplisit di kolom mentah.
🔎 Amati. Menambahkan rasio pengeluaran dan encoding siklik jam (sin/cos) menaikkan akurasi. Model linear tidak bisa membentuk rasio dari dua kolom terpisah, dan jam sebagai angka 0-23 menyesatkan karena jam 23 dan jam 0 sebenarnya berdekatan; encoding siklik memperbaiki keduanya.
26 Section 2 - Mini Project
26.1 Soal
Anda diberi data transaksi dengan kolom tanggal (hari ke-0..364), jumlah_item, total_belanja, dan poin_loyalitas. Targetnya pakai_promo (1/0).
Tugas:
Buat minimal 5 fitur turunan (misalnya harga rata-rata per item, fitur musiman dari tanggal via sin/cos, rasio poin terhadap belanja).
Bandingkan model pada fitur mentah vs fitur mentah + turunan.
Tunjukkan mana fitur turunan yang paling menaikkan skor.
Luaran: kode pembentukan fitur, perbandingan skor, dan 2-3 kalimat kesimpulan.
Kriteria penilaian: (a) minimal 5 fitur turunan; (b) encoding waktu yang benar (siklik); (c) evaluasi CV yang adil.