Jika 99% email bukan spam, model yang selalu menjawab "bukan spam" memiliki akurasi 99% — lebih tinggi dari banyak model machine learning. Namun model ini tidak berguna sama sekali untuk mendeteksi spam.
Ini adalah jebakan umum dalam evaluasi model: akurasi saja tidak cukup. Metrik yang lebih informatif adalah precision, recall, F1-score, atau AUC-ROC. Relevan dalam diagnostik medis (penyakit langka), deteksi penipuan, dan sistem keamanan — domain di mana kelas minoritas justru paling penting untuk dideteksi.
← Kembali ke Daftar Paradoks