Bu repoda veri bilimi ve makine öğrenmesinde yapılan hataları gösteren notebooklar paylaşılmaktadır.
-
Data Leakage, eğitim veri seti dışındaki bilginin modelin oluşturulması sırasında kullanılması durumunda ortaya çıkar. Bu, modele ek bir bilgi sağlayabilir ve aslında bu ek bilginin model tarafından bilinmemesi gerekir. Neticede model öğrenmemesi gerektiği bir özellik öğrendiğinde bu modelin performansını çok kolay bir şekilde geçersiz kılabilir."
-
Yani yapılan bu hata (Data Leakage), aşırı iyimser veya gerçek hayatta bir işe yaramayacak modeller oluşturmanıza neden olabilir.
-
- Var mı yok mu diye deneylerin yapılması
-
- Farklı senaryolarda farklı modeller nasıl sonuçlar gösterir, yorumlama yeteneği nasıl etkilenir?