Yanıt değişkeni bölünmesi% 98 (Yanlış) -2% (Doğru) olan bir rasgele orman sınıflandırma modeli yapıyorum. Bunun için Scikit Learn'in RandomForest sınıflandırıcısını kullanıyorum.Rastgele orman için Tabakalı örnekleme -Python
Bu dengesiz veriyi işlemenin ve çok fazla örneklemeyi önlemenin en iyi yolu nedir?
Bu soruya daha önce de cevap verdim. Lütfen kontrol edin. http://stackoverflow.com/a/36255925/2523817 –