"0" sınıfına (yaklaşık 30000 vs 1500) doğru büyük bir eğriliğe sahip bir ikili sınıf veri kümem var (0/1). Her bir örnek için 7 özellik vardır, eksik değerler yoktur.Weka ağaç sınıflandırıcılarına bilerek nasıl yüklenir?
J48 veya başka bir ağaç sınıflandırıcısı kullandığımda, "0" olarak sınıflandırılan "1" örneklerinin neredeyse tümünü alırım. Tüm bu yardım etmedi - 1 olarak yaprak başına örneklerinin minimum sayıda ayar 1 olarak güven faktörünü ayarlayarak, örnek kimliği numarası ile bir kukla özellik ekleyerek, için "unpruned" sınıflandırıcı ayarlanması
.
Ben sadece veri overfits bir model oluşturmak olamaz!
Ayrıca Weka'nın sağladığı diğer tüm sınıflandırıcıları denedim, ancak benzer sonuçlar elde ettim.
IB1 kullanımı% 100 doğrulukta (tren setinde tren seti), aynı özellik değerlerine ve farklı sınıflara sahip birden çok örnek sorun yaratmaz.
nasıl tamamen unpruned ağacı oluşturabilir? Ya da Weka'yı verilerimi aşırıya zorlamak için mi zorluyorsunuz?
Teşekkürler.
Güncelleme: Tamam, bu çok saçma. Ben sadece yaklaşık 3100 negatif ve 1200 olumlu örnekler kullandım ve bu aldığım ağaçtır (unpruned!):
J48 unpruned tree
------------------
F <= 0.90747: 1 (201.0/54.0)
F > 0.90747: 0 (4153.0/1062.0)
Söylemeye gerek yok, IB 1 hala% 100 hassasiyet vermektedir.
Güncelleme 2: Bunu nasıl özlediğimi bilmiyorum - benzersiz SimpleCart çalışır ve trende% 100 doğrulukta tren verir; budanmış SimpleCart J48 kadar önyargılı değildir ve iyi bir yanlış pozitif ve negatif orana sahiptir.
olası ilgili soru (daha doğrusu büyük olasılıkla sınıfa yerine): http://stackoverflow.com/
sonuç için algoritma sonra çalışacaktı olmasıdır sorular/2519997/farklı-ağırlıkları-yanlış-pozitif-ve-yanlış-negatif-içinde-nöral-ağ – Amro