2017-05-04 80 views
6

Bazı veri analizi yapmaya çalışıyorum ve en iyi kutuları oluşturmak için autobinning komutunu kullanmak, her bölme için WOE (kanıt ağırlığı) değerini hesaplamak ve daha sonra orijinal değerleri değiştirmek Her bir bölmeye, ilgili WOE değeri ile aittir. Yani aşağıda benim yaptığım:NaN değerleri için bir Binek oluşturma

CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0); 
scAB = autobinning(CreSC,'Algorithm','Monotone'); 
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE'); 

sorun Yukarıdaki prosedür VERİ içindedir NaN değerleri dikkate olmamasıdır ve bunları otomatik olarak dışlar.

Amacım, yalnızca NaN değerleri için ayrı bir bin oluşturmak vekomutunu NaN değerlerini dikkate almaya zorlamaktır.

Herkesin makul bir çözümü var mı?

cevap

2

Tüm NaN değerlerini bulun.

Verilerinizde mevcut olmayan bir değer seçin.

Tüm NaN değerlerini bu değere göre değiştirin.

Binning'inizi çalıştırın ve bu değeri kendiniz sonunda NaN ile eşleyin.

+0

Cevabınız için teşekkür ederiz. Bunu zaten denedim. Bu şekilde işe yaramaz çünkü kutulardaki aralıklar NaN'lerde atanan değerden etkilenir. Yine, amacım SADECE NaN'lerle bir çöp kutusu yaratmak! –