Yükseltilmiş regresyon ağaçlarının (paket gbm'si) R varsayılan değeri, tahmin edici değişkenlerin eksik değerleriyle nasıl başa çıkılır? Hangi algoritmaya göre, onlar imputed ve onlar mı?R: Yükseltilmiş regresyon ağaçları eksik verilerle nasıl baş eder?
Sorumu Arkaplan: Analizleri neredeyse bir yıl önce yaptım ve Elith et al. 2008 (gbm'yi çağırmak için gerileme ağaçları, Journal of Animal Ecology 77, 802-813) için bir çalışma rehberi. Şimdi bazı tahmin edici değişkenler için NA'larım olduğunu farkettim ve gerileyen regresyon ağaçlarının bunlarla nasıl uğraştığını merak ediyorum. Çeşitli el kitaplarında ve kağıtlarda tarama yaparak "gerilemiş ağaçların kayıp değerleri barındırabilir" gibi ifadeler buldum ve benzerleri var, ancak gbm'nin eksik değerler ile ne yaptığının kesin bir açıklamasını bulamadım. Analiz, problemsiz koştu, bu yüzden gbm, onlarla ya da başka bir şekilde bunları ele almış olmalıydı. Gbm el kitabında, kasten NA'ların gbm'nin sorunsuz çalışmayı sürdürdüğünü göstermek için kullanıldığı bir örnek bile vardır. Şimdi, gbm'nin NA'larla tam olarak ne yaptığını bilmek istiyorum (onları atla, onları ihanet et, ...?).
Bu soru bu istatistiksel bir algoritma uygulanması konusunda, çünkü konu dışı gibi görünüyor. Belki de Doğrulanmış Haç için daha uygun. –
@ SimonO101: Hangisinin uygun forum olacağından şüphe ettim. Crossvalidated'de yayınlayacağım. – user7417
Bir süre ayrılıyorum - site topluluk çalışıyor. Eğer görüş birliği konu dışı ise, soru kapanacak ve özgeçmişinizi sormak isteyeceksiniz. Şu anda, CV'nin daha uygun olduğunu düşünen sadece ben! –