2016-03-30 27 views
5

Tohumun genel olarak ayarlandığını biliyorum, böylece aynı sonucu üretebilsin. Ancak, tohumun kurulması aslında rasgele orman kısmında ne yapar. R nTree veya sampSize gibi randomForest() işlevinin bağımsız değişkenlerini değiştirir.Tohum, rastgele ormanlarda ne yapar?

Her seferinde rastgele orman modelim için farklı tohumlar kullanıyorum, ancak farklı tohumların rasgele bir orman modelini nasıl etkilediğini bilmek istiyorum.

+1

randomForest' 'yana (http://stackoverflow.com/questions/13605271/reasons-for-using-the-set-seed-function) [R. tohum hakkında bilgi için bakınız] rastgele ağaçlar üretir, tohumun ayarlanması aynı çıkışı garanti eder. Normal kullanım için, tohum ile hiçbir şey yapmayın, varsayılan olarak 'rastgele' olacaktır. – Axeman

+0

Farklı tohumlar 'nTree' veya' sampSize' değiştirmez ancak modelin sonucunu biraz değiştirebilir, ntree gibi parametreler daha düşük değerlere ayarlandığında daha dramatik olarak değişir. – Axeman

+1

@Axeman, açıklama ile bir cevap eklemeyi düşünün –

cevap

2

Ağaçlar tohumlardan büyür ve böylece ;-) inşa rastgele ormana farklı yolları vardır

(SCNR) ormanları yapmak, ancak, ortak tüm çoklu ağaçlar inşa olmasıdır. Tek bir karar ağacında sınıflandırma doğruluğunu geliştirmek için, rastgele bir ormandaki tek tek ağaçların, aynı ağacın nTree katı kadar farklı olması gerekir. Bu fark, ağaçların oluşturulmasında rastlantısallığın getirilmesiyle elde edilir. Rastgele, tohumdan etkilenir ve tohumun en önemli özelliği, aynı tohumun kullanılması her zaman aynı sonucu vermesidir.

Rasgelelik ağaç yapısını nasıl etkiler? Birden çok yolu var. - rastgele bir altküme için ağaç oluşturun. Bu, ormanın her bir ağacı için bir eğitim örneği alt kümesi çizilir ve daha sonra bu alt küme için bir ağaç oluşturulur - ağaçtaki her bir karar noktasında, karar özelliği rastgele seçilir.

Genellikle bu iki öğe birleştirilir.

http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1