2016-03-27 24 views
0

Göreceli olarak büyük miktarda veri (150M) için SVM sınıflandırması (ikili yanıtla) çalıştırmak istiyorum. Bu nedenle, bir eğitim veri seti (yaklaşık 50.000 Say) aldım ve R içinde svm{e1071} kullanarak modeli oluşturdum. Şimdi sonucu tüm veri kümesine uygulamak istiyorum. R'da büyük bir veri kümesinin nasıl yüklenip çalıştırılacağı konusunda hiçbir fikrim yok. Yani, ihtiyacım olan şey model parametrelerini R'dan ayıklamak ve başka bir platformda çalıştırmak. Diğer bir deyişle, ben tüm veriler için aynı weight.svm (olasılıkları) almak istiyorum:Büyük miktarda veri için SVM tahmini

model.svm = svm(as.factor(response) ~.,data=predictors, probability=TRUE) 
predict.svm= predict(model.svm,predictors,probability=TRUE) 
weight.svm = data.frame(attr(predict.svm,"probabilities")) 

Herhangi bir öneri? Bu tahmin işlevinin SVM'de nasıl çalıştığını gösteren herhangi bir basit metin/referans? model.svm nesnesinden hangi değerleri almalıyım? model.svm$SV vb?

+0

PMML'yi incelemek isteyebilirsiniz: https://support.zementis.com/entries/21197842-PMML-Export-Functionality-in-R-Supported-Packages. Bu şirketle ilgili bir geçmişim yok ve bunun için kefil olamaz, ancak çeşitli modellerin yapısını ihraç edip onlarla ilgili tahminlerde bulunabileceğini iddia ediyor. –

cevap

0

Çekirdeğiniz doğrusalysa, Pegasos algorithm'u kullanabilirsiniz. Algoritmayı kağıdın 7. sayfasında bulabilirsiniz, 10 satırdan az koddur ve SVM optimizasyon problemini çözmek için en hızlı algoritmalardan biridir.