Pandalar ve scikit kullanarak bir spam sınıflandırıcı geliştirdim, bu programa, todoop tabanlı sistemimize entegrasyon için hazır olduğu noktaya kadar. Bu amaçla, sınıflandırıcımı dekapajtan daha yaygın bir biçime aktarmam gerekiyor.Bir Scikit Verme Hadoop Platformunda Kullanmak için Rastgele Orman Öğrenin
Öngörülü Model İşaretleme Dili (PMML) tercih edilen dışa aktarma biçimimdir. Halihazırda kullandığımız Cascading ile son derece iyi oynar. Ancak, şaşırtıcı bir şekilde scikit-öğrenen modelleri PMML'ye aktaran herhangi bir python kütüphanesi bulamıyorum.
Bu kullanım durumu konusunda tecrübesi olan var mı? PMIC'ye scikit-learn ve hadoop arasında birlikte işlerlik kazandıracak herhangi bir alternatif var mı? Katı bir PMML ihracat kütüphanesine ne dersiniz?
Quora'da benzer bir soru var http://www.quora.com/How-do-I-use-scikit-learn-with-Hadoop-and-Mapreduce – miraculixx
Girdiğiniz için teşekkürler. Akış API'sini kullanmak ideal değildir, ancak tüm bunlar başarısız olursa buna başvurmak zorunda kalabilirim. –
Spam sınıflandırması e-posta spam'ında olduğu gibi mi? Bunun için nasıl bir Rasgele Orman kullanmaya geldin? –