val cv = new CrossValidator()
.setEstimator(pipeline)
.setEstimatorParamMaps(paramGrid)
.setEvaluator(new MulticlassClassificationEvaluator)
.setNumFolds(10)
val cvModel = cv.fit(trainingSet)
boru hattı zamanki trafoları içerir ve Aşağıdaki sıraya göre tahmin ediciler: Tokenizer, StopWordsRemover, HashingTF, IDF ve son olarak NaiveBayes.
En iyi model için hesaplanan metriklere erişmek mümkün müdür?
İdeal olarak, parametrelerin değiştirilmesinin sınıflandırma kalitesini nasıl değiştirdiğini görmek için tüm modellerin metriklerine erişmek istiyorum. Ama şimdilik, en iyi model yeterince iyi.
Bilginize, ben Spark 1.6.0 Burada
zip çalışır ama gerçekten istemiyorum Bunun gibi CrossValidator'un nasıl çalıştığına dair içsel bilgi varsayar. Metrikler dizisinin nasıl oluşturulacağını değiştirebilir, böylece bir sonraki sürüm için farklı bir sıraya göre değişir ve siz de gözardı edilirsiniz, ancak kodunuzu hala kullandığından dolayı kullandığınızı bilmiyorsunuzdur. Metriği ile döndürülen bir model için paramler istiyorum. Ayrıca, sadece ortalama yerine özet istatistiklerini görmek isterim. Standart sapma olmadan ortalama ne kadar yararlıdır? – Turbo