2017-03-28 71 views
5

Bunu doğru alıyorum emin yapma negatiftir: Biz sklearn.metrics.log_loss tek başına kullanırsanızsklearn metrics.log_loss puanlama 'neg_log_loss' vs pozitif

, yani log_loss (y_true, y_pred), pozitif bir skor üretir - Skor ne kadar küçük olursa performans o kadar iyi olur. . Skor daha büyük, daha iyi performans

Ve puanlama düzeni inşa edilmiştir, bu kaynaklanmaktadır -

Ancak, 'cross_val_score" gibi bir puanlama düzeni olarak 'neg_log_loss' kullanırsanız, skor negatiftir genellikle bu yana, daha iyi daha yüksek, biz doğru bu anlayış log_loss trend ile tutarlı olması için. Ve bu amaçla bunu yalnızca yapılır. normal mi inkâr. diğer puanlama düzenleri ile tutarlı olması için?

[ Arka plan: metric.log_loss için pozitif puanlar ve 'neg_los_loss' için negatif puanlar aldı ve her ikisi de aynı belge sayfası.

+1

Ben de aynı şeyi merak ediyordum –

cevap

0

sklearn.metrics.log_loss, tipik olarak tanımlandığı gibi hata ölçütünün bir uygulamasıdır ve bu, çoğu hata metriği pozitif sayıdır. Bu durumda, maksimize edilen doğruluk gibi ölçümlerin aksine, genellikle küçültülmüş bir metriktir (örneğin, regresyon için ortalama karesel hata olarak).

'Neg_log_loss', her metrik için işlevin davranışını değiştirmek zorunda kalmadan işlevlerin ve sklearn sınıflarının en üst düzeye çıkarılması için optimize edilmesine olanak tanıyan bir fayda değeri oluşturmak için bir tekniktir (örneğin, örneğin cross_val_score adlı GridSearchCV, RandomizedSearchCV ve diğerleri).