2013-02-14 12 views
9

'u destekleyin Destek Vektör Makinesi sonuçlarını iyileştirmek için, daha iyi parametreler ve çapraz doğrulamayı aramak için ızgara aramayı kullanmam gerekir. Bunları scikit-learn'de nasıl birleştirdiğimi bilmiyorum. Izgara arama arama iyi parametreleri (http://scikit-learn.org/stable/modules/grid_search.html) ve overfitting çapraz doğrulama önlemek (http://scikit-learn.org/dev/modules/cross_validation.html)Kılavuz aramayı ve çapraz doğrulama sistemini bir araya getirin

#GRID SEARCH 
from sklearn import grid_search 
parameters = {'kernel':('linear', 'rbf'), 'C':[1, 10]} 
svr = svm.SVC() 
clf = grid_search.GridSearchCV(svr, parameters) 
#print(clf.fit(X, Y)) 

#CROSS VALIDATION 
from sklearn import cross_validation 
X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, Y, test_size=0.4, random_state=0) 
clf = svm.SVC(kernel='linear', C=1).fit(X_train, y_train) 

print("crossvalidation") 
print(clf.score(X_test, y_test)) 
clf = svm.SVC(kernel='linear', C=1) 
scores = cross_validation.cross_val_score(clf, X, Y, cv=3) 
print(scores) 

sonuçları:

GridSearchCV(cv=None, 
    estimator=SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0, degree=3, gamma=0.0, 
kernel=rbf, probability=False, shrinking=True, tol=0.001, verbose=False), 
    estimator__C=1.0, estimator__cache_size=200, 
    estimator__class_weight=None, estimator__coef0=0.0, 
    estimator__degree=3, estimator__gamma=0.0, estimator__kernel=rbf, 
    estimator__probability=False, estimator__shrinking=True, 
    estimator__tol=0.001, estimator__verbose=False, fit_params={}, 
    iid=True, loss_func=None, n_jobs=1, 
    param_grid={'kernel': ('linear', 'rbf'), 'C': [1, 10]}, 
    pre_dispatch=2*n_jobs, refit=True, score_func=None, verbose=0) 

crossvalidation 
0.0 
[ 0.11111111 0.11111111 0.  ] 

cevap

13

Önce siz bir gelişme/değerlendirme Bacak açmayı gelişimi üzerine şebeke aramasına çalışmalıdır Sonunda değerlendirme kısmındaki benzersiz bir final skorunu ölçün ve ölçün:

the documentation'da bulunmaktadır.

+0

Verilerim ile çalışmayı denedim ve şu hatayı aldım: clf = GridSearchCV (SVC (C = 1), tuned_parameters, puanlama = puan) TypeError: __init __() beklenmedik bir anahtar kelime argümanı var 'puanlama' var, denedim Orijinal örneği çalıştırmak için de aynı hata var, ama nasıl mümkün olabilir? puanlama bir işlev parametresidir! – postgres

+2

Belgenin sürüm numarasını kontrol edin ve yüklediğinizle eşleşen olanı seçin. URL'ler her sürüm için farklıdır: http://scikit-learn.org/dev/modules/grid_search.html geliştirme dalıdır. http://scikit-learn.org/stable/modules/grid_search.html son yayınlanan sürümdür (yazma sırasında 0.13) ve http://scikit-learn.org/0.13/modules/grid_search.html bir 0.13 sürümü için sabit URL. – ogrisel

+0

Yanıtın dokümanın kararlı sürümüne işaret etmesini sağladım. – ogrisel