Train_test_split() kullanırken verilerin orijinal endekslerini nasıl edinebilirim?Scikit-learn train_test_split with endeksler
Ne var şu
from sklearn.cross_validation import train_test_split
import numpy as np
data = np.reshape(np.randn(20),(10,2)) # 10 training examples
labels = np.random.randint(2, size=10) # 10 labels
x1, x2, y1, y2 = train_test_split(data, labels, size=0.2)
olduğunu Fakat bu orijinal verilerin indeksleri vermez. Tek çözüm, verilere indeks eklemek (ör. data = [(i, d) for i, d in enumerate(data)]
) ve daha sonra bunları train_test_split
içine geçirip tekrar genişletmektir. Temiz bir çözüm var mı?
de dikkat [sklearn.model_selection.ShuffleSplit] (http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.ShuffleSplit. html) ve [sklearn.model_selection.StratifiedShuffleSplit] (http: // scikit-lear n.org/stable/modules/generated/sklearn.model_selection.StratifiedShuffleSplit.html). – Jost