2016-02-10 9 views
6

i bir csv dosyası var ve v3 sütunu vardır ama bu sütun bazı 'nan' satır var. Satırlar dışında nasıl olabilirim.piton - TypeError: unorderable türleri: str()> şamandıra()

dataset = pd.read_csv('mypath') 

    enc = LabelEncoder() 
    enc.fit(dataset['v3']) 
    print('fitting') 
    dataset['v3'] = enc.transform(dataset['v3']) 
    print('transforming') 
    print(dataset['v3']) 
    print('end') 

Düzenleme: 1,2,3,1,2 (V3 sütun, A, C, B, A, C, D ,,, A, S, böyle vardır ve ı dönüştürmek isteyen (

mask = ~dataset['v3'].isnull() 
dataset['v3'][mask] = enc.fit_transform(dataset['v3'][mask]) 

başka bir yolu pandas.factorize işlevini kullanmaktır, otomatik nans ilgilenir: 4 ,,, 1,7)

+0

csv dosya içeriğinizi gösterir misiniz? –

+0

Bu satırlarla ne yapmak istersiniz? Bırak onları? ('dropna') NaN değerlerini doldurun? ('fillna') – joris

+0

no, bu satıra sayıları kategorilere ayırmak istiyorum. Bu satırda karakterler var. –

cevap

8

~ ISNULL() kullanarak nan değerleri Maske onları atar) -1):

dataset['v3'] = dataset['v3'].factorize()[0] 
+0

çok teşekkürler :) veri kümesi [ 'v3'] = veri kümesi [ 'v3'] çarpanlara ayırmak() [0] çözüldü benim sorunum –