2016-04-13 38 views
1

str.extract() öğesini kullanarak veri çerçevemin bir satırındaki sözcükleri ayıklamaya çalışıyorum, ancak sonuçta yalnızca bir kelime alıyorum. Benim dataframe sütunlarında birinde Örneğin:df ['var']. Str.extract() (Python) kullanarak birden çok sözcük bulun.

var1 
THIS IS A STRING 

Ben kullandığınızda:

df['words'] = df['var1'].str.extract('([A-Z]\w{0,})') 

çıkış Ben bütün cümleyi 'BU BİR IS ayıklamak nasıl

var1    words 
THIS IS A STRING THIS 

olduğunu STRING '?

Teşekkür ederiz!

+0

Kişisel dataframe var1' 'anlamına gelir ama' df [ 'test'] 'dan özü. Yanlış mı yazdınız? – Alexander

+0

Evet, yazım hatasıydı. İşaret ettiğin için teşekkürler. – Jess

cevap

0
Eğer keyfi boşluk \s+ tarafından split kullanabilirsiniz IIUC

ve sonra applySeries:

print df 
       var1 
0 THIS IS A STRING 

print df.var1.str.split('\s+').apply(pd.Series) 
     0 1 2  3 
0 THIS IS A STRING 
+0

Nasıl çalışır? – jezrael