hatırlamak ve hala Pandalar "kanayan kalbi" olduğunu DataFrame kucaklayan en kolay bir seçenektir:
1) Veritabanında yeni bir sütun oluşturun. uzunluğu için bir değer inci:
df['length'] = df.alfa.str.len()
2) Endeksi yeni kolon kullanılarak:
df = df[df.length < 3]
Ardından bu durumda gerçekten alakalı olmayan yukarıdaki zamanlamalar için karşılaştırma verileri çok olduğu gibi
adım 1:
%timeit df['length'] = df.alfa.str.len()
genellikle küçük ve size iş akışını kesmek zorunda şeyin nasıl hatırlamak gidip değiliz kadar olası daha az önemlidir
Döngü başına 359 µs ± 6.83 µs (ortalama ± std. dev. 7 çalışır 1000 adım 2
) her döngüler. Döngü başına 76.9 us ±
df = df[df.length < 3]
627 us (standart sapma ortalama ± 7 ishal, 1000 halkalarını her biri)
iyi. haber, boyut büyüdüğünde, zamanın doğrusal olarak büyümediği. Örneğin, 30.000 satırlık veriyle aynı işlemi yapmak yaklaşık 3 ms (10,000x veri, 3x hız artışı) alır. Pandalar DataFrame bir tren gibidir, onu almak için enerji harcar (mutlak mukayese altında küçük şeyler için pek iyi değildir, fakat nesnel olarak çok küçük bir şey yapmaz ... küçük veri şeylerinde olduğu gibi).