Ben şu anda şöyle bir pandalar Serisi vardır: ...Pandalar: yeniden şekillendirilmesi veri
14 [Yellow, Pizza, Restaurants]
...
160920 [Automotive, Auto Parts & Supplies]
160921 [Lighting Fixtures & Equipment, Home Services]
160922 [Food, Pizza, Candy Stores]
160923 [Hair Removal, Nail Salons, Beauty & Spas]
160924 [Hair Removal, Nail Salons, Beauty & Spas]
Ve kökten şuna benzer bir dataframe içine yeniden şekillendirmek isteyen
Yellow Automotive Pizza
14 1 0 1
…
160920 0 1 0
160921 0 0 0
160922 0 0 1
160923 0 0 0
160924 0 0 0
yani. her gözlemin hangi kategoriye girdiğine dikkat çeken mantıklı bir yapı.
Bu sorunu çözmek için döngü tabanlı kod yazabiliyorum, ancak ele almam gereken çok sayıda satır verildiğinde, bu çok yavaş olacak.
Bu tür sorunlara yönelik bir vektör çözümünü bilen var mı? Çok minnettar olurum.
DÜZENLEME: Listemde 509 kategori var.
Bu, efendim, çok zekice. Altın rozetde –
tebrikler! http://stackoverflow.com/help/badges/3296/pandas?userid=644898 –
Bunun nasıl çalıştığını açıklayabilir misiniz? Oluşturulan bireysel diziye baktığımda, ör. Seri (1, index = s [1]), dizi indeksi (beklediğim gibi) listedeki harflerdir. Ancak s.apply(), dizi dizinleri sütun olarak bir DataFrame verir. Pivot nasıl oldu? – jdmarino