Bir Pandas veri karesinde kayan nokta verisi var. Her sütun bir değişkeni temsil eder (dizge adları vardır) ve her biri bir değerler kümesini sıralar (satırlar, önemli olmayan tamsayı adlarına sahiptir).Pandalar Dataframe'i log10 ölçeği x ekseni ile Çoklu Histogram olarak çizmek istiyorsunuz
>>> print data
0 kppawr23 kppaspyd
1 3.312387 13.266040
2 2.775202 0.100000
3 100.000000 100.000000
4 100.000000 39.437420
5 17.017150 33.019040
...
Her sütun için bir histogram çizmek istiyorum. Tek elde en iyi sonuç dataframe bir geçmiş yöntemi ile:
data.hist(bins=20)
ama her bir histogramın x-ekseni, bir log 10 ölçekte istiyorum. Ve depolar da log10 ölçeğinde olmalı, ancak bu, bins = np.logspace (-2,2,20) ile yeterince kolaydır.
bir geçici çözüm log 10 komplo önce verileri dönüştürmek için olabilir, ama yaklaşımlar bana bir kayan nokta hata vermek,
data.apply(math.log10)
ve
data.apply(lambda x: math.log10(x))
çalıştılar.
"cannot convert the series to {0}".format(str(converter)))
TypeError: ("cannot convert the series to <type 'float'>", u'occurred at index kppawr23')
Teşekkürler! Ravel() hakkında bilmiyordum. Ben de uyuşmadım. Pandalara odaklanmaya çalışıyorum çünkü büyük veri kümelerinde okumada çok hızlı olsaydı. –
Bu arada, hızlandırmak için herhangi bir yolu var mı? Üretmek için 219 histogramım var ve birkaç dakika sürüyor (PyCharm topluluk baskısında hata ayıklama modunda çalışıyor). –
Ve bir şekilde data.hist için tight_layout uygulayabilir miyim? –