features
adında bir VectorUDT
sütununa sahip bir df
veri karegim var. İlk eleman diyelim, sütunun bir elemanını nasıl alabilirim?Bir Spark DataFrame'deki VectorUDT sütununun öğesine nasıl erişilir?
aşağıdaki
from pyspark.sql.functions import udf
first_elem_udf = udf(lambda row: row.values[0])
df.select(first_elem_udf(df.features)).show()
yapıyor denedim ama net.razorvine.pickle.PickleException: expected zero arguments for construction of ClassDict(for numpy.dtype)
hatası alıyorum. Bunun yerine first_elem_udf = first_elem_udf(lambda row: row.toArray()[0])
yaparsam aynı hata.
Ayrıca, explode()
da denedim, ancak bir dizi veya harita türü gerektirdiğinden bir hata alıyorum.
Bu genel bir işlem olmalı bence. float
için
Bu benim için çalışmadı. – user2205916
@ user2205916 Burada tekrarlanabilir bir örnek var. __did_________________________________ __ :) – zero323
Bu, benim için işe yaramadı, ben (1) 'ye“ aydınlandı (0) ”değiştirilinceye kadar. Yani teşekkürler! –