Spark SQL, Scala'da bir Spark DataFrame için pencere kaydırma işlevine bakıyorum.kıvılcım sql pencere fonksiyonu gecikmesi
Sütun Col1, Col1, Col1, date ile bir veri çerçevem var.
Col1 Col2 Col3 date volume new_col
201601 100.5
201602 120.6 100.5
201603 450.2 120.6
201604 200.7 450.2
201605 121.4 200.7`
Şimdi yukarıda gösterildiği gibi bir satır aşağı slided isme (new_col) ile yeni bir sütun eklemek istiyorum.
Pencere işlevini kullanmak için aşağıdaki seçeneği denedim.
val windSldBrdrxNrx_df = df.withColumn("Prev_brand_rx", lag("Prev_brand_rx",1))
Nasıl yapılacağı konusunda bana yardımcı olabilecek herhangi biri olabilir. Doğru tüm cevapsız yapıyoruz
@Ramesh Spark 2.0 kadar, kullanıcılar pencere fonksiyonlarını uygulamak için 'SQLContext' yerine' HiveContext' kullanmak zorunda kaldı. "HiveContext", "SparkContext" örneğini geçirerek "SQLContext" ile aynı şekilde oluşturulur. Doğru olarak hatırlarsam, Spark dağıtımınız için uygun bir sürümle birlikte 'org.apache.spark: spark-hive_2.10' eklemeniz gerekir. –
@msrinivas, Cevabınız doğru çıktı. – Ramesh