parquet

9ısı

2cevap

Bağımsız bir java kodunda parke dosyası nasıl okunmalı?

cloudera'nın parke dokümanları, domuz/kovan/impala ile entegrasyon örneklerini göstermektedir. ama birçok durumda hata ayıklama amacıyla parke dosyasını okumak istiyorum. Parke dosyasını okumak için b

9ısı

1cevap

Spark SQL, Parşömen verilerini çok sayıda parça ile birlikte yazdıramıyor

S3'deki json log verilerini S3'teki Parke dosyalarına aktarmak için Apache Spark SQL'i kullanmaya çalışıyorum. Kodum temelde: import org.apache.spark._ val sqlContext = sql.SQLContext(sc) val data =