cloudera'nın parke dokümanları, domuz/kovan/impala ile entegrasyon örneklerini göstermektedir. ama birçok durumda hata ayıklama amacıyla parke dosyasını okumak istiyorum. Parke dosyasını okumak için b
S3'deki json log verilerini S3'teki Parke dosyalarına aktarmak için Apache Spark SQL'i kullanmaya çalışıyorum. Kodum temelde: import org.apache.spark._
val sqlContext = sql.SQLContext(sc)
val data =