Bir csv dosyasını bir veri çerçevesine okumaya çalışıyorum. Veri dosyamın şemasının csv dosyamı bildiğimden beri ne olacağını biliyorum. Ayrıca dosyayı okumak için kıvılcım csv paketi kullanıyorum. Aşağıdaki gibi şema belirtmeye çalışıyorum.Csv dosyasını bir dataframe olarak okurken şema sağlayın
val pagecount = sqlContext.read.format("csv")
.option("delimiter"," ").option("quote","")
.option("schema","project: string ,article: string ,requests: integer ,bytes_served: long")
.load("dbfs:/databricks-datasets/wikipedia-datasets/data-001/pagecounts/sample/pagecounts-20151124-170000")
Oluşturduğum veri çerçevesinin şemasını denetlediğimde, kendi şemasını almış gibi görünüyor. Yanlış bir şey yapıyorum? Bahsettiğim şemayı almak için kıvılcım yapmak nasıl?
> pagecount.printSchema
root
|-- _c0: string (nullable = true)
|-- _c1: string (nullable = true)
|-- _c2: string (nullable = true)
|-- _c3: string (nullable = true)
kullandığınız kıvılcım versiyonu? –