Spark kullanarak Hadoop Sekans Dosyalarımı okuyorum (v1.6.1). RDD'yi önbelleğe aldıktan sonra, RDD'deki içerik geçersiz hale gelir (son giriş n kez kopyalanır). İşte benim kod parçacığı geçerli: impor
içerecek şekilde genişlet Sekans dosyalarını okuyan özel bir InputFormat oluşturabilmek istiyorum, ancak dosya yolunu ve kaydın bulunduğu dosyanın içindeki ofseti de ekleyebilirim. Geri adım atmak içi