2016-04-08 51 views
1

nedeniyle olabilir CDH dağıtımı (sürüm 5.6.0) Impala (sürüm 2.4.0) ile çalıştırıyorum.Cloudera Impala: Dosyanın geçersiz bir sürümü var. Bu, eski meta veriler

HDFS'de saklanan bazı Parke dosyalarım var. Tüm dosyalar başarıyla listelenir aşağıdaki sorguyu yürütme sonrasında

create external table parquetTable 
like parquet 'hdfs://cloudera-impala-mn0.eastus.cloudapp.azure.com:8020/user/root/big_data/part-r-00015-66cf01ca-ffee-4a62-b2c3-c09177ec4bd7.gz.parquet' 
stored as parquet location 'hdfs://cloudera-impala-mn0.eastus.cloudapp.azure.com:8020/user/root/big_data/; 

: Sonra, ben şu sorgu ile bir Impala dış tabloya bu dosyaları yüklediğiniz Ayrıca

[cloudera-impala-dn0.eastus.cloudapp.azure.com:21000] > show files in parquettable; 

, meta (doğrudur describe parquettable çalıştırılarak kontrol edildi.

tablonun istatistik şunlardır:

[cloudera-impala-dn0.eastus.cloudapp.azure.com:21000] > show table stats parquettable; 

Rows | Files | Size | Bytes Cached | Cache Replication | Format | Incremental stats | Location

-1 | 838 | 249.64GB | NOT CACHED | NOT CACHED | PARQUET | false | hdfs://cloudera-impala-mn0.eastus.cloudapp.azure.com:8020/user/root/big_data

aşağıdaki sorgu yapıldığında: Aşağıdaki UYARI içinde

[cloudera-impala-dn0.eastus.cloudapp.azure.com:21000] > select count(*) from parquettable; 

sonuçlar, ancak herhangi bir çıkış sonuç veya hatasız:

File 'hdfs://cloudera-impala-mn0.eastus.cloudapp.azure.com:8020/user/root/big_data/part-r-00001-7c29b85c-bd1f-420e-8834-96300076a92d.gz.parquet' has an invalid version number: ▒.F/ This could be due to stale metadata. Try running "refresh default.parquettable".

Çalışan refresh default.parquettable hiçbir etkisi olmamıştır.

Herhangi bir yardım için teşekkür ederiz!

+0

Impala shell'de "invalidate metadata" komutunu çalıştırmayı ve sorguyu tekrar denemeyi deneyebilir misiniz? – Lan

+0

@Lan Ben de denedim ama hala başarı yok. Uyarı mesajı aynı kalır ve çıkış olmaz. –

+0

Parke bazlı masa nasıl oluşturulur? – Lan

cevap

1

Adımlarınız iyi görünüyor. Tablo oluştururken hata part-r-00015-66cf01ca-ffee-4a62-b2c3-c09177ec4bd7.gz.parquet kullanırken r-00001-7c29b85c-bd1f-420e-8834-96300076a92d.gz.parquet hakkında şikayette bulunur . Bu yüzden bölüm-r-00001-7c29b85c-bd1f-420e-8834-96300076a92d.gz.parquet'de bir sorun var gibi görünüyor. Part-r-00015-66cf01ca-ffee-4a62-b2c3-c09177ec4bd7.gz.parquet dışındaki big_data tablosundaki tüm dosyalardan kurtulabiliyor musunuz?