2016-03-28 29 views
1

Bazı işlemleri gerçekleştirmek için diğer python/csv dosyalarını python udf dosyasına aktarmak istiyorum.
Gibi,
Tablo verilerini (bir satır olarak satır, satır satır) harici bir .csv satırıyla karşılaştırma. KodPython UDF - harici dosyaları alma/okuma

cevap

1

ise (UDF gibi değil) gayet iyi normal bir piton komut dosyası olarak yazıldığında işe yararken
ben .csv dosyasının verilerini okumaya çalışırım bana bir hata

IOError: File /home/abc/xyz/myfile.csv does not exist

verir Onu doğru anladım. ADD FILE [Tüm dosya yolunuz] veya 'yu deneyebilirsiniz. DOSYALAR ekle [Dizin yolunuz].

Küme üzerindeki herhangi bir şeye başvurmadan önce, dağıtım koduna eklemeniz gerekir, böylece kod o kısma erişebilir. bir göz atabilirsiniz. https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Cli

+0

ADD DOSYA .py dosyaları için bir hata, – Denver

+0

Ben aynı soruyu "ithal modül bulunamadı" Ben harici kullanmak gerekir atar, .csv dosyaları için iyi çalışıyor fakat .py değildir. Python udf dosyamda txt dosyası; Python udf dosyasını .sql dosyasında "ADD FILE address" olarak ekledim. Ancak, python'umdaki .txt dosyasına nasıl başvurabilirim bilmiyorum? –

0

Sözdizimi konusunda dikkatli olun! Birçok soruna neden olabilir ve ne yazık ki, sorgu dili yorumlayıcısı sorunun nereden geldiğini gösteremiyor ve sadece bazı genel hata raporlarını gösteriyor.

Dosyaya hitaben bir sözdizimi sorununun neden olduğu, aynı sorunun türüne bakın!

Accessing external file in Python UDF