2013-09-06 3 views
5

Ben Cascalog başlarken kılavuzu fark Cascalog Hadoop sürümü desteği

:profiles { :dev {:dependencies [[org.apache.hadoop/hadoop-core "1.0.3"]]}} 

Hadoop'un

bir sürümünü belirtir? Cascalog'un hangi dizi Hadoop versiyonunda çalıştığı daha geniş kapsamlı?

+1

Cascading uyumluluk matrisi burada: http://www.cascading.org/support/compatibility/. Diğer dağıtımlar çalışabilir, ancak resmi olarak desteklenmez. – Alex

+1

@Alex bu güzel bir grafik. Cascalog ve Cascading'in desteği tam olarak uyuyor mu? – MRocklin

cevap

0

Basit yanıt şu anda (10 Ağustos 2014 itibariyle) Cascalog 2.1.1 sürümünde ve varsayılan olarak Cascading 2.5.3 ve Hadoop 1.2.1 kullanıyor, bu yüzden eğer ekibiniz Hadoop sürüm 1'i kullanmıyorsa evet. x o zaman şansın yok. Bununla birlikte, Cascalog, Hadoop 2.x'e taşınabilmiştir. , Basamaklı-hadoop.jar ve basamaklı-hadoop2 iki Java bağımlılıkları sağlayarak

2,5 destekleri Hadoop 1.x ve 2.x hem Basamaklı: Basamaklı 2.5.x docs Hadoop 1 vs Hadoop 2 den Hadoop'un 2 desteği vardır -mr1.jar. Bu bağımlılıklar birbiriyle değiştirilebilir ancak hadoop2-mr1.jar yeni tanıttı ve uygun olduğunda eski API çağrılarını kullanımdan kaldırır. Dikkat edilmelidir hadoop1-mr1.jar sadece MapReduce 1 API sözleşmelerini destekler. Bu adlandırma şeması ile bağımlılıklar üzerinde çarpışmaların isimlendirilmesi riski olmadan yeni API sözleşmeleri uygulanabilir.

aşağıdaki Hadoop 2.x için Cascalog güncellenmesi için bir naif bir rehberdir Kullanımdan kaldırılmış Cascading API'nin tüm kullanımları ve yeni sözleşmelere güncellenmesi.

  • Derleme ve düzeltmek uyarı/hata
  • Ben Cascalog kaynağında hiçbir uzman değilim, ama API Basamaklı kullanımları grep birkaç satır ile bulundu ve API yükseltme oldukça düz görünüyor olabilir tekrarlanmasını ileri, biraz sıkıcı ise.

    +0

    Neredeyse bir sene geçti, bu konuda henüz bir şey değişip değişmediğini bilen var mı? Bu noktada, insanların bu noktada basamaklı versiyonlarla cascalog çalıştırması gerektiği görünüyor, ancak bunu öneren hiçbir belge bulamadım. – joefromct

    +0

    Bildiğim kadarıyla bu cephede hiçbir şey değişmedi. Https://github.com/nathanmarz/cascalog/blob/develop/CHANGELOG.md adresindeki 3.0.0 changelog'una bakıldığında, basamaklı veya hadoop sürümlerinin çarpışmasıyla ilgili herhangi bir plan ortaya çıkmaz. –