2016-04-13 28 views
1

Kıvılcım ipliği ile - Eşzamanlı işlerin planlanmasını önlemek için bir yol göremiyorum. Tamamen toplu işlem yapmak için mimarlık ayarım var.İplik Kıvılcımı: Çoklu kıvılcım işlerinin planlanması nasıl önlenir

Aşağıdaki nedenlerden dolayı bu gerekir:

  • Kaynak kısıtları
  • UserCache kıvılcım gerçekten hızlı büyür. Birden çok iş çalıştırmak, önbellek üzerinde bir alan patlamasına neden olur.

İdeal olarak, İplik'te herhangi bir zamanda çalışacak bir işin olmasını sağlayacak bir yapılandırma olup olmadığını görmek isterim.

cevap

1

Yalnızca bir uygulama yöneticisi barındırabilen ve bu sıradaki tüm Spark işlerini çalıştıran bir kuyruk oluşturabilirsiniz. Bu nedenle, bir Spark işi çalışıyorsa diğeri kabul edilir, ancak çalıştırılan yürütme bitene kadar planlanmayacak ve çalıştırılmayacaklardır ...

+0

HortonWorks'ten HDP kullanıyorum. Gördüğüm bir sıra var ama sadece birinin çalıştığından emin olmak için nasıl yapılandırılacağını göremiyorum. Hangi yapılandırmanın aranacağıyla ilgili ipuçları var mı? – Keshi

+1

Burada Hortonworks tarafından kuyruk yönetimi hakkında bazı belgeler bulabilirsiniz (https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.3.2/bk_performance_tuning/content/section_create_configure_yarn_capacity_scheduler_queues.html). Bir sıra için ayarlardan birini gördüğünüz gibi kabul edilen maksimum uygulama sayısıdır ... – mgaido

0

Sonunda çözüm bulundu - iplik belgelerinde bulundu: yarn.scheduler.capacity .max-uygulamaları 10000 yerine 1'e ayarlanmalıdır.