pyspark'ta önceden hazırlanmış bir xgboost sınıflandırıcı kullanmak istiyorum, ancak kümedeki düğümler xgboost modülünün yüklü olmadığını gösteriyor. Eğitim aldığım ve yayınladığım sınıflandırıcıyı seçebilirim ancak bu, her bir küme düğümüne yüklenecek olan modüle hala ihtiyacım olduğu için yeterli değil.Spark'da kullanmak için xgboost modülü nasıl dağıtılır?
Kök olmadığından ve paylaşılan dosya sistemi olmadığından küme düğümlerine yükleyemiyorum.
Spark'da kullanım için xgboost sınıflandırıcısını nasıl dağıtabilirim?
Ben xgboost için bir yumurta var. http://apache-spark-user-list.1001560.n3.nabble.com/Loading-Python-libraries-into-Spark-td7059.html veya https://stackoverflow.com/a/24686708/2179021 gibi bir şey işe yarayabilir mi?
Münferit makinelere SSH erişiminiz var mı? Hangi küme yöneticisini kullanıyorsunuz? – zero323
@ zero323 YARN kullanıyoruz ama makinelere ssh erişimim yok. Yapmam gereken şey, 'yumurta' yayınını içeren bir çözüm bulmak. – eleanora
Dürüst tavsiyem, sizi sorumlu kütüphanelerle veya yapılandırılabilir ortamlarla (Anaconda yüklemeleri gibi) sağlamak için sorumlu kişiyi bulmaktır. Yerel bağımlılıkları doğru şekilde oluşturmak ve yapılandırmak yalnızca rahatınız değil aynı zamanda temel performans hakkında da. Ve farklar oldukça anlamlı olabilir. – zero323