Bir Spark ve Flink k-means uygulaması kurdum. Test durumum, 3 düğüm kümesinde 1 milyon nokta üzerinde kümelenme.Spark vs Flink az hafıza kullanılabilir
Bellek içi darboğazlar başladığında, Flink diske kaynak aktarmaya başlar ve yavaş çalışır ancak çalışır. Ancak, bellek doluysa ve tekrar başladığında Spark, sürücüleri kaybeder (sonsuz döngü?).
Bellek ayarını buradan posta listesi yardımıyla buradan özelleştirmeye çalışıyorum, teşekkürler. Ama Spark hala çalışmıyor.
Ayarlanacak herhangi bir yapılandırmaya sahip olmak gerekli mi? Flink, düşük hafızayla çalıştığı anlamına geliyor, Spark da yapabilmelidir; ya da değil?
Spark, verileri diske serileştirebilir, ancak verilerin belirli bölümleri için JVM'nin yığınının üzerinde olmasını gerektirir. Yığın boyutu yeterli değilse, iş bir OutOfMemoryError ile ölür. Aksine, Flink'in motoru yığın üzerinde çok fazla nesne biriktirmez, ancak bunları özel bir bellek bölgesinde depolar. Tüm operatörler çok az bellekle baş edebilecekleri ve diske dökülebilecekleri şekilde uygulanmaktadır. Bu [blog yayını] (http://flink.apache.org/news/2015/05/11/Juggling-with-Bits-and-Bytes.html) Flink'in bellek yönetimini ve ikili verilerde nasıl çalıştığını anlatır. –