varsayalım ben bir sekme böyle biçimlendirilmiş kullanıcı etkinliği verilerini içeren dosyayı ayrılmış vardır:Hadoop - kompozit anahtar
timestamp user_id page_id action_id
Ben her sayfada kullanıcı eylemleri saymak için bir Hadoop işi yazmak istiyorum, bu yüzden çıktı dosyası görünmelidir böyle:
user_id page_id number_of_actions
burada kompozit anahtar gibi bir şey gerekiyor - bu user_id ve PAGE_ID içerecektir. Bunu hadoop ile yapmak için herhangi bir genel yolu var mı? Yardımcı bir şey bulamadım.
context.write(new Text(user_id + "\t" + page_id), one);
O inşaat, ama en iyi çözüm olmadığını hissetmek: Şimdiye kadar eşleştiricisindeki böyle anahtarını yayan ediyorum.
ComparisionChain bu kullanım durumu için gerçekten kolaylık sağlar. Teşekkürler –