Harita ile bu algoritmanın uygulanmasında yardıma ihtiyacım var. Büyük bir veri setinden geçecek bazı metin dosyalarını okuyacağım ve bu satırlarda belirli terimleri arayabilecek bir algoritma var. Java'da uygulamam var ama kod yazmayı istemedim, öyle görünmüyor ki, benim için onu uygulamak için birini arıyordum, ama gerçekte çok fazla yardıma ihtiyacım var! Bu benim projem için planlanmadı, ancak veri seti çok büyük oldu, bu yüzden öğretmen bunu böyle yapmam gerektiğini söyledi.Hadoop MapReduce
DÜZENLEME Ben verisi seti Hadoop küme üzerinde olduğu (i versiyonunu previos açıklık yoktu) ve ben MapReduce okuyordum onun MapReduce uygulaması
yapmak ve ben ilk yapmak thaught gerekir standart uygulama ve daha sonra haritacı ile daha az/daha kolay olacaktır. Ancak, algoritma oldukça aptalca ve özel bir şey olmadığı ve haritayı azalttığı için ... ... aklımı buralarda dolamıyorum. Gördüğünüz gibi Yani burada
,
LIST termList (there is method that creates this list from lucene index)
FOLDER topFolder
INPUT topFolder
IF it is folder and not empty
list files (there are 30 sub folders inside)
FOR EACH sub folder
GET file "CheckedFile.txt"
analyze(CheckedFile)
ENDFOR
END IF
Method ANALYZE(CheckedFile)
read CheckedFile
WHILE CheckedFile has next line
GET line
FOR(loops through termList)
GET third word from line
IF third word = term from list
append whole line to string buffer
ENDIF
ENDFOR
END WHILE
OUTPUT string buffer to file
Ayrıca benim algoritmanın sözde kod kısaca "analiz" oluşturulacak, yeni bir dosya adı verilen sahiptir her zaman olduğu, ben bu mapreduce anlaşılmaktadır zordur birçok çıktıya yazmak ???
Ben mapreduce sezgi anlamak ve benim örnek MapReduce için son derece uygundur görünüyor, ama bunu yapmak için geldiğinde, açıkçası yeterince bilmiyorum ve ben TAKıLMA değilim!
Lütfen yardım edin.
Merhaba! Cevap için teşekkürler! Ama anladığımdan emin değilim: Bana biraz daha bilgi verebilir misin? Bunun gibi bazı örnekler var mı? – Julia