2016-03-23 28 views
0

DocumentTermMatrix'teki maxWordLength argümanının herhangi bir etkisi yok gibi görünüyor (uyarı yok, hata yok). Tm_0.6-2 kullanıyorum. R sürümü 3.2.2 mac. Herhangi bir fikir? Corpus (DataframeSource (data.frame (as.character ("Bu son derece uzun kelime ile benim test dizedir")))) df.dtf < - - DocumentTermMatrix (df, kontrol = listesinde (tokenizeDocumentTermMatrix çalışmıyor?

< df = BigramTokenizer, minWordLength = 2, maxWordLength = 4, minDocFreq = minFreq))

kontrol (df.dtf)

verim:

kontrol (df.dtf) <> dışı/seyrek girişleri: 7/0 sparsity: 0% Maksimal terimi uzunluk: 13 Ağırlık: Burada frekans (tf) kelime

Terms 

Dokümanlar derece uzun bir şerit testi Bu 1 1 1 sana doğru anlaşıldığı takdirde 1 1 1 1

cevap

0

Bu 1, benim için çalışıyor ve sadece 'sınır' maksimum kelime uzunluğu istiyorum:

df.dtf <- DocumentTermMatrix(df, control = list(wordLengths=c(1,4)))