DocumentTermMatrix'teki maxWordLength argümanının herhangi bir etkisi yok gibi görünüyor (uyarı yok, hata yok). Tm_0.6-2 kullanıyorum. R sürümü 3.2.2 mac. Herhangi bir fikir? Corpus (DataframeSource (data.frame (as.character ("Bu son derece uzun kelime ile benim test dizedir")))) df.dtf < - - DocumentTermMatrix (df, kontrol = listesinde (tokenizeDocumentTermMatrix çalışmıyor?
< df = BigramTokenizer, minWordLength = 2, maxWordLength = 4, minDocFreq = minFreq))
kontrol (df.dtf)
verim:
kontrol (df.dtf) <> dışı/seyrek girişleri: 7/0 sparsity: 0% Maksimal terimi uzunluk: 13 Ağırlık: Burada frekans (tf) kelime
Terms
Dokümanlar derece uzun bir şerit testi Bu 1 1 1 sana doğru anlaşıldığı takdirde 1 1 1 1