Yığın akışını ve web'de arama yaptım ve yalnızca kısmi çözümleri bulabilir VEYA TM veya qdap'deki değişikliklerden dolayı çalışmayan bazı dosyalar. Sorun aşağıda:Belge kimliğini R corpus ile koru
Bir dataframe vardır: (o Basit belge kimliği/adı ve bazı metin) kimliği ve Metin
İki sorunları var:
Bölüm 1: Bir tdm veya dtm nasıl oluşturabilirim ve belge adını/kimliğini nasıl koruyabilirim? Sadece teftişte "karakter (0)" gösterir (tdm).
Part 2 : Yalnızca belirli bir terimler listesini, yani özel stopwords'leri kaldırmanın karşılığını tutmak istiyorum. Bunun tüberlüğünde olmasını istiyorum, tdm/dtm değil. How to implement proximity rules in tm dictionary for counting words?
Bu seferki tdm kısmında gerçekleşir: Bölüm 2 için
, buraya geldiğimden bir çözüm kullandı! "Tm_map (my.corpus, keepOnlyWords, özel liste)" gibi bir şey kullandığınız 2. Bölüm için daha iyi bir çözüm var mı? "
Herhangi bir yardım büyük takdir edilecektir. Çok teşekkürler!
Harika! Bir rüya çalışıyor! – RUser
Teşekkürler. İyi iş! – imriss
ancak diğer deneyler için kullanabilmemiz için kimlikleri eşlenmiş bir veri çerçevesine nasıl dönüştürebiliriz? – bicepjai