Ben bir dizidir bir ben scikit en tfidf vectorizer kullanılarak elde edilen csr_matrix ve y olarak X'i sahipBir gensim corpus değişkenini bir csr_matrix ile nasıl başlatırsınız?
Planım LDA kullanılarak özellikleri oluşturmaktır, ancak, X ile bir gensim en korpus değişkeni nasıl başlatıldığını bulmak için başarısız bir csr_matrix olarak. Başka bir deyişle, gensim belgelerinde gösterildiği gibi bir corpus indirmek veya X'i yoğun bir matrise dönüştürmek istemiyorum çünkü çok fazla bellek tüketir ve bilgisayar askıda kalabilir. Kısacası
, sorularım
- nasıl I (seyrek) bir csr_matrix bütün külliyatını temsil sahip olduğu göz önüne alındığında, bir gensim külliyat başlatmak mı, şu vardır?
- Özellikleri ayıklamak için LDA'yı nasıl kullanırsınız?
Aynı zamanda terim frekans matrisini bu yönteme de iletebilir miyiz? – Shashank