Gensim içinde bir LDA modeli için en uygun konu sayısını elde etmeye çalışıyorum. Bulduğum bir yöntem, her model için günlük olasılığını hesaplamak ve her birini birbiriyle karşılaştırmak, örn. The input parameters for using latent Dirichlet allocation DolayısıylaGensim kullanarak LDA Modeli için en uygun konu sayısını elde etmenin en iyi yolu nedir?
azından ben Gensim ile LDA-modelin günlük olasılığını hesaplarken içine baktı ve post aşağıdaki rastladım: temelde update_alpha() yöntemi Huang, Jonathan sayfasında açıklanan yöntemi uygulayan belirten How do you estimate α parameter of a latent dirichlet allocation model?
. Dirichlet dağıtım parametrelerinin maksimum olasılık tahmini. Yine de, bu parametreyi kod değiştirmeden libary kullanarak nasıl elde edeceğimi bilmiyorum.
Bir LDA modelinden Gensim ile günlük olasılığını nasıl alabilirim?
Gensim ile en uygun konu sayısını elde etmek için daha iyi bir yol var mı?
Burada "en iyi" sayıda konuyla ilgili bir cevap bulabilirsiniz: http://stackoverflow.com/questions/31729227/how-to-evaluate-the-best-k-for-lda-using-mallet. Esasen, en fazla sayıda konu dediğiniz şey, verilerde görmek istediğiniz şeylere bağlıdır. – jknappen
Olasılığı bulmayı başardınız mı? – Peanut