2010-11-04 22 views
5

ExtractingRequestHandler'ı kullanarak PDF'leri Solr ile dizinliyorum. Sayfa numarasını, bir belgedeki isabetlerle birlikte görüntülemek istiyorum. "foo terimi 0, 2, 3 ve 5, sayfalarda bar.pdf bulunmuştur."Sayfa numaraları ile PDF'yi Solr ile eşitleme

Bu gibi sorgu sonucuna sayfa numaralarını eklemek mümkün mü?

cevap

5

Bazı geliştirme çabaları gerektirir, ancak bunu her bir belgenin her sayfasını ayrı bir Solr belgesi olarak dizine ekleyerek ve ardından her bir belge için farklı sayfa isabetlerini gruplandırmak için field collapsing kullanın.

Bunun için bir geceye ihtiyacınız olduğunu unutmayın, şu anda yayınlanan Solr sürümünde alan daraltma uygulanmaz.

Ayrıca dikkat: Alan daraltma, sürüm Solr 3.3'da uygulanır. Bir sonraki büyük versiyonda daha fazla güncelleme bekleniyor (Solr 4.0)

+1

Bu noktada belki bu problem için yeni çözümler var mı? – zygimantus

+1

@zygimantus JIRA'da 10 yaşında olan birkaç SOLR biletini kontrol ettik. Hayır demesi oldukça güvenli. Önerilen yol, bu cevapta açıklandığı gibidir. Diğer yollar da mümkün olabilir, ancak Solr'un kendisini özelleştirmek zorunda olduğunuzdan daha uzun sürecek/zorlaşacaktır. – Howie