my rap website numaralı telefondan tam metin arama işlevselliğini gerçekleştiriyorum ve rapçi ve şarkı adları ile bazı sorunları yaşıyorum. Örneğin, birisi "cam123" sorgusunu kullanarak "Cam'ron" rapçi için arama yapmak isteyebilir (ortadaki kelime kesme işaretini dışarıda bırakarak). Aynı şekilde, birisi "3peat" sorgusunu kullanarak "3 Peat" şarkısını arayabilir.Solr ile düzensiz rapçi adları için tam metin araması
"The Notorious B.I.G." biraz garip bir durum: "The Notorious BIG" ve "The Notorious B.I.G." Her iki çalışma (sanırım solr.StandardFilterFactory kısaltmalar noktalardan kaldırır çünkü sanırım?), ama "The Notorious B.I.G" (yani, eksi nokta).
İdeal olarak bu isimlerin tüm makul çeşitleri çalışmalıdır. Sanırım cevabın solr.WordDelimiterFilterFactory ile ilgisi var, ama emin değilim.
Ayrıca, eğer ilgili ise Rays ile Rayspot kullanıyorum.
Büyük tavsiye, teşekkürler. Aşağıdakileri ekledim: schema.xml:: '. Bu, "B.I.G" vakası hariç her şeyi çözüyor gibi görünüyor. Herhangi bir fikir? –
StandartTokenizatör nedeniyle olabilir. Bunun yerine WhitespaceTokenizer ile yerine.Analizörünüzün nasıl çalıştığını analiz etmek için, bunun için web arayüzünüz varsa, çözümünüzde "Analiz" seçeneğini kullanabilirsiniz. Orada analizörün metninizi dönüştürdüğünü ve çalışmanın sonucunun ne olduğunu görebilirsiniz. – Yurish