Metin lekeleri dışındaki adları filtrelemeye çalışıyorum. Şu anda sadece bir kelime listesi üretiyorum ve el ile filtreliyorum ama daha iyi bir yol arıyorum diye ~ 8k kelimelere sahibim. Bir sözlük alıp filtreleyebilirim ama bu, smith ve uçurum gibi isimleri caydırabilirdi.Uygun isimlerin listesi?
Benim ihtiyacım aşağıdakilerden biri geçerlidir: Ortak isimlerin
- bir liste
- da kelime olmak olur bir isim listesi (ı> 5k en yaygın isimler gerekiyordu)
Aralarında bir şey buluyorum, ihtiyacım olan şeyi elde etmek için birleşik bir kara liste/beyaz liste yapabilirim.
Hangi dilde ortak adlar? Ya da hangi ülkede, çünkü "Ali" Arapça bir isim olmasına rağmen ABD'de oldukça popülerdir. –
@John, Olduğu gibi, çoğunlukla, İngilizce, ancak bundan sonra, hemen hemen her şey. "Ayrıca kelimeler" biti; İngilizce. – BCS