Kullanıcının arama değerini ve captcha'yı girmesini gerektiren bir siteyi taramaya çalışıyorum. Captcha için zamanın% 33'ünü aşan bir optik karakter tanıma (OCR) rutinim var. Captcha'lar her zaman alfabetik metin olduğundan, OCR işlevi alfabetik olmayan karakterler döndürdüğünde captcha'yu yeniden yüklemek istiyorum. Bir metin "kelimesi" aldığımda, arama formunu göndermek istiyorum.Bir captcha ile başa çıkmak için Scrapy'yi nasıl kurarım
Sonuçlar, yeni bir arama için hazır form ve yeni bir captcha ile aynı sayfaya geri gelir. Bu yüzden arama terimlerimi tüketene kadar durulayıp tekrar etmem gerekiyor. OCR salt metin neden geri gelmezse başlangıçta
- Yük sayfa: İşte üst düzey algoritması var , kaptan doğru olup olmadığını görmek için yanıtı kontrol arama terimi ve Captcha
- ile sayfaya sorgu formu gönder captcha'yı yenileyip bu adımı
- tekrarlayın Doğru olsaydı
- , veri
- Git Ben captcha'yı almak için bir boru hattı kullanarak denedim ama sonra form gönderimine ilişkin değeri olmayan 2
için kazıyın. Çerçeveden geçmeden urllib veya başka bir şey kullanmadan görüntüyü getirirsem, oturumla birlikte tanımlama bilgisi gönderilmez, dolayısıyla sunucudaki captcha doğrulaması başarısız olur.
Bunu yapmanın en iyi yolu nedir?