Örümcem bağlantılarını takip etmede sorun yaşıyorum. Scrapy öğreticisini defalarca okudum ve biraz arandım, ama hala kafam karıştı.Scrub parse_dir_contents ile ilgili bağlantıları takip etmiyor Geri arama
Bazı nedenlerden dolayı, yaklaşık 15-20 sayfalık yüzlerce sonuç yayılmış olsa da, örümcekim her zaman 5 - 7 sonuç döndürüyor ve tamamlandı diyor.
Her ikisi de parse_dir_contents yöntemim çağrılmadan hemen önce ve çalışmaya başladıkça sağda bazı baskı ifadeleri yerleştirdim. Bir sebepten ötürü, 40 kez (iki takım 20) denir ve sadece 5 - 7 kez çalışır. Her sayfa için yaklaşık 20 sonuç var ve her seferinde gezinmekte olduğu URL'yi yazdırıyorsam, sayfa 1'i asla geçmemesidir.
Eminim ki daha iyi yapabileceğim pek çok şey vardır bu kod Herhangi bir yardım, gerçekten takdir edilecektir. Bu işi yapmak için gerçekten çok çalışıyorum.
Burada, gerçekten işleri karıştırmaya yetecek miktarda "yardımcı" kod var. Özür dilerim, ancak size en iyi çözümü almak için kullanacağım kodları vermek istedim.
Her sayfada, her sayfa için çoğaltılan bir dizi "vip" listesi vardır. Bu yüzden sadece bir kez kazımak istedim ve numPages hesaplamasına katmalarını istemedim.
Ben ipuçlarını ve yorumlarınızı takdir ediyorum. Ben sadece bu örümcek elde etmek istiyorum ve istekliliğinizi t atmak istemiyorum gibi tam örümcek kod dahil kod güncellendi o yardım. Lütfen hata ayıklamaya yardımcı olmak için tüm çaylak kodunu ve rastgele yazdırma ifadelerini affedin. –
Oops, sizi yorumda etiketlemediğimi fark ettim. –