aynı örümcek birden çok örneğini başlatırken ederken şaşırıp. 1 örümcek örneği için 1 url gibi çalıştırmak istiyorum. 50k URL'leri işlemek zorundayım ve bunun için her biri için ayrı örnekleri başlatmam gerekiyor. benim ana örümcek komut dosyasında, ben uzun zamandır tarama değilim emin olmak için, 7 dakika closedpider timeut belirledik.Scrapy - Aynı örümcek işleminin birden çok örneğini nasıl başlatırsınız?
from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
import urlparse
for start_url in all_urls:
domain = urlparse.urlparse(start_url).netloc
if domain.startswith('ww'):
domain = domain.split(".",1)[1]
process = CrawlerProcess(get_project_settings())
process.crawl('textextractor', start_url=start_url,allowed_domains=domain)
process.start()
O 1 url için tamamen çalışır bur 2 url geçirildiğinde bundan sonra bu hata aşağıda verir: Aşağıdaki kodu bakınız
raise error.ReactorNotRestartable()
ReactorNotRestartable
bunu yapmak için ne yapması gerektiğini önermek Lütfen Aynı örümceğin birden çok örneğini çalıştırmak için Ayrıca, konuları kullanarak bir kerede birden fazla scrapy örneğini başlatmayı düşünüyorum. Bu iyi bir yaklaşım mı?
Herhangi güncelleme hakkında? – UriCS