Bu yüzden bir sitedeki heykelleri kazımak için aşağıdaki kodu kullanıyorum. Sorun, bazı bölümlerin eksik olmasıdır. Örneğin, bölüm 1 ila bölüm 2 için sayfalar vardır, daha sonra bölüm 3,4,5 için sayfa mevcut değildir. Kullanım aralığı (1,9) kullanıldığında, bana (0003/0003, 0004/0004, 0005/0005) URL'leri mevcut olmadığından bölüm 3,4,5 içeriklerini toplayamadığı için hatalar verir.BeautifulSoup kullanarak Python web kazıma, Loop ve belirli URL değerini atla
Döngüsümdeki eksik URL'leri nasıl atlayabilirim ve programın aralıktaki bir sonraki kullanılabilir URL'yi bulmasına nasıl izin verebilirim? Burada
bölüm 1'in url'dir: http://www.leg.state.fl.us/statutes/index.cfm?App_mode=Display_Statute&URL=0000-0099/0001/0001.html
Hızlı yanıt için teşekkürler! kod çalışır! Bana tam olarak ne denemeyi/hariç tutmayı açıklar mısınız? Requestexception işlevi yapar? – CHballer
Bu, Özel durumları işleme hakkında (daha fazlası için bkz. Https://docs.python.org/2/tutorial/errors.html#handling-exceptions). Ama sizin durumunuzda, konu "find_all" undefined 'tableContents' nesnesine (eksik bölümlere) uygulandı. – SLePort