2016-04-09 23 views
6

jsoup olsa bir web sayfasına erişirken 404 alıyorum. Ancak, bir tarayıcıdan erişildiğinde sayfa düzgün yüklenir.jsoup aracılığıyla bir web sayfasına erişirken 404 alınıyor

Birkaç gün önce jsoup aracılığıyla sayfaya erişebildim. Ama şimdi 404'ü atar. Kullanıcı Aracısı, zaman aşımı vb. Eklemeye çalıştı ancak şans yok.

Firebug'da da istek için 404 alıyorum, ancak sayfa tarayıcıda düzgün yükleniyor.

Sayfanın tarayıcıda nasıl oluşturulduğundan değil, Java Programından nasıl üretildiğinden emin olun. hata altına alma, Java programını çalıştırırken On

Document doc = Jsoup.connect("http://example.com/stock.php?"+quote).userAgent("Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.110 Safari/537.36") 
      .timeout(1000*7).get(); 

:

org.jsoup.HttpStatusException: HTTP error fetching URL. Status=404, URL= http://example.com/stock.php?AAA
at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:537)

daha bilgi gerekirse lütfen bize bildirin.

+0

Tarayıcının yüklendiğinden emin misiniz? Önbellekten olabilir mi? – Areca

+0

Gerçek URL'yi ekleyebiliyorsanız faydalı olabilir. – TDG

+0

@Areca, Önbelleği de temizlemeyi denedim. Hala hayır şans. –

cevap

1

Varsayılan olarak Jsoup bir HTTP hatası aldığında bir istisna atar. Sayfa bir hata döndürse bile sayfa içeriğini okumak için ignoreHttpErrors değerini true olarak ayarlayabilirsiniz.

Document doc = Jsoup 
       .connect("http://example.com/stock.php?"+quote) 
       .userAgent("...") 
       .timeout(1000*7) 
       .ignoreHttpErrors(true) 
       .get();