2016-07-20 38 views
12

site'u ayrıştırmam gerekiyordu, ancak 403 Yasaklı hatam var.Python istekleri. 403 Yasak

url = 'http://worldagnetwork.com/' 
result = requests.get(url) 
print(result.content.decode()) 

Onun çıkışı::

<html> 
<head><title>403 Forbidden</title></head> 
<body bgcolor="white"> 
<center><h1>403 Forbidden</h1></center> 
<hr><center>nginx</center> 
</body> 
</html> 

, sorunun ne olduğunu söyle İşte koddur.

cevap

38

Sayfa User-Agent tanımlamak istemeyen GET istekleri reddediyor gibi görünüyor. Bir tarayıcı (Chrome) sayfasını ziyaret ederek GET isteğin User-Agent başlık (geliştirici araçları Ağ sekmesinde bakmak) kopyalanan:

import requests 
url = 'http://worldagnetwork.com/' 
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'} 
result = requests.get(url, headers=headers) 
print(result.content.decode()) 

# <!doctype html> 
# <!--[if lt IE 7 ]><html class="no-js ie ie6" lang="en"> <![endif]--> 
# <!--[if IE 7 ]><html class="no-js ie ie7" lang="en"> <![endif]--> 
# <!--[if IE 8 ]><html class="no-js ie ie8" lang="en"> <![endif]--> 
# <!--[if (gte IE 9)|!(IE)]><!--><html class="no-js" lang="en"> <!--<![endif]--> 
# ... 
+0

çok teşekkür ederiz! –

+0

benim için çalıştı, teşekkür ederim –

+0

Ben bu hata neden benim için açılır açıldığını anlamıyorum, birkaç saat önce çalışıyordu. Ama çözüm mükemmel çalıştı, teşekkürler! – rodrigorf