2015-04-16 20 views
5

Yapmaya çalıştığım şey, bir HEADER istekleri içerik türünü bir dosya uzantısına dönüştürmektir. Tipik içerik türü, html sayfaları için python'dan verilen yanıt olan "text/html; charset = utf-8" şeklindedir. Mimetype modülünü, aradığım şeyi barındırdığı gibi görünmediğinden, hiç başarıya ulaşmamıştım.Content-Type üstbilgisini dosya uzantısına dönüştürün

İncelemesi: Ben "text/html; charset = utf-8" dönüştürmek istediğiniz

tipik görüntü içerik türü "image/jpeg" bağlı olan bu ".html"

içine görüntü türünde, ancak çoğu URL'nin yoldaki görüntüyü belirttiği düşünüldüğünde, görüntüler hakkında çok endişelenmiyorum. Bu, "blahahah.html" ile bitmeyen web siteleri için daha fazla

Temel python kitaplığında bulunmayan kütüphaneleri kullanmak istemiyorum.

cevap

8
Sen bölünmüş

ve Verileri,:

r = requests.get("http://stackoverflow.com/questions/29674905/convert-content-type-header-into-file-extension") 

from mimetypes import guess_extension 

print(guess_extension(r.headers['content-type'].split()[0].rstrip(";"))) 
.html 
+1

sayesinde, bir tanrısın. Hayatım için yapamamıştım, bu guess_extension nasıl çalıştı? – Shifty

+0

@Shiftym etmeyin, 'guess_extension (r.headers [ 'içerik tipi']) 'tek başına belirli sitelerde çalışır, ancak bölme daha fazla baz, –

+0

Garip anormallik kapsamalıdır - dosya uzantısı "htm" ve" arasında değişmektedir. html "aynı web sitesinde – Shifty