içine Python bilinmeyen kodlamayla Dosya alınıyor.Python HTTP üzerinden bir sekme ile sınırlandırılmış dosyasını içe üzerinde çalışmak MongoDB
MongoDB içine satırın veri ekleme önce, eğik çizgi kaldırarak ediyorum, kene ve ipten tırnak. olduğunca çabuk elimden geldiği kadar ben istiyorum yaptığım okuma, bu sorunu çözmek için bir çaba içinde Yani
bson.errors.InvalidStringData: strings in documents must be valid UTF-8
: bilginin kodlanması MongoDB bana istisna atıyor ne olursa olsun
, unicode() işlevini kullanarak satırın verilerini Unicode'a dönüştürün. Buna ek olarak, ilk parametre olarak kod çözme() fonksiyonu geçen "unicode" çağıran denedi ama hata alırsınız: Böyle eğik çizgi yerine olarak benim dize manipülasyonlar yapabilir, Oradan
LookupError: unknown encoding: unicode
, keneler ve tırnak. Sonra verileri MongoDB'ye yerleştirmeden önce, str.encode ('utf-8') fonksiyonunu kullanarak UTF-8'e dönüştürün.
Sorun: Unicode için dönüştürürken, ben bu hata ile hata
UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 1258: ordinal not in range(128)
alıyorum, ben devam etmek tam olarak nerede emin değilim. Nasıl başarıyla kodlama bilmeden bir dosyadan veri almak yoktur ve başarılı UTF-8 gerektirir MongoDB, takın:
Sorum şudur?
sayesinde çok!
Bu neden etiketli "csv" this article okuma düşünün? –
Ancak "HTTP üzerinden sekmeyle ayrılmış bir dosya içe aktarılıyor" dediniz ... "CSV" buna uygun mu? –