Latin-1 (aka ISO-8859-1) karakter kümesi, en düşük 256 kod noktası olarak ayarlanan Unicode karakter kümesine gömülü olduğundan dönüşüm önemsiz, ama ben sadece ortak UTF kodlamaları için dönüşüm işlevleri içeren Data.Text.Encoding
içinde herhangi bir latin-1 kodlama dönüşüm işlevleri görmedim.Latin1 kodlu DataByteString ve Data.Text Arasındaki Dönüştürme
Latin-1 gösterimi ve Data.Text
değerleri kodlanmış Data.ByteString
değerleri arasında dönüştürmek için önerilen ve/veya verimli yolu nedir?
, "latin 1 karakter kümesi en düşük 256 kod noktaları olarak belirlenen Unicode karakter gömülü olduğundan, dönüşüm önemsiz olmasını beklersiniz" varsayımı yersizdir. İki farklı kodlamada tek bir kod noktası akışını kodlayan sonuç testlerinin birbiriyle çok küçük bir ilişkiye sahip olmasını beklemek için bir neden yoktur. –
@DanielWagner: Evet, genel durumda bunu beklememeliyim (örneğin, Data.Text, utf8 iç Unicode temsili olarak kullanılıyorsa), ancak Data.Text'in güncel sürümü. kütüphane, UTF16 gösterimini kullanır; buradaki latin1'den dönüştürme, aslında, sıfır oktetlerin sonra veya daha önce eklenmesinden (UTF16LE veya UTF16BE'nin gerekip gerekmediğine bağlı olarak) her latin1 oktetinden oluşan önemsiz bir dönüşümdür. – hvr