Bir metin dosyası üzerinde aşağıdaki komutu kullanmaya çalışıyorum başarısız oldu:sıralama: string karşılaştırma Geçersiz veya eksik çokbaytlı veya geniş karakter
aşağıdaki hata mesajı alıyorum Ancak$ sort <m.txt | uniq -c | sort -nr >m.dict
:
sort: string comparison failed: Invalid or incomplete multibyte or wide character
sort: Set LC_ALL='C' to work around the problem.
sort: The strings compared were ‘enwedig\r’ and ‘mwy\r’.
Windows 7'de Cygwin kullanıyorum ve her sözcüğü yeni bir satırda dosyaya koymak için m.txt dosyasını düzenlemede sorun yaşıyordum. bakınız: Python içinde Galli metin üzerinde çalışmak edildiğinde
Using AWK to place each word in a text file on a new line
bunu ne kadar bu hatalar nedeniyle alıyorum emin değilim, ya da (m.txt Galli alfabesinden karakterler içerdiğinden, Kodlamayı 'Latin-1' olarak değiştirmem gerekiyordu.
Hata mesajının önerilerini takip etmeyi ve LC_ALL = 'C' değiştirmeyi denedim ancak bu yardımcı olmadı. Herkes, aldığım hataların ayrıntılarını açıklayabilir ve bu sorunu çözmeye çalışmakla ilgili olarak tavsiyelerde bulunabilir.
GÜNCELLEME:
dos2unix çalışırken, hatalar belli hatlarda geçersiz karakterler hakkında görüntülenen ediliyordu. Bu Galce karakterleri değil, diğer garip karakterler (oklar vb) değildi çıktı. Dos2unix komutunu hatasız kullanana kadar bu karakterleri kaldırarak metin dosyamdan geçtim. Ancak, dos2unix komutunu kullandıktan sonra tüm metin birleştirildi (boşluk/satırsonu veya herhangi bir şey, dosyadaki her sözcük ayrı bir satırda olmalıydı). Daha sonra unix2dos kullandım ve metin dosyası normale döndü . Her bir kelimeyi kendi satırında nasıl yapabilirim ve '\ r' karakterleri hakkında bana hatalar vermeden sıralama komutunu kullanabilir miyim?
'dos2unix' bir uzun satıra yol açmaz; Sadece Unix satır sonlarını anlamayan Windows araçları. Bir Unix dosyasına bakmak için bir Windows editörü kullanmayın, 'vi 'gibi bir Unix editörü kullanın ve her kelimeyi bir satırda görürsünüz. Ve Windows sıralama programını değil, cygwin sıralama programını kullandığınızdan emin olun. Emin olmak için '/ usr/bin/sort' kullanın. – Jens
Ah görüyorum. Benim problemim hala çözülmedi ama sanırım şimdi asıl sorudan çok uzaklaştı ve ben de bir tane daha yarattım. Şimdi bu soruyu kapatacağım, yardımın için teşekkürler. – hjalpmig