UTF-8 这种编码已经是大势所趋,但是还有不少中文的文档保留着老式的 GB2132 编码,而且只要你要和 Windows 打交道,就免不了要处理 GB2132 的问题,比如处理从 Windows 下拷过来的程序源代码、文本文件、字母文件之类。
编码转换的方法估计大多数同学都知道了,不过还是有必要再强调一下,我就是老忘……
Linux 下的 iconv 命令可以来处理字符编码的转换,基本命令格式如下:
-f 代表 from,-t 代表 to。
假设我要把 text.txt 从 GB2132 编码转换成 UTF-8,并且保存为 text-utf-8.txt 的话,那么命令如下:
不过有的时候,转换会报错,很可能的原因是原文件中有些字符超过了 GB2132 的范围,那么,这个时候,我们可以把 GB2312 改成它的超集 GB18030,一般就解决问题了:
is-Programmer 是一个面向 Linux 爱好者与程序员的 Blog 系统,具有简洁的风格,方便的代码高亮和数学公式插入功能,适合撰写学习笔记和技术文档。
Host by is-Programmer.com | Power by Chito 1.3.3 beta
2008年1月10日 15:57 好久没有用这个命令了呵呵
2008年1月10日 23:52 传说中的iconv
2023年7月20日 05:01
Hi everyone, I really love your story. You have very useful information; I am from Imamia Quran Academy. Online ahle tashi Madrasa has enabled students to grasp and learn Quran knowledge via one click. It includes the basic beliefs of the Shias, the history of Islam, Nahj al-Balagha (which contains the sermons of Hazrat Ali a.s), and the prayers of other imams such as the book of supplications of Hazrat Imam Sajjad a.s, (Sahifa Sajjadiya).