## 什么是编码 在日常工作中我们经常听到编码这个词汇,在了解编码之前,我们先来看看什么是字符集。字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。编码,就是对这些字符集的编码。比如A、B两种编码同时对Unicode字符集进行编码,在A编码中字母E的值为100,在B编码中字母E的值为200,都是对同一个字母的编码,但是他们在各自编码中的值并不一样。所以你用B编码打开A编码的文件,自然也就产生了所谓的乱码。 ## 关于Unicode Unicode是一个字符集,其中定义了全球所有国家的语言所使用的字符。对Unicode的编码方式,常见的有UTF8,UTF16,UTF32。UTF8兼容ASCII,大字符部分使用特征码用三字节进行编码。UTF16使用2字节编码,UTF32则使用了4字节,除此之外还有Big/Little Endian之分。UTF16兼顾了内存和效率,在EverEdit中大部分的数据交换、API都是通过UTF16进行的。 ## UTF8 因为UTF8兼容ASCII,所以对于只含有英文字符的UTF8编码的文件,如果不加BOM的话,它本身和ASCII没有任何区别。为了照顾这一点,在EverEdit中有一项设置,当探测到文件是ASCII编码时,可以强制认为它是UTF8编码。可以到`设置→文件`中启用。 ## 编码探测 EverEdit拥有强大的编码探测能力,可以准确的探测绝大多数的文件。当然,部分特征重合、或者特征不够强的文件也有可能出现探测失败的情况。编码探测,较为浪费CPU,从而造成启动缓慢,为此EverEdit提供了一个可以设置的探测的buffer的大小。用户可以自行修改`设置→性能`。 ## 编码转换 在日常工作中,我们经常会用到把一个文件转换成另一个编码的情况,EverEdit为此提供了充分的支持。用户可以非常方便的对单个文件,多个文件进行快速的转换。 **单文件转换**:`主菜单→文档→转换编码`。 **批量转码**:`主菜单→文档→批量转码`。 批量转码可以对所有打开的文件一次性设置编码和换行符。在列表区域,通过点击可以选择多个。
© 2011-2016 www.EverEdit.net. All rights reserved.