对照表怎么做 Unicode和ASCII的区别是什么?
Unicode和ASCII的区别是什么?
ASCII是对26个英文字母和一些常用符号进行编码,然后扩展一半。总之,它是一个字节用于编码,大于128的部分是一些特殊符号。但是ASCII不能编码其他任何东西。例如,没有说“中国ASCII码需要2个字符”。ASCII只有一个字节。Unicode足以编码地球上所有的语言,因此它包括所有可以用ASCII表示的语言。Unicode本身只有两个字节。UTF-8、UTF-16等的出现是为了根据不同的应用环境提高整体编码效率。例如,如果一篇文章的大部分是英文的(可以用一个字节来表示),UTF-8更合适。如果文章大部分是中文(需要双字节),utf-16可能更适合计算机发明后,为了在计算机中表达字符,人们开发了一种称为ASCII码的代码。ASCII码由一个字节中的7位表示,范围从0x00到0x7F,总共128个字符。然后他们突然发现,如果需要以表格形式打印这些字符,就缺少“制表符”。因此,ASCII的定义被扩展为使用一个字节的所有8位来表示字符,这被称为扩展ASCII码。范围为0x00-0xff,共256个字符。中国人用两个连续的扩展ASCII区域(0xa0之后)来表示一个汉字。本方法的标准为gb-2312。后来,日本,韩国,阿拉伯,台湾传统(大5)。。。它们都采用相似的方法来扩展局部字符集的定义,现在统一为MBCs字符集(multi-byte character set)。这种方法存在缺陷,因为不同国家和地区定义的字符集有交集,所以使用gb-2312软件,不能在Big-5环境下运行(显示乱码),反之亦然。为了对全世界人民的所有字符进行编码,人们建立了Unicode标准字符集。Unicode使用两个字节来表示一个字符(unsigned shot int、wcharwcharuut、OLECHAR)。最后,世界上任何一个地区的软件都可以在另一个地区运行,而无需修改。虽然我用IE浏览日文网站,但它显示了我不认识的日文字符,但至少不会被乱码。Unicode的范围从0x0000到0xFFFF,总共有6万多个字符,其中仅汉字就占了4万多个
ASCII是一种古老的代码。当时,字符集和代码没有区别,可以看作是两者的结合。
严格来说,Unicode是一个字符集,可以通过多种方式进行编码。UTF-8是一种Unicode编码。我记得,兼容性最好的是没有BOM头的UTF-8。注:字符集是字符集,它包含一定数量的字符。每个字符都有一个对应的ID值,称为代码点。在实际存储中,不需要直接存储字符串的代码点(例如,为了节省空间),因此需要对其进行转换。转换规则是编码。
对照表怎么做 unicode码和ascii码相同吗 unicode编码和ascii码
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。