unicode和ascii字符编码 几个字符组成一个字?
几个字符组成一个字?
2个字符。
字符是指计算机中不使用的字母、数字、字和符号,除了:1、2、3、A、B、C、~!·#¥%……—*()——等等。在ASCII编码中,一个英文字母字符存储要1个字节。在GB2312编码或GBK编码中,一个汉字字符存储是需要2个字节。
汉字的文字编码标准主要有ASCII、GB2312、GBK、Unicode等。ASCII编码是最简单的西文编码方案。GB2312、GBK、GB18030是汉字字符编码方案的国家标准。ISO/IEC10646和Unicode都是全球字符编码的国际标准。
是为解决、日本和韩国的象形文字符和ASCII的某种兼容性,直接出现了双字节字符集,DBCS从第256代码开始,得象ASCII差不多,在此之前的128个代码是ASCII。
较高的128个代码中的某些总是跟随着第二个字节。这两个字节互相(称作首字节和领着字节)定义一个字符,正常情况是两个奇怪的象形文字。
有了utf-8还要unicode干嘛?
Unicode是一个字符集。UTF-8是编码规则。
unicode虽定义方法字符的二进制编码,但没有规定怎么储存。UTF-8是符号表示了二进制码如何能存储位置。它是一种可变长度的编码规则与ASCII首字节兼容,方便些转换,通用性好。
什么是Unicode码?
Unicode是一种可能的宽字符集。由Unicode协会开发的能可以表示全都世界上所有书写语言的字符编码标准。Unicode字符清单有多种代表形式,以及UTF-8、UTF-16和UTF-32。大都Windows界面使用UTF-16。
Unicode传输格式8(UTF-8)
在ASCII码基础上发展的协议字符设置。UTF-8协议可以提供ASCII码的扩展支持,UCS-2码的翻译,国际16进制Unicode编码字符设置。与建议使用字符数据的ASCII或存储ASCII编码比起,UTF-8可获得更大范围的名称。
Unicode字符系统(UCS)
充当Unicode标准一部分的国际标准字符集建议参考。现在广泛在用的UCS标准的版本是UCS-2,该版本委托的16位字符数值已才是世界上大多数语言的编码标准而被认可,并得到了承认。
再选unicode就可以了。
如果不是没有特殊字符,ansi保存也没事。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。