ASCII
ASCII(发音: /ˈæski/ ass-kee[1],American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本EASCII则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。
ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,至今为止共定义了128个字符;其中33个字符无法显示(一些终端提供了扩展,使得这些字符可显示为诸如笑脸、扑克牌花式等8-bit符号),且这33个字符多数都已是陈废的控制字符。控制字符的用途主要是用来操控已经处理过的文字。在33个字符之外的是95个可显示的字符。用键盘敲下空白键所产生的空白字符也算1个可显示字符(显示为空白)。
Unicode
Unicode(中文:万国码、国际码、统一码、单一码)是计算机科学领域里的一项业界标准。它对世界上大部分的文字系统进行了整理、编码,使得电脑可以用更为简单的方式来呈现和处理文字。
ASCII码与程序语言关系
javascript与php 在127以后转的字符就不同了
//补充点 - 测试过程使用了PHP与JAVA建立TCP连接并发送数据且解析也可成功.
chr(); [手册-chr](http://php.net/manual/en/function.chr.php) // Values outside the valid range (0..255) will be bitwise and'ed with 255, which is equivalent to the following algorithm
ord(); [手册-ord](http://php.net/manual/en/function.ord.php)
String.fromCharCode
var str="Hello world!"
document.write(str.charCodeAt(1)) //将对应Unicode编码的转成对应的ASCII值.
字符 | ASCII | Unicode | UTF-8 |
---|---|---|---|
A | 0100 0001 | 0000 0000 0100 0001 | 0100 0001 |
中 | – | 0100 1110 0010 1101 | 1110 0100 1011 1000 1010 1101 |
相关资料
维基-ASCII
维基-Unicode
维基-Unicode字符列表
三种常见字符编码简介:ASCII、Unicode和UTF-8
阮一峰-字符编码笔记