对字符进行编码,是信息交流的技术基础,在此之前,需要了解一些基本概念,如“字节”“字符”“字符集”“编码”“内码”。
1、字节、字符和字符集:
字节是计算机存储数据的单位,一个字节是一串8位二进制数,是一个具体的二进制空间;
字符是各种文字和符号的总称,包括各个国家文字、标点符号、图形符号、数字等;
字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集有ASCII字符集等。
2、内码:在计算机科学及相关领域中,内码是指整机系统中使用的二进制字符编码,指的是“将资讯编码后,通过某种方式存储在特定存储设备时,内部的编码形式”。在不同的系统中,会有不同的内码。