1.数值数据原码、反码和补码数值数据的符号在计算机中采用在数值位前设置符号位来表示,0表示正,1表示负计算机中有多种符号位和数值位一起编码的方法,常用的有原码、反码和补码原码的编码规则符号位用0表示正,用1表示负。数值部分用二进制的绝对值表示反码的编码规则正数的反码是其原码,负数的反码符号位不变、数值部分是对应的原码按位取反补码的编码规则正数的补码是其原码,负数的补码符号不变,数值部分是对应的反码再加1【例1.6】两个整数的加减法运算如用两字节存放数值,其中最高位为符号位,则42-84用补码表示为:
42的补码是0000000000101010,
-84的补码是1111111110101100,
42-84的运算,是42的补码加上-84的补码运算,
得到结果:1111111111010110,结果便是-42的补码*第29页,共74页,星期日,2025年,2月5日定点表示与浮点表示计算机中表示的数值如果采用固定小数点位置的方法称为定点表示,定点表示的数值有两种:定点整数和定点小数采用定点数表示的优点是数据的有效精度高,缺点是数据表示范围小如用16位表示定点整数,则补码表示的整数的范围是-32768~+32767数学上采用的“科学计数法”,在计算机数据编码中称为浮点表示即把表示这种数据的代码分成两段:一段表示数据的有效数值部分,另一段表示指数部分,即表示小数点的位置。当改变指数部分的数值时,相当于改变了小数点的位置,即小数点是浮动的,故称为浮点数计算机中称指数部分为阶码,数值部分为尾数,格式如图1-11所示,通常阶码用定点整数表示,尾数用定点小数表示。*第30页,共74页,星期日,2025年,2月5日2.西文字符目前对非数值数据使用最广泛的编码是美国标准信息交换码(AmericanStandardCodeforInformationInterchange),简称ASCII码。标准ASCII码是用七位二进制数来进行编码的。这样可以表示128种不同的字符在这128个字符中,包括0~9、52个大小写英文字母、32个标点符号和34个不可打印或显示的控制代码,每个字符在计算机内正好占用八个二进制位中的七位,最高位不用ASCII码表如表1-7所示。从上述码表中可以得知,字母A对应的ASCII码为1000001(41H)、字母a对应的ASCII码为1100001(61H)*第31页,共74页,星期日,2025年,2月5日3.汉字编码汉字信息处理的首要任务就是解决汉字在计算机中的表示,即汉字编码问题;其次是要解决汉字如何输入及汉字如何输出的问题由于目前计算机的输入设备包括键盘,因此人们首先研究
了各种从计算机键盘输入汉字的方法,同样为了能在屏幕显示汉字,人们首先考虑如何用“描点”的方式将汉字显示出来每一个汉字从键盘输入,到汉字在计算机内的存储和处理,再到屏幕上输出有各种字体的汉字字形,其中要经过一系列的处理和转换。计算机在处理汉字信息过程中的转换和处理过程可用如下流程表示*第32页,共74页,星期日,2025年,2月5日汉字存储编码方案国家标准GB2312—1980(信息交换用汉字编码字符集基本集)1980年我国颁布的第一个汉字编码字符集标准,简称GB2312-80或GB2312,它是现在所有简体汉字系统的基础,GB2312共有字符7445个,其中,汉字占6763个,图形符号682个GB2312—80规定的汉字与符号组成一个94×94的矩阵,在此方阵中的每一行称为一个“区”,每一列称为一个“位”,每个“区”和“位”的编号分别为01~94,因此任意一个国标汉字都有一个确切的区号和位号相对应*第33页,共74页,星期日,2025年,2月5日小知识汉字与符号在方阵中的分布情况如下01~09区:图形符号,共682个,如数学序号、日文假名、表格符号等16~55区:第一级汉字字符,共3755个常用汉字,按拼音/笔画顺序排列56~86区:第二级汉字字符,共3008个次常用汉字,按部首/笔画顺序排列10~15区及87~94区:空白位置,用于扩展及用户造字范围鉴于汉字数量众多,在计算机内存储时采用双字节编码方式,为避免与ASCII基本集冲突,存储编码的两个字节均取码A1~FE*第34页,共74页,星期日,2025年,2月5日BIG5码(大五码)BIG5是一个繁体字编码方案(事实上的标准)BIG5码也是双字节编码方案,首字节在A0~FE之间,次字节在4