打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
char、signed char、unsigned char的区别
    ANSI C 提供了3种字符类型,分别是char、signed char、unsigned char
char相当于signed char或者unsigned char,但是这取决于编译器!

这三种字符类型都是按照1个字节存储的,可以保存256个不同的值。
不同的是取值范围
signed char取值范围是 -128 到127
unsigned char 取值范围是 0 到255
signed char的最高位为符号位,因此char能表示-128~127, unsignedchar没有符号位,因此能表示0~255。


但是char究竟相当于signed char呢还是相当于unsigned char呢??
这就是char和int的不同之处!
int==signedint,但是char不能简单以为==signed char

要确定char究竟等同什么要基于不同的编译器做测试
大多数机器使用补码来存储整数,在这些机器中按照整数类型存储的-1的所有位均是1
假设我的机器也是如此存储,就能据此判断char究竟是等于signed char还是unsigned char
在实际使用过程种有什么区别呢?

主要是符号位,但是在普通的赋值,读写文件和网络字节流都没什么区别,反正就是一个字节,不管最高位是什么,最终的读取结果都一样,只是你怎么理解最高位而已,在屏幕上面的显示可能不一样。

但是我们却发现在表示byte时,都用unsignedchar,这是因为byte没有符号位之说

如果是char,那么系统认为最高位是符号位,而int可能是16或者32位,那么会对最高位进行扩展(注意,赋给unsignedint也会扩展),而如果是unsigned char,那么不会扩展。

这就是二者的最大区别。

同理可以推导到其它的类型,比如short, unsigned short。等等

具体可以通过下面的小例子看看其区别
static get_utili(const char *p)
{ int util;
 
  while
(isspace((int)*p)) //跳过空格
    ++p;
  util = (int) *p++;
 
}
现象&后果: 

当传入的参数p指向的内容为0x9A、0XAB等内容(最高位为1)时,得到的int型变量util的值将会出错,因为char会进行符号扩展,使得0x9A(十进制的154)变成了-102。会造成程序运行时的数据处理错误。

Bug分析: 

char符号扩展是与编译器相关的,但在x86平台上,对于任何主流的编译平台,char总是进行符号扩展的。上述代码在将char型的*p赋给int型变量util的时候,需要先进行char型到unsignedchar型的转换,以避免按照char的最高位进行符号扩展。
上述出错代码的符号扩展过程如下:
因为要扩展的短数据类型为有符号数的-- char x=10011100b(即0x9A)
因而在int y=(int)x时--进行符号扩展,即短数据类型的符号位填充到长数据类型的高字节位(比短数据类型多出的那一部分),则y的值为1111111110011100b(变成了十进制的-102);
但是,将要扩展的短数据类型变成无符号数后--unsigned char x=10011100b(即0x9A)
在 int y=(int)x时--进行扩展的时候是以零扩展,即用零来填充长数据类型的高字节位,则y的值应为0000000010011100b(十进制的154)。

正确代码: 
util = (int) *p++;改成
util = (int)(unsigned char) *p++


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
C语言数据存储
数据在内存中的存储
char 与 unsigned char的本质区别
对有符号字符型的深入理解
为什么char的范围是 —128~ 127
15W4K58S4 实验4:自动类型转换
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服