设为首页 加入收藏

TOP

Unicode简介(十)
2010-12-30 21:07:57 】 浏览:18619
Tags:Unicode 简介
ic变数,如下:

static char a[] = "Hello!" ;

无论哪种情况,字串都储存在静态程式记忆体中,并在末尾添加0,这样就需要7个位元组的储存空间。

宽字元
 

Unicode或者宽字元都没有改变char资料型态在C中的含义。char继续表示1个位元组的储存空间, sizeof (char) 继续返回1。理论上,C中1个位元组可比8位元长,但对我们大多数人来说,1个位元组(也就是1个char)是8位元宽。

C中的宽字元基於wchar_t资料型态,它在几个表头档案包括WCHAR.H中都有定义,像这样:

typedef unsigned short wchar_t ;

因此,wchar_t资料型态与无符号短整数型态相同,都是16位元宽。

要定义包含一个宽字元的变数,可使用下面的语句:

wchar_t c = 'A' ;

变数c是一个双位元组值0x0041,是Unicode表示的字母A。(然而,因为Intel微处理器从最小的位元组开始储存多位元组数值,该位元组实际上是以0x41、0x00的顺序保存在记忆体中。如果检查Unicode文字的电脑储存应注意这一点。)

您还可定义指向宽字串的指标:

wchar_t * p = L"Hello!" ;

注意紧接在第一个引号前面的大写字母L(代表「long」)。这将告诉编译器该字串按宽字元保存-即每个字元占用2个位元组。通常,指标变数p要占用4个位元组,而字串变数需要14个位元组-每个字元需要2个位元组,末尾的0还需要2个位元组。

同样,您还可以用下面的语句定义宽字元阵列:

static wchar_t a[] = L"Hello!" ;

该字串也需要14个位元组的储存空间,sizeof (a) 将返回14。索引阵列a可得到单独的字元。a[1] 的值是宽字元「e」,或者0x0065。

虽然看上去更像一个印刷符号,但第一个引号前面的L非常重要,并且在两个符号之间必须没有空格。只有带有L,编译器才知道您需要将字串存为每个字元2位元组。稍後,当我们看到使用宽字串而不是变数定义时,您还会遇到第一个引号前面的L。幸运的是,如果忘记了包含L,C编译器通常会给提出警告或错误资讯。

您还可在单个字元文字前面使用L字首,来表示它们应解释为宽字元。如下所示:

wchar_t c = L'A' ;

但通常这是不必要的,C编译器会对该字元进行扩充,使它成为宽字

首页 上一页 7 8 9 10 11 12 13 下一页 尾页 10/21/21
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇视窗和讯息 下一篇没有了

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目