1.空指针
一般来说,程序的起始地址是从“代码区”的0地址开始存放的(注:如果插入一个内存分布图,则更能说明问题,此处省略),但实际上现代操作系统并非如此,却保留了从0开始的一块内存。至于这块内存到底有有多大,与具体的操作系统有关。如果程序试图访问这块内存,则系统提示异常。
为什么操作系统不是保留一个字节呢?由于内存管理是按页来进行的,因此无法做到单独保留一个字节。尽管如此,但还是有极少数系统设定RAM区从0地址开始,但指向有效变量的指针不会指向0地址。即使“代码区”从0地址开始,但在任何情况下,0地址都不是C语言中任何函数的起始地址,因此指向有效函数地址的指针也不会指向0地址。
☛ 课外知识延伸
虽然 80C51微控制器XDATA区(外部RAM)是从0地址开始的,但只要对保存在0地址中的变量不进行取地址操作(&操作),即可有效地保证指针不会指向0地址。
与此同时,虽然32位ARM7微控制器也是从0地址开始的,但这块内存仅用于存放中断向量代码,而不是程序中的有效变量地址,因此即便用空指针来判断指针的有效性,其仍然是可行的。
基于此,于是将空指针定义为指向0地址的指针。毫无疑问,任何一种指针类型都有一个特殊的指针值,即空指针。它既不会指向任何对象或函数,也不是任何对象或函数的地址。而未初始化的指针,则完全可能指向任何地方。
由此可见,空指针与未初始化的指针是完全不同的两个概念。那么,将如何在程序中获得一个空指针呢?
2. 空指针常量与NULL
标准C规定,在初始化、赋值或比较时,如果一边是变量或指针类型的表达式,则编译器可以确定另一边的常数0为空指针,并生成正确的空指针值。即在指针上下文中“值为0的整型常量表达式”在编译时转换为空指针。
为了让程序中的空指针使用更加明确,标准C专门定义了一个标准预处理宏NULL,其值为“空指针常量”,通常为0或(void *)0,即在指针上下文中NULL与0是等价的,而未加修饰的0也是完全可以接受的。由于void *指针的特殊赋值属性,比如:
#define NULL ((void *)0)
当NULL定义为((void *)0)时,即NULL是可以赋值给任何类型指针的值,它的类型为void*,而不是整数0,因此初始化“FILE *fp = NULL;”是完全合法的。
而为了区分整数0和空指针0,当需要其它类型的0的时候,即使可能工作,但也不能使用NULL,如果这样处理其格式是错误的,这在非指针上下文中是不能工作的。特别地,不能在需要ASCII空字符(NUL)的地方使用NULL。如果确实需要,则可以自定义为:
#define NUL ''
由此可见,常数0是一个空指针常量,而NULL仅仅是它的一个别名。
3. 空指针的用途
一般来说,未初始化是不能使用的非法指针,因为它完全有可能指向任何地方,从而导致程序无法判断它为非法指针。因此,不管指针变量是全局的还是局部的、静态的还是非静态的,都应该在声明它的同时进行初始化,要么赋予一个有效的地址,要么赋予NULL。
标准C规定,全局指针变量的默认值为NULL,而对于局部指针变量则必须明确地指定其初值。因此,void通常用于指针变量的初始化,用来判断一个指针的有效性。比如:
unsigned char *pucBuf=(void *)0; // 定义pucBuf为unsigned char类型指针并初始化为空指针
如果后续的代码忘记初始化指针而直接使用的话,则可能造成程序失败。虽然空指针也是非法指针,但可以通过程序判断并告诉程序员代码可能有问题。也就是说,如果一开始就将指针初始化为空指针,则可避免程序异常。比如:
if(pucBuf==0){
return error; // 如果pucBuf为空指针,则返回参数错误
}
由于void类型指针的不确定性,因此它可以指向任意类型的数据,那么只要在使用时做一个简单的强制类型转换就可以了。比如:
unsignned char *pcData = NULL; // 定义pcData为unsigned char类型指针
void *pvData; // 定义pvData为void类型指针
pvData = pcData; // 无需进行强制类型转换
pcData = (unsigned char*) pvData; // 将pvData强制转换为unsigned char类型指针
显然不存在void类型的对象,也就是说,当对象为空类型时,其大小为0字节;当对象未确定类型时,那么它的大小也是未确定的,因此不能声明void类型变量。比如:
void a; // 非法声明
既然上述声明是非法的,那么,也就不能将sizeof运算符用于void类型。也就意味着,编译器不知道所指对象的大小,由于指针的算术运算总是基于所指对象的大小的,因此不允许对void指针进行算术运算。
总之,在指针声明中,void *表示通用指针的类型。如果void作为函数的返回类型,则表示不返回任何值。如果void位于参数列表中,则表示没有参数。
4. 用无类型指针作为函数参数
由于C语言中最小长度的变量为char类型(包括unsigned char、signed char等),其sizeof(char)的结果为1,而其它任何变量的长度都是它的整数倍。比如,如果使用SDCC51编译器,其sizeof(int)为2。因为通用swap函数函数不知道需要交换的变量的类型,所以需要一个参数给出相应的指示。由于C语言的变量类型多种多样,因此不可能为每一种变量类型编号,而且swap并不关心变量的真正类型,所以可以用变量的长度代替变量类型。通用swap函数的原型为:
void swap(void *pvData1, void *pvData2, int iDataSize)
将a,b两个变量(变量类型必须一样)的值交换的代码如下:
swap(&a, &b, sizeof(a));
通用swap排序函数的参考代码见程序清单1.1。
程序清单1.1 通用swap排序函数
1 void swap (void *pvData1, void *pvData2, int iDataSize)
2 {
3 unsigned char *pcData1 = NULL;
4 unsigned char *pcData2 = NULL;
5 unsigned char ucTmp1;
6
7 pcData1 = (unsigned char *)pvData1;
8 pcData2 = (unsigned char *)pvData2;
9
10 do {
11 ucTmp1 = *pcData1;
12 *pcData1 = *pcData2;
13 *pcData2 = ucTmp1;
14 pcData1++;
15 pcData2++;
16 } while (--iDataSize > 0);
17 }