edsionte's TechBlog

No Pains, No Gains

指针和数组的可交换性

7 2 月, 2011 by edsionte 无评论 »

指针和数组是不相同的，但“很多时候”我们总认为指针和数组等价的。不可否认，这两者在某种情况下是可以相互替换的，但并不能就因此而认为在所有情况下都适合。《指针和数组不是一回事儿》系列文章将逐步深入分析指针和数组的不同之处，并解释什么时候指数组等价于指针。本文属于《指针和数组不是一回事儿》系列文章之三。

虽然前面两篇文章已经说明了数组和指针的不同，但不可否认的是，指针和数组某些可相互交换的用法仍然令人混淆。本文将给出指针和数组可交换的情景，并且分析可交换的原因。

“指针和数组可以交换！”

说出这句话并不是毫无根据的，因为在下面的两个举例中使用数组形式和指针形式都可以达到相同的结果。

举例1：

#include < stdio.h >

int main()
{
	char *p = "edsionte";
	char str[] = "edsionte";

	printf("p[1]=%c *(p+1)=%c\n",p[1],*(p+1));
	printf("str[1]=%c *(str+1)=%c\n",str[1],*(str+1));

	return 0;
}

/* 编译并运行程序 */
edsionte@edsionte-laptop:~/code/expertC$ gcc tmp.c -o tmp
edsionte@edsionte-laptop:~/code/expertC$ ./tmp
p[1]=d *(p+1)=d
str[1]=d *(str+1)=d

在举例1中，指针p指向一个匿名的字符串“edsionte”，这个匿名字符串的占用的内存空间为9个字节；与p指向一个匿名字符串不同，数组str内存储着字符串“edsionte”，占用了9个字节的空间。

现在分别要访问’d’，则方法如下。对于指针p，分别可以通过指针形式*(p+1)和数组形式p[1]来访问其所指的数据；对于数组str，分别可以通过指针形式*(str+1)和数组形式str[1]来访问数组内的元素。

我们已经知道指针和数组在内存构造和访问方式上都不同，但为什么它们都分别可以通过指针的方式和数组的方式进行访问？

举例2：

#include < stdio.h >

void getStr_pointer(char *str)
{
	printf("%s\n",str);
	printf("getStr_pointer(): sizeof(str)=%d\n",sizeof(str));
}

void getStr_array(char str[100])
{
	printf("%s\n",str);
	printf("getStr_array(): sizeof(str)=%d\n",sizeof(str));
}

int main()
{
	char str[] = "I am edsionte!";

	getStr_pointer(str);
	getStr_array(str);
	printf("main(): sizeof(str)=%d\n",sizeof(str));
}

/* 编译并运行程序 */
edsionte@edsionte-laptop:~/code/expertC$ gcc tmp2.c -o tmp2
edsionte@edsionte-laptop:~/code/expertC$ ./tmp2
I am edsionte!
getStr_pointer(): sizeof(str)=4
I am edsionte!
getStr_array(): sizeof(str)=4
main(): sizeof(str)=15

在举例2中，getStr_pointer函数和getStr_array函数的功能都是显示一条字符串。但不同的是，前者传入的参数是一个指针，后者传入的参数是一个数组。在主函数中分别调用这两个函数，传入的参数都是数组str。

既然数组和指针不同，但为什么作为函数的形参，char str[ ]和char *str相同？

上述举例所引出的这两个问题正是本文讨论的重点，它们分别对应着“指针和数组是相同”的两种情况。下面将分别进行讨论。

1.表达式中的数组名就是指针

表达式中的数组名其实就是数组首元素的首地址。对于编译器而言，a[i]其实就是*(a+i)的形式，因此以数组形式访问数组元素总是可以写成“数组首元素首地址加上偏移量”的形式。取下标符号[ ]其实可以看成一种运算规则，即指向T类型的指针和一个整数相加，最终产生的结果类型为T。这里的指针就为数组首元素首地址，而整数即为数组的偏移量。

这里必须说明一下偏移量，它是指针每次移动的步长。对于数组而言，偏移量即数组元素的大小；对于指针而言，它的偏移量即为指针所指类型的大小。在对指针进行移动时，编译器负责计算每次指针移动的步长。

因此，str[i]和*(str+i)两种形式其实是等价的。因为编译器总是将数组形式的访问自动转换成指针形式的访问。上面的分析都是针对数组而言，其实对指针以数组和指针形式访问的原理也是如此。只不过此时的访问是对指针所指向数据的访问。

结合数组和指针访问方式的不同，下面对举例1的代码做详细分析：

1.1.以指针的形式和以数组的形式访问数组

从符号表中得到符号str的地址即为数组首元素的首地址。

以数组的形式：str[1]。从符号表中得到str符号的地址，即数组首元素的首地址；编译器将数组形式转化为*(str+1)，在首元素首地址上加一个偏移量得到新地址；从这个新地址中读取数据，即为’d’；
以指针的形式：*(str+1)。从符号表中得到str的地址，即数组首元素的首地址；在此地址上加一个偏移量得到新地址；从这个新地址中读取数据，即为’d’；

1.2.以指针的形式和以数组的形式访问指针

不管以何种方式访问，我们应该清楚p始终是一个指针。从编译器符号表中得到符号p的地址为指针p的地址。

以指针的形式：*(p+1)。首先从符号表中得到p的地址；从该地址中得到指针p；对指针p加上1个偏移量得到新地址；从这个新地址中读取数据，即为’d’；
以数组的形式：p[1]。首先从符号表中得到p的地址；从该地址中得到指针p；编译器将数组形式转化成*(p+1)，对p加一个偏移量得到新地址；从这个新地址中读取新数据，即为’d’；

分析至此，你应该了解到以数组形式和以指针形式访问只是写法上的不同而已，其本质对内存的访问过程是一样的。

2.作为函数参数的数组名等同于指针

当作为函数形参时，编译器会将数组改成指向数组首元素的指针。此时的数组就等价于指针。之所以将传递给函数的数组形参转化为指针是处于效率的考虑。

在C语言中，所有非数组的实参数据都是以传值形式传递给函数的，即将实参的一份拷贝传递给调用函数中的形参，调用函数对这份拷贝（也就是形参）的修改不影响实参本身的值。如果按照这样的道理，传递数组时就必须拷贝整个数组空间，这样必然会产生很大的开销。并且，大部分时候并不会访问到数组中所有的元素而只是其中的几个。考虑到上述的原因，数组作为实参传递给调用函数时，只需将数组名传递给函数即可；而形参会被编译器该成指针的形式。因此，作为形参的数组既可以写成数组也可以写成指针。

现在再回到举例2中的代码，对于形参中的char str[]和char *str也就感到不再奇怪了。事实上，即便将形参写成char str[]或char str[100]，编译器仍然会将它们改成char *str的形式。

既然任何数组作为形参时候都等价于一个指针，那么在函数内对“数组”的一切操作都等价于对指针的操作。验证这一点的很好例证就是举例2中对数组str求长度。在主函数中，sizeof(str)的值为15，这个结果毫无争议，它就是数组str的长度。而在getStr_pointer()和getStr_array()中，sizeof(str)的值都为4，也就验证了作为形参的数组str在调用函数中就是一个指针！在上述情况1中，虽然表达式中数组名也被认为是指针，但是数组仍然是数组（main函数中sizeof的结果就是很好的验证），而此部分数组就是指针。这也是数组等价于指针的唯一情况。

换句话说，虽然在将数组作为形参的函数中，你可以继续以数组的形式使用这个参数，但实际上你跟不可能找到数组的踪影！

总结

关于指针和数组之间的异同需要反复的思考和总结，才能搞清关系。下面对指针和数组之间的可交换性再作义简单的总结。

1.在表达式中以a[i]这样的形式对数组进行访问时，编译器总将其解释为*(a+i)的形式；

2.在数组作为函数的形参时，编译器将数组改写成指针，这个指针即为数组首元素的首地址。这也是数组等价指针的唯一情形；

3.由于2的原因，一个数组作为函数的形参时，既可以将数组定义成数组，也可以将数组定义成指针；

4.指针和数组永远是两码事，因此在不同文件中的声明和定义必须匹配，但却始终都能写成指针的形式和数组的形式（这完全是写法的不同）。

参考：

《C专家编程》人民邮电出版社；（美）林登（LinDen.P.V.D）著，徐波译；

《C语言深度解剖》北京航空航天大学出版社；陈正冲著；

无评论 »

Posted in C语言的那些事儿

Tags: C编程 C语言的那些事儿指针数组

指针和数组的访问方式

5 2 月, 2011 by edsionte 无评论 »

指针和数组是不相同的，但“很多时候”我们总认为指针和数组等价的。不可否认，这两者在某种情况下是可以相互替换的，但并不能就因此而认为在所有情况下都适合。《指针和数组不是一回事儿》系列文章将逐步深入分析指针和数组的不同之处，并解释什么时候指数组等价于指针。本文属于《指针和数组不是一回事儿》系列文章之二。

前文从内存结构的角度说明了指针和数组的不同，本文将以访问方式的角度再次说明指针和数组的不同。先看下面的代码：

char str[] = "edsionte";
char *p = "edsionte";

当编译完程序后，程序中的标示符都有一个地址，所有标示符的地址形成一个符号表。

数组的访问方式

以数组str为例，如果要访问str[1]，即数组str的第二个元素，则它的访问步骤如下：

1.从编译器的符号表中得到str的地址，比如0x0000FE00。这个地址即为数组str首元素的首地址；

2.在这个地址上加一个偏移量得到新的地址0x0000FE01；

3.从这个新地址中读取数据；

通过下图可以加深对数组访问方式的理解：

指针的访问方式

以上述代码中的指针p为例，如果要访问*(p+1)，即指针p所指向的匿名字符串的第二个字符，则它的访问步骤如下：

1.从编译器符号表中得到指针p的地址，比如0x0000EE20。这个地址即为&p，也就是指向指针p的指针；

2.从地址0x0000EE20中读取它内容即为指针p，比如0x00F0A000；

3.在0x00F0A000的基础上加一个偏移量，得到新地址0x00F0A001；

4.读取0x00F0A001中的内容，即为指针p所指的数据；

通过下图可以近一步理解指针的访问方式：

通过分析得知，在符号表中得到的是指针的地址而不是我们所要访问的指针；而在符号表中可以直接得到数组首元素的首地址。因此，访问指针时必须先通过符号表中指针的地址得到所要访问的指针，再接着进行指针所指内容的访问；而数组则直接可以通过符号表中的地址进行元素访问。也就是说指针的访问比数组的访问多了一次对内存地址的读取。

一不小心就引发的错误

现在看下面的两段代码：

/* 代码段1 */
file1:
char str[] = "edsionte";
file2:
extern char *str;
/* 代码段2 */
file1:
char *p == "edsionte";
file2:
extern char str[];

对于代码段1，在文件1中定义了数组str，而在文件2中将str声明为指针；对于代码段2，在文件1中定义了指针p，而在文件2中将p声明为数组。这里的声明指的是外部引用型声明，定义指的是定义型声明。

不管是上述那种情形，编译的时候都会出现错误。从上述对指针和数组访问方式的分析中可以得知，一个标示符被声明成指针还是数组对其访问方式影响巨大。下面我们对这两种错误作详细分析。

定义为数组，声明为指针

在文件2中，既然str被声明成指针，那么就应当按照指针的方式进行访问。首先从符号表中得到指针str的地址；从该地址中读取4个字节的数据即为指针str；接下来根据指针str访问其所指向的数据。这个过程好像很顺利，不过对于文件1中的数组str，其访问过程又是怎样的？文件1和文件2的访问结果是否一致？下图可帮助你理解。

从上图可以看到，str在文件2中被声明成指针，那么就符号表中str的地址0x0000FE00会被当作指针str的地址。根据指针的访问方式，必须从这个地址中取出指针p。虽然以0x0000FE00为首的四个字节中存储的是“edsi”，但是它们一律会被当成地址，按十六进制表示即为0x65647379。即便可以访问到这个地址，但是从这个地址中按照char型取出的数据并不是我们想要的。

由于编译器对每个文件进行单独编译，文件2并不知道str在文件1中被定义成什么类型。str在文件1中被定义成数组，那么就应该按照数组的方式访问数据；str在文件2中被声明成指针，那么就应该按照数组的方式访问数据。因此，在两个不同的文件中分别将str定义成数组而声明成指针会出现对str访问不一致的现象，所以编译器会产生错误。

定义为指针，声明为数组

此时，对于这种情况的理解也就简单多了。由于在文件而中p被声明成数组，因此就应该按照数组的方式对其进行访问。编译器会将原本指针str的地址当作str数组首元素的首地址，再对其加相应偏移量进行访问。这显然也是不合理的，因此编译器产生错误。具体可参见下图：

对上述的错误进行分析后，我们应该清楚将一个标示符声明成数组，编译器就会按照数组的访问方式去访问它；指针也是如此。因此，应该在多个文件中保持声明和定义相匹配。

指针和数组的其他区别

指针和数组除了在内存构造和访问方式上不同外，还有一些其他的区别。

1.指针通常用于指向一个动态的数据结构，而数组则用于存储固定大小和数据类型相同的数据；

2.指针所指向的数据通过malloc()分配，并且需要free()释放；而数组本身的内存空间则是隐士分配和释放，也就是在定义数组的时候进行；

3.指针所指向的数据通常是匿名的，而数组名则是数组所占内存空间的名字；

在本系列的最后一篇文章中，我们将分析指针和数组易被混淆的根源——也可将其称为指针和数组的可交换性。

参考：

《C专家编程》人民邮电出版社；（美）林登（LinDen.P.V.D）著，徐波译；

《C语言深度解剖》北京航空航天大学出版社；陈正冲著；

无评论 »

Posted in C语言的那些事儿

Tags: C编程 C语言的那些事儿指针数组

指针和数组的内存构造

1 2 月, 2011 by edsionte 5 comments »

指针和数组是不相同的，但“很多时候”我们总认为指针和数组等价的。不可否认，这两者在某种情况下是可以相互替换的，但并不能就因此而认为在所有情况下都适合。《指针和数组不是一回事儿》系列文章将逐步深入分析指针和数组的不同之处，并解释什么时候指数组等价于指针。本文属于《指针和数组不是一回事儿》系列文章之一。

指针和数组的本质是什么，这是本文讨论的重点。从内存结构的角度来说，两者是截然不同的两个概念。

数组的声明与定义

关于C语言中的声明，《声明那回事儿》一文中已详细叙述。这里再具体针对数组的定义和声明做以分析。以下面的声明代码为例：

char str[10];
extern char str[];

第一条声明语句定义了一个char型的数组，并为其分配了100字节大小的内存空间。而第二条声明语句则是为了告诉编译器这个数组的类型以及大小。由于在外部引用型声明中并不会数组分配内存空间，因此这种声明并不需要指定数组的大小。对于多维数组也并不需要指定第一维的大小。

指针的内存布局

指针本质上就是一个内存地址，为了方便使用这个内存地址将它和一个标示符绑定在一起。比如：

int i = 10;
int *p = &i; /* 假设变量i的内存地址为0x000F3E00 */

上述语句将地址0x000F3E00和p绑定在一起，并且一旦绑定就不能再修改，p此时也被称为指针变量，简称指针。“指针变量“中的“变量”并不是说明p可以再和其他地址绑定，而是强调与p绑定的这个地址中的内容可变，即i的值可以变化。

既然指针p是一个内存地址，那么在32位的系统中指针p所占的内存大小就始终为4字节。虽然整型变量i也占4字节，但是这两个同大小的内存空间却有着本质区别。指针p只能存放内存地址，并且这个地址只能是整型数据的首地址。即使在p内存放了其他数据，也会一律被当作内存地址来处理。

通过下图可以近一步了解指针和其所指数据的关系：

从图中可得知，不管指针所指数据占多大的内存空间，指针本身只占用4字节的大小。由于指针p本身占用4字节的内存空间，因此这部分内存空间也必然会有首地址。通过&p操作就可以得到指针p的首地址，也就是存储指针p的内存空间的首地址。从上图中可以看到指针p中即为整型变量i的首地址，因此我们也称p是一个指向整型变量i的指针。

数组的内存布局

数组是一块连续的内存空间，这块内存空间的名称即为数组名。比如：

int a[100];

当定义了一个具体的数组a时，编译器就根据数据类型和大小为其分配100*sizeof(int)大小的内存空间，并将这块连续的内存空间命名为a。虽然我们可以通过a[i]这种方式来访问元素i，但这并不代表a[i]就是这个元素的名称。因此每个数组元素实际上是没有名字的，编译器只为这块内存提供了唯一的名称a。同时数组名a也代表数组首元素的首地址。数组的内存结构如下：

通过对指针和数组内存布局的分析，我们可以得知这两者完全是不相同的。指针不管指向什么数据，它本身的大小就是4个字节（32位系统）；而数组则是一块连续的内存空间。在下文中，将会从访问方式的角度分析指针和数组的不同。

参考：

《C专家编程》人民邮电出版社；（美）林登（LinDen.P.V.D）著，徐波译；

《C语言深度解剖》北京航空航天大学出版社；陈正冲著；

5 comments »

Posted in C语言的那些事儿

Tags: C编程 C语言的那些事儿指针数组

typedef那回事儿

30 1 月, 2011 by edsionte 无评论 »

typedef是一种特殊的声明方式，不过它与普通声明（详见这里）的含义取大不相同。普通声明的主角是“变量”，它或是创建一个新变量或是对外文件变量使用前的声明；而typedef声明的主角则是“类型”，通过这个声明对一种数据类型引入新的名字。从引入新名字这个角度来说，typedef声明又和宏定义有些相似：用新名字代替已有的名字。不过，在本文接下来的叙述中你会看到这两者之间的区别。

typedef是特殊的

正如本文一开始所说的那样，typedef是特殊的声明。我们最常见以及常用的方式如下：

/* 代码段1 */
struct stuinfo
{
	char id[20];
	char name[20];
	int age;
};
typedef struct stuinfo stu; /* 语句1 */

通过typedef声明为stuinfo结构体引入了一个新的名字stu。现在stuinfo结构和stu属于同一种数据类型，只不过两者在声明一个变量时使用的名字不同：

/* 代码段2 */
stu mystu1;
struct stuinfo mystu2; /* 语句2 */

通过上述两个代码段，可以再一次的理解typedef声明和普通声明的区别。代码段1通过typedef声明为stuinfo引入了一个新的名字stu；而代码段2则通过同一种数据类型的不同名称分别声明了两个同类型的变量。注意到语句1和语句2，除了语句1在声明前多了typedef关键字外，两者在形式上几乎一样，因此都可以通过上文所述的声明规则进行阅读。正是由于typedef这个关键字，使得这两种声明的含义有着巨大差异。

其实，像上面的举例那样通过typedef声明而省去一个struct并没有多大的意义。使用typedef声明的最大优点是可以简洁的表达一个指针。比如ANSI C中的signal()，它的定义如下：

void ( *signal(int signum, void (*handler)(int)) ) (int);

考验你的时刻到了！你是否能快速说出这个声明的含义？

这个复杂的语句声明了signal函数，这个函数有两个参数signum和handler；signum参数是一个整型变量。handler是一个函数指针，指向一个拥有整型参数并且返回空值的函数；signal函数的返回值是一个函数指针，该指针同样指向一个拥有整型参数并且返回空值的函数。

对于这个复杂声明的解读的确很令人费劲。但是经过typedef的改进，它的阅读过程就简化了很多：

 typedef void (*sighandler_t)(int);
 sighandler_t signal(int signum, sighandler_t handler);

通过typedef的声明，使得sighandler_t是这样一种类型：它是一个函数指针，该函数拥有一个整型参数并且返回空值。第二条语句则声明了函数signal，它拥有两个参数signum和handler。并且这个函数的返回值和参数handler都是sighandler_t类型的。

虽然这样的声明在形式上简洁许多，不过和普通声明一样，此时阅读声明时仍然要记住声明符号的优先级规则。这种困扰在C语言中是难以避免的。

typedef int x和#define x int是不一样的

typedef和宏定义看似都是文本替换，但其实质不同。typedef表面上是对已有数据类型引入新名称，实则是对数据类型的严格封装。这种封装体现在下述两个方面。

首先，经过宏定义后的类型名可以进行再次扩展，但是经过typedef引入的类型名则不能进行扩充。比如：

#define myint1 int
unsigned myint1 x; /* 正确 */

typedef int myint2;
unsigned myint2 x; /* 语法错误！ */

由于typedef是一种严格的数据封装，它只引入了myint2类型而没有引入unsigned myint2类型。也就是说，通过typedef的声明，编译器只能识别myint2类型。而unsigned myint2既不是基本类型也不是经过typedef声明过的类型，编译器就无法识别。

其次，在连续的几个变量声明中，使用typedef定义的类型能够保证所有变量均为相同类型，而用宏定义的变量则无法保证统一性。比如：

#define myint1 int *
myint1 x,y; /* 经过宏替换后为: int *x,y; */

typedef int * myint2;
myint2 x,y;

由于宏定义只是直接的文本替换，因此只能保证x是整型的指针变量而y为整型变量。而typedef定义过的类型myint2则是对int *的完全封装，所以x和y均为整型的指针变量。

C语言中的名字空间

在说明名字空间之前，请先阅读下面的代码：

/*
 *Author: edsionte
 *Email:  edsionte@gmail.com
 *Time:   2011/02/03
 */

#include < stdio.h >
#include < string.h >

struct id
{
	int id;
}id;

typedef struct name
{
	char name[20];
}name;

struct name name1;
name name2;

int main()
{
	id.id = 1;
	strcpy(name1.name,"hello,");
	strcpy(name2.name,"edsionte!");
	printf("id.id = %d, %s%s\n",id.id,name1.name,name2.name);
	return 0;
}
/* 运行结果 */
edsionte@edsionte-laptop:~/code/expertC$ gcc tpdef.c -o tpdef
edsionte@edsionte-laptop:~/code/expertC$ ./tpdef
id.id = 1, hello,edsionte!

你可能已经发现在上述代码中出现了多个id和name，并且这样的代码可以成功的编译。这些相同的名字标签为何可以同时出现？每个标签代表什么含义？这些问题将是下面分析的重点。

以上述代码中10到13行的代码为例，这条语句中包含三个id标签。它们分别对应C语言中三种常见的名字空间：

结构标签：这种标签用于结构体、联合体和枚举类型；struct后的id即为此类型的名字空间；
成员名：每个结构体或联合体内部都与属于自己的名字空间；struct内部的成员id即为此类型；
标签名：声明中的标示符；比如最后一个id，他是struct id类型的变量；

由于这三种标签所处的名字空间不同，因此它们可以同时存在。但是在同一个名字空间中不能出现多个同名的标签。常见的例子就是一个结构体内不可能出现同名的变量。

根据上面对名字空间的划分，15到18行的代码的解释为：struct后的name属于结构体标签；结构体内部的name属于成员名；而最后一个name属于声明的标示符；整条语句的含义是通过typedef声明将name结构体重命名为name。

通过上面对typedef的分析，你应该对于struct name和name均可以声明一个变量不再陌生。此处我们用名字空间的来理解他们的区别，20句中的name属于结构标签，21句中的name属于一种类型的名称。

上述同名的情况在日常的代码中实属罕见，这里只是为了说明名字空间而特别的举例。一般为了提高代码的可阅读性，最好对容易产生混淆的标签加上特别标记。比如VFS中inode和dentry结构体，两者内部均有flag一字段。尽管不同的结构体内有各自的名字空间，但是实际命名时仍然采用i_flag和d_flag。

有了上面的基础，本部分一开始所举例的代码也就可以轻松阅读了。

参考：

《C专家编程》人民邮电出版社；（美）林登（LinDen.P.V.D）著，徐波译；

无评论 »

Posted in C语言的那些事儿

Tags: C编程 C语言的那些事儿 typedef

声明那回事儿

29 1 月, 2011 by edsionte 2 comments »

C语言中的变量声明是让程序员比较苦恼的一件事，因为过多的优先级规则使得阅读声明并不能像自然方式那样从左至右的阅读。比如下面这个声明：

int (*(*fun)())();

对于这个声明，你能准确说出它的含义吗？这个声明涉及到本文的两大主题：什么是声明和声明的阅读规则。本文的最后将给出这个声明的准确含义。

声明和定义

在C语言中，提到声明就不得不提到定义。这里说的声明既包含变量的声明又包含函数的声明。对于函数的定义和声明易于理解，比如：

int myfun2();

int myfun2()
{
	printf("I am myfun2~\n");
	return 0;
}

所谓函数的定义就是对该函数进行具体的功能实现，而函数声明则是对该函数返回值和参数类型的说明，使得其他函数感知到这个函数的存在，以便在需要时直接调用该函数。

变量的声明具体分为两种情况：定义型声明和外部引用型声明。

定义型声明其实就等价于定义。C语言的定义是指为变量分配内存空间，并在需要时为其赋一个初值。定义型声明用于创建一个新的变量，它在定义这个变量的同时也声明了这个变量。比如下述代码就声明（定义）了一个变量num，并将0作为其初值。

int num = 0;

使用外部引用型声明是由于要在当前程序中使用定义在其他文件中的变量。也就是说这个变量是已存在的，因此这种声明并不包含变量的定义。比如：

file1:
int a = 100;
file2:
extern int a;

C语言中的变量只能有一个定义，但是它却可以有多个extern的声明。因为extern声明并不分配内存空间，只是告诉引用这个变量的函数：这个变量已经定义过了，你可以直接的使用。

声明的组成

声明确定了变量的基本类型和相应的初值（如果需要的话）。一个完整的声明包括三部分：一个类型说明符，一个或多个声明器（declarator）和一个分号。

类型说明符用于描述所要声明变量的类型；分号说明了声明的结束；声明器是标示符以及和它组合在一起的指针符、函数括号和数组下标等，有时候也将初始化内容放在声明器中。多个声明器用逗号隔开。关于声明和声明器的关系可参考下图：

该图所示的语句声明了四个变量，其基本类型都是整型。由于四个变量分别对应着不同的声明器，则最终的变量类型就有所不同。整型变量a的声明器即为标示符a；第二个声明器为*b=NULL，它声明b是一个指针变量，其初值为NULL。由于类型说明符为int，则说明了b是一个指向整型的指针；第三个声明器为(*c)[20]，它声明c是一个数组指针，该指针指向拥有20个元素的数组。由类型说明符得知该数组的元素都是整型的；最后一个声明器为*j[20]，其说明j是一个指针数组，该数组有20个元素，每个元素都是指向整型变量的指针。

优先级规则

了解了声明的组成后，到了该给出声明优先级规则的时候了。C语言中声明的优先级规则如下：

1.声明从最左的标示符开始，然后按照下面的优先级规则依次读取；

2.具体的优先级为：

2.1 被括号括起来的那部分；
2.2 后缀部分；如果后缀为( )，表明这是一个函数；如果后缀为[ ]，表明这是一个数组；
2.3 前缀部分；*表示指向…的指针；

3.如果const或volatile关键字后紧邻基本类型说明符，则它作用于该类型的变量；否则，const和volatile作用于仅靠它左边的星号，即作用于指针变量；

上述规则需要参考实际的声明来慢慢理解。下面通过两个简单的声明举例来说明上述优先级规则：

const int (*p)();
const int *p();

声明1：

首先找到标示符p，由于声明1中的p和*被包括起来，根据规则2.1得知p是一个指针。该指针指向什么类型是接下来读声明的关注对象；
标示符的后缀部分是( )，根据规则2.2得知该指针指向一个函数。这个函数返回值是什么类型是接下来读声明的关注对象；
读完上述声明符号后，剩下了const int，根据规则3得知这个函数的返回值是一个只读型的整数；

综合上面的几部分可得知该声明的含义：p是一个指针，它指向一个函数。这个函数没有参数，返回一个只读型的整数。

声明2：

首先找到标示符p，它与*没有被包括在一起，因此可以排除p是一个指针；
由于标示符的后缀部分是( )，根据规则2.2得知p是一个函数。该函数返回什么类型是接下来读声明的关注对象；
由于p标示符前有*，则说明该函数的返回值是一个指针。至于该指针指向什么样的数据是接下来对声明的关注对象；
通过队则3可得知该指针指向一个只读型的整型变量；

通过上述的分步分析可得知该声明的含义：p是一个函数，它没有参数，返回值是一个指针。该指针指向一个只读型的整型变量。

通过上述的优先级规则，可以轻松的阅读任何一个声明。从上述两个举例中也可总结出阅读声明的大致方法，首先判别该声明是声明一个函数还是一个变量；再根据具体的声明类型切换接下来读声明的关注对象；最后未读的基本类型就是最后一次关注对象的类型。上述的大致方法可详细总结如下：

1.找到最左边的标示符，表示已被阅读；
2.若已阅读符号右方紧邻[，则从左至右阅读到与之配对的 ] 为止。这一段符号表示当前的关注对象是一个数组，该数组的元素类型未知；接下来的关注对象是数组的元素的类型，转4；否则转至3；
3.若已阅读符号右方紧邻(，则从左至右阅读到与之配对的 )为止。这一段符号表示当前的关注对象是一个函数，该函数的返回值类型未知；接下来的关注对象是函数的返回值类型；顺序执行4；
4.如果已阅读符号左边的符号是(，则寻找与之配对的 )，这一段符号表示已经阅读过；转至2；否则转至5；
5.如果已阅读符号左边的符号是const，volatile和*之一，则不同符号代表不同的含义。const表示只读；volatile表示禁止编译器优化；*表示一个指针，该指针指向那种类型是接下来的关注对象，转4；否则转至6；
6.剩下的未阅读的符号为基本的数据类型，即为当前关注对象的数据类型；

通过上述方法即可阅读一个声明，并理解它具体的含义。现在来解决本文一开始的那个声明：

int (*(*fun)())();

其步骤如下：

找到标示符fun，fun已被阅读；
步骤2，3，4不满足，转到步骤5；fun的左方为*，说明fun是一个指针。当前的关注对象是fun指向什么类型的数据，转到第4步；
*fun的左方为(，则(*fun)表示已被阅读的符号。当前的关注对象仍然是fun指向什么类型的数据，转到第2步；
(*fun)的右方紧邻(，则(*fun)()为已阅读的符号。它表示fun指向一个函数，该函数的返回值类型成为接下来的关注对象，转到第4步；
步骤4不满足，转到步骤5；(*fun)()的左方为*，说明返回值类型为一个指针，该指针指向什么类型是接下来的关注对象。当前已读过的符号表示fun是一个指针，它指向一个函数，该函数返回一个指针，该指针指向什么类型未知；转至4；
*(*fun)()左方为(，则(*(*fun)())表示已被阅读。转至第2步；
(*(*fun)())的右方为(，则(*(*fun)())()为已阅读的符号，它表示当前的关注对象是一个函数。目前为止已阅读的符号表示fun是一个指针，它指向一个函数，该函数返回一个指针，该指针指向一个函数，该函数返回值类型未知；转至4；
步骤4，5不满足转至6；int表示当前的关注对象为整型，目前所有的符号已阅读完毕。所有的声明符号表示fun是一个指针，它指向一个函数，该函数返回一个指针，该指针指向一个函数，该函数返回一个整型变量；

大功告成！

上述的分析过程看起来可能有些复杂和呆板，当你熟悉了整个分析过程后，这个过程就变得轻而易举。

举例

结合上面的理论分析，可以阅读下面的代码。这个代码一方面可以帮助你巩固上面的阅读规则，另一方面可以帮助你理解函数声明和指向函数指针的声明两者之间的区别。

/*
 * Author: edsionte
 * Email:  edsionte@gmail.com
 * Time:   2011/02/01
 */
#include 

int (*myfun1())();
int myfun2();

int (*myfun1())()
{
	//myfun1 return a pointer which point a function;
	//The return function hasn't argument and reurun a int value;

	int (*fun2)();
	printf("I am myfun1~\n");
	fun2 = myfun2;
	return fun2;
}

int myfun2()
{
	printf("I am myfun2~\n");
	return 0;
}

int main()
{
	int (*(*fun1)())();
	int (*fun2)();

	fun1 = myfun1;
	fun2 = fun1();
	fun2();

	return 0;
}

参考：

《C专家编程》人民邮电出版社；（美）林登（LinDen.P.V.D）著，徐波译；

edsionte's TechBlog

指针和数组的可交换性

“指针和数组可以交换！”

1.表达式中的数组名就是指针

2.作为函数参数的数组名等同于指针

总结

指针和数组的访问方式

数组的访问方式

指针的访问方式

一不小心就引发的错误

定义为数组，声明为指针

定义为指针，声明为数组

指针和数组的其他区别

指针和数组的内存构造

数组的声明与定义

指针的内存布局

数组的内存布局

typedef那回事儿

typedef是特殊的

typedef int x和#define x int是不一样的

C语言中的名字空间

声明那回事儿

声明和定义

声明的组成

优先级规则

举例

本博客中的所有文字、图片及代码均可任意转载，但是请在转载时以超链接形式标明文章原始出处和作者信息。

windows 7 ultimate product key

winrar download free

winzip registration code

winzip free download

winzip activation code

windows 7 key generator

winzip freeware

winzip free download full version

free winrar download

free winrar

windows 7 crack

windows xp product key

windows 7 activation crack

free winzip

winrar free download

winrar free

download winrar free

windows 7 product key