解读 C 语言中的指针

我想对很多学习C语言的新手来说,指针无疑是一个难点。但是,我觉得指针也是C语言特别重要的一个特性。也许,你在除了C和C++以外的编程语言中,很少看到指针。而C++中,也多用引用,而非指针。指针,作为一种高效的工具,可谓是一把双刃剑——用得好,可以大大提高程序效率,但用的不好,就是很多bug的滋生地。

这或许也是人们对指针褒贬不一的原因吧。就我个人而言,我还是很喜欢这个特性,因为我需要经常和硬件以及一些底层的软件打交道。这个时候,指针便体现出它独特的魅力。指针的知识很多,有一本经典的书叫《C和指针》,如果有兴趣可以读一读。这里,我主要总结一些如何去解读指针(说实话这个东西实在是很容易让人困惑)的方法,一方面给自己做查询用,另一方面,希望可以给别人一些帮助。

一,基本概念

关于指针的基本概念,我就不详细介绍了,因为有许多书都介绍的很详细。这里我只介绍一部分。指针指向一个地址,而指针本身在大多数系统上都是一个无符号整数(在32bit机上是4byte,在64bit机上是8byte)。下面用一个例子来说明其机制:

在上面的例子中,先定义了一个指针p,它的类型是int,也就是说它只能指向一个int型的变量,而不能指向其他类型的变量。最后我们将a变量的地址赋给p。在这个过程中,涉及到两个内存块,一个是存放指针p的内存(用&p可得到内存地址),一个是存放a的值的内存块(用&a可以得到内存地址)。而第一个内存存的p的值经过赋值语句后也就是&a的值了。另外一个注意点是, *(星号)和变量类型以及变量名之间可以有任意个空格,也可以没有。比如下面三种方式都是一样的:

在上面的例子中,先定义了一个指针p,它的类型是int,也就是说它只能指向一个int型的变量,而不能指向其他类型的变量。最后我们将a变量的地址赋给p。在这个过程中,涉及到两个内存块,一个是存放指针p的内存(用&p可得到内存地址),一个是存放a的值的内存块(用&a可以得到内存地址)。而第一个内存存的p的值经过赋值语句后也就是&a的值了。另外一个注意点是, *(星号)和变量类型以及变量名之间可以有任意个空格,也可以没有。比如下面三种方式都是一样的:

解读方法:

首先从标示符开始阅读,然后往右读,每遇到圆括号的右半边就调转阅读方向。重复这个过程直到整个声明解析完毕。需要注意的是,已经读过的部分在后续作为一个整体来看。

看下面一个例子:

二,数组首地址a,&a,&a[0]

注:a,&a,&a[0]的含义虽然不同,但是他们三个的值是相等的!

以int a[3]为例说明:

  1. a作为右值时,代表数组首元素的首地址,而非数组地址。 也就是a[0]的地址。int i = (a+1),这里a是右值,所以代表首元素的首地址,a+1代表下一个元素的首地址,即&a[1]。
  2. a是整个数组的名字。所以sizeof(a)的值为sizeof(int) * 3 = 40,代表整个数组的大小。
  3. &a即为取a的首地址,也即整个数组的首地址。所以sizeof(&a) = 4。 int p = (int)(&a+1)中的&a+1代表下一个数组的首地址,显然是越界的。
  4. &a[0]代表首元素的首地址。 所以sizeof(&a[0]) = 4。
  5. &a[3],很显然数组越界了,但它的sizeof是多少呢? 也是4,因为关键字sizeof求值是在编译的时候,虽然并不存在a[3]这个元素,但是这里并没有真正访问a[3],而是根据数组元素类型来确定其值的。所以sizeof(a[3])不会出错。
  6. a[-1]代表什么意思?首先要明白下标的形式被编译器解析成指针的形式,即a[1]被解析成(a+1)。那么,a[-1]被解析成*(a-1)。

关于数组首元素的首地址和数组的首地址的区别:其实,数组首元素的首地址和数组首地址的值是相同的,即&a[0]和a(以及&a)是相等的,但是而这含义不一样。首元素的首地址加1后,是第二个元素的首地址(之所以一直说首地址,是因为有的类型存储时会占多个地址),但数组的首地址加1后是“下一个数组的地址”,这里的下一个数组只是为了说明加1时加了整个数组的大小,而不是一个元素的大小。

有一点比较容易混淆:a虽然代表整个数组,但(a+1)却代表下一个元素的首地址,即和(&a[0]+1)一样,下一个数组的形式为:(&a+1)。 下面以一个程序来说明:

输出结果:

 说明(下面的行数只计算main函数内有代码的行)

  1. 程序第1行定义了一个具有3个元素的整型数组。
  2. 第2行打印了long型的大小。因为我是64bit的,所以一个long是8byte。
  3. 第3行打印了*(a+1)的值,结果和a[1]的值相等。说明a虽然代表整个数组,但作为右值时,的确代表首元素的首地址。
  4. 第4行输出值为12,是整个数组的大小。
  5. 第5行打印了一个出界元素的大小,没有报错,验证了上面第5条。
  6. 第6行打印了a[-1]和*(a-1),输出值相等。验证了上面第6条。
  7. 第7行打印了a和&a[0],值相等。说明数组的首地址和首元素的首地址是相等的。
  8. 第8行打印了a,(a+1),(&a+1),由结果就可以看出首元素的首地址加1是加了一个数组元素的大小,而数组首地址加1是加了一个数组的大小。

三,指针数组和数组指针

指针数组: 首先它是一个数组,数组的元素是指针,也成为“存储指针的数组”。

数组指针: 首先它是一个指针,它指向一个数组,也可以理解为“数组的指针”。 也可以利用前面的“解读方法”去分析。

四,函数指针和指针函数

函数指针: 指向函数的指针变量。

指针函数: 带指针的函数,也就是返回指针的函数。

五,指针常量和常量指针

怎么记?

1. 可以先把类型名去掉,然后看const离谁近,就修饰谁。

2. 也可以const在*左边的为常量指针,const在*右边的为指针常量。

三~五的万能钥匙

其实,关于“指针数组与数组指针、函数指针与指针函数、指针常量与常量指针”的判断,有一个万能钥匙。那就是根据我们强大的中文语法:前边是修饰词,后边才是主语。比如“指针数组”,前面的指针只是修饰词,后面的数组才是主语,所以它是一个数组。

六,野指针

野指针指没有确定指向的指针。造成野指针的情况有:

1. 指针变量创建但没有初始化。

2. 指针p被free或者delete之后,没有置为NULL。

打赏支持我写出更多好文章,谢谢!

打赏作者

打赏支持我写出更多好文章,谢谢!

任选一种支付方式

3 15 收藏 3 评论

关于作者:倪彦春

个人博客:http://time-track.cn 个人主页 · 我的文章 · 12 ·       

相关文章

可能感兴趣的话题



直接登录
最新评论
  • Yu_Hao 微信公众号: 一分钟的编程知识 2016/06/11

    有个小错误: 所有的 printf 语句都写错了。%p 对应的指针必须是 void * 类型, 所以必须做一次type cast.  sizeof 操作符的返回类型是 size_t, 对应的 printf 格式符是 %zu, 不能用 %ld.

    • 倪彦春 高级服务器工程师 2016/06/12

      嗯,你提醒的对。(1)在man文档里面的确是说了size_t、ssize_t需要用%zu;p用于void*的格式化输出。但其实用%lu输出也不会有问题(当然文章里面用%ld格式化是有不妥),因为size_t其实也是用unsigned long int定义的。比如在C99中没有引入z之前,格式化size_t用%lu肯定也不会有错。(2)新的C标准中引入void*的一个主要目的就是为了传参方便,因为它可以指代任意一种类型的指针而不用显式的类型转换。所以格式化打印void*,就是可以格式化打印任意一种类型的指针。你可以看一下一些经典书上面(比如《C Primer Plus》等)对于任何类型指针的打印都是%p,而且我们实际中除了传参会使用void*,其它场景比较少使用这种没有明确类型的指针。所以博客里面举得例子你可以试一下,改成你说的方式和现在的这种写法都不会有问题,而且编译器也不会有任何抱怨。BTW:既然新的标准里面明确给出了这些接口,我们去使用这些接口肯定通用性会更好一些。

      • Yu_Hao 微信公众号: 一分钟的编程知识 2016/06/13

        size_t 不一定和 unsigned long int 是同一种类型,使用除 %zu 外的格式会减弱代码的可移植性。
        正确的用法是: printf("%p", (void *)p);  需要有个显式的类型转换, 具体的规定在C11标准的7.21.6.1节。和上条一样, 这也是一条language lawyer级的指正, 在大多数环境文中的代码不会真正的导致错误, 但严格来说仍然是错误的。BTW,  void * 在C89里就存在了。

跳到底部
返回顶部