这是本文配套资料https://pan.quark.cn/s/b5638e1405d7前言这不是我第一次写关于C指针的文章了只是因为指针对于C来说太重要而且随着自己编程经历越多对指针的理解越多因此有了本文。然而想要全面理解指针除了要对C语言有熟练的掌握外还要有计算机硬件以及操作系统等方方面面的基本知识。所以我想通过一篇文章来尽可能的讲解指针以对得起这个文章的标题吧。本文会持续更新。为什么需要指针?指针解决了一些编程中基本的问题。第一指针的使用使得不同区域的代码可以轻易的共享内存数据。当然你也可以通过数据的复制达到相同的效果但是这样往往效率不太好因为诸如结构体等大型数据占用的字节数多复制很消耗性能。但使用指针就可以很好的避免这个问题因为任何类型的指针占用的字节数都是一样的根据平台不同有4字节或者8字节或者其他可能。第二指针使得一些复杂的链接性的数据结构的构建成为可能比如链表链式二叉树等等。第三有些操作必须使用指针。如操作申请的堆内存。还有一点C语言中的一切函数调用中实参传递给形参的机理都是“按值传递(pass by value)”如果我们要在函数中修改被传递过来的对象就必须通过这个对象的指针来完成。指针是什么我们指知道C语言中的数组是指 一类 类型数组具体区分为 int 类型数组double类型数组,char数组 等等。同样指针 这个概念也泛指 一类 数据类型int指针类型double指针类型char指针类型等等。通常我们用int类型保存一些整型的数据如 int num 97 我们也会用char来存储字符 char ch ‘a’。我们也必须知道任何程序数据载入内存后在内存都有他们的地址这就是指针。而为了保存一个数据在内存中的地址我们就需要指针变量。因此指针是程序数据在内存中的地址而指针变量是用来保存这些地址的变量。为什么程序中的数据会有自己的地址弄清这个问题我们需要从操作系统的角度去认知内存。电脑维修师傅眼中的内存是这样的内存在物理上是由一组DRAM芯片组成的。而作为一个程序员我们不需要了解内存的物理结构操作系统将DRAM等硬件和软件结合起来给程序员提供的一种对物理内存使用的抽象。这种抽象机制使得程序使用的是虚拟存储器,而不是直接操作物理存储器。所有的虚拟地址形成的集合就是虚拟地址空间。在程序员眼中的内存应该是下面这样的。假设使用的是32位系统平台虚拟存储空间为4GB也就是说虚拟存储器是一个很大的线性的字节数组平坦寻址。每一个字节都是固定的大小由8个二进制位组成。最关键的是每一个字节都有一个唯一的编号,编号从0开始一直到最后一个字节。如上图中这是一个4GB的虚拟存储器的模型它一共有4x1024x1024x1024 个字节那么它的虚拟地址范围就是 0 ~ 4x1024x1024x1024-1 。由于内存中的每一个字节都有一个唯一的编号因此在程序中使用的变量常量甚至数函数等数据当他们被载入到内存中后都有自己唯一的一个编号这个编号就是这个数据的地址。指针就是这样形成的。下面用代码说明#includestdio.hintmain(void){charcha;intnum97;printf(ch 的地址:%p\n,ch);//ch 的地址:0028FF47printf(num的地址:%p\n,num);//num的地址:0028FF40return0;}指针的值实质是内存单元即字节的编号所以指针 单独从数值上看也是整数他们一般用16进制表示。指针的值虚拟地址值使用一个机器字的大小来存储,也就是说,对于一个机器字为w位的电脑而言,它的虚拟地址空间是0~2w 1 ,程序最多能访问2w个字节。这就是为什么xp这种32位系统最大支持4GB内存的原因了。我们可以大致画出变量ch和num在内存模型中的存储。假设 char占1个字节int占4字节操作系统为什么提供虚拟地址空间给程序员用而不是让程序员直接使用物理地址空间本节内容属于编程思想上的内容可以先不看或仅作了解。1、提高物理内存的利用效率。你可能会困惑这怎么就提高物理内存使用效率了呢我这里举个共享单车的例子假如一个国家有10个人而只生产了2辆自行车(国家小资源有限嘛~)这2辆车被2个人买了。把你自己想象为那8个没有自行车的人之一你的思维是什么——“我没有自行车我只能步行外出”。倘若是那2个有车的人呢——“我每次外出都可以骑车去但是大部分时间我的车是空闲的没其他人用”。后来这个国家回收了这仅有的2辆车把车刷成了统一的颜色贴上二维码引入了共享单车系统然后发出公告只要车停在路边没人用任何人都可以刷开骑走。那现在这10个人怎么想呢——“只要我看到有空闲的单车我就可以使用它”。2、抽象的东西更加简单稳定。从古至今我们对于“去饭馆吃饭”这个抽象社会行为没有太大的变化——进入饭馆点菜付钱享用走人。但是人们烹饪的方法却发生了具大的改变烹饪的器材、食材、食谱一直都在更新改进如果你经常烹饪你就需要不断的学习因为你需要掌握做一道菜的每个细节。回到内存相关的话题来无论机器的内存用的是ddr3还是ddr4是4G物理内存还是8G物理内存程序员都似乎无需太过关心因为他们在编程时面向的是虚拟内存而虚拟内存的模型到目前为止都是固定的。这给程序员带来非常大的便利他们无需为快速更新的计算机设备而改变自己的编程思维。这并不意味着抽象的东西就一定不会改变。例如从“到饭馆吃饭”到“点外卖”从32位操作系统到64位操作系统。都属于抽象的更新换代。3、使用虚拟地址空间更加安全。操作系统对应用程序提供操作内存的API而不让应用程序直接操作物理内存。避免应用程序因操作不当而导致整个系统挂掉的危险情况发生。总结我个人认为资产有限的情况下使用合理的资产使用管理机制可以使有限的资产服务于更多的人。抽象的事物更加简单稳定特定的事物更加复杂易变。底层通过给上层提供抽象服务来获得利益上层通过使用底层的抽象来获得便利。变量和内存为了简单起见这里就用上面例子中的 int num 97 这个局部变量来分析变量在内存中的存储模型。已知num的类型是int占用了4个字节的内存空间其值是97地址是0028FF40。我们从以下几个方面去分析。1、内存的数据内存的数据就是变量的值对应的二进制一切都是二进制。97的二进制是 : 00000000 00000000 00000000 0110000 , 但使用的小端模式存储时低位数据存放在低地址所以图中画的时候是倒过来的。2、内存数据的类型内存的数据类型决定了这个数据占用的字节数以及计算机将如何解释这些字节。num的类型是int因此将被解释为 一个整数。相同的内存数据以不同的数据类型去解析的时候会得到不同的值所以数据的类型是非常重要的。3、内存数据的名称内存的名称就是变量名。实质上内存数据都是以地址来标识的根本没有内存的名称这个说法这只是高级语言提供的抽象机制 方便我们操作内存数据。而且在C语言中并不是所有的内存数据都有名称例如使用malloc申请的堆内存就没有。4、内存数据的地址如果一个类型占用的字节数大于1则其变量的地址就是其占用的所有字节的地址值最小的那个字节的地址。因此num的地址是 0028FF40。 内存的地址用于标识这个内存块。5、内存数据的生命周期num是main函数中的局部变量因此当main函数被启动时它被分配于栈内存上当main执行结束时消亡。如果一个数据一直占用着他的内存那么我们就说他是“活着的”如果他占用的内存被回收了则这个数据就“消亡了”。C语言中的程序数据会按照他们定义的位置数据的种类修饰的关键字等因素决定他们的生命周期特性。实质上我们程序使用的内存会被逻辑上划分为栈区堆区静态数据区代码区。不同的区域的数据有不同的生命周期和读写权限。无论以后计算机硬件如何发展内存容量都是有限的因此清楚理解程序中每一个程序数据的生命周期是非常重要的。指针变量 和 指向关系用来保存 指针(地址) 的变量就是指针变量。如果指针变量p1保存了变量 num的地址则就说p1指向了变量num也可以说p1指向了num所在的内存块 这种指向关系在图中一般用 箭头表示。上图中指针变量p1指向了num所在的内存块 即从地址0028FF40开始的4个byte 的内存块。这里学2个名词读英文资料的时候可能会用到pointer指针例如上面例子中的p1pointee被指向的数据对象例如上面例子中的num所以我们可以说a pointer stores the address of a pointee定义指针变量C语言中定义变量时在变量名 前 写一个 * 星号这个变量就变成了对应变量类型的指针变量。必要时要加( ) 来避免优先级的问题。引申C语言中定义变量时在定义的最前面写上typedef 那么这个变量名就成了一种类型即这个类型的同义词。inta;//int类型变量 aint*p;//int* 变量pintarr[3];//arr是包含3个int元素的数组int(*parr)[3];//parr是一个指向【包含3个int元素的数组】的指针变量//-----------------各种类型的指针------------------------------int*p_int;//指向int类型变量的指针double*p_double;//指向double类型变量的指针structStudent*p_struct;//结构体类型的指针int(*p_func)(int,int);//指向返回类型为int有2个int形参的函数的指针int(*p_arr)[3];//指向含有3个int元素的数组的指针int**p_pointer;//指向 一个整形变量指针的指针取地址既然有了指针变量那就得让他保存其它变量的地址使用 运算符取得一个变量的地址。intadd(inta,intb){returnab;}intmain(void){intnum97;floatscore10.00F;intarr[3]{1,2,3};//-----------------------int*p_numnum;float*p_scorescore;int(*p_arr)[3]arr;int(*fp_add)(int,int)add;//p_add是指向函数add的函数指针return0;}特殊的情况他们并不一定需要使用取地址数组名的值就是这个数组的第一个元素的地址。函数名的值就是这个函数的地址。字符串字面值常量作为右值时就是这个字符串对应的字符数组的名称,也就是这个字符串在内存中的地址。intadd(inta,intb){returnab;}intmain(void){intarr[3]{1,2,3};//-----------------------int*p_firstarr;int(*fp_add)(int,int)add;constchar*msgHello world;return0;}解地址我们需要一个数据的指针变量干什么当然使用通过它来操作读/写它指向的数据啦。对一个指针解地址就可以取到这个内存数据解地址 的写法就是在指针的前面加一个*号。解指针的实质是从指针指向的内存块中取出这个内存数据。intmain(void){intage19;int*p_ageage;*p_age20;//通过指针修改指向的内存数据printf(age %d\n,*p_age);//通过指针读取指向的内存数据printf(age %d\n,age);return0;}指针之间的赋值指针赋值和int变量赋值一样就是将地址的值拷贝给另外一个。指针之间的赋值是一种浅拷贝是在多个编程单元之间共享内存数据的高效的方法。int*p1num;int*p3p1;//通过指针 p1 、 p3 都可以对内存数据 num 进行读写如果2个函数分别使用了p1 和p3那么这2个函数就共享了数据num。空指针指向空或者说不指向任何东西。在C语言中我们让指针变量赋值为NULL表示一个空指针而C语言中NULL实质是 ((void*)0) 在C中NULL实质是0。换种说法任何程序数据都不会存储在地址为0的内存块中它是被操作系统预留的内存块。下面代码摘自 stddef.h#ifdef__cplusplus#defineNULL0#else#defineNULL((void*)0)#endif坏指针指针变量的值是NULL或者未知的地址值或者是当前应用程序不可访问的地址值这样的指针就是坏指针不能对他们做解指针操作否则程序会出现运行时错误导致程序意外终止。任何一个指针变量在做 解地址操作前都必须保证它指向的是有效的可用的内存块否则就会出错。坏指针是造成C语言Bug的最频繁的原因之一。下面的代码就是错误的示例。voidopp(){int*pNULL;*p10;//Oops! 不能对NULL解地址}voidfoo(){int*p;*p10;//Oops! 不能对一个未知的地址解地址}voidbar(){int*p(int*)1000;*p10;//Oops! 不能对一个可能不属于本程序的内存的地址的指针解地址}指针的2个重要属性指针也是一种数据指针变量也是一种变量因此指针 这种数据也符合前面 变量和内存 主题中的特性。 这里我只想强调2个属性 指针的类型指针的值。intmain(void){intnum97;int*p1num;char*p2(char*)(num);printf(%d\n,*p1);//输出 97putchar(*p2);//输出 areturn0;}指针的值很好理解如上面的num 变量 其地址的值就是0028FF40 因此 p1的值就是0028FF40。数据的地址用于在内存中定位和标识这个数据因为任何2个内存不重叠的不同数据的地址都是不同的。指针的类型指针的类型决定了这个指针指向的内存的字节数并如何解释这些字节信息。一般指针变量的类型要和它指向的数据的类型匹配。由于num的地址是0028FF40因此p1 和 p2的值都是0028FF40*p1 : 将从地址0028FF40 开始解析因为p1是int类型指针int占4字节因此向后连续取4个字节并将这4个字节的二进制数据解析为一个整数 97。*p2 : 将从地址0028FF40 开始解析因为p2是char类型指针char占1字节因此向后连续取1个字节并将这1个字节的二进制数据解析为一个字符即’a’。同样的地址因为指针的类型不同对它指向的内存的解释就不同得到的就是不同的数据。void*类型指针由于void是空类型因此void类型的指针只保存了指针的值而丢失了类型信息我们不知道他指向的数据是什么类型的只知道这个数据在内存中的起始地址如果想要完整的提取指向的数据程序员就必须对这个指针做出正确的类型转换然后再解指针。前面已经提到过数据的类型是正确解析出内存数据的关键相同的内存数据以不同的数据类型去解析的时候会得到不同的值。程序需要得到什么数据不光要知道其地址还要明确其类型因此编译器不允许直接对void类型的指针做解指针操作。结构体和指针结构体指针有特殊的语法 - 符号如果p是一个结构体指针则可以使用 p -【成员】 的方法访问结构体的成员。p-member 等价于 (*p).member。typedefstruct{charname[31];intage;floatscore;}Student;intmain(void){Student stu{Bob,19,98.0};Student*psstu;ps-age20;ps-score99.0;printf(name:%s age:%d\n,ps-name,ps-age);return0;}数组和指针1、数组名作为右值的时候就是第一个元素的地址。intmain(void){intarr[3]{1,2,3};int*p_firstarr;printf(%d\n,*p_first);//1return0;}2、指向数组元素的指针 支持 递增 递减 运算。实质上所有指针都支持递增递减 运算 但只有在数组中使用才是有意义的intmain(void){intarr[3]{1,2,3};int*parr;for(;p!arr3;p){printf(%d\n,*p);}return0;}3、p p1 意思是让p指向原来指向的内存块的下一个相邻的相同类型的内存块。同一个数组中元素的指针之间可以做减法运算此时指针之差等于下标之差。4、一般来说假设p为某种类型的指针变量或者表达式i是一个整数则凡是形如 p[i] 都等价于 *(pi) 两种书写形式可以互换。p[i]这种形式更加便于阅读理解代码而*(pi)这种形式更加贴近机器对内存数据寻址的实现细节。有些编译器会将p[i]转换为*(pi)形式甚至有些编译期允许你写出下面这样“诡异”的代码5、当对数组名使用sizeof运算符时返回的是整个数组占用的内存字节数。当把数组名赋值给一个指针后再对指针使用sizeof运算符返回的是指针的大小。这就是为什么我么将一个数组传递给一个函数时需要另外用一个参数传递数组元素个数的原因了。intmain(void){intarr[3]{1,2,3};int*parr;printf(sizeof(arr)%d\n,sizeof(arr));//sizeof(arr)12printf(sizeof(p)%d\n,sizeof(p));//sizeof(p)4return0;}函数和指针函数的参数和指针C语言中实参传递给形参是按值传递的也就是说函数中的形参是实参的拷贝份形参和实参只是在值上面一样而不是同一个内存数据对象。这就意味着这种数据传递是单向的即从调用者传递给被调函数而被调函数无法修改传递的参数达到回传的效果。voidchange(inta){a;//在函数中改变的只是这个函数的局部变量a而随着函数执行结束a被销毁。age还是原来的age纹丝不动。}intmain(void){intage19;change(age);printf(age %d\n,age);// age 19return0;}有时候我们可以使用函数的返回值来回传数据在简单的情况下是可以的但是如果返回值有其它用途例如返回函数的执行状态量或者要回传的数据不止一个返回值就解决不了了。传递变量的指针可以轻松解决上述问题。voidchange(int*pa){(*pa);//因为传递的是age的地址因此pa指向内存数据age。当在函数中对指针pa解地址时//会直接去内存中找到age这个数据然后把它增1。}intmain(void){intage19;change(age);printf(age %d\n,age);// age 20return0;}再来一个老生常谈的用函数交换2个变量的值的例子#includestdio.hvoidswap_bad(inta,intb);voidswap_ok(int*pa,int*pb);intmain(){inta5;intb3;swap_bad(a,b);//Cant swap;swap_ok(a,b);//OKreturn0;}//错误的写法voidswap_bad(inta,intb){intt;ta;ab;bt;}//正确的写法通过指针voidswap_ok(int*pa,int*pb){intt;t*pa;*pa*pb;*pbt;}有的时候我们通过指针传递数据给函数不是为了在函数中改变他指向的对象相反我们防止这个目标数据被改变。传递指针只是为了避免拷贝大型数据。考虑一个结构体类型Student。我们通过show函数输出Student变量的数据。typedefstruct{charname[31];intage;floatscore;}Student;//打印Student变量信息voidshow(constStudent*ps){printf(name:%s , age:%d , score:%.2f\n,ps-name,ps-age,ps-score);}我们只是在show函数中取读Student变量的信息而不会去修改它为了防止意外修改我们使用了常量指针去约束。另外我们为什么要使用指针而不是直接传递Student变量呢从定义的结构看出Student变量的大小至少是39个字节那么通过函数直接传递变量实参赋值数据给形参需要拷贝至少39个字节的数据极不高效。而传递变量的指针却快很多因为在同一个平台下无论什么类型的指针大小都是固定的X86指针4字节X64指针8字节远远比一个Student结构体变量小。函数的指针每一个函数本身也是一种程序数据一个函数包含了多条执行语句它被编译后实质上是多条机器指令的合集。在程序载入到内存后函数的机器指令存放在一个特定的逻辑区域代码区。既然是存放在内存中那么函数也是有自己的指针的。C语言中函数名作为右值时就是这个函数的指针。voidecho(constchar*msg){printf(%s,msg);}intmain(void){void(*p)(constchar*)echo;//函数指针变量指向echo这个函数p(Hello );//通过函数的指针p调用函数等价于echo(Hello )echo(World\n);return0;}const 和 指针const到底修饰谁谁才是不变的下面是我总结的经验分享一下。如果const 后面是一个类型则跳过最近的原子类型修饰后面的数据。原子类型是不可再分割的类型如int, short , char以及typedef包装后的类型如果const后面就是一个数据则直接修饰这个数据。intmain(){inta1;intconst*p1a;//const后面是*p1实质是数据a则修饰*p1通过p1不能修改a的值constint*p2a;//const后面是int类型则跳过int 修饰*p2 效果同上int*constp3NULL;//const后面是数据p3。也就是指针p3本身是const .constint*constp4a;// 通过p4不能改变a 的值同时p4本身也是 constintconst*constp5a;//效果同上return0;}typedefint*pint_t;//将 int* 类型 包装为 pint_t,则pint_t 现在是一个完整的原子类型intmain(){inta1;constpint_tp1a;//同样const跳过类型pint_t修饰p1指针p1本身是constpint_tconstp2a;//const 直接修饰p同上return0;}深拷贝和浅拷贝如果2个程序单元例如2个函数是通过拷贝 他们所共享的数据的 指针来工作的这就是浅拷贝因为真正要访问的数据并没有被拷贝。如果被访问的数据被拷贝了在每个单元中都有自己的一份对目标数据的操作相互 不受影响则叫做深拷贝。附加知识指针和引用这个2个名词的区别。他们本质上来说是同样的东西。指针常用在C语言中而引用则用于诸如JavaC#等 在语言层面封装了对指针的直接操作的编程语言中。引用是编程语言提供给程序员的抽象机制而指针是操作系统提供给软件开发模型的抽象机制。大端模式和小端模式Little-Endian就是数据的低字节排放在内存的低地址端高字节排放在内存的高地址端。个人PC常用Intel X86处理器是小端模式。B i g-Endian就是数据的高字节排放在内存的低地址端低字节排放在内存的高地址端。采用大端方式 进行数据存放符合人类的正常思维而采用小端方式进行数据存放利于计算机处理。有些机器同时支持大端和小端模式。假如 short类型占用2个字节且存储的地址为0x30。short a 1;如下图#includestdio.h//测试机器使用的是否为小端模式。是则返回true否则返回false//这个方法判别的依据就是C语言中一个对象的地址就是这个对象占用的字节中地址值最小的那个字节的地址。intisSmallIndain(void){unsignedshortval0x0001;unsignedchar*p(unsignedchar*)val;//C/C对于多字节数据取地址是取的数据对象的第一个字节的地址也就是数据的低地址return(*p0x01);}intmain(void){if(isSmallIndain()){puts(小端);}else{puts(大端);}return0;}第二种方法使用union类型#includestdio.htypedefunion{unsignedshortus;unsignedcharuc;}Test_t;intmain(void){Test_t val;val.us0x0001;if(val.uc0x01){puts(小端);}else{puts(大端);}return0;}#includestdio.h//打印出一个unsigned short int 类型的原始字节流//这个例子中很明显看到取到a的首地址后我们循环递增了p而非递减p也从来不会看到有从首地址递减输出数据的字节的写法。//这也就佐证了在C语言中对于一个多字节数据它的地址就是它占用的所有字节中的地址值最小的那个字节的虚拟空间地址//这也又说明了一个事实C语言中一个多字节数据类型的实例占用的虚拟内存空间是连续的。intmain(void){size_ti;unsignedshortinta0xA1FF;unsignedchar*p(unsignedchar*)a;for(i0;isizeof(a);i){printf(%#x ,*p);//小端平台输出0xFF 0xA1p;//大端平台输出0xA1 0xFF}printf(\n\n);return0;}