CottLi
3/13/2020 - 9:28 AM

指针

指针杂记

C/C++的内存管理

  • 将内存抽象成一个很大的一堆字符数组,对内存中的每一个字节分配一个32位或64位的编号(与32位或64位处理器相关),这个编号就是我们常说的内存地址
  • 内存单元的地址不需要保存,是由操作系统给分配的;
  • 每次要访问哪个地址,由地址线来信号来确定;
  • 每个程序有自己的地址空间,通常由段地址加偏移量来确定,段地址存放在段地址寄存器中;
  • 内存地址是内存当中存储数据的一个标识,并不是数据本身,通过内存地址可以找到内存当中存储的数据。

C/C++的内存分配

在c/c++中,内存分成5个区,他们分别是堆、栈、自由存储区、全局/静态存储区和常量存储区。

  • 栈:就是那些由编译器在需要的时候分配,在不需要的时候自动清楚的变量的存储区。里面的变量通常是局部变量、函数参数等。
  • 堆:就是那些由new分配的内存块,他们的释放编译器不去管,由我们的应用程序去控制,一般一个new就要对应一个delete。如果程序员没有释放掉,那么在程序结束后,操作系统会自动回收。
  • 自由存储区:就是那些由malloc等分配的内存块,他和堆是十分相似的,不过它是用free来结束自己的生命的。
  • 全局存储区(静态存储区):全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域, 未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。程序结束后有系统释放。
  • 常量存储区:这是一块比较特殊的存储区,他们里面存放的是常量,不允许修改。

c语言变量名、变量和地址的关系

定义

  • 变量:用来标识一块内存区域,即变量就是一块内存区域,而这个区域里面的值可以更改,故叫做‘变’量;
  • 变量名
    • 是一个标识符,用来指代一块内存区域,即变量;
    • 变量名并不占用内存空间
    • 使用变量名的目的是让我们以区域、以块为单位操作内存==,提高了方便性;
    • 变量名是给编译器看的,编译器根据变量是局部还是全局分配内存地址或栈空间,所谓的变量名在内存中不存在,操作时转换成地址存放在寄存器中了。
  • 编译器会将合法的变量名放到一个叫“符号表”的一个表中。每个符号对应一个地址。当你调用此变量时,就会根据此符号表找到对应的地址,然后进行操作。可见,取地址&操作和在字典中通过键名提取键值类似。(个人理解:变量名仅在编译过程中存在,变量在编译过程中为变量分配了内存,那么变量名则和内存地址联系到一起,在编译器继续编译遇到相同的变量名时,直接以变量名相关联的地址替换掉)

变量名不是内存地址,其他都是名都是地址吗

  • 所谓的其他名无非是函数名、标识符常量名、指针名、数组名、结构名、类名等等。
  • 指针名、数组名、函数名等就是地址,它们分别表示指针所指向元素的地址、数组的首地址和函数的入口地址;
  • 变量名虽然不直接表示地址,但可用取地址符号&来获得它所代表的变量的存放地址。因为在定义变量的同时会分配给它相应的空间
  • 指针变量呢,它本身也是一个变量名,只不过它标识的那块内存存放的是一个地址值;

实例说明

  • 定义int a;时,编译器分配4个字节内存,并命名该4个字节的空间名字为a(即变量名),当用到变量名a时,就是在使用那4个字节的内存空间;
  • 5是一个常数,在程序编译时存放在代码的常量区存放着它的值(就是5),当执行a=5时,程序将5这个常量拷贝到a所在的4个字节空间中,就完成了赋值操作。

a是我们对那个整形变量的4个字节取的"名字",是我们人为给的,实际上计算机并不存储a这个名字,只是我们编程时给那4个字节内存取个名字好用。实际上程序在编译时,所有的a都转换为了那个地址空间了。编译成机器代码后,没有a这个说法了。a这个名字只存在于我们编写的代码中。

原文链接:vic_blackRabbit

二级指针

/*二级指针应用*/
#include<stdio.h>
int main()
{
  /* 定义指针数组,并用字符串为其初始化 */
  char *name[ ]={"Book","Cell Phone", "Table","Program","Computer"};
  // name既是数组名,也是指向数组首元素的地址;该数组的元素为字符型指针,因此数组名name为指向首元素(指针)的指针,也就是name是一个二级指针,它的特殊之处在于它是一个二级指针常量!

  char **p;  // 定义字符型二级指针变量,相比于二级常量指针name更方便使用
  int i;
  for(i=0;i<5;i++)
  {
    p=name+i;     /* 二级指针指向指针数组 */
    printf("%s\n",*p);  // *p 访问的是数组的元素,数组的每个元素都是字符指针,都指向一个字符串(数组)的首地址;
  }
    return 0;
}

示例程序

示例1

  int *p1, *p2, *p, a, b;
  a = 3, b = 5;
  p1 = &a, p2 = &b;   // 将变量a,b的地址赋给(拷贝到)指针变量p1和p2
  // 交换指针变量p1和p2的值
  p = p1;
  p1 = p2;
  p2 = p1;
  printf("a=%d,b=%d\n",a,b);  // 变量a和b本身的值和地址并未改变
  printf(“max=%d,min=%d\n”,*p1,*p2);

分析

  1. 交换指针变量p1和p2的过程中,变量a和b本身的地址并没有改变,改变的只是两个指针变量本身的值,即指针变量存储的地址;
  2. 整个过程中,改变的是指针p1和p2的指向关系:
    • p1原本指向a,被改变后指向b;
    • p2原本指向b,被改变后指向a;

示例2:字符数组和字符指针的区别

  char str[] = "Hello World";   // 方式一:定义一个字符数组
  char *str  = "Hello World";   // 方式二:定义一个字符指针,指向字符串中的字符。

分析

  • 方式一定义字符数组,并将数组初始化为"Hello World",数组名为数组首元素的地址;
  • 方式二定义字符指针指向字符串中的字符,换句话说,用字符串为指针初始化,这里的字符串是一个字符串常量,因此字符串中的字符是不可以改变的,而在字符串数组中这些字符是可以被改变的;

其他区别:

  • 存储内容
    • 字符数组占据一块连续的内存区域,存放数组的每个元素;
    • 字符指针仅存放字符串第一个字符的地址,不存放每个字符;
  • 分配内存:
    • 字符数组在编译时根据字符的个数分配一块连续的区域,每个字符都有确定的地址;
    • 字符指针在定义字符指针变量时,分配内存单元,该单元仅用于存放地址;

C指针详解

前言:复杂类型说明

要了解指针,多多少少会出现一些比较复杂的类型,所以我先介绍一下如何完全理解一个复杂类型,要理解复杂类型其实很简单,一个类型里会出现很多运算符,他们也像普通的表达式一样,有优先级,其优先级和运算优先级一样,所以我总结了一下其原则:从变量名处起,根据运算符优先级结合,一步一步分析.下面让我们先从简单的类型开始慢慢分析吧:

int p; //这是一个普通的整型变量
int *p; //首先从P 处开始,先与*结合,所以说明P 是一个指针,然后再与int 结合,说明指针所指向的内容的类型为int 型.所以P是一个返回整型数据的指针
int p[3]; //首先从P 处开始,先与[]结合,说明P 是一个数组,然后与int 结合,说明数组里的元素是整型的,所以P 是一个由整型数据组成的数组
int *p[3]; //首先从P 处开始,先与[]结合,因为其优先级比*高,所以P 是一个数组,然后再与*结合,说明数组里的元素是指针类型,然后再与int 结合,说明指针所指向的内容的类型是整型的,所以P 是一个由返回整型数据的指针所组成的数组
int (*p)[3]; //首先从P 处开始,先与*结合,说明P 是一个指针然后再与[]结合(与"()"这步可以忽略,只是为了改变优先级),说明指针所指向的内容是一个数组,然后再与int 结合,说明数组里的元素是整型的.所以P 是一个指向由整型数据组成的数组的指针
int **p; //首先从P 开始,先与*结合,说是P 是一个指针,然后再与*结合,说明指针所指向的元素是指针,然后再与int 结合,说明该指针所指向的元素是整型数据.由于二级指针以及更高级的指针极少用在复杂的类型中,所以后面更复杂的类型我们就不考虑多级指针了,最多只考虑一级指针.
int p(int); // 从P 处起,先与()结合,说明P 是一个函数,然后进入()里分析,说明该函数有一个整型变量的参数,然后再与外面的int 结合,说明函数的返回值是一个整型数据
int (*p)(int); //从P 处开始,先与指针结合,说明P 是一个指针,然后与()结合,说明指针指向的是一个函数,然后再与()里的int 结合,说明函数有一个int 型的参数,再与最外层的int 结合,说明函数的返回类型是整型,所以P 是一个指向有一个整型参数且返回类型为整型的函数的指针
int *(*p(int))[3]; //可以先跳过,不看这个类型,过于复杂。从P 开始,先与()结合,说明P 是一个函数,然后进入()里面,与int 结合,说明函数有一个整型变量参数,然后再与外面的*结合,说明函数返回的是一个指针,,然后到最外面一层,先与[]结合,说明返回的指针指向的是一个数组,然后再与*结合,说明数组里的元素是指针,然后再与int 结合,说明指针指向的内容是整型数据.所以P 是一个参数为一个整数据且返回一个指向由整型指针变量组成的数组的指针变量的函数.

说到这里也就差不多了,我们的任务也就这么多,理解了这几个类型,其它的类型对我们来说也是小菜了,不过我们一般不会用太复杂的类型,那样会大大减小程序的可读性,请慎用,这上面的几种类型已经足够我们用了.

细说指针

指针是一个特殊的变量,它里面存储的数值被解释为内存里的一个地址。要搞清一个指针需要搞清指针的四方面的内容:指针的类型、指针所指向的类型、指针的值或者叫指针所指向的内存区、指针本身所占据的内存区。让我们分别说明。

先声明几个指针放着做例子: 例一:

(1)int*ptr;
(2)char*ptr;
(3)int**ptr;
(4)int(*ptr)[3];
(5)int*(*ptr)[4];

指针的类型

从语法的角度看,你只要把指针声明语句里的指针名字去掉,剩下的部分就是这个指针的类型。这是指针本身所具有的类型。让我们看看例一中各个指针的类型:

(1)int*ptr;         //指针的类型是int*
(2)char*ptr;        //指针的类型是char*
(3)int**ptr;        //指针的类型是int**
(4)int(*ptr)[3];    //指针的类型是int(*)[3]
(5)int*(*ptr)[4];   //指针的类型是int*(*)[4]

指针所指向的类型

  • 当你通过指针来访问指针所指向的内存区时,指针所指向的类型决定了编译器将把那片内存区里的内容当做什么来看待;
  • 指针变量所指向的类型决定了指针变量所取内存空间的宽度,也决定了指针变量$+1$ 时跳过的字节数(跨度或称字节单位)
  • 从语法上看,你只须把指针声明语句中的指针名字和名字左边的指针声明符*去掉,剩下的就是指针所指向的类型。例如:
(1)int*ptr;         //指针所指向的类型是 int
(2)char*ptr;        //指针所指向的的类型是 char
(3)int**ptr;        //指针所指向的的类型是 int*
(4)int(*ptr)[3];    //指针所指向的的类型是 int()[3]
(5)int*(*ptr)[4];   //指针所指向的的类型是 int*()[4]

在指针的算术运算中,指针所指向的类型有很大的作用。 指针的类型(即指针本身的类型)和指针所指向的类型是两个概念。当你对C 越来越熟悉时,你会发现,把与指针搅和在一起的"类型"这个概念分成"指针的类型"和"指针所指向的类型"两个概念,是精通指针的关键点之一。

指针的值----或者叫指针所指向的内存区或地址

指针本身占了多大的内存?你只要用函数sizeof(指针的类型)测一下就知道了。在32位平台里,指针本身占据了4 个字节的长度。指针本身占据的内存这个概念在判断一个指针表达式(后面会解释)是否是左值时很有用。

指针的算术运算

指针可以加上或减去一个整数。指针的这种运算的意义和通常的数值的加减运算的意义是不一样的。例如:

例二:

char a[20];
// ptr的指针类型为 int*,而a的指针类型为 char*,使用(int*)将a的指针类型强制转换
int *ptr=(int *)a; //强制类型转换并不会改变a的类型
ptr++;

在上例中,指针ptr的类型是int*,它指向的类型是int,它被初始化为指向整型变量a。接下来的第3句中,指针ptr被加了1,编译器是这样处理的:它把指针ptr的值加上了sizeof(int),在32位程序中,是被加上了4,因为在32 位程序中,int占4个字节。由于地址是用字节做单位的,故ptr所指向的地址由原来的变量a的地址向高地址方向增加了4个字节。由于char类型的长度是一个字节,所以,原来ptr是指向数组a的第0号单元开始的四个字节,此时指向了数组a中从第4号单元开始的四个字节。我们可以用一个指针和一个循环来遍历一个数组,看例子:

例三:

int array[20]={0};
int *ptr=array;
for(i=0;i<20;i++)
{
    (*ptr)++;
    ptr++;
}

这个例子将整型数组中各个单元的值加1。由于每次循环都将指针ptr加1个单元,所以每次循环都能访问数组的下一个单元。

再看例子:

例四:

char a[20]="You_are_a_girl";
int *ptr=(int *)a;  \\ ptr 指向数组 a 首元素的地址,指针类型为 int*
ptr+=5;

在这个例子中,ptr被加上了5,编译器是这样处理的:将指针ptr 的值加上$5\times \mathrm{sizeof(int)}$,在32位程序中就是加上了$5\times4=20$。由于地址的单位是字节,故现在的ptr所指向的地址比起加5后的ptr所指向的地址来说,向高地址方向移动了20个字节。

在这个例子中,没加5前的ptr指向数组a的第0号单元开始的四个字节,加5后,ptr已经指向了数组a的合法范围之外了(个人备注:每个字符占1个字节,20个元素的字符数组总共占20个字节。从首地址往高地址移动20个字节超出了字符数组的内存范围)。虽然这种情况在应用上会出问题,但在语法上却是可以的。这也体现出了指针的灵活性。如果上例中,ptr是被减去5,那么处理过程大同小异,只不过ptr 的值是被减去$5\times \mathrm{sizeof(int)}$,新的ptr 指向的地址将比原来的ptr所指向的地址向低地址方向移动了20个字节。

下面请允许我再举一个例子:(一个误区)

例五:

#include<stdio.h>
int main()
{
    char a[20]=" You_are_a_girl";
    char *p=a;
    char **ptr=&p;
    //printf("p=%d\n",p);
    //printf("ptr=%d\n",ptr);
    //printf("*ptr=%d\n",*ptr);
    printf("**ptr=%c\n",**ptr);
    ptr++;
    //printf("ptr=%d\n",ptr);
    //printf("*ptr=%d\n",*ptr);
    printf("**ptr=%c\n",**ptr);
}
  • 误区一:输出答案为Yo
    • 误解:ptr是一个char类型的二级指针,当执行ptr++;时,会使指针加一个sizeof(char),所以输出如上结果,这个可能只是少部分人的结果.
  • 误区二:输出答案为Ya
    • 误解:ptr指向的是一个char *类型的指针,当执行ptr++;时,会使指针加一个sizeof(char *)(有可能会有人认为这个值为1,那就会得到误区一的答案,这个值应该是4,参考前面内容), 即&p+4; 那进行一次取值运算不就指向数组中的第五个元素了吗?那输出的结果不就是数组中第五个元素了吗?答案是否定的.
  • 正解: ptr的类型是char **,指向的类型是一个char *类型,它指向的地址就是p的地址(&p),当执行ptr++;时,会使指针加一个sizeof(char*),即&p+4;,那*(&p+4)指向哪呢,这个你去问上帝吧,或者他会告诉你在哪?所以最后的输出会是一个随机的值,或许是一个非法操作。(私人备注:此时移动的是指针变量p自己的地址,这个地址本身和数组的地址没有联系,两者的联系在与p指向的内存中保存着数组首元素的地址,即*p == a)

运算符&和*

这里&是取地址运算符,*是间接运算符;

&a的运算结果是一个指针,指针的类型是a的类型加个*,指针所指向的类型是a的类型,指针所指向的地址嘛,那就是a的地址。 *p 的运算结果就五花八门了。总之*p 的结果是p所指向的东西,这个东西有这些特点:它的类型是p指向的类型,它所占用的地址是p所指向的地址。 例六:

int a=12; int b; int *p; int **ptr;
p=&a;   //&a 的结果是一个指针,指针类型是int*,指向的类型是
        //int,指向的地址是a的地址。
*p=24;  //*p 的结果,在这里它的类型是int,它所占用的地址是
        //p 所指向的地址,显然,*p 就是变量a。

ptr=&p; //&p 的结果是个指针,该指针的类型是p 的类型加个*,
        //在这里是int **。该指针所指向的类型是p 的类型,这
        //里是int*。该指针所指向的地址就是指针p 自己的地址

*ptr=&b; //*ptr是个指针,&b 的结果也是个指针,且这两个指针
        //的类型和所指向的类型是一样的,所以用&b 来给*`ptr`赋
        //值就是毫无问题的了。

**ptr=34; //*ptr的结果是ptr所指向的东西,在这里是一个指针,
        //对这个指针再做一次*运算,结果是一个int 类型的变量。

补充说明

示例程序:

int a = 10;
int *b = &a;

printf(“%d\n”, a);    // 结果:10
printf(“%d\n”, &a);   // 结果:6487620
printf(“%d\n”, b);    // 结果:6487620
printf(“%d\n”, *b);   // 结果:10
  • 变量a本质上代表一个存储单元,CPU通过该存储单元的地址访问该存储单元中的数据。所以变量a本来代表两个值:存储单元的地址和储单元中的数据。于是就有了二异性。为了消除二义性,CC语言规定:

    • a表示存储单元中的数据;
    • &a表示存储单元的地址;
  • a存储单元中的数据可以是一个普通数值,也可以是另一个存储单元的地址,比如:a = &b; 语句就是将b的存储单元的地址存入a存储单元中。C语言规定*a代表a中存储的地址对应的存储单元中的数据,也就是访问*a就等于访问b,于是*a提供了通过a访问b中的数据的手段。

  • *a表示:

    1. 首先,要求a对应的存储单元中的数据一定是另一个存储单元的地址;
    2. 满足条件1时,*a表示另一个存储单元中的数据。

示例

  1. a声明的类型是int时,a中存储的是一个整数数值,通过a可以访问(读取或修改)这个数值。
  2. a声明的类型是int*时,a中存储的是某个存储单元的地址,而该存储单元中存储的数据是一个整数数值;通过*a可以访问(读取或修改)这个数值。a == &*a都是该存储单元的地址。
  3. a声明的类型是int**时,a中存储的是某个存储单元的地址,而该存储单元中存储的数据是另外一个存储单元的地址,另外这个存储单元中存储的是一个整数数值;通过**a可以访问(读取或修改)这个数值。 ———————————————— 补充部分来自:kiraliam

指针表达式

一个表达式的结果如果是一个指针,那么这个表达式就叫指针表式。 下面是一些指针表达式的例子:

例七:

int a,b;
int array[10];
int *pa;
    pa    = &a;     // &a 是一个指针表达式。
int **ptr = &pa;    // &pa 也是一个指针表达式。
    *ptr  = &b;     // *ptr和&b 都是指针表达式。
    pa    = array;
pa++;               //这也是指针表达式。

例八:

char *arr[20];
char **parr = arr;  //如果把arr 看作指针的话,arr 也是指针表达式
char *str;
str = *parr;      //*parr 是指针表达式
str = *(parr+1);  //*(parr+1)是指针表达式
str = *(parr+2);  //*(parr+2)是指针表达式

由于指针表达式的结果是一个指针,所以指针表达式也具有指针所具有的四个要素:指针的类型,指针所指向的类型,指针指向的内存区,指针自身占据的内存。

好了,当一个指针表达式的结果指针已经明确地具有了指针自身占据的内存的话,这个指针表达式就是一个左值,否则就不是一个左值。在例七中,&a不是一个左值,因为它还没有占据明确的内存。*ptr是一个左值,因为*ptr这个指针已经占据了内存,其实*ptr就是指针pa,既然pa已经在内存中有了自己的位置,那么*ptr当然也有了自己的位置。

数组和指针的关系

数组的数组名其实可以看作一个指针。看下例: 例九:

int array[10]={0,1,2,3,4,5,6,7,8,9},value;
value = array[0];  //也可写成:value=*array;
value = array[3];  //也可写成:value=*(array+3);
value = array[4];  //也可写成:value=*(array+4);

上例中,一般而言数组名array代表数组本身,类型是int[10],但如果把array看做指针的话,它指向数组的第0个单元,类型是int*,所指向的类型是数组单元的类型即int。因此*array等于0就一点也不奇怪了。同理,array+3是一个指向数组第3个单元的指针,所以*(array+3)等于3。其它依此类推。 例十:

char *str[3]={
    "Hello,thisisasample!",
    "Hi,goodmorning.",
    "Helloworld"
};
char s[80];
strcpy(s,str[0]); //也可写成strcpy(s,*str);
strcpy(s,str[1]); //也可写成strcpy(s,*(str+1));
strcpy(s,str[2]); //也可写成strcpy(s,*(str+2));

上例中,str是一个三单元的数组,该数组的每个单元都是一个指针,这些指针各指向一个字符串。把指针数组名str当作一个指针的话,它指向数组的第0号单元,它的类型是char **,它指向的类型是char *

*str也是一个指针,它的类型是char *,它所指向的类型是char,它指向的地址是字符串"Hello,thisisasample!"的第一个字符的地址,即'H'的地址。注意:字符串相当于是一个数组,在内存中以数组的形式储存,只不过字符串是一个数组常量,内容不可改变,且只能是右值.如果看成指针的话,他即是常量指针,也是指针常量.

str+1 也是一个指针,它指向数组的第1号单元,它的类型是char**,它指向的类型是char**(str+1)也是一个指针,它的类型是char*,它所指向的类型是char,它指向"Hi,goodmorning."的第一个字符'H';

下面总结一下数组的数组名(数组中储存的也是数组)的问题:

声明了一个数组TYPE array[n],则数组名称array 就有了两重含义:

  • 第一,它代表整个数组,它的类型是TYPE[n];
  • 第二,它是一个常量指针,该指针的类型是TYPE*,该指针指向的类型是TYPE,也就是数组单元的类型,该指针指向的内存区就是数组第0号单元,该指针自己占有单独的内存区,注意它和数组第0号单元占据的内存区是不同的。该指针的值是不能修改的,即类似array++的表达式是错误的在不同的表达式中数组名array 可以扮演不同的角色
    • 在表达式sizeof(array)中,数组名array代表数组本身,故这时sizeof 函数测出的是整个数组的大小。
    • 在表达式*array 中,array扮演的是指针,因此这个表达式的结果就是数组第0号单元的值。sizeof(*array)测出的是数组单元的大小。

表达式array+n(其中n=0,1,2,.....)中,array扮演的是指针,故array+n的结果是一个指针,它的类型是TYPE *,它指向的类型是TYPE,它指向数组第n号单元。故sizeof(array+n)测出的是指针类型的大小。在32位程序中结果是4.

例十一:

int array[10];
int (*ptr)[10];
ptr = &array;:

上例中ptr是一个指针,它的类型是int(*)[10],它指向的类型是int[10],我们用整个数组的首地址来初始化它。在语句ptr=&array中,array代表数组本身(为int[10]类型的数组)。

本节中提到了函数sizeof(),那么我来问一问,sizeof(指针名称)测出的究竟是指针自身类型的大小呢还是指针所指向的类型的大小?答案是前者。

例如:

int(*ptr)[10];  // 则在32位程序中,有:
// sizeof(int(*)[10])==4
// sizeof(int[10])==40
// sizeof(ptr)==4

实际上,sizeof(对象)测出的都是对象自身的类型的大小,而不是别的什么类型的大小。

指针和结构类型的关系

可以声明一个指向结构类型对象的指针。 例十二:

struct MyStruct
{
    int a;
    int b;
    int c;
};

struct MyStruct ss={20,30,40};
//声明了结构对象ss,并把ss 的成员初始化为20,30 和40。
struct MyStruct *ptr=&ss;
//声明了一个指向结构对象ss 的指针。它的类型是
//MyStruct *,它指向的类型是MyStruct。
int *pstr=(int*)&ss;
//声明了一个指向结构对象ss 的指针。但是pstr 和
//它被指向的类型`ptr`是不同的。

请问怎样通过指针ptr来访问ss 的三个成员变量? 答案:

ptr->a; //指向运算符,或者可以这们(*ptr).a,建议使用前者
ptr->b;
ptr->c;

又请问怎样通过指针pstr 来访问ss 的三个成员变量? 答案:

*pstr; //访问了ss 的成员a。
*(pstr+1); //访问了ss 的成员b。
*(pstr+2) //访问了ss 的成员c。

虽然我在我的MSVC++6.0 上调式过上述代码,但是要知道,这样使用pstr 来访问结构成员是不正规的,为了说明为什么不正规,让我们看看怎样通过指针来访问数组的各个单元: (将结构体换成数组).

例十三:

int array[3]={35,56,37};
int *pa=array;
//通过指针pa 访问数组array 的三个单元的方法是:
*pa; //访问了第0 号单元
*(pa+1); //访问了第1 号单元
*(pa+2); //访问了第2 号单元

从格式上看倒是与通过指针访问结构成员的不正规方法的格式一样。 所有的C/C++编译器在排列数组的单元时,总是把各个数组单元存放在连续的存储区里,单元和单元之间没有空隙。但在存放结构对象的各个成员时,在某种编译环境下,可能会需要字对齐或双字对齐或者是别的什么对齐,需要在相邻两个成员之间加若干个"填充字节",这就导致各个成员之间可能会有若干个字节的空隙。 所以,在例十二中,即使pstr 访问到了结构对象ss 的第一个成员变量a,也不能保证(pstr+1)就一定能访问到结构成员b。因为成员a 和成员b 之间可能会有若干填充字节,说不定*(pstr+1)就正好访问到了这些填充字节呢。这也证明了指针的灵活性。要是你的目的就是想看看各个结构成员之间到底有没有填充字节,嘿,这倒是个不错的方法。 不过指针访问结构成员的正确方法应该是象例十二中使用指针ptr的方法。

指针和函数的关系

可以把一个指针声明成为一个指向函数的指针。

int fun1(char *,int);
int (*pfun1)(char *,int);
pfun1=fun1;
int a=(*pfun1)("abcdefg",7); //通过函数指针调用函数。
int fun(char *);
int a;
char str[]="abcdefghijklmn";
a=fun(str);
int fun(char *s)
{
    int num=0;
    for(int i=0;;)
    {
        num+=*s;s++;
    }
    return num;
}

这个例子中的函数fun统计一个字符串中各个字符的ASCII码值之和。前面说了,数组的名字也是一个指针。在函数调用中,当把str作为实参传递给形参s 后,实际是把str的值传递给了ss所指向的地址就和str所指向的地址一致,但是strs各自占用各自的存储空间。在函数体内对s进行自加1 运算,并不意味着同时对str进行了自加1运算.

指针类型转换

当我们初始化一个指针或给一个指针赋值时,赋值号的左边是一个指针,赋值号的右边是一个指针表达式。在我们前面所举的例子中,绝大多数情况下,指针的类型和指针表达式的类型是一样的,指针所指向的类型和指针表达式所指向的类型是一样的。

例十五:

float f=12.3;
float *fptr=&f;
int *p;

在上面的例子中,假如我们想让指针p 指向实数f,应该怎么办? 是用下面的语句吗?

p=&f;

不对。因为指针p 的类型是int *,它指向的类型是int。表达式&f的结果是一个指针,指针的类型是float *,它指向的类型是float

两者不一致,直接赋值的方法是不行的。至少在我的MSVC++6.0 上,对指针的赋值语句要求赋值号两边的类型一致,所指向的类型也一致,其它的编译器上我没试过,大家可以试试。为了实现我们的目的,需要进行"强制类型转换": p=(int*)&f;

如果有一个指针p,我们需要把它的类型和所指向的类型改为TYEP *TYPE, 那么语法格式是:(TYPE *)p

这样强制类型转换的结果是一个新指针,该新指针的类型是TYPE *,它指向的类型是TYPE,它指向的地址就是原指针指向的地址。

而原来的指针p 的一切属性都没有被修改。(切记)

一个函数如果使用了指针作为形参,那么在函数调用语句的实参和形参的结合过程中,必须保证类型一致,否则需要强制转换;

例十六:

void fun(char*);
int a=125,b;
fun((char*)&a);
void fun(char*s)
{
    char c;
    c = *(s+3);*(s+3) = *(s+0);*(s+0) = c;
    c = *(s+2);*(s+2) = *(s+1);*(s+1) = c;
}

注意这是一个32 位程序,故int 类型占了四个字节,char类型占一个字节。函数fun的作用是把一个整数的四个字节的顺序来个颠倒。注意到了吗?在函数调用语句中,实参&a的结果是一个指针,它的类型是int *,它指向的类型是int。形参这个指针的类型是char *,它指向的类型是char。这样,在实参和形参的结合过程中,我们必须进行一次从int *类型到char *类型的转换。

结合这个例子,我们可以这样来想象编译器进行转换的过程:编译器先构造一个临时指针char *temp,然后执行temp=(char *)&a,最后再把temp的值传递给s。所以最后的结果是:s 的类型是char *,它指向的类型是char,它指向的地址就是a的首地址。

我们已经知道,指针的值就是指针指向的地址,在32位程序中,指针的值其实是一个32位整数。

那可不可以把一个整数当作指针的值直接赋给指针呢?就象下面的语句:

unsigned int a;
TYPE *ptr;      //TYPE 是int,char 或结构类型等等类型。
a=20345686;
ptr=20345686;   //我们的目的是要使指针`ptr`指向地址20345686
ptr=a;          //我们的目的是要使指针`ptr`指向地址20345686
//编译一下吧。结果发现后面两条语句全是错的。那么我们的目的就不能达到了吗?不,还有办法:
unsigned int a;
TYPE *ptr;      //TYPE 是int,char 或结构类型等等类型。
a=N             //无符号整数 N 必须代表一个合法的地址;
ptr=(TYPE*)a;  //呵呵,这就可以了。

严格说来这里的(TYPE *)和指针类型转换中的(TYPE *)还不一样。这里的(TYPE*)的意思是把无符号整数a的值当作一个地址来看待。上面强调了a的值必须代表一个合法的地址,否则的话,在你使用ptr的时候,就会出现非法操作错误。想想能不能反过来,把指针指向的地址即指针的值当作一个整数取出来。完全可以。下面的例子演示了把一个指针的值当作一个整数取出来,然后再把这个整数当作一个地址赋给一个指针:

例十七:

int a=123,b;
int *ptr=&a;
char *str;
b=(int)ptr;     //把指针`ptr`的值当作一个整数取出来。
str=(char*)b;   //把这个整数的值当作一个地址赋给指针str。

现在我们已经知道了,可以把指针的值当作一个整数取出来,也可以把一个整数值当作地址赋给一个指针

指针的安全问题

看下面的例子:

例十八:

char a;
int *ptr = &a;
ptr++;
*ptr = 115;

该例子完全可以通过编译,并能执行。但是看到没有?第3句对指针ptr进行自加1 运算后,ptr指向了和整型变量a相邻的高地址方向的一块存储区。这块存储区里是什么?我们不知道。有可能它是一个非常重要的数据,甚至可能是一条代码。

而第4句竟然往这片存储区里写入一个数据!这是严重的错误。所以在使用指针时,程序员心里必须非常清楚:我的指针究竟指向了哪里。在用指针访问数组的时候,也要注意不要超出数组的低端和高端界限,否则也会造成类似的错误。

在指针的强制类型转换:ptr1=(TYPE *)ptr2 中:

  • 如果sizeof(ptr2的类型)大于sizeof(ptr1 的类型),那么在使用指针ptr1来访问ptr2所指向的存储区时是安全的;
  • 如果sizeof(ptr2的类型) 小于sizeof(ptr1的类型),那么在使用指针ptr1来访问ptr2所指向的存储区时是不安全的。至于为什么,读者结合例十八来想一想,应该会明白的。

(个人备注:因为prt1指向的数据类型每个数据占据的内存区域大于prt2指向的数据类型每个数据占据的内存区域。假设prt2指向的数据占2个字节,而ptr1指向的数据占4个字节,当用ptr1指针访问ptr2指针指向的数据时,ptr1会一次性访问4个字节的数据,但ptr2指向的数据只占2个字节,因此额外的2个字节是什么不得而知)

转载至网页,版权归原作者所有