指针与函数传递
skaiuijing
理解指针
很多人经常使用指针,看到这个标题可能不屑一顾。但笔者想说,把指针当作理所当然而不去探索它的本质,这是不对的。
先问个问题:指针是地址还是变量?(int *)a +1 增加了多少?
如果说 int a代表一个int大小的a变量,那么 int *a代表什么呢?答案是指向一个int 变量的指针变量a。
既然a有大小,是int,那么int *a有没有大小呢?答案是:肯定有!可能有人会回答一个字的大小,其实多少有点不严谨,指针的大小取决于具体的计算机架构和编译器,例如在常见的MCU-stm32上,一个指针的大小是32位,对应一个字。
所以说,指针的本质也是变量,(int *)a + 1,其实是加了对应一个指针的大小。
为什么指针能够修改内存
笔者定义一个结构体:
1 |
|
程序的运行结果:
1 | address:6422032,address-a: 6422032,address-b: 6422036 |
x86-64为大端序,转为二进制就是:10100000000000000000000000000001010
假设架构为x86*64,那么内存布局如下:
变量 | a (4 bytes) | b (4 bytes) |
---|---|---|
值 | 1010 | 101 |
地址 | 00000000 01100001 11111110 00010000 | 00000000 01100001 11111110 00010100 |
让我们思考一下,poinself->a = 10时,到底发生了什么?
答案是:机器通过pointself这个指针,找到了这个具体地址对应的空间,然后存放了a的值。
反汇编如下:(程序已经被gcc优化得非常好了,可能不足以解释这个过程,但是可以作为参考)
1 | main: |
- 内存分配:
sub rsp, 32
分配了 32 个字节的栈空间,用于存储address
和pointself
。mov QWORD PTR [rbp-8], 0
初始化address
为 0。lea rax, [rbp-8]
计算address
的地址并存储到寄存器rax
。mov QWORD PTR [rbp-16], rax
将address
的地址存储到pointself
。
- 赋值操作:
mov DWORD PTR [rbp-8], 10
将值 10 存储到pointself->a
对应的内存位置。mov DWORD PTR [rbp-4], 5
将值 5 存储到pointself->b
对应的内存位置。
- 打印操作:
mov rax, QWORD PTR [rbp-16]
将pointself
的值加载到寄存器rax
。mov rsi, rax
将rax
的值移动到rsi
,作为printf
的参数。lea rdx, [rbp-8]
计算pointself->a
的地址并存储到rdx
。lea rcx, [rbp-4]
计算pointself->b
的地址并存储到rcx
。mov edi, OFFSET FLAT:.LC0
将格式字符串的地址加载到edi
。call printf
调用printf
函数。mov rax, QWORD PTR [rbp-16]
将pointself
的值加载到寄存器rax
。mov rax, QWORD PTR [rax]
将address
的值加载到寄存器rax
。mov esi, eax
将eax
的值移动到esi
,作为printf
的参数。mov rax, QWORD PTR [rbp-16]
将pointself
的值加载到寄存器rax
。mov eax, DWORD PTR [rax+4]
将pointself->b
的值加载到寄存器eax
。mov edi, OFFSET FLAT:.LC1
将格式字符串的地址加载到edi
。mov edx, eax
将eax
的值移动到edx
,作为printf
的参数。call printf
调用printf
函数。
现在你是否明白为什么我们在使用指针时,常常要malloc?其实就是在给指针变量赋一个有意义的值,不然当我们使用->时,计算机会发现这块空间存储了莫名其妙的东西,或者是这块空间压根不存在。
既然理解了指针,那么该使用它了。
在使用函数时,我们常常使用return传递某些变量,但是,有时候我们希望函数能够传递多个元素,这时有什么好办法呢?
现在,是时候看看指针的伟大之处了。
1.使用指针修改对应地址指向的值
1 | #include <stdio.h> |
2.返回指向数组的指针
1 | #include <stdio.h> |
3.返回指向结构体的指针
1 | #include <stdio.h> |
这里解释一下,定义变量,其实就是开辟一片内存空间。我们一般在函数中定义的变量,都是局部变量,被存储在栈中,而malloc开辟的空间,是在堆中。栈的空间在函数结束后会被回收,而堆不会,必须手动清理,否则它永远存在,并且会造成内存溢出等问题。所以,我们可以使用动态内存分配来存储变量的值。
当然,你要是对地址、空间、内存这些东西感到烦躁,也有别的方法。不一定只能使用指针。
直接使用结构体
1 | #include <stdio.h> |