介绍
除此之外,c++99 添加了 limit 关键字,作为程序员指定指针是指向作用域中给定对象的唯一指针的一种方式,从而给编译器一个“提示” ”,当通过该指针访问对象时,它可能会执行额外的优化。
问题
为了说明限制要解决的问题,请考虑如下函数:
1 2 3 4 |
|
1 2 3 4 |
|
你可能想知道为什么它生成第 3 行,因为它看起来与第 1 行是多余的。问题是编译器不知道你没有做这样的事情:
1 2 |
|
在 update_ptrs() 中,p 和 v 会别名 相同 int,因此编译器必须谨慎行事并假设 *v 的值可以在读取之间发生变化,因此需要额外的 mov 指令。
一般来说,c 中的指针会混淆优化,因为编译器无法知道两个指针是否彼此别名。 在性能关键的代码中,消除内存读取可能是一个巨大的胜利如果编译器可以安全地做到这一点。
解决方案
为了解决上述问题,c 中添加了 limit,允许您指定给定指针是 唯一 指向该指针作用域中的对象的指针,即同一作用域别名中没有其他指针它。
要使用限制,请将其插入声明中的 * 和指针名称之间。 重写为使用限制的 update_ptrs() 将是:
1 2 3 4 5 |
|
(从右到左读取,例如 v 是指向常量 int 的受限指针;或使用 cdecl。)
通过添加限制,编译器现在可以生成如下代码:
1 2 3 |
|
现在,编译器能够删除附加 mov 指令的前第 3 行。
也许最知名的使用restrict的例子是标准库函数memcpy()。 这是复制内存块的最快方法如果源地址和目标地址不重叠。当地址 重叠时,可以使用稍慢的 memmove() 函数。
陷阱
滥用限制会导致未定义的行为,例如,将 do 彼此别名的指针传递给 update_ptrs_v2() 或 memcpy()。 在某些情况下,编译器可以警告您,但并非在所有情况下,因此不要依赖编译器来捕获误用。
请注意,限制是针对给定范围的。 将一个受限制的指针分配给同一范围内的另一个会导致未定义的行为:
1 2 |
|
但是,您可以将受限制的指针分配给不受限制的指针:
1 2 |
|
即使 p 不受限制,编译器仍然可以执行相同的优化。
也可以将内部作用域中的受限指针分配给外部作用域中的另一个受限制指针(但反之则不然):
1 2 3 4 5 6 7 |
|
何时(以及何时不)使用限制
首先,您绝对应该分析您的代码(甚至可能查看生成的汇编代码),看看使用限制是否确实能够带来显着的性能改进,以证明冒潜在陷阱的风险是合理的。 诊断因滥用限制而导致的错误非常很难做到。
其次,如果限制的使用仅限于实现通过受限指针访问的内存由you分配的函数,那么它会更安全。 例如,给定:
1 2 3 4 5 6 7 8 |
|
代码可以安全地对数组的前半部分和后半部分进行操作,因为它们不重叠(假设您从未访问 half_1st[n/2] 或更多)。
第三,如果在函数的参数中使用restrict,那么它可能不太安全。 例如,将 safer() 与 update_ptrs_v2() 进行对比,其中 调用者 控制指针。 据你所知,调用者错误并传递了别名的指针。
各种各样的
只有指向对象(或void)的指针可以用restrict限定:
1 2 3 |
|
可以对结构体成员使用restrict,例如:
1 2 3 4 5 |
表示 data 将是指向该数据的唯一指针,并且 left 和 right 永远不会指向同一个节点。 然而,对结构成员使用限制是非常不常见的。
最后,c++ 没有有限制。 为什么不呢? 答案很长,但 tl;dr 版本是:
- 它可能是 c++ 委员会不想从 c 导入的难以发现的错误的来源。
- c++ 越来越多地使用指针,例如这个,使得安全使用限制变得更加困难。
但是,许多编译器都有 __restrict__ 作为扩展。
结论
在有限的情况下,使用限制可以提高性能,但也存在一些重大缺陷。 如果您正在考虑使用限制,请先分析您的代码。
明智地使用。