圣诞树动画

Question

xperious

Asked:2020-01-08 00:47:55 +0000 UTC2020-01-08 00:47:55 +0000 UTC 2020-01-08 00:47:55 +0000 UTC

带有和不带有-O2的asma linux gcc排气

772

有一个功能

int foo(int num) {
if(num)
    return 1;
else
    return 3;
}

我理解没有优化的输出：

foo(int):
  pushq %rbp
  movq %rsp, %rbp
  movl %edi, -4(%rbp)
  cmpl $0, -4(%rbp)
  je .L2
  movl $1, %eax
  jmp .L3
.L2:
  movl $3, %eax
.L3:
  popq %rbp
  ret

但目前还不清楚 O2 发生了什么：

foo(int):
  cmpl $1, %edi
  sbbl %eax, %eax
  andl $2, %eax
  addl $1, %eax
  ret

为什么要使用 SubBtract 和 Borrow ......此外，如果你用 return 2 替换 return 3 的返回值，那么总的来说，奇怪的是一切都解决了

 foo(int):
  xorl %eax, %eax
  testl %edi, %edi
  sete %al
  addl $1, %eax
  ret

澄清一点优化的地方......否则我无法以任何方式输入一些东西

2 个回答

Voted

Fat-Zer · Answer 1 · 2020-01-08T03:45:09Z

Best Answer

Fat-Zer

2020-01-08T03:45:09Z2020-01-08T03:45:09Z

编译器不需要生成可理解和/或易于理解的代码。另一方面，如果您在一张纸上对所有输入和输出进行所有计算，那么函数的逻辑将完全相同：

foo(int):
  cmpl $1, %edi    # устанавливает CF, если %edi-1<0 т.е. если %edi==0
  sbbl %eax, %eax  # %eax = CF ? 0xFFFFFFFF : 0
  andl $2, %eax    # %eax &= 2 т.е. в зависимости от CF: %eax=={2|0}
  addl $1, %eax    # %eax += 1 т.е. %eax=={3|1}
  ret

在第二种情况下，一切都更简单，您可以用示例性 C 伪代码重写它：

 foo(int):
  xorl %eax, %eax   # int rv=0;
  testl %edi, %edi  # if(num==0)
  sete %al          #   rv = 1;
  addl $1, %eax     # rv++;
  ret               # return rv;

这些优化的想法是摆脱条件分支指令，在现代（i586+）CPU 上，如果预测块没有正确猜测，会导致管道重置，从而显着减慢计算速度。

7

AnT stands with Russia · Answer 2 · 2020-01-08T04:06:15Z

AnT stands with Russia

2020-01-08T04:06:15Z2020-01-08T04:06:15Z

如果您在函数中尝试使用不同的常量作为返回值

int foo(int num) 
{
  if(num)
    return A;
  else
    return B;
}

那么您可以看到，在模式下的一般情况下，-O2编译器选择以下方法作为计算结果的最佳策略

int foo(int edi) 
{
  int eax = edi ? 0 : 0xFFFFFFFF; 
  eax &= B - A;                   // `B - A` - константа
  return eax + A;
}

组合

cmpl $1, %edi
sbbl %eax, %eax

它只不过是一种计算运算符值的有效方法?:。进一步的代码与上面的代码基本对应。

在返回的常量相差不超过 1 的情况下，编译器会选择不同的方法 - through sete。

5

带有和不带有-O2的asma linux gcc排气

是否可以在 C++ 中继承类 <---> 结构？

这种神经网络架构适合文本分类吗？

为什么分配的工作方式不同？

控制台中的光标坐标

如何在 C++ 中删除类的实例？

点是否属于线段的问题

json结构错误

ServiceWorker 中的“获取”事件

c ++控制台应用程序exe文件[重复]

按多列从sql表中选择

带有和不带有-O2的asma linux gcc排气

2 个回答

相关问题