跳转至

Optimizing Program Performance

  • CPE:每个元素需要消耗的时钟周期数
  • 编译器优化必须基于正确性,所以编译器的优化会很保守,会考虑最坏情况再进行优化。
  • 优化很重要的步骤:看汇编

Reducing Function Calls

  • 代码移动:例如将固定的函数值移出循环,避免重复调用;将函数调用转化成直接访问地址(效果其实都是要看是否是瓶颈)

Reducing Memory References

  • 将读写内存操作改为开临时变量——因为一个是在对内存操作,而另一个只是对寄存器进行操作

Using Modern Processors

  • 利用指令并行