D
← 返回 RuntimeScope 首页

Chapter 06 · performance playground

代码 ↔ 执行实验台

写一段代码,看 cache hit/miss 和 cycles 如何变化。先猜,再跑,再纠正。

这一章不是完整 Monaco + Compiler Explorer 联动版,但已经把 Ch06 的核心教学目标落地: 性能直觉、cache 行为、预测—验证闭环。四个经典实验都可以逐步回放。

CH06 PERFORMANCE LAB
性能预测小测验

同样 8×8 矩阵求和,行优先和列优先哪个更快?

init · 第 1 / 65

行优先遍历 8×8 矩阵

按行扫描:同一行的元素落在相邻 cache line,命中率高。

8×8 矩阵访问热力图
访问次数
0
Cache Hit
0
Cache Miss
0
Cycles(估算)
0
为什么

CPU 按 cache line 加载内存;行内相邻元素通常共享同一条 line。

不变量

内层循环走列方向,外层循环走行方向。

下一步 · 三栏代码联动

后续会把 C/Rust 编辑区、汇编输出和微操作拆解接到同一实验台。 当前版本先保证「看得见性能差异」。