Chapter 06 · performance playground
代码 ↔ 执行实验台
写一段代码,看 cache hit/miss 和 cycles 如何变化。先猜,再跑,再纠正。
这一章不是完整 Monaco + Compiler Explorer 联动版,但已经把 Ch06 的核心教学目标落地: 性能直觉、cache 行为、预测—验证闭环。四个经典实验都可以逐步回放。
性能预测小测验
同样 8×8 矩阵求和,行优先和列优先哪个更快?
init · 第 1 / 65 步
行优先遍历 8×8 矩阵
按行扫描:同一行的元素落在相邻 cache line,命中率高。
8×8 矩阵访问热力图
访问次数
0
Cache Hit
0
Cache Miss
0
Cycles(估算)
0
为什么
CPU 按 cache line 加载内存;行内相邻元素通常共享同一条 line。
不变量
内层循环走列方向,外层循环走行方向。
下一步 · 三栏代码联动
后续会把 C/Rust 编辑区、汇编输出和微操作拆解接到同一实验台。 当前版本先保证「看得见性能差异」。