Tile Fusion 主要针对以下两类 PTO 指令序列进行优化: ● 存在依赖关系(Producer-Consumer):对于前后有依赖的 PTO指令,经过 Tile Fusion 后会将多个PTO指令融合成一个 VF,并优化掉对 UB (Unified Buffer) 的 Load/Store 指令。 ● 无依赖关系(Independent Ops):对于没有依赖的 PTO指令,Tile Fusion 也会将多个PTO指令融合成一个 VF,降低 VF Launch 开销。