class="ql-indent-1">讀對應(yīng)的向量元素(8字節(jié))</li><li>計算只涉及一個乘法 + 一個加法(2 FLOPs)</li><li class="ql-indent-1">結(jié)果:每20-24 字節(jié)數(shù)據(jù),只有2FLOPs → 算法強(qiáng)度 ≈ 0.1 FLOPs/Byte</li></ul><p> 根據(jù)Roofline Model,該強(qiáng)度較低,位于帶寬瓶頸區(qū)域 Memory-Bound