tl; dr:Sandy Bridge CPU上同时进行顺序读写的二级高速缓存带宽是多少? 我正在尝试根据一些测试数据来估算我的算法的绝对基线时间。对于这些数据,可以归结为在计算和写回一个160 KB的新块时,重复读取大约160 KB的顺序数据(因此不适合L1)。所有这些都发生在单个内核上,并且不涉及多线程。部分金额可能是我正在做的一个很好的近似值。 我能够找到一些不同的来源,这些隐含的带宽大约在30-100 GB / s之内。特别是: 无论如何,在这种情况下合理的估算值是什么?
0 个答案:
没有答案