4Manuals

  • PDF Cloud HOME

Sandy Bridge CPU上的二级缓存带宽 Download

    如何检测启动时让我的应用变慢的速度? 为什么在同一台机器上使用相同的二进制代码会得到不同的费用? 2类之间的JAVA性能测试 如何在Linux开发笔记本电脑上修复“ java.lang.OutOfMemoryError:无法创建新的本机线程” C ++套接字编程:网络低速分析 Python-NMF在Apache上运行缓慢,但在开发服务器上运行很快 cygwin1.dll +自己编译的C程序运行缓慢 是否有理由不在HTML中包含JS? Python运行时差 提高JDBC查询的性能-ArrayList比较

tl; dr:Sandy Bridge CPU上同时进行顺序读写的二级高速缓存带宽是多少?


我正在尝试根据一些测试数据来估算我的算法的绝对基线时间。对于这些数据,可以归结为在计算和写回一个160 KB的新块时,重复读取大约160 KB的顺序数据(因此不适合L1)。所有这些都发生在单个内核上,并且不涉及多线程。部分金额可能是我正在做的一个很好的近似值。

我能够找到一些不同的来源,这些隐含的带宽大约在30-100 GB / s之内。特别是:

  • Agner Fog's manual(第132页)加上一些仔细的计算,并假设我每个周期能够执行两次读取(因为我期望CPU读取整个64字节的高速缓存行,所以第4位地址的-6将有所不同。)
  • This线程。
  • 我现在不容易找到的一篇博客文章正在分析原始读取带宽,并获得了大约100 GB / s的速度,但是(a)对于Skylake和(b)没有同时写入。

无论如何,在这种情况下合理的估算值是什么?

0 个答案:

没有答案



Similar searches
    将gmaps infowindow值传递给表单 我正在一个项目中,我以古吉拉特语插入数据,但是当我通过数据表检索数据时,它会显示编码数据 所有游戏中的Fps掉落 命令模式-以“权重”执行任务的命令 使用Regex提取多行SAS代码