mperson 发表于 2010-3-19 12:18:56

请教在多个cudadevice之间交换数据最有效率的方式

两种情形
1 主板有两个pci-e插槽,各有一个cudadevice,
2 单个pci-e插槽,但是通过br04这种芯片插一个单卡双芯的,比如9800gx2,gtx295这种

什么传递方式最有效率?

NAMD的开发组实现了多个GPU的类NBODY算法,一个到三个9800gtx的情况几乎是性能线性增长,效率>99%,很想知道通过什么方法可以实现这么高的效率

Edison 发表于 2010-4-10 23:36:21

cuda device 之间的同步都是透过 pcie 实现的,你可以依据实际测试的情况决定采用 page 还是 pinned 方式存取系统主内存。

只要计算的对象可以切成相互独立、粒度适当的问题大小,就能达到非常高的并行度。

levy_more 发表于 2010-8-24 20:20:39

学习!!!!!!

cyji99 发表于 2010-9-30 18:12:30

实现这么高的效率
页: [1]
查看完整版本: 请教在多个cudadevice之间交换数据最有效率的方式