前往业界动态栏目前往脑场特工栏目暂未开通前往IN评测栏目暂未开通前往大家的PCINLIFE暂未开通

赞助商广告

官方活动宣传

发新话题
打印

[体系架构] 替RV770說點好話

本主题由 Edison 于 2008-9-12 02:01 提升
引用:
原帖由 airforce14 于 2008-3-12 09:51 发表
这文章是最近难得的好文章了  不过如果是4bank x 40個shader的话 那就只有对AMD太失望了  难道新增加的SP都来做AA了?
如果是4X40那AMD真的傻掉了。

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 Asuka 于 2008-3-12 10:03 发表


不是存储器,是存储器与GPU时钟差距带来的延迟

其实你可以自己算一下:

以Radeon 3870为例,它的核心部件,也就是ALU/reg file/UTDP 的工作时钟是770MHz,这样它内部每个时钟周期的长度在1.3ns左右.它搭配 ...
这个解释简单易懂,哈哈

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 shu0202 于 2008-3-12 08:40 发表
Eji的意思是RV770的扩展式架构不是什么好东西。一方面是用尽可能少的晶体管代价提高效能,一方面是规模扩大造成执行效率下降。Eji也倾向于标量架构是GPU的未来了吗?那为什么Intel没有选择标量的路子呢?我不认为AMD架构缺陷和矢量单元有必然关系。倒是暴露出传统架构在新一代指令执行上的力不从心。不过NV的标量架构现在看也好不了多少。
well,我不覺得哪種ALU結構是所謂的"未來".... 我只是覺得夠強的記憶體延遲遮蔽、夠好的multi-threading、夠高的電晶體效率才是關鍵。比方說,NVIDIA的ALU底層其實還是SIMD,只是中間有架一層額外的高速移位單元來遮蔽這些特性。

G100/GT200應該會把share memory的容量做大幅的提升,如果傳聞的1800M可信,那麼16個TPC可以每個都放256KB的share memory....內部實質可用頻寬會大幅增加。

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

好文章,一定要顶,认真学习。

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 Asuka 于 2008-3-12 10:03 发表


不是存储器,是存储器与GPU时钟差距带来的延迟

其实你可以自己算一下:

以Radeon 3870为例,它的核心部件,也就是ALU/reg file/UTDP 的工作时钟是770MHz,这样它内部每个时钟周期的长度在1.3ns左右.它搭配 ...
这个看起来通俗易懂的多,各位版主发言还是不一样啊。

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

回复 43# 的帖子

从16KB大幅提升到256KB是个好消息
越来越像更灵活的GPU了,有这个容量对GPGPU是个好消息

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

amd采取保守策略了,基本上不去争那个第一了。

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 1empress 于 2008-3-11 19:39 发表
总算把TMU加上去了

不过执行单元加了一倍,才只做到和G94一样的面积

AMD在制程成本上的功力真是很可怕
背后站了个蓝色巨人,功力深厚真那

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 Eji 于 2008-3-12 10:46 发表


well,我不覺得哪種ALU結構是所謂的"未來".... 我只是覺得夠強的記憶體延遲遮蔽、夠好的multi-threading、夠高的電晶體效率才是關鍵。比方說,NVIDIA的ALU底層其實還是SIMD,只是中間有架一層額外的高速移位單元 ...
矢量架构显现为标量架构是怎么回事?我不能理解。谁来解释一下?这样做的目的是什么?GT200不大可能做到18亿,这对整个产品线的成本控制都是灾难性的。除非NV为GT200单独设立品牌并以K$为单位销售他。

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 Asuka 于 2008-3-12 09:37 发表


这些分析获得的意义很小

crysis的shader是最大瓶颈,这个不是什么秘密,已经是妇孺皆知的东西

这个测试只抽象的告诉你shader是瓶颈,但是shader可以有无数种写法,crysis是卡在哪些shader上?

RV670的F ...
G80不是说什么样的shader对效能都没有影响么?

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

鉴于amd疲软和美元贬值,gt200 999usd一块有可能

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

矢量架构显现为标量架构是怎么回事?我不能理解。谁来解释一下?
-->
G80的batch size是4×2×2=32pixel (per warp),执行的单位却是1/2 warp,所以每个SM很可能是4SP再加上duuble pump
另外,对于每个SM来说,4个thread在dynamic branch的时候走不同的方向,就要顺序执行,因此底层实际上应该是4D SIMD unit + duuble pump + SFU
具体的细节不是很清楚,但是可以肯定它的元件管理非常的独立,内部reg资源也非常丰富,通过一些特别的设计,swizzle是完全free的,所以可以把它看成full scalar
换句话说,G80只有16个4D SIMD unit,但是因为优良的设计,它直接可以当成full scalar来用



这样做的目的是什么?
-->
完全硬件化的MIMD在旗舰级GPU这种芯片上是不现实的,G80是量产芯片,不是用来做实验的,除了成本,产能和工艺承受度也是必须考虑的问题



GT200不大可能做到18亿,这对整个产品线的成本控制都是灾难性的。除非NV为GT200单独设立品牌并以K$为单位销售他。
-->
我能告诉你的是,GT200的晶体管小于或者等于1000M


G80不是说什么样的shader对效能都没有影响么?
-->
通吃指令不意味着通吃shader,要写一个让G80跑不动的shader实在太简单了。记住:在batch size做到per pixel之前,这种话都属于行销手段
G80能保证的,就是它对各种复杂shader的适应性远好过R6XX,仅此而已,离“任何shader对效能都没有影响”还差几个世纪

Benchmark != benchmark

If (benchmark) do_one_thing();
else do_something_else();

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

提示: 作者被禁止或删除 内容自动屏蔽

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 来不及思考 于 2008-3-12 13:24 发表
矢量架构显现为标量架构是怎么回事?我不能理解。谁来解释一下?
-->
G80的batch size是4×2×2=32pixel (per warp),执行的单位却是1/2 warp,所以每个SM很可能是4SP再加上duuble pump
另外,对于每个SM来说,4个 ...
Gt200晶体管9亿多...

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

谢谢思考的解释,受教了!

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

看了老半天也没有看懂大家说什么

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 haifengx88 于 2008-3-12 13:54 发表
Gt200晶体管9亿多...
~1000M嗎....看起來像是現有的ALU規模,再加執行資源....果然NVIDIA比較重視procedure。

[ 本帖最后由 Eji 于 2008-3-12 15:27 编辑 ]

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

思考好久不見XD
引用:
原帖由 来不及思考 于 2008-3-12 13:24 发表
矢量架构显现为标量架构是怎么回事?我不能理解。谁来解释一下?
-->
G80的batch size是4×2×2=32pixel (per warp),执行的单位却是1/2 warp,所以每个SM很可能是4SP再加上duuble pump
另外,对于每个SM来说,4个thread在dynamic branch的时候走不同的方向,就要顺序执行,因此底层实际上应该是4D SIMD unit + duuble pump + SFU
具体的细节不是很清楚,但是可以肯定它的元件管理非常的独立,内部reg资源也非常丰富,通过一些特别的设计,swizzle是完全free的,所以可以把它看成full scalar
换句话说,G80只有16个4D SIMD unit,但是因为优良的设计,它直接可以当成full scalar来用
補充兩個部分:swizzle = 移位,所以如果你們看CUDA的performance guideline的話,有一系列的圖提到了share memory access的bank conflict、以及boardcast機制。
而且對繪圖工作來說,share memory是完全由compiler管理的,shader並不會碰觸到這塊,這就是NVIDIA的人員有空間作optimize的部分。
以性質來說,這和CELL SPE那個高頻寬的256KB/s Local Storage是同類型的。(對SPE的ALU有50GB/s的頻寬)
引用:
原帖由 来不及思考 于 2008-3-12 13:24 发表
这样做的目的是什么?
-->
完全硬件化的MIMD在旗舰级GPU这种芯片上是不现实的,G80是量产芯片,不是用来做实验的,除了成本,产能和工艺承受度也是必须考虑的问题

GT200不大可能做到18亿,这对整个产品线的成本控制都是灾难性的。除非NV为GT200单独设立品牌并以K$为单位销售他。
-->
我能告诉你的是,GT200的晶体管小于或者等于1000M

G80不是说什么样的shader对效能都没有影响么?
-->
通吃指令不意味着通吃shader,要写一个让G80跑不动的shader实在太简单了。记住:在batch size做到per pixel之前,这种话都属于行销手段
G80能保证的,就是它对各种复杂shader的适应性远好过R6XX,仅此而已,离“任何shader对效能都没有影响”还差几个世纪
以前RacingPHT兄寫的ray tracer program,就可以看出G8x可以提供的register資源還沒辦法支撐光跡追蹤的需求,share memory也不夠大。
當然這並不是個很好的例子.... 不過shader並不是加三倍ALU就一定會有三倍的性能跑出來。

[ 本帖最后由 Eji 于 2008-3-12 15:24 编辑 ]

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 airforce14 于 2008-3-12 09:51 发表
这文章是最近难得的好文章了  不过如果是4bank x 40個shader的话 那就只有对AMD太失望了  难道新增加的SP都来做AA了?
RV770是 160 ALUs per shader array 。

“They’re the world’s leading designers and manufacturers of CPUs – how hard could it be to build a GPU? I mean, come on, how hard could it be? That crummy little company down the road builds them – we could build them in our sleep. Come on, how hard could it be?” ——NVIDIA David Kirk

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

好文章,虽然看得有点晕乎

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 Edison 于 2008-3-12 20:51 发表

RV770是 160 ALUs per shader array 。
玩完咯~

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 Edison 于 2008-3-12 20:51 发表

RV770是 160 ALUs per shader array 。
RV670是80么...

TOP

[广告] 买猫头鹰CPU散热器特价,还送i7 扣具一套! | Vista降临,PC够强吗?远景带您进入绚烂的美化世界

引用:
原帖由 haifengx88 于 2008-3-12 23:17 发表
RV670是80么...
RV670/R600都是80 ALUs、RV63x是40 ALUs、2400是20 ALUs。

“They’re the world’s leading designers and manufacturers of CPUs – how hard could it be to build a GPU? I mean, come on, how hard could it be? That crummy little company down the road builds them – we could build them in our sleep. Come on, how hard could it be?” ——NVIDIA David Kirk

TOP