135 1234
发新话题
打印

[体系架构] NVIDIA 下一代 GPU 体系架构猜测、讨论专题

本主题由 Edison 于 2008-7-20 18:44 推荐主题

NVIDIA 下一代 GPU 体系架构猜测、讨论专题

现在 NVIDIA 的 GT200 (别号 G100、Tesla 10 等)已经上市,各类测试报告也已经在各网站发表,对其体系架构现在大家基本上是明了了,不过到目前为止,尚未有任何关于 NVIDIA 下一代体系架构的消息出现。

为了方便大家讨论 GT200 的下一代架构 (GT300?),特别建立此讨论串,本主题的讨论风格将如同之前 Larrabee 讨论主题,所有讨论将以技术分析展开,需要提醒大家的是,我们这里讨论的是GT200的真正下一代架构,而不是基于GT200的工艺改进版。由于没有任何相关的资料,因此本主题中的大量讨论都是猜测性质,请勿依此为准。

为了大家的讨论更加集中,我在这里为大家提供几个相关的话题。

1、 GT200 体系架构中,你觉得最主要的特色是什么呢?最好能有一些专业的测试数据来辅证。
2、 GT200 体系架构中,最主要的问题是什么呢?下一代架构是否会延续这个架构的基本框架做优化呢?
3、 下一代架构中你认为会在在那些方面作出改进? DX11?动态分支性能?双精度性能?AA性能/算法?Tessellation?等等。
4、 你想到与之相关的技术分析、预测。



这个讨论串会作长期保留,请大家在讨论的时候互相尊重,大致的要求如下:
1、请不要把其他网站的新闻照抄过来,如果你需要大家关注其内容,只需要把链接提供,照搬的内容我们会予以删除。
2、与上面或者其他网友提供的信息重复或者重叠的内容请不要再引用。
3、请注意网络礼节。


关于 AMD 的下一代体系架构讨论,我们有另外专门的讨论串。

与 GT200 相关的参考连接:

GPUbench 1.2.1测试结果
GTX280: http://www.pcinlife.com/article_photo/gt200/gtx280_177.26/index.html

9800GTX 177.26: http://www.pcinlife.com/article_photo/gt200/9800gtx_177.26/index.html

Rightmark 2.0 Pro测试结果:
http://www.pcinlife.com/article/graphics/2008-07-13/1215942095d535_6.html



之前展开的 Larrabee 讨论串:http://we.pcinlife.com/viewthrea ... 26amp%3Btypeid%3D62
“They’re the world’s leading designers and manufacturers of CPUs – how hard could it be to build a GPU? I mean, come on, how hard could it be? That crummy little company down the road builds them – we could build them in our sleep. Come on, how hard could it be?” ——NVIDIA David Kirk
不厚道的占掉沙发,改天再来详细回复 {blush:]

附件: 您所在的用户组无法下载或查看附件
这是 gtx280+177.26 的 GPUbench 1.2.1 ps30 branch 成绩:



9800GTX+177.26 的 GPUbench 1.2.1 ps30 branch 成绩:


抽取其中 4x4 block 的来直接对比:



从结果看,GT200 在这个测试中的 sweet point 是在 15% 的 fragment 需要进行处理的情况下可以达到比 g92 理论 shader 差距更大的性能测距,而在这之后,似乎因为各个 TPC 内 texture fetch 能力相对较弱而会出现比理论值差距低大约 10%。

如果 GT200 的 3SM per 8TF 策略维持下去,最好想办法提升每个 TPC 的 TF 性能,例如单周期 fp32 fetch (unfilter-ed 的就可以了)。
附件: 您所在的用户组无法下载或查看附件
“They’re the world’s leading designers and manufacturers of CPUs – how hard could it be to build a GPU? I mean, come on, how hard could it be? That crummy little company down the road builds them – we could build them in our sleep. Come on, how hard could it be?” ——NVIDIA David Kirk
哦哦~~加多点Tf就是喇。
按惯例,NV在某代SM末期是不会与竞争对手做过多纠缠的,都是在旧产品基础上修修补补撑住。然后.......
怎么做成图表,我只有一组数据

TOP

现在讨论有点早,我想需要看DX11有哪些吃重的设定和针对DX10性能做出的改进。个人以为继续维持标量体系不够明智,在工艺落后对手的情况下,继续用低运算密度的代价换取灵活性的做法不太行得通。

TOP

应该不会再走怪物芯片的路线勒吧,该反思反思勒

TOP

我只关心NV的显卡什么时候全面支持光线追踪。。。

TOP

相对落后的R6XX构架,NV始终掌握着没晶体管性能的巨大优势,不过AMD会尝试新工艺来减小这个劣势,马上就冲击40NM了吧?  
GT200算是NV真正的第一代CUDA卡,的第二代US 了吧?看到10个TPC只占了ondie不到60%的面积,这里面的取舍不太好说啊。

TOP

从G80=》G200来看,这个架构靠纯扩充运算资源与带来的性能提升不成比例

TOP

不是说DX11有OOO的么?

TOP

引用:
原帖由 stcshy 于 2008-7-21 20:32 发表

GT200对RV770在性能/晶体管比上有什么优势了?
到底是谁架构落后?规模越大相对越强与规模越大相对越弱的架构比谁更先进呢?
对比RV770和G92,GDDR3版本对比,RV770都占不到便宜。GT200拿来比什么?另一个成面的东西,不单纯是一块GPU了。

TOP

感觉GT200还是想暴力撑过这一代,真正的进步在GT300。
基本上,以双倍摩尔速度来运行,只能这样。

2代革命一次,中间加一次暴力。

TOP

在HW支持DX11的基础上Shader规模继续扩容。
AA性能会有极大改进/增强。
也许会类似AMD弄个内部显存带宽数倍于外部显存带宽。
增加片上缓存容量。应用eDRAM?

TOP

引用:
原帖由 天下18 于 2008-7-21 21:27 发表


对比RV770和G92,GDDR3版本对比,RV770都占不到便宜。GT200拿来比什么?另一个成面的东西,不单纯是一块GPU了。
你能告诉我什么东西是GTX200能干而G92不能干的,而导致GTX200晶体管数量剧增,性能却增加少的可怜.[rolleyes>

[ 本帖最后由 shieldfeng 于 2008-7-21 22:18 编辑 ]

TOP

引用:
原帖由 shieldfeng 于 2008-7-21 22:16 发表
你能告诉我什么东西是GTX200能干而G92不能干的,而导致GTX200晶体管数量剧增,性能却增加少的可怜.
双精度运算、atomic function、Read/Write Combin、warp vote等都是g9x实现不了的。

如果以Crysis 1680x1050 4aa 16af为例,gt200的性能大约是9800gtx的1.6倍。
“They’re the world’s leading designers and manufacturers of CPUs – how hard could it be to build a GPU? I mean, come on, how hard could it be? That crummy little company down the road builds them – we could build them in our sleep. Come on, how hard could it be?” ——NVIDIA David Kirk

TOP

引用:
原帖由 Edison 于 2008/7/21 22:26 发表


双精度运算、atomic function、Read/Write Combin、warp vote等都是g9x实现不了的。

如果以Crysis 1680x1050 4aa 16af为例,gt200的性能大约是9800gtx的1.6倍。
MS这些东西对现在的游戏性能提升不大,不过对CUDA倒是很有帮助……

TOP

引用:
原帖由 harleylg 于 2008-7-21 22:31 发表
MS这些东西对现在的游戏性能提升不大,不过对CUDA倒是很有帮助……
CUDA也可以用于游戏加速,例如物理、AI。
“They’re the world’s leading designers and manufacturers of CPUs – how hard could it be to build a GPU? I mean, come on, how hard could it be? That crummy little company down the road builds them – we could build them in our sleep. Come on, how hard could it be?” ——NVIDIA David Kirk

TOP

那是8800 U?的多少倍?

TOP

引用:
原帖由 harleylg 于 2008-7-21 22:31 发表


MS这些东西对现在的游戏性能提升不大,不过对CUDA倒是很有帮助……
对,所以说GT200不知是单纯的GPU。曾大的晶体管很大一部分的功用是一些人看不到的。

TOP

提示: 作者被禁止或删除 内容自动屏蔽

TOP

提示: 作者被禁止或删除 内容自动屏蔽

TOP

现在中端市场NV好一点,低端市场买世界都是499元的256M的3850。。。

TOP

提示: 作者被禁止或删除 内容自动屏蔽

TOP

引用:
原帖由 k10 于 2008-7-21 18:26 发表


然后彻底抛弃老拥护 拥抱新时代
是么,恰恰相反,我倒是认为在该发力时软弱,濒临落伍才显示自己“后劲”的产品才是最不负责任的。

TOP

引用:
原帖由 k10 于 2008-7-22 00:27 发表
GT200 和G92的功耗 成本都不在一个档次 强是理所当然
你可以参考GT200 vs G80的成绩。
“They’re the world’s leading designers and manufacturers of CPUs – how hard could it be to build a GPU? I mean, come on, how hard could it be? That crummy little company down the road builds them – we could build them in our sleep. Come on, how hard could it be?” ——NVIDIA David Kirk

TOP

引用:
原帖由 stcshy 于 2008-7-21 20:34 发表
G80--GT200架构已经到头了
无法再做大
架构更换势在必行
沉溺于G80的辉煌中自我陶醉丝毫无助于NV扭转劣势
可不可以說一下到頭的理由?哪個部分是最重大的瓶頸?
引用:
原帖由 天下18 于 2008-7-21 22:42 发表
对,所以说GT200不知是单纯的GPU。曾大的晶体管很大一部分的功用是一些人看不到的。
我不覺得耶,GT200真正的改變是"讓那些晶體管可以做很多別的事情",比方說thread倍增、就是對繪圖和非常規處理都有用的東西;
但是為了非常規處理的推廣,又沒有修改16KB share memory;DP只做了一點點,未來可能會增加但是其實實際意義並不是真的那麼大。
這回GT200對非常規處理的幫助真的最大的,是warp vote、atomic function、Read/Write Combine這些東西,
而這些東西又是透過ROP修改得來的,所以其實沒有增加多少電晶體。比方說Atomic function,會占用ROP的L2 Texture Cache,使得GT200目前無法同時進行GPGPU與繪圖工作。
這可以看出GT200其實做了非常大的折衷,如果完全實現(比方說Atomic Function & R/W combine與texture access完全獨立)的話,那就可能要比現在大上很多的電晶體。

我比較同意上面Edison說的,他們現在為了保證SM吞吐,有必要增加一些Texture Fetch能力。
但是我其實是看不出來,GT200(G100這個系統)這回在架構上是不是已經"老舊不堪",因為本身都還是有加強的空間。
GT200這回表現差的原因有很大是因為shader clock太低,另外一個是MRT的時候ROP有點速度上的問題,但是MSAA本身其實是差不多。

[ 本帖最后由 Eji 于 2008-7-22 01:37 编辑 ]

TOP