引用:
原帖由 1empress 于 2008-3-11 19:51 发表
这个未必吧,如果1:4不够的话,很难相信1:5的比例就可以做得好,但从R520一路看下来,这种ALU增加起来很容易,面积也很小.
这样持续增加Pixel Shader的ALU比例,在我看来是以最少成本尽可能获得更大效能的方式,而不是为了追求效率而增加晶体管.
说起来MS的DX10真是害人哪....NV连主流方案都做到240mm了,想当年横扫一切的NV40也只有260mm而已。我是很不看好G9X系列的寿命的
唔,我既然這篇寫要說好話,我就很不希望作出"批評"....不過要寫的話還是可以寫一些。
今天我們可以從G94看到,NVIDIA的結構效率是高得多的,而且電晶體的數量也比較少。
die size會比較大,單純是因為NVIDIA在製程面上相對地保守;ATI衝製程衝比較快,有很大的原因和結構效率、設計能力有關,並不能說是好事。
如果RV670的良率很好,為什麼初期會供貨不順?那這個良率數字能夠相信嗎?同理可以套用到RV770上。
此外,我們回到ALU追加的"性能",這並不是沒有成本的:從R520開始,它的分支粒度隨著ALU的追加不斷地放大,因為所有的設計都集中在Ultra Threading Dispatch Processor上,所以相對的更改也很困難。
比方說,RV770到底是4bank x 40個shader,還是5bank x 32個shader?還是8bank x 20個shader、甚至是10bank x 16個shader?毫無疑問地,更改幅度必然會受到bank數影響而越來越大,而以盡量不更改設計來考量的話,4x40顯然是最可能的;而且不管是哪種更改,分支變化其實都是一樣的(成長到160個pixel or vertex per branch)....
然後NVIDIA目前的分支粒度,還是維持在32個pixel or 16個vertex。因為register file是成對的,所以G8x/G9x的規模其實光看電晶體數量就已經讓人覺得要比ATI R5x0目前的延伸好上太多,因為它的規模每一份的效率都是一定的,ATI的強化卻總是會把架構上的缺陷越挖越大,你要維持分支粒度、提升性能的同時又不提升規模,唯一的方式就是從memory hierarchy來下工夫,天下沒有白吃的午餐啊。
來個以前思考問過的問題:我們什麼時候可以做到dynamic branch per pixel....XD
----
NVIDIA從G7x到G8x的更新,包含電晶體效率、結構改進,能夠如此是因為memory hierarachy的變更、引入倍速shader(並不是為了無限制提升時脈,而是改善電晶體效率)、ALU的free swizzle(隱藏底層的SIMD ALU),這些複雜的設計都在NV3x到G7x的這段時間一口氣達成,所以ATI也必須在R5x0~R7x0的這段時間應該要做出徹底的架構革新,否則R7x0只是試圖延伸一個傳統想法的壽命而已,如果這個延伸不是替一個革命的架構爭取時間的話,那麼就只是苟延殘喘而已了。
[
本帖最后由 Eji 于 2008-3-11 21:41 编辑 ]