R600 pod drobnohľadom

Benchmark výsledky

Výkon shader core:

V nasledujúcom teste sa používajú 2 rôzne shadre, optimalizované pre 5 sub skalárne ALUs R600. Jeden slúži na zistenie max. výkonu shader core a druhý predstavuje „worst case“ scenár – čiže najhorší možný prípad. Shadre bežia v 2 aplikáciách. Jedna je určená pre DirectX 9 a druhá pre Direct3D 10, aby sme zistili, či existujú výkonnostné rozdiely pri použití rôznych API.

Jedna časť testu obsahuje navzájom závislý tok skalárnych inštrukcií a predstavuje tak najhorší možný prípad, keď z 5 sub skalárnych ALUs bude vyťažená len 1 a výkon shader core tak spadne na 1/5. Druhá časť obsahuje navzájom nazávislých tok inštrukcii a slúži na zistenie maximálneho výkonu. Všetky shadre v teste sú pixel shadre.
 


 

Výkon shader core teda vidieť v tabuľke a je takmer zhodný pri použití rôznych API. Navzájom závislý tok skalárnych inštrukcií ukázal s čím musí R600 bojovať a čo skalárna architektúra G80 zvláda oveľa lepšie. Hardware R600 nemal jednoducho možnosť rozvrhnúť voľné inštrukcie na zvyšné ALUs. Treba si ale uvedomiť, že typické shadre v hrách obsahujú množstvo rôznych inštrukcií, rôzne množstvo komponentov a ešte veľa iných rozdielov, ktoré musí R600 rozumne rozvrhnúť.

Takisto sme zaznamenali, že všetky špeciálne funkcie dokáže hardware vykonávať s výkonom 1 SFU za takt, okrem RCP, ktoré je vykonávané polovičnou rýchlosťou. Okrem toho bolo vidieť, že konverzia float INT potrebuje 1 takt na 1 skalárny kanál a hardware vykonáva DP4 za 1 takt, pokiaľ sú všetky 4 sub skalárne ALUs voľné (toto platí samozrejme aj pre DP3/DP2). Teoreticky by mal byť ADD výkon shader core R600 veľmi vysoký, pokiaľ ho dokáže hardware efektívne rozvrhnúť. Podľa všetkého je možné dosiahnuť maximálny výkon shader core hocijakou samostatnou inštrukciou, pokiaľ sa s ňou dokáže compiler vysporiadať. Toto je ale prvok, ktorý musel byť zvládnutý aj pri každej predchádzajúcej programovatelnej architektúre. Veríme preto, že kompetentné osoby v AMD/ATi dokážu optimalizovať čip pre väčšínu bežných situácii a časom aj pre tie menej bežné.

Výkon sampler hardwaru:

V ďalšom benchmarku sa dá nastaviť množstvo formátov, niektoré aj s premenlivými kanálmi a samozrejme output, čiže texturing operácie za sekundu. My sme sa pozreli na bilinear a point sampling výsledky INT 8, INT 16, FP 16,FP32 a DXT. Zamerali sme sa hlavne na povrchové formáty INT8 a FP16, nakoľko sa často využívajú v Direct3D 10.

Využívali sme sample zo 4x4 textúri, aby sme dosiahli maximálny výkon. V porovnaní s G80 má R600 prístupnú 1/4 INT8 bilerp a 1/2 FP 16 bilerp rate za takt. Radeon HD 2900XT má ale pracovnú frekvenciu sampler hardwaru až 742MHz.


 

R600 nestráca výkon pri INT8 a FP16 bilinearnom filtrovaní (vrátane 4 kanálových povrchov), pokiaľ nelimituje priepustnosť (všetkých 16 texelov bolo čítaných z texture cache). S ďalšími nekomprimovanými formátmi stráca R600 polovičku výkonu pri porovnaní 4 kanálového s 1 kanálovými povrchom. G80 má vyšší 4 kanálových FP32 filtrovací výkon vďaka výkonnejším sampler jednotkám. A

ko vidieť, nestráca Radeon HD 2900XT výkon ani so 4 kanálovým FP16 filtrovaním. Pri 4 kanálovom INT16 už ale stráca polovičku výkonu, nakoľko nemá sampler hardware dostatok presnosti k dispozícii (nie je dostatok mantis k dispozícii). Sampler hardware G80 však má dostatok presnoti k dispozícii, preto nestráca výkon. Pokiaľ sa ešte pozrieme na D32F filtrovanie (Depth32), nestráca R600 žiaden výkon na rozdiel od G80. Tento formát je vhodný pre takmer každé implementácie tieňov, okrem VSM.

Point sampling výsledku sú skoro totožné pre formáty, ktoré sme testovali:
 


 

Výkon ROPs:

Pozreli sme sa samozrejme aj na výkon ROPs. Testovali sme Color, Color + Z a Z-only fillrate v rozlíšení 1024x768. Vo výsledkoch vidieť dvojnásobnú Z-only fillrate pokiaľ je vypnutá Color. Takisto zobrazujú výsledky predpokladaný prepad fillrate so zapnutým 8xMSAA.


 
Komentáre (18)
subz3ro
Good work, cruxo. Opäť sa ukazuje, kto je u nás odborníkom v oblasti technológií grafických kariet :)
gabriel
Tak musim pochvalit -> clanok je po stranke obsahovej fantasticky na svoje si pridu urcite vsetci ako bezni tak aj velmi narocni citatelia. Co je vsak este lepsie je forma akou je clanok pisany -> tentokrat je to resp. to precita aj bezny clovek.
epto
fiha. riadne dlhy clanok. aj ked musim sa priznat, mne obycajnemu cloveku vela pojmov nic nehovorilo. nemozem povedat, ze som v oblasti PC "lama". PC pouzivam uz roky, zhruba 15-20 som ich uz aj poskladal. ale moj zaujem o vykonnu graficku kartu uz nie je na prvom mieste nakolko PC vyuzivam hlavne na pracu. tymto nechcem clanok kritizovat, len ze som niektore casti rovno preskocil a precital az vyhodnotenie.
Pavol Bobik
Ano, dobra recenzia, klobu dole :)
MichiGen
Naozaj skvely rozbor, myslim ze vsetko dolezite sa podarilo v tejto recenzii obsiahnut :)
koro
good job
Ryko
Tak musim zatlieskat cruxovi... uz davno som necital tak kvalitne spracovyn clanok v oblasti graf.kariet... absoutne vycerpavajuce informacie o zlozeni a fungovani chipu... imho by to mozno chcelo vysvetlit niektore odborne pojmy, aby bol clanok pristupnejsi pre sirsie spektrum ludi... lae zas takych clankov je na nete dost... este raz vdaka za squele citanie...
glide
proste perfektne
thimy
Nebolo by odveci opravit: 12 - Custom Filter AntiAlaising Premysliet zakladnu myslienku, spracovat podklady a vôbec napisat takyto clanok muselo zabrat kopu casu. fakt respect
A2C
Klaniam sa
noben
....asi nepoviem nič, lebo mám stále otvorené ústa a oči vyplešťené na monitore....
cpy
Musim uznat tak dobre a vystizne zrobenu recenziu som este necital (alebo si nepamatam zeby som taku cital) Tie videa na porovnanie su fakt vybornym doplnkom recenzie.
teho
vrela vdaka za super clanok na slovenskom nete nevidaneee.
Dwarden
clanek pekny, ale skoda tech starych ovladacu, bylo by fajn otestovat znovu s nadchazejicim ovladaci 7.8 (uz RC3 ukazuje znacne zlepseni ve vykonu 2xxx serie pri pouziti AA, take je tu novy AA mod k dispozici od ovladacu 7.7)
crux2005
Žiaľ, potom by sa dalo čakať v podstate donekonečna. Samozrejme na prepad výkon s AA a novými ovládačmi sa v blízkej budúcnosti pozrieme ;-) "take je tu novy AA mod k dispozici od ovladacu 7.7" Aký nový AA mod máte na mysli ?
mirke
Tak konecne som si nasiel cas to precitat a musim uznat, ze z mojho pohladu sa jedna o kvalitnu a rozsiahlu recenziu, ktora pokial viem nema na nete obdoby. Patri ti velka poklona odo mna. Inac velmi rad som pomohol, mozno aj nabuduce zase s novym highendo od ATI :D
Dwarden
nejde mi o nekonecne cekani spis o o to, ze test byl proveden na 7.5 coz znaci 3 mesice zpet tj. otazka zni proc ne 7.6 nebo 7.7 jinak ten novy AA je popsan v seznamu zmen u 7.7 " 12x and 24x Anti-Aliasing support for the ATI Radeon™ HD 2900 XT and ATI Radeon™ HD 2600 Series This release of Catalyst™ introduces support for 12X and 24X Anti-Aliasing for the ATI Radeon™ HD 2900 XT, and ATI Radeon™ HD 2600 Series. These new Anti-Aliasing settings are available through the new Anti-Aliasing Edge Detect Filter. Selecting 4X Anti-Aliasing plus selecting the Edge Detect filter deliver the equivalent of 12X Anti-Aliasing. Selecting 8X Anti-Aliasing plus selecting the Edge Detect filter deliver the equivalent of 24X Anti-Aliasing. " dalsi co jsem mel na mysli je moznost aktualizace vysledku testu napr. tedy az vyjdou 7.8 s komentarem typu "AMD.ATI evidentne zlepsuje/zhorsuje ovladace" :) a napriklad pridat test kvality prehravani videa :)
crux2005
Ovládač Catalyst 7.5 sme boli nútený použiť, nakoľko predstavoval v dobe testovania najaktuálnejšie WHQL ovládač. Catalysty 7.7 sme nemohli použiť nakoľko sa objavili až testne pred uverejnením článku. Okrem toho sme sa pozreli aj na výkon Catalystov 7.6, avšak v daných testoch sme nezaznamenali voči Catalystom 7.5 žiadne výkonnostné zmeny. Pokiaľ si pozorne čítal, tak si si určite všimol, že som túto zmenu spomenul v článku ;-) "Okrem toho je od Catalystu 7.7 dostupný štandardne aj edge detect mód. (Poznámka: my sme museli pre testovanie kvality EDCFAA použiť ešte beta ovládače a špeciálnu utilitku, ktorá nám túto možnosť sprístupnila)" Ďakujem za návrhy, budem určite rozmýšlať na ich možnom spracovaní. btw: každá pozitívna odoza ma samozrejme teší :)
Pridať nový komentár
TOPlist