AMD/ATi Radeon HD 3870 (CrossFire)

Po sklamaní s názvom Radeon HD 2900 XT, ktorý nedokázal splniť to čo od neho ľudia očakávali, si chce AMD/ATi vylepšiť postavenie na trhu a reputáciu s novou HD 3000 sériou. R600 teda dostal v prezlečení novú šancu a názov - RV670. Na tomto čipe sú založené všetky grafické karty HD 3000 série od vyššieho mainstreamu po high-end. V dnešnej recenzii sa pozrieme detailne na čip RV670, grafickú kartu Radeon HD 3870 s GDDR4 pamäťou a jej CrossFire zapojenie. Aký je ich výkon v porovnaní s konkurenciou? Dokáže čip RV670 naozaj odstrániť nedostatky R600? Má AMD/ATi konečne konkurenta pre GeForce 8800 GTX ? alebo je nutné až CrossFire zapojenie? Otázky nad otázky, pokiaľ sa chcete dozvedieť viac, čítajte ďalej recenziu ...

Úvod

Našu recenziu začneme pohľadom do minulosti. Koncom roka 2006 vydala Kalifornská spoločnosť nVidia svoju GeForce 8800 sériu, ktorá dominovala dlho v high-ende ešte aj začiatkom roka 2007. To malo dva dôvody. Prvý bol bez pochýb veľmi vydarený čip G80 a jeho architektúra. Ponúkal veľmi dobrý pomer medzi výkonom, kvalitou obrazu (AA, AF, a pod.) a poskytovanými features. Druhý dôvod bola konkurencia. AMD/ATi posúvala stále viac a viac dozadu dátum vydania HD 2000 série, pre problémy s ovládačmi, hardvérom a spotrebou. Po ich odstránení boli vydané HD 2400, 2600 a 2900 grafické karty. V low-ende a mainstreame sa darilo kartám pomerne dobre konkurovať náprotivkom od nVidie. Nie ale v high-ende.


Radeon HD 2900 XT nedokázala splniť viaceré očakávania, ktoré do nej vkladali ľudia. Výkon na úrovni slabšieho G80 so siedmimi clustermi - GeForce 8800 GTS, vysoká spotreba, hlučný chladič, vysoké prepady s AA. Bolo toho dosť. Nakoniec si spravila nVidia konkurenciu pre vlastné high-end karty v podobe GeForce 8800 GT, ktorá za polovičnú cenu ponúkala 75% výkonu high-endu. Pôvodne mala vyzerať „GeForce 8800 GT“ úplne inak. Mala mať menej clusterov – výpočtových jednotiek a aj názov mal byť pôvodne iný. nVidia ale zistila, že AMD/ATi sa pravdepodobne podarí vydať Radeon HD 3000 sériu skôr ako očakávali. Tak sa aj stalo, HD 3000 séria bola predstavená 19. novembra 2007. Spolu s ňou čip RV670.


RV670 so štyrmi clustermi sa dnes nachádza vo všetkých grafických kartách od vyššieho mainstreamu po high-end. Menovite myslím na Radeon HD 3850, 3870 a 3870X2. Výkonnostné rozdiely medzi nimi sú dosiahnuté jedine pomocou rozdielnej pracovnej frekvencii jadra, pamäte a počtu jadier. Zatiaľ čo HD 3850, 3870 obsahujú na svojom PCB len jeden čip a líšia sa len pracovnými frekvenciami, má HD 3870X2 dva čipy RV670 na PCB s ešte vyššou pracovnou frekvenciou jadra – 800 MHz. Asus Radeon HD 3870X2 sa budeme bližšie venovať v ďalšej recenzii.


Radeon HD 3850



Radeon HD 3870



Radeon HD 3870 X2

Väčšina Radeon HD 3870 má osadené GDDR4 pamäte (existujú modely aj s GDDR 3 pamäťami), ktoré dosahujú oproti GDDR3 pamätiam vyššie frekvencie a majú menšiu spotrebu. Avšak pri priamom porovnaní GDDR 3 vs. GDDR 4 s rovnakou pracovnou frekvenciou VRAM a jadra sú GDDR 3 pamäte mierne výkonnejšie. Je to logické, nakoľko majú GDDR 3 nižšie latencie. Niečo podobné sa odohralo aj pri prechode z DDR na DDR2 RAM, kde až s narastajúcou frekvenciou majú DDR2 pamäte navrh.


Na ďalšej stránke sa pozrieme naprv na čip RV670, ktorý je „menovateľom“ viacerých grafických kariet a našej testovanej Radeon HD 3870 od výrobcu Sapphire.



Čip RV670


(očistené jadro RV670 bez chladiča)


RV670 vychádza z čipu R600 a predstavuje jeho evolúciu. Z tohoto dôvodu sa pozriem len na novinky a rozdiely voči R600. Odporúčam preto prečítať aj článok "R600 pod drobnohľadom”, kde je architektúra čipu R600 kompletne rozobratá.

Problémy R600 boli hlavne: vysoká spotreba – z toho vyplývajúca vysoká teplota jadra, hlučný chladič a v neposlednom rade aj výkon, ktorý neohromil ľudí, tak ako to očakávali. Tieto problémy si v AMD/ATi uvedomili a preto vznikol RV670. „V“ v názve značí „Value“ - teda cenovo výhodný čip. Výkonom možno zaradiť RV670 do „performance“ triedy ako svojho času známu RV570. Na výkon sa pozrieme v časti „Benchmark výsledky“. Cenou možno čip zaradiť do mainstream kategórie.

Kľúčovým faktom pre vznik RV670 bol výrobný proces. AMD/ATi vsadilo opäť na veľmi mladý half node 55nm proces “55GT” v TSMC, ktorý predstavuje optický shrink 65nm procesu. Prechod bol taký úspešný, že aj pracovníci ATi boli prekvapení. Ďalším pozitívnym vedľajším účinkom bolo, že sa predstavenie RV670 mohlo posunúť o ~2 mesiace dopredu z 1.Q 2008 na 4.Q 2007. Vďaka menšiemu výrobnému procesu, ktorý nemá okrem toho vysokú static power leakage ako 80HS sa výrazne zlepšili tepelné vlastnosti čipu – menšia spotreba a TDP. 400mm^2 obor R600 sa razom zmenšil o viac ako polovičku. Veľkosť jadra RV670 je len 193mm^2 (~ 13,8x13,8mm).


Celkovo bol návrh jadra R600 uprataný. Redundantné tranzistory boli vyhodené a došlo k viacerým optimalizáciám. Prístup k pamäti cache sa urýchlil, shader resolve v ALUs bol vylepšený a zvýšný bol aj geometry shader výkon. Presné čísla, ako je zvykom, AMD/ATi nemenuje. Špekulácie existujú aj o tom, že frekvencia ALUs je vyššia ako zbytok čipu – išlo by teda o “shader doménu” ako ju poznáme z G80. Či je to pravda nevieme. Vylúčiť to ale nemôžeme, nakoľko vlastní AMD/ATi už dlhšie podobný patent.

RV670 obsahuje rovnaký počet sampler, aritmetických a rasterizačných jednotiek ako R600, nakoľko predstavuje jeho shrink s určitými vylepšeniami. Vyjadrené v číslách – 4 sampler jednotky, 320 (64x5D ALUs) stream processing units a 4 quady rasterizačných jednotiek. Vďaka menšiemu výrobnému procesu môžu pracovať na HD 3870 s 11% vyššou frekvenciou – 775MHz. Tesselačná jednotka samozrejme ostala v desinge. Počet tranzistorov napriek tomu klesol. Zo 700 miliónov na 666 miliónov :-) (tu si môže každý doplňiť svoj vlastný vtip).


Technické parametre čipu "RV670"
Výrobný proces:
55nm @ TSMC
Počet tranzistorov: ~ 666 miliónov
Plocha a rozmery jadra: 193 mm2; 13,8 x 13,9 mm
Obal jadra: "Flipchip"
Základná konfigurácia: 16 textúr/ 16 pixelov/ 32x Z
Zbernica: 256-bit
8 x 32-bit
Podpora Direct3D: 10.1
Pripojenie k systému: PCI-Express 2.0 x16
Výstupy: 2x Dual-link DVI, HDMI, HDCP

Do vienka dostal RV670, ako prvý desktop consumer čip, podporu double precision IEEE 754. Presnejšie povedané 4/5 (256 SPUs) všetkých ALUs – tie “chudšie” môžu počítať s Double precision (DP) = 64bit presnosť spracovania všetkých dát so ¼ rýchlosťou. Preto klesne MADD aritmetický výkon na 1/5 (99,2 GFLOPs). Pokiaľ počítajú 4/5 ALUs s DP môže 1/5 = tie “výkonnejšie” počítať so single precision (SP). V tomto “mixed” móde je aritmetický výkon okolo 200 GFLOPs. Veľkú výhodu môže mať DP pre vedcov a iné skupinky ľudí, ktorý potrebujú 64bit presnosť pre svoje (GPGPU) aplikácie, nakoľko nie je 32bit presnosť dostačujúca.

Zmenšená voči R600 bola jedine šírka zbernice. V prípade R600 bol kladený dôraz na FP-16 výkon a tomu bol podriadený celý návrh. Napríklad: sampler jednotky, šírka zbernice, ALUs. Počaš života nepomohla 512bit zbernica R600. V budúcnosti sa to pravdepodobne zanedbateľne zmení. To už bude ale nezaujímavé, nakoľko aj výkon bude nedostačujúci. RV670 má preto “len” 256bit (512bit interný, dvojsmerný RingBus) zbernicu, ktorá je však mierne vylepšená a ďalej zoptimalizovaná. Hlavne arbiter jednotky boli mierne prepracované. V spojení s podporovanou GDDR 4 pamäťou má jadro vo väčšine prípadov dostatočnú priepustnosť k dispozícii aj preto, že vie lepšie narábať s priepustnosťou. Len v extrémnych situáciách má R600 s viac ako 100 GB/s priepustnosťou navrch.

Miesta na jadre ešte stále ostalo, tak prečo nepridať UVD (Unified Video Decoder), ktorý R600 neobsahuje ? UVD zaberajúci na 65nm čipoch RV630/610 len 4,5mm^2, urýchluje tri hlavné HD video formáty H.264, VC-1 a MPEG2. Vďaka tomu odbremeňuje CPU od výpočtov. V prípade RV670 dostal nový názov “UVD+” a podporuje rozlíšenia do 2560x1600.


Do čipu bola pridaná aj podpora najnovšieho Direct3D 10.1, ktoré bolo len nedávno vydané spolu so Service Packom 1 pre Windows Vista. Direct3D 10.1 predstavuje mierne vylepšené Direct3D 10, zjednodušuje programovanie vývojárom a podporuje nové rendering features. Pôvodne mali byť tieto features integrované už do Direct3D 10. Kvôli tlaku iných strán, hlavne nVidie sa MS rozhodol pre takýto posun.

Hlavné vylepšenia Direct3D 10.1 sú:

  • TextureCube Arrays which are dynamically indexable in shader code
  • The ability to select the MSAA sample pattern for a resource from a palette of patterns, and retrieve the corresponding sample positions
  • The ability to render to block-compressed textures
  • More flexibility with respect to copying of resources
  • Support for blending on all unorm and snorm formats

Zmeny to nie sú veľké, avšak umožňujú jednoduchšie vytvoriť content. Napr. Cube Map Arrays sa dajú využiť veľmi dobre na Global Illumination. Konečne by mal byť podporovaný MSAA v Deffered Rendering enginoch ako UT3 a pod. bez hackov zo strán nV/ATi.

Direct3D 10.1 prináša automaticky so sebou nový Shader Model. Tentoraz vo verzii 4.1. Zaujímavý je určite aj fakt, že D3D 10.1 ako prvý prikazuje podporu MSAA s minimálne 4 samplami pre všetky 32 aj 64bit formáty. Okrem toho majú 2x, 4x, 8x a 16xMSAA predpísané pozície samplov. Vyžadovaná je aj podpora FP-32 filteringu v TMUs a Int16 blendingu v ROPs.

Ak sa pozrieme na konkurenčné čipy od nVidie – G8x a G9x, zistíme, že im úplné podpora D3D 10.1 chýba. G92 nikdy nemal byť D3D 10.1 čip a teda ani ďalšie jeho deriváty nemajú túto podporu. Prečo sa tak nVidia rozhodla ? Nevieme to s úplnou 100% istotou, dá sa však predpokladať, že nV nepripisovala D3D 10.1 taký význam a tieto tranzistory radšej zainvestovala do niečoho iného. Konkrétne do “custom tranzistorov”, ktoré sú ručne navrhnované, upravované, aby Shader Core mohol pracovať na svojich vysokých frekvenciách. Pre lepší obraz o situácii ešte treba vedieť, že G92 sa nVidii nevydaril, tak ako chceli, obsahuje pomerne veľa tranzistorov, nedosahuje očakávané pracovné frekvencie. Okrem toho si ním nV strelila do vlastného kolena, keď predstavila GeForce 8800GT.

Ešte zreteľnejšie je vidieť ako nVidii nezáleží na podpore D3D 10.1 a snaží sa ho rôznymi cestami bojkotovať v rozhovore s CEO Cryteku - Cevat Yerli:

"We pride ourselves on being the first to adopt any important new technology that can improve our games so you would expect us to get with DX10.1 right away but we've looked at it and there's just nothing in it important enough to make it needed. So we have no plans to use it at all, not even in the future.”

(Crytek je v nVidia TWIMTBP programe)

a v nVidia dokumente o D3D 10.1

DirectX 10.1 is a minor extension of DirectX 10 that makes a few optional features in DirectX 10 mandatory”

Je teda logické, že AMD/ATi sa snaží robiť v tomto smere osvetu. Na svojich stránkach zverejnila dokument o Direct3D 10.1. Prednedávnom bolo zverejnené aj D3D 10.1 techdemo pre HD 3000 grafické karty. Techdemo má názov “Ping Pong” a v hlavnej úhlohe sú okrem loptičiek - Global Illumination, Dynamic Ambient Occlusion a MSAA s Deferred Shadingom.


Majitelia Radeon HD 3000 karty s operačným systémom Windows Vista a SP1 si môžu stiahnuť a nainštalovať timedemo zo stránky AMD/ATi. Pre nás ostatných bolo vytvorené video, ktoré si môžete buď stiahnuť, alebo pozrieť na YouTube.com.

(klikni pre zväčšenie)

Ako to vyzerá s D3D 10.1 hrami ? V najbližšom roku neočakávam väčšie množstvo hier, ktoré by využívali tento najnovší API (Application programming interface), nakoľko nVidia ešte nemá čip s plnou podporu. Zmení sa to pravdepodobne až s príchodom nového čipu GT200. nVidia bude nútená podporovať D3D 10.1, nakoľko Direct3D 11 bude oficiálne predstavené až s ďalším operačným systémom Windows Seven (7). MS hovorí oficiálne až o roku 2010. Väčšie množstvo D3D 10.1 hier, keď vôbec, očakávam preto v roku 2009.

S novinkami v čipe RV670 ešte neskončíme. Ako vidieť aj v tabuľke, čip RV670 podporuje najnovšiu verziu zbernice PCI-Express 2.0 zavedenú s Intel X38 čipsetom.Táto prináša zdvojnásobenie priepustnosti oproti PCI-Express 1.1 na 16GB/s pre oba kanály. Niečo podobné sa uskutočnilo aj v minulosti s AGP 4x – 8x. Na rozdiel od nVidie, hovorí AMD/ATi vo svojich dokumentoch až o 10% navýšení výkonu, vďaka vyššej priepustnosti novej zbernice. Na rozdiel od chýrov, poskytuje PCI-Express 2.0 rovnako ako staršia verzia maximálne 75W pre grafickú kartu. RV670 aj PCI-Express 2.0 sú spätne kompatibilné so staršími verziami, teda ani majitelia dosiek s PCI-Express 1.0, 1.1 slotom sa nemusia obávať o nekompatibilitu. Tú spôsobujú skôr (VIA) čipsety.


Na ohlasy nVidie o Quad-SLi a Tripple-SLi musela samozrejme zareagovať aj AMD/ATi a poskytnúť podobné riešenie. Výsledkom je podpora “CrossFire X” v čipoch RV670. Jedná sa v podstate o CrossFire, ktoré podporuje zapojenie viacerých – dvoch, troch a štyroch čipov.


(Štyri Radeon HD 3850 zapojené v CrossFireX)

Pre dual-CrossFire zapojenie dvoch čipov stačí jeden CF mostík. CF mostíky sa veľmi podobajú na nVidia SLI mostíky, sú len širšie a s nápisom “CrossFire”. Pre zapojenie troch čipov (kariet) je nutné využiť oba mostíky, aby boli všetky tri karty navzájom prepojené. Prvý čip s druhým, druhý s tretím. V prípade Quad CF pozostávajúceho zo štyroch kariet, ktoré je v 99% možné len zo štyroch Radeon HD 3850, je princíp zapojenia podobný ako v prípade troch kariet (čipov). Technicky by sa dali zapojiť aj štyri HD 3870, problém tu však nastáva pre dvojslotový chladič. Nie všetky základné dosky majú 8 slotov, z ktorých sú štyri PCI-Express. (výnimka existuje od spoločnosti Foxconn) Pre zapojenie dvojčipových kariet Radeon HD 3870X2 do CF stačí jeden CF mostík.



(klikni pre zväčšenie)


V ATi si zobrali spotrebu čipu RV670 k srdcu, preto obsahuje aj feature s názvom “PowerPlay”. PowerPlay je názov pre ďalšiu generáciu power management technológie, teda ekvivalent k Intel Speed Step na GPUs, ktorá bola doposiaľ integrovaná len do mobilných Radeon čipov pre notebooky. Dovoľuje dynamické zníženie frekvencie jadra, zníženie pracovného napätia a deaktiváciu výpočtových jednotiek, pokiaľ nie je potrebný maximálny výkon. O tom rozhoduje grafický ovládač, lebo vie zistiť vyťaženie jadra. Výsledkom je veľké zníženie spotreby v 2D režíme. Medzistupňom je nastavenie pre tzv. "light gaming" v ktorom pracuje len časť výpočtových jednotiek. Okrem toho garantuje AMD/ATi, že PowerPlay bude pracovať vždy synchronizovane s Vista power management profilmi.



Toto všetko teda získate v čipe RV670. Aby si ľudia nespájali nový RV670 so starým R600, nakoľko nebol najlepším čipom v histórii, bola zavedená nova séria Radeon HD 3000. RV670 ako najvýkonnejší čip patrí do Radeon HD 3800 sérii. Ako ste si mohli všimnúť, označenia XT, Pro vypadli a boli nahradené číslami. xx70 je ekvivalent k XT a xx50 k Pro. Vidieť tu vplyv od AMD, ktorá takéto označenia používa už dlhšie pre svoje procesory.



Sapphire grafická karta

Spoločnosť Sapphire predstavuje "dvorného" výrobcu ATi grafických kariet a tak nesmie ani v jej portfóliu chýbať, medzičasom veľmi obľúbená, Radeon HD 3870. Do redakcie sa nám dostali dve Sapphire Radeon HD 3870 GDDR 4, ktoré sa držia referečného designu - chladič, PCB a referenčných taktov - jadro: 775MHz, GDDR4 pamäť 1125MHz. Reálne pracovné frekvencie grafických kariet sú mierne vyššie. GPU-Z screenshot:



(GPU-Z detekuje HD 3870 a jej technické parametre už vo verzii 0.1.7 správne)

Úloha Radeon HD 3870 je jasná. Konkurovať GeForce 8800 GT. Výkonom, podporou Direct3D 10.1, malou spotrebou a tichým chodom. Momentálna cena kariet v Slovenskej Republike sa pohybuje okolo 5000 SK s DPH. Za túto cenu dostanete grafickú kartu, ktorá patrí do performance triedy a ponúka veľmi dobrý pomer cena/výkon. V portfóliu AMD/ATi je HD 3870 najvýkonnejšia single čip grafická karta. Výkonnejšia je už len high-end Radeon HD 3870 X2, ktorá využíva interné CrossFire zapojenie dvoch RV670 čipov na jednom PCB. Technické parametre Radeon HD 3870 sú zhrnuté v nasledovnej tabuľke:

Technické parametre ATi Radeon HD 3870:
Názov grafickej karty:
Radeon HD 3870
Veľkosť pamäte VRAM:
512 MiB
Čip: RV670
Pracovná frekvencia jadra: 775 MHz
Pracovaná frekvencia pamäte: 1125 MHz
Teoretické peak hodnoty @ 775/1125 MHz
Pixel fillrate:
12 400 Mpixels/s
Texel fillrate:
12 400 Mtexels/s
Z sample rate:
24 800 Msamples/s
AA sample rate: 49 600 Msamples/s
Aritmetický výkon: 496 GFlops/s
Geometry rate: 775 Mtrianlges/s
Priepustnosť pamäte: 72 GB/s

Vyšší výkon a teoretické hodnoty oproti R600 boli dosiahnuté zvýšením pracovnej frekvencie jadra a pomocou viacerých drobných vylepšení v jadre RV670, ktorému sme sa bližšie venovali na predchádzajúcej strane. Teraz sa z toho dôvodu pozrieme už len grafickú kartu Sapphire Radeon HD 3870.





PCB a dvojslotový chladič, ktorý pripomína ten na Radeon X1950 XTX, sú pre ATi grafické karty v typickej červenej farbe. 7,2W ventilátor (0.6A, 12V) od NTK Technologies s celkovým priemerom 75mm je axiálny a fúka studený vzduch na medený pasív s viacerými jemnými lamelami, ktorý sa nachádza na jadre RV670. Použitá bola klasická sivá pasta s nie najlepšími tepelnými vlastnosťami. Časť teplého vzduchu sa dostáva von cez 8 štrbín a zvyšok cez záslepku. V spodnej strane plastového krytu pod ventilátorom sú taktiež viaceré štrbiny, ofukované sú preto aj napäťové regulátory – MOSFETy s namontovaným medeným pasívnom. Medený pasív v tvare L je pripevnený aj na GDDR4 pamätiach.








Na rozdiel od HD 2900XT nemá HD 3870 sedem fázové napájanie, ale len dvoj fázové. Je to pochopiteľné, nakoľko nemá karta takú vysokú spotrebu - hlavne kvôli jadru a PCB, ktoré nie je také komplexné. Na každej fáze sa nachádzajú štyri Infineon BSC042N03LS G MOSFETy stavané pre 93A prúd, vysoké teploty ~100°C a podporujúce SuperSO8 package. Súčasťou našich testov bolo aj pretaktovanie jadra a pamätí, vďaka čomu sme súčasne otestovali možnosti OC a kvalitu napájania. Zo štandardnej frekvencie 775/1125 MHz sme boli schopný pomocou integrovanej funkcie CCC s názvom Overdrive pretaktovať jadro na frekvenciu 850MHz a pamäť na 1250MHz. Tieto hodnoty pracovných frekvencií boli s ventilátorom nastaveným na 100% otáčky stabilné aj pri dlhšom zaťažení.



(55nm jadro grafickej karty Radeon HD 3870 - RV670)

Podobne ako na HD 2600 XT s GDDR 4 je hlavný radič uPI Semiconductor uP6201AQ, uP6101BSA je zodpovedný za pamäte. Na konci PCB sa nachádza prídavné napájanie, nakoľko má Radeon HD 3870 TDP rovné 105W. Je realizované pomocou 6-pin PCI-Express 1.0 konektora, ktorý vie dodať ďalších 75W. Chladič karty je v 2D režíme, keď sa pracovná frekvencia jadra zníži na 300 MHz, tichý. AMD/ATi sama uvádza hlučnosť chladiča ~34dBA. Bližšie detaily v časti hlučnosť, teploty, spotreba.




Na PCB karty sa nachádza dokopy 512 MiB (8x64) 0,8ns GDDR 4 pamäte od Samsung s označením „K4U52324QE-BC08“, ktoré majú 1,8V pracovné napätie a 1200 MHz (reálne) rating. Pomerne veľká rezerva na pretaktovanie teda apoň v prípade pamätí ostáva, lebo na grafickej karte pracujú štandardne s frekvenciou 1125 MHz (reálne), čo v spojení s 256bit externou zbernicou dáva priepustnosť 72 GB/s. Priepustnosť je jediný parameter, ktorý bol voči HD 2900XT znížený. Na celkovom výkone sa to ale neodráža, nakoľko vie RV670 úspornejšie zaobchádzať s dostupnou priepustnosťou, zlepšená bola mierne latencia RingBusu a aj kompresia. Konkurencia v podobe GeForce 8800 GT má v porovnaní len 57,6 GB/s priepustnosť. Celková dĺžka karty je 23cm, rovnako ako GeForce 8800GT a o skoro 1cm menej ako Radeon HD 2900XT. Vďaka tomu by nemali nastať žiadne problémy s nedostatkom miesta v skrinke. GeForce 8800GTX s 27cm dlhým PCB pôsobí o dosť väčším a mohutnejším dojmom:




Na zadnej strane karty je vyvedený jeden HDTV a dva dual-link DVI výstupy podporujúce HDCP. Nie je preto problém vysielať chránený obsah v rozlíšení 2560x1600. Balenie Sapphire HD 3870 GDDR4 obsahuje aj DVI-to-HDMI prevodník, vďaka ktorému je možné prenášať audio a video signál cez DVI výstup. Prevodník spĺňa HDMI-1.2 štandard a umožňuje preto prenos Dolby-Digital a DTS zvukovej stopy z DVD, Blu-ray alebo HD-DVD. Nové formáty Dolby TrueHD, DTS-HD a Dolby Digital Plus nie sú podporované.


Balenie Sapphire HD 3870 grafickej karty je celkovo veľmi bohaté. Okrem klasicky pribalených adaptérov: DVI-to-HDMI, DVI-to-D-Sub, S-Video-to-Composite, S-Video-to-YUV sa v ňom nachádza aj množstvo užitočného softwaru ako Advanced Edition 3DMark2006, Cyberlink DVD Suite, PowerDVD s príslušnými aktivačnými kľučmi. Nesmie samozrejme chýbať ani inštalačné CD od Sapphire s ovládačmi Catalyst, kupón na BlackBox od Valve, jeden CrossFire mostík, inštalačný manuál a nálepka so Sapphire logom. Pokiaľ sa rozhodujete medzi jednotlivými štandardne taktovanými HD 3870 a záleží vám na príslušenstve je Sapphire určite správna voľba.





CrossFireX




CrossFireX
(CFX) je marketingový názov pre Multi-GPU riešenie v piatej generácii od AMD/ATi zavedené s HD 3000 sériou. Jediná zmena voči CrossFire je podpora viacej ako dvoch grafických kariet, ktoré je možné zapojiť. Momentálne maximum sú štyri. Predstavuje konkurenta pre SLI od nVidie. Primárna výhoda CFX (SLI) spočíva v tom, že sa dá pomerne jednoducho (pre koncového zákazníka a výrobcu grafických čipov) zvýšiť výkon grafickej karty, pridaním ďalšej do tandemu. Grafické karty zapojené do CFX budú spoločne renderovať výsledný obraz. Túto možnosť sa ale väčšinou oplatí využiť len vtedy, pokiaľ vlastníte high-end grafickú kartu, ktorá nemá dostatok výkonu pre veľmi vysoké rozlíšenia, ako 1600x1200 a viac. V prípade lowend a mainstream kariet sa CFX, SLI väčšinou neoplatí, nakoľko má toto zapojenie aj nevýhody, častokrát je jedna high-end grafická karta lacnejšia a výkonnejšia. Ďalšia výhoda, na ktorú sa konkrétne pozrieme na ďalšej strane, je možnosť pretransformovať vyšší výkon v kvalitnejší anti-aliasing.


klikni pre zväčšenie

Pre CF(X) ale aj SLI musíte spĺňať najprv určité predpoklady. Musíte vlastniť základnú dosku, ktorej čipset podporuje jednu alebo druhú technológiu a má dostatok voľných PCI-Express slotov. My sme dostali na testy základnú dosku Gigabyte GA-X38-DQ6, ktorá vďaka svojmu Intel X38 čipsetu poskytuje dva PCI-Express 2.0 x16 sloty a podporuje len CF(X). SLI podporu majú zatiaľ výhradne nFore čipsety od nVidie a nepredpokladáme, že by sa to v budúcnosti zmenilo. Toto obmedzenie nemá žiaden technický dôvod. AMD/ATi a hlavne nVidia jednoducho využívajú svoje licencie, aby existoval dôvod zakúpiť základnú dosku s práve ich čipovou sústavou. (Ešte samostatná ATi predala spoločnosti Intel licenciu, aby ich základné dosky mohli podporovať CF)



klikni pre zväčšenie

Dve alebo viaceré grafické karty zapojené do takéhoto tandemu ale musia medzi sebou komunikovať, aby si vedeli vymieňať dáta. V prípade CrossFire sa to v minulosti riešilo cez dosť obtiažny dongle kábel, pre ktorý bolo nutné zakúpenie tzv. „master“ karty. Dnešné Radeon HD 3870 už takéto obmedzenia nemajú, dve zhodné HD 3870 spojíte jednoducho, „interne“, pomocou CrossFire mostíka. Ďalšie možné kombinácie grafických kariet zapojitelných do CF(X) a základných dosiek vidieť v tabuľkách:


Menej výkonné grafické karty ani nie ne nutné spojiť „interne“ pomocou CF mostíka, môžu komunikovať cez PCI-Express (2.0) sloty, v tzv. Software CrossFire režíme. Ďanou bude ~ 10% strata výkonu.


Catalyst 8.3 priniesol so sebou aj väčšiu flexibilitu pri výbere možných kombinácii


CrossFireX konektor na grafickej karte Sapphire Radeon HD 3870

Karty v CrossFireX budú, ako som spomínal, spoločne renderovať výsledný obraz. Existuje viacero multi-GPU render techník – AFR, SFR, Super Tiling, Super AA, ktoré rozložia obraz na určité časti, aby mohla byť následne záťaž rozdelená medzi jednotlivé grafické karty. Dnes sa využíva vo väčšine prípadov, ak je to možné, Alternate Frame Rendering (AFR). Princíp renderovania spočíva v tom, že jedna grafická karta počíta vždy „párne“ frame a druhé „nepárne“ frames. Výhodou je, že sa zvýšia (podľa počtu grafických kariet) fillraty, geometrický výkon, šírka zbernice.


klikni pre celý slajd (zdroj: AMD, PDF o Catalyst 8.3)

Od teórie sa teraz vrátime k našich dvom Radeon HD 3870, ktoré sme zapojili do CrossFire. Po tom ako si Windows Vista Ultimate 32bit stiahol update a zdetekoval ich, sme mohli nainštalovať v tej dobe najnovšie Catalyst 8.3 ovládače. Nasledoval reštart a „zábava“ mohla začať. Budeme sa venovať hlavne nevýhodám a nedostatkom momentálneho CrossFire, nakoľko sú hlavné výhody – vyšší výkon a kvalitnejšie AA rozobraté na ďalších stranách.





Do Overdrive pribudol ukazovateľ vyťaženia GPU. Jednotlivé grafické karty zapojené do CF je možné pretaktovať samostatne.

Pri pohľade do ovládačov Catalyst sa nám odokryje hneď niekoľko nevýhod. Okrem kategórie „CrossFire“ v ktorej je možnosť zapnúť/vypnúť CrossFire zapojenie a dať detekovať GPU nám pribudnú už len ďalšie AA varianty v kategórii 3D, Anti-aliasing. Nič viac. Veľmi nám chýbala možnosť vytvoriť tzv. CF profil pre konkrétnu hru, kde by si mohol koncový užívateľ nadefinovať parametre, aby fungovalo CrossFire k spokojnosti a prinášalo dobrý výkonnostný nárast aj napriek tomu, že s oficiálnym ovládačom to tak nie je. Takisto chýba možnosť vytvoriť profil aj v prípade single-čip grafických kariet, kde by bolo možné nastaviť pre viaceré hry rozličné kvality obrazu – od AA, cez V-sync, AF, kvalitu filtrovania po optimalizácie. nVidia ponúka tieto možnosti v ovládačoch „GeForce“. Okrem toho existuje veľmi dobrá utilitka s názvom nHancer. Odporúčam ju užívateľom SLI a GeForce grafických kariet. Spĺňa rovnakú úlohu – tvorba profilov pre hry, SLI. Bez týchto možností je užívateľ CrossFire závislí na mesačných updatoch ovládačov Catalyst, do ktorých pridávajú tvorcovia CF profili. „Z vonku“ teda nie je možné momentálne do nich zasahovať. Toto je veľká nevýhoda CF o ktorej sa málo hovorí, píše a preto o nej koncový užívatelia len málo vedia. Aby sa mohlo stať CrossFire zapojenie naozaj konkurencie schopné, musí byť tento závažný nedostatok odstránený. Nečudujem sa preto faktu, že komunita SLI narastá rýchlejšie ako tá okolo CrossFire(X).


Kategória CrossFire s chudobnými možnosťami

S ďalším problémom všetkých multi-GPU riešení sa stretnete pri hraní hier. Napriek relatívne vysokým, teda „plynulým“ FPS, je cítiť „trhanie obrazu“. Mohli by sme teraz dlho rozpisovať čo pociťuje človek ako plynulé a čo nie. Faktom je ale, že 30 FPS (obrázkov za sekundu) sú vnímané väčšinou populácie ako plynulé. Keď si to prepočítame na čas, vyjde nám logicky, že každých 33ms (1s = 1000 ms; 1000ms/30FPS) sa zobrazí na obrazovke jeden frame. V tomto prípade sa zobrazujú jednotlivé obrázky v pravidelných intervaloch, čo vníma ľudské oko ako plynulé. Problém však nastáva s multi-GPU zapojením, ktoré nedokáže udržať zhruba harmonický priebeh medzi jednotlivými frame-ami. Dochádza k tzv. micro stutteringu, napriek „plynulým FPS“. Jednoduchý príklad na objasnenie: za prvým frame-om nasleduje po 10ms druhý. To by znamenalo 100 FPS. Tretí frame sa dostane na obrazovku ale až za 35ms, nasledovaný hneď po 10ms štvrtým. Výsledok je fatálny a jasne viditeľný. Vnímané FPS multi-GPU riešenia môžu byť v extrémnom prípade hlboko pod single GPU riešením, napriek oveľa vyšším FPS. K micro stutteringu dochádza hlavne pri nižších FPS, 30 FPS sú kritickým bodom. Lebo platí, čím sú časové rozdiely medzi jednotlivými frame-ami väčšie, tým je dôležitejšie rovnomerné rozloženie framov. Pri niektorých hrách sa tento fenomén ukazuje aj pri 40, 50 FPS. Všeobecne platné konštatovanie, pri akých FPS dochádza k micro stutteringu, teda nemožno sformulovať. Záleží to od hry a ovládača.



Aj Radeon HD 3870X2 trpí týmto problémom

Dôvod tohoto fenoménu spočíva v render technike AFR, ktorú využívajú multi-GPU riešenia. nVidia aj AMD/ATi vedia o probléme, riešenie pre momentálne karty ale pravdepodobne nikdy nebude. AMD/ATi sa vyjadruje k problému nasledovne:

„Pri CrossFire môže byť frame 3 odoslaný karte A až vtedy, keď je táto hotová s framom 1. Frame 4 môže byť odoslaný karte B až vtedy, keď je táto hotová s framom 2. Zatriedenie týchto frames (teda command buffera) je aspoň v prípade Windows Vista uskutočňované kernelom. To znamená, že tento fenomén nie je možné grafickým ovládačom ovplyvniť.

Keď sa pozriete na jeden príklad, môžete rýchlo prísť na nápad, zdržať prijatie ďalšieho frame-u, aby sa frames rovnomerne rozdelili za čas. Toto by sa dalo pravdepodobne riešiť aj cez ovládač, tak, že by sa GPU označilo na určitý čas ako vyťažené. Problém ale je, že na začiatku jedného frame-u sa nevie, ako dlho ho bude treba renderovať. Z rovnakého dôvodu posiela kernel ďalší frame hneď, keď je predchádzajúci hotový, aby mohol byť v pravý čas vypočítavaný.
Myslíme si ale, že užívateľom CrossFire ide hlavne o vysoké FPS, kde sa efekt micro stuttering tak výrazne neprejavuje“.
(Zdroj: PCGH) Len aby sa dámy a páni z AMD/ATi nemýlili ...

Pritom nezáleží na tom, či sa jedná o grafickú kartu s dvoma GPUs ako GeForce 7950GX2, 9800GX2 a Radeon HD 3870X2, alebo o CrossFire, SLI či Multichrome zapojenie ľubovoľných kariet. Dôsledok je rovnaký. S narastajúcim počtom GPUs – Quad,Tripple SLI/CF sa nežiadúci efekt len prehlbuje, nakoľko je väčšia latencia a dlhšie sa musí čakať na frames. Nasledujúci problém nemali napr. 3dfx Voodoo 5 grafické karty v roku 2000 a ani Quad „SLI“ zapojenie GPUs na Voodoo 5 6000, nakoľko využívali inú render techniku. Každé GPU počítalo striedavo určitý riadok vo finálnom obraze namiesto celých. Preto nevznikal tento problém, nerovnomerne zobrazených frames. Túto techniku žiaľ nie je možné použiť s modernými efektami.


Quad-SLI s dvoma GeForce 9800GX2, micro stuttering deluxe, zdroj: nVidia


Medzi veľmi dobré príklady, kde sa micro stuttering výrazne prejavuje, patria Crysis, UT3, NFS: Pro Street, 3DMark06 a Vantage (New Calico). Naše tvrdenia dokazujú frametimes zaznamenané aplikáciou FRAPS. V utvorenom textovom dokumente sú zreteľné nerovnomerné rozdieli medzi jednotlivými frames. Video záznam sme žiaľ neboli schopný vyhotoviť, nakoľko nemáme k dispozícii (HD)kameru. Vizualizácia frametimes v hre UT3 pri nižších FPS, dosiahnuté 24xEDCFAA a vysokým rozlíšením vyzerá nasledovne.



veľké časové rozdiely medzi jednotlivými frame-ami spôsobujúce micro stuttering, napriek "plynulým" FPS

Vysoké FPS za každú cenu, také je zmýšľanie koncových zákazníkov a výrobcov grafických čipov. Vďaka SLI a CF ich dostanete, avšak podstatné nie je množstvo ale ich „kvalita“. 30 FPS na grafickej karte s jedným čipom sú plynulé, nakoľko je latencia 33ms. Pri CF,SLI zapojení s dvoma kartami a 30 FPS je teoretická latencia už 66,7ms. QuadSLI/CF má pri rovnakých FPS latenciu 133,3 FPS. [Na výpočet sa môže použiť vzorec (1000ms/FPS * počet GPUs)]. Teória sa ale líši od reality, nakoľko nie je rozloženie framov CF/SLI zapojenia pravidelné. Pri grafických kartách s jedným čipom je preto kvalita FPS stále najvyššia. S narastajúcim počtom jadier len klesá. Zmýšľanie ľudí sa preto musí zmeniť. Vysoké FPS nie sú všetko, lebo hra s 18 FPS môže pôsobiť naozaj plynulejším dojmom ako rovnaká hra pri 32 FPS a CrossFire systéme.



Pred porovnaním technických parametrov jednotlivých kariet je nutné si uvedomiť fakt, že pri CrossFire a iných momentálnych multi-GPU riešeniach sa nezvyšuje využiteľná kapacita VRAM. Nemožno jednoducho sčítať VRAM jednotlivých grafických kariet, lebo každá karta zapojená v CF musí mať vo svojej VRAM všetky textúry, potrebné údaje atď. Marketingové označenia ako Radeon HD 3870X2 1GB sú nepresné a zavádzajúce. Reálne má karta využiteľných len 512MiB VRAM.




Super Anti-Aliasing

CrossFire(X) a SLI zapojenie grafických kariet ponúka okrem možnosti zvýšiť výkon v hrách aj možnosť zlepšiť kvalitu obrazu pomocou (teoreticky) kvalitnejšieho anti-aliasingu. Rovnako ako v prípade CF zapojenia dvoch Radeon X1x00 ponúka aj zapojenie Radeon HD 2000 a HD 3000 grafických kariet od ovládača Catalyst 8.3 viaceré „SuperAA“ varianty, ktoré žiaľ neobsahujú supersampling podiel. Ich názvy sú 16xAA a 24xAA, 32xAA, posledné dva menovanú využívajú Custom Filter anti-aliasing na ďalšie zlepšenie kvality vyhladenia hrán. Pôvodne mal byť integrovaný aj 42xEdge Detect filter, ktorý to ale nakoniec nestihol do ovládačov Catalyst 8.3. Spoločným menovateľom všetkých AA variant je 16xAA, na ktorý sa najprv pozrieme.

SuperAA varianty:
16xAA 16xMSAA
24xAA 16xMSAA + Narrow tent
32xAA 16xMSAA + Wide-tent
42xAA (zatiaľ nedostupný)
16xMSAA + Edge Detect



Názov tohto anti-aliasing módu hovorí za všetko. Jedná sa naozaj o 16xRGMSAA. Pýtate sa, ako je to možné keď čip RV670, rovnako ako R600, podporujú maximálne 8x(SG)MSAA ? Princíp je vysvetlený veľmi rýchlo. Každá karta počíta výsledný obraz s 8xMSAA. Potom otočí jedna karta všetky pozície samplov a pri spojení tak vzniká 16x rotated grid multisampling antialiasing. Rovnako vznikajú aj ďalšie varianty, pridá sa však narrow-tent alebo wide-tent filter. Toľko teória.
Chceli sme si samozrejme zistiť jednotlivé pozície samplov 16xRGMSAA pomocou aplikácie D3D FSAA Viewer. Výsledný obraz, ktorý sme ale dostali sa zhodoval so 8xSGMSAA. EER jednotlivých anti-aliasingov sme preto neboli schopný zistiť. Rovnako úspešné bolo porovnanie 8xSGMSAA so 16xRGMSAA v aplikácii D3D FSAA Tester. Jednotlivé výsledky sa od seba vôbec nelíšili.

8xMSAA, 16xMSAA:



8xMSAA, 16xMSAA:



(klikni pre zväčšenie)

Na ďalšie porovnanie kvality anti-aliasingu sme sa rozhodli pre hru Half Life 2: Lost Coast. Jednotlivé rozdiely medzi 8xSGMSAA a 16xRGMSAA sú na prvý pohľad v rozlíšení 1280x1024 malé, nakoľko poskytuje aj 8xAA veľmi kvalitné vyhladenie hrán. Skoro rovnaký obraz dostaneme aj s 24xAA a 32xAA. Rozdiely vidieť až pri bližšom pohľade a priblížení scén s množstvom polygonov, kde sa väčšie množstvo vzoriek môže aspoň teoreticky prejaviť. Na ľavej, pravej a prednej stene sa dá spozorovať aj mierne rozostrenie textúr spôsobené CFAA.

8xMSAA, 16xMSAA:



24xAA, 32xAA:



(klikni pre zväčšenie)

Nasledujúce (500x) nazoomované screenshoty ukazujú jasne rozdiely medzi 8xAA a 16xAA. Väčšinu uhlov a hrán vyhladzuje 16xAA mód lepšie. Uhly a hrany, ktoré nie sú lepšie vyhladené, ani nie je možné pomocou MSAA lepšie vyhladiť, nakoľko narážame na limity boxfiltrov a MSAA. Platí zákon klesajúcich výnosov alebo po anglicky: law of diminishing returns – v prenesenom význame to pre nás znamená - s narastajúcim počtom multisampling samplov nie je možné dosiahnuť rovnako veľké zvýšenie kvality vyhladenia hrán. Preto sa už dlhšie skúma v tejto oblasti a výsledkom sú varianty ako napríklad: custom filter anti-aliasing (CFAA), ktorý je non-boxfilter, využívajúci blur. Ani tie ale neposkytujú úplne dokonalé anti-aliasing, vylepšovať by sa dalo vždy dačo. Vidieť to na našich obrázkoch, kde prinášajú oproti 16xAA (Box) len na určitých miestach nárast kvality vyhladenia, čo vyplýva z princípu ako fungujú. Určité objekty sú dokonca horšie vyhladené. Viditeľné je aj rozmazanie "drevenej" textúry.

8xMSAA, 16xMSAA:



24xAA, 32xAA:



(klikni pre zväčšenie)

Kvalitné vyhladenie hrán je zbytočné, pokiaľ nemajú grafické karty dostatok výkonu na jeho reálne využitie v hrách. Pozreli sme preto len na prepad výkonu 16xMSAA voči 8xMSAA vo viacerých novších a starších hrách. 24xAA a 32xAA sme zámerne vynechali, nakoľko spotrebujú ešte o 15-20% výkonu viac aj keby teoreticky nemali a spôsobujú mierne rozmazanie textúr.
Už z princípu ako pracuje 16xAA anti-aliasing mód, by malo byť jasné, že prepady výkonu budú veľké. Čisto teoreticky by mal byť výkon CF zapojenia dvoch HD 3870 so 16xAA rovnaký ako výkon jednej HD 3870 so zapnutým 8xAA, pokiaľ by sa jednalo o graficky limitovanú scénu, pamäť VRAM by nelimitovala a CrossFire zapojenie by prinieslo 100% nárast výkonu. Reálne tomu tak pochopiteľne nie je.


V tabuľke sú uvedené priemerné (Avg.) hodnoty z jednotlivých meraní. Výkon dvoch Radeon HD 3870 v CF s 8xAA je zhruba dvojnásobný oproti 16xAA. HL2: LostCoast a FEAR: Perseus Mandate predstavujú staršie hry, ktorá sú často limitované procesorom. Naša prognóza sa v testoch potvrdila a výkon jednej HD 3870 s 8xAA bol podobný ako výkon CF zapojenia s 16xAA.



napriek hotovým slajdom to 42xAA nestihol do Catalystu 8.3

CrossFire 16xAA, 24xAA a 32xAA sú momentálne možnosti v ovládačoch, ktorá asi nebudú často použité v praxi, nakoľko máju viaceré negatíva. Z teoretického hľadiska predstavuje 16xAA momentálne najkvalitnejší multisampling anti-aliasing, žiaľ reálne viditeľné rozdiely oproti 8xMSAA sú v hrách minimálne. Určite preto, že platí zákon klesajúcich výnosov a 16xAA má rotated (otočený) grid, 8xAA (boxfilter) ručne optimalizovaný sparse (roztrúsený) grid. 24xAA a 32xAA, ktoré sú non-box filtere, vyhladia určité uhly a časti o niečo lepšie, ale stále by sa dalo na týchto filtroch niečo vylepšovať. Okrem toho rozmazávajú do určitej miery textúry ako Custom Filter anti-aliasing. Záleží samozrejme od pozorovateľa, ako je na to citlivý. Nevýhodou všetkých variant je aj veľký výkonnostný prepad. Možno sformulovať pravidlo, že hru, ktorú nie je možné plynule hrať na jednej HD 3870 512MiB GDDR4 s 8xMSAA, nebude možné hrať plynule ani v CrossFire so zapnutým 16xAA. Okruh využitia sa teda zúžil na staršie (2-3 ročné) hry. V tomto prípade bude chýbať užívateľovi supersampling podiel, lebo 16xAA vyhladí iba hrany polygonov, iné neduhy a textúry zostanú bez zmeny. Ďalšie varianty tu už skôr neprichádzajú do úvahy pre vyššie zmieňované dôvody. Zaujímavý by bol ešte 42xAA mod, ktorý sa zatiaľ nedá zapnúť. Výkonnostný prepad by bol samozrejme najvyšší.



Technické údaje grafických kariet

Na nasledujúcej stránke máme porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické peak hodnoty:

Radeon HD 3850 512 GDDR3

Radeon HD 3870 512 GDDR4

HD 3870 512 GDDR4 @ CrossFire

GeForce 8800 GT

GeForce 8800 GTX

Jadro:
RV670 RV670 2x RV670 G92 G80
Výrobný proces:
55nm 55nm 55nm 65nm 90nm
Veľkosť jadra:
~192 mm2 ~192 mm2 2x ~192 mm2 ~325 mm2 ~484 mm2
Počet tranzistorov:
~666 miliónov ~666 miliónov ~666 miliónov ~754 miliónov ~681 miliónov
Frekvencia jadra:
670 MHz
775 MHz 2x 775 MHz 600 MHz
575 MHz
Frekvencia pamäte:
830 MHz 1125 MHz
2x 1125 MHz 900 MHz
900 MHz
Kapacita, typ pamäte:
512MiB, GDDR3 512MiB, GDDR4
2x 512MiB, GDDR4 512MiB, GDDR3
768MiB, GDDR3
Frekvencia shadercore:
670 MHz
775 MHz
2x 775 MHz 1512 MHz
1350 MHz
Počet TFUs:
16 16 2x 16
56 64
Počet TAUs:
32 32 2x 32 56 32
Počet ALUs:
4x Vec16 (320 SPs)
4x Vec16 (320 SPs)
2x 4x Vec16 (640 SPs)
7x Vec16 (112 SPs)
8x Vec16 (128 SPs)
Počet ROPs
16 16 2x 16
16 24
Podpora D3D: 10.1 10.1 10.1 10 10
Pixel fillrate:
12 400 Mpixels/s 10 720 Mpixels/s 2x 12 400 Mpixels/s 9600 Mpixels/s 13 800 Mpixels/s
Bilinear texelfillrate:
12 400 Mtexels/s 10 720 Mtexels/s 2x 12 400 Mpixels/s 33 600 Mtexels/s
18 400 Mtexels/s
Bilinear FP-16
texel fillrate:

12 400 Mtexels/s 10 720 Mtexels/s 2x 12 400 Mtexels/s 16 800 Mtexels/s 18 400 Mtexels/s
Z-sample rate:
24 800 Msamples/s 21 440 Msamples/s 2x 24 800 Msamples/s 38 400 Msamples/s 55 200 Msamples/s
AA-sample rate: 49 600 Msamples/s 42 880 Msamples/s 2x 49 600 Msamples/s 76 800 Msamples/s 110 400 Msamples/s
Aritmetický výkon: 496 GFlop/s 428,8 GFlop/s 2x 496 GFlop/s 508 GFlop/s 518,4 GFlop/s
Geometry rate: 775 Mtriangles/s 670 Mtriangles/s 2x 775 Mtriangles/s 600 Mtriangles/s 575 Mtriangles/s
Šírka zbernice:
256 bit 256 bit 2x 256 bit
256 bit 384 bit
Priepustnosť pamäte: 53,1 GB/s 72 GB/s 2x 72 GB/s 57,6 GB/s 86,4 GB/s

Poznámky:

Každá TMU = textúrovacia jednotka sa skladá z TFUs = filtrovacích a TAUs = adresovacích subjednotiek. Rozhodli sme sa zaradiť do tabuľky aj Bilinear FP-16 texelfillrate okrem "čistej" bilinear texelfillrate, lebo má vyššiu výpovednú hodnotu. V hrách asi už len málokto nevyužíva trilineárny či anizotropný filter - dvojnásobne to platí pri high-end kartách a architektúre silnej na texelfillrate ako je G8x/G9x. Pure fillrate má GeForce 8800 GT vyššiu oproti GTX, kvôli väčšiemu počtu adresovacích jednotiek (TAUs) v sampler array. 8800GTX má na rozdiel od toho viac filtrovacích jednotiek (TFUs), ktoré dokáže využiť napr. až pri trilieárnom, anizotropnom alebo bilinearnom FP-16 filtrovaní. Jej texelfillrate so zapnutím bilinear 2x anizotropného filtra neklesne. 8800GT, áno. Možno z toho dôvodu hovoriť o trilineárnych TMUs v prípade G8x a o bilineárnych TMUs v prípade G9x.
Aritmetický výkon sme na GeForce 8800GT a GTX počítali s 3 FLOPs (MAD + MUL) za takt ako udáva nVidia, aj napriek tomu, že MUL sub-ALU, ktorá dodáva tretiu FLOPs je často využívaná na korektúru perspektív, interpoláciu a SFUs. Od grafického ovládača ForceWare 158.19 je ju možné využiť na general shading, ako MAD jednotky, ale len z časti. Dôvod prečo sme takto počítali je v konkurencii. Reálny aritmetický výkon RV670 čipe je taktiež nižší, lebo Vec5 ALUs dokážu za takt spracovať len vtedy 5 komponentov, pokiaľ nie sú na sebe závislé a 5. sub-ALU = tá väčšia, sa stará takisto o SFUs. G8x/G9x má oproti R(V)6xx výhodu v lepšom vyťažení shadercore, lebo jej ALUs sa tvária ako "skalárne" vďaka riadiacej logike (v skutočnosti sú to Vec ALUs) a superskalárna architektúra R(V)6xx využívajúca VLIW je závislá na compileri, assembleri.

Pre viac detailov ohľade jednotlivých architektúr odporúčam prečítať technické články zaoberajúce sa čipom G80, R600:





Testovacia zostava

Každú grafickú kartu sme testovali na nasledujúcej zostave s čisto formatovaným pevným diskom a nanovo nainštalovaným operačným systémom.

Testovacia zostava:

  • Procesor: Intel Core 2 Extreme 9650 (4 jadrový procesor, 45nm, 2x6MiB = 12MiB L2 cache, 1333MHz) pretaktovaný na 3.4 GHz, 1360 MHz FSB, 10x násobič
  • Vodou chladený procesor @ Alphacool Cool Answer PRO
  • Základná doska: Gigabyte GA-X38-DQ6 (čipset Intel X38, podpora 1600MHz FSB, 45nm procesorov)
  • RAM: 2GiB DDR 2 Corsair, 800MHz @ 816 MHz (4-4-4-12-2T)
  • HDD: 750GB Western Digital Caviar 7500AAKS
  • Zdroj: X-Spice 650W
  • DVD mechanika: Plextor PX-716A
  • Operačný systém: Windows Vista Ultimate 32bit, Build: 6000 so všetkými dostupnými záplatami
  • Viac informácií ...


Za poskytnutie produktov by sme sa chceli poďakovať spoločnostiam: Bez ich podpori by nebolo možné uskutočniť túto recenziu.

Použité ovládače:

  • Catalyst 8.3 WHQL
  • ForceWare 174.16 Beta s upraveným INF.súborom
Testované grafické karty:
  • Sapphire Radeon HD 3870, 512MiB VRAM (777/1126MHz)
  • CrossFire 2x Sapphire Radeon HD 3870 512MiB VRAM (777/1126MHz)
  • MSi GeForce 8800GTX 768MiB VRAM (G80) (575/1350/900MHz)


(Všetky údaje, okrem teoretickej hodnoty Texture Fillrate na GeForce 8800 GTX, sú správne.
Veľmi by ma zaujímalo ako prišli na 38,7 GTexel/s. Správny údaj je 18,4 GTexel/s)


Použité benchmarky:

Syntetické:
  • 3DMark 2006, verzia 1.1.0 s hotfixom
  • Fillrate Tester
  • FableMark 1.0
  • ShaderMark 2.1
Hry:
  • Call of Duty 4: Modern Warfare, DX 9, verzia 1.5
  • Call of Juarez D3D 10, Benchmark Demo
  • Clive Barker's Jericho, DX9, verzia 1.0
  • Colin McRae: DIRT, DX 9, verzia 1.2
  • Company of Heroes Opposing Fronts, DX9, verzia 2.101
  • Crysis, D3D 10, verzia 1.1
  • Enemy Territory: Quake Wars, DX 9, verzia 1.4
  • FEAR Perseus Mandate, DX9, verzia 1.0
  • Lost Planet: Extreme Condition, D3D10, Benchmark Demo
  • Need For Speed: Pro Street, DX 9, verzia 1.0
  • PT Boats: Knights of the Sea, D3D 10, Benchmark Demo
  • Unreal Tournament 3, DX 9, verzia 1.1
  • World in Conflict, D3D 10, verzia 1.006
Presné nastavenia nájdete pri výsledkoch konkrétnej hry. Vo všeobecnosti sme testovali s maximálnymi detailami v rozlíšeniach: 1024x768, 1280x1024. Jedenkrát so 4xMSAA, 16xAF a druhýkrát bez. Vyššie rozlíšenie s AA, AF je ideálnejšie, nakoľko nelimituje tak procesor. Rozlíšenie 1024x768 sme zaradili do testov preto, aby sme mohli porovnať výkon aj so slabšími grafickými kartami. TSSAA (nV) a QAAA (ATi) sme nechali vypnuté, kvôli rozdielom a problémom s kompatibilitou.

Použité programy:
Nastavenia v grafických ovládačoch:

Po dôkladnom premyslení a analýzach kvality obrazu oboch čipov sme sa rozhodli pre nasledujúce nastavenia kvality obrazu v ovládačoch:

nVidia ForceWare:
  • Texture filtering - Quality: Quality
  • Force Mimmaps - Trilinear
  • Texture filtering - Negative LOD bias: Clamp
  • V-sync: Force Off
  • Antialiasing (AA): Application-controlled, 4xMSAA
  • Antialiasing - Gamma correction: On
  • Anisotropic filtering (AF): Application-controlled, 16x
  • Antialiasing - Transparency: Off




ATi Catalyst:
  • Catalyst AI: Standard
  • Mipmap Detail Level: High Quality
  • V-sync: Always Off
  • Antialiasing (AA): Use application settings, 4xMSAA (box filter)
  • Anisotropic filtering (AF): Use application settings, 16x
  • Adaptive Antialiasing: Off





Nastavenia kvality sú teda viac-menej rovnaké, aj keď je nemožné dosiahnuť úplne identickú kvalitu. Bližšie sme sa venovali kvalite obrazu v článku: R600 pod drobnohľadom (časti: Porovnanie AA, AF, AI), kde je kvalita obrazu čipu R600 porovnaná s G80. Nakoľko vychádza RV670 z R600 sa ani kvalita obrazu nezmenila voči R600. Ako vidieť z nastavení, G8x grafické karty poskytujú väčšie možnosti nastavenia kvality a majú s maximálnym nastavením kvalitnejší, takmer dokonalý anisotropný filter.




Syntetické benchmarky

Fillrate tester

Fillrate tester je malý ale veľmi užitočný program na meranie fillrate-ov jednotlivých grafických kariet. Na rozdiel od fillrate testera v 3DMarku2006, ktorý je v prípade Single-Texturing veľmi limitovaný priepustnosťou pamäte, dokáže tento program merať rôzne druhy fillratov. My sme nechali prebehnúť všetky merania. Použité shadre v teste sú pomerne krátke a zaťažujú aj dosť priepustnosť, preto sme použili max. možné rozlíšenie, aby sme ťažisko preniesli na fillrate. Testovali sme v rozlíšení 1280x1024, 32-Bit, 24-Bit Z a 8-Bit Stencil buffer s obnovovacou frekvenciou 60Hz.




Vysoká Z-pixelfillrate GeForce 8800GTX je logická a vyplýva z výkonných ROPs. Pokiaľ nie je zapnutý AA a ide čisto o aritmetický výkon, pixelshadery, sa dokáže CrossFire so svojimi ~ 1TFlops/s presadiť, napriek veľmi malým optimalizáciám ovládačov. Radeon HD 3870 a CrossFire zapojenie majú ale pomerne veľký prepad fillratov so zapnutým anti-aliasingom voči GeForce 8800GTX.

Fablemark


Fablemark bol podobne ako jeho nástupca templemark vyvinutý spoločnosťou PowerVR. Predstavuje pomerne staré techdemo s veľkým podieľom overdraw, ktoré malo vtedy ukázať silné stránky TBDR architektúry čipu „Kyro“. Tou je stencil výkon stencil buffera, ktorý limituje v tomto teste. Vďaka tomu poukazuje na ROPs výkon grafických kariet.

Bez anti-aliasingu je CrossFire vpredu, vďaka svojim teoretickým 32 ROPs. So zapnutím 4xMSAA sa obraz znovu obracia a rozdiel medzi GeForce 8800GTX a 2x HD 3870 v CrossFire je zanedbateľný. Prírastok výkonu CF so zapnutým vyhladzovaním hrán a AF je ale prekvapivo veľký.

Shadermark


Shadermark 2.1 je syntetický benchmark určený na meraniu pixelshader výkonu grafických kariet od tommti-systems. Vďaka častým updatom ide benchmark stále s dobou a podporuje aj Shader Model 3.0. Hodí sa preto k porovnaniu moderných architektúr. Benchmark testuje výkon v 25 rôznych shaderoch, ktoré sú napísané pomocou HLSL (High Level Shader Language).



Všetky testované grafické karty vykazujú pomerne vyrovnaný výkon.  Myslím si, že by CrossFire s optimalizovanými ovládačmi malo ešte vyšší výkon.

3DMark2006

3DMark2006

Pravdepodobne jeden z najznámejších benchmarkov od spoločnosti „Futuremark“ vo verzii z roku 2006 má označenie 3DMark2006. Zo šiestich testovaných scén merajú štyri výkon grafickej karty. Dva sú určené pre test výkonu procesora. Pre dosiahnutie očarujúcich scén siahli vývojári po moderných 3D technológiách. Využíva sa Shader Model 3.0, textúry s vysokým rozlíšením, komplexné výpočty tieňov, dynamické osvetlenie, high dynamic range rendering (HDR-R). Futuremark vsadila na FP-16 HDR, ktoré poskytuje momentálne najlepšiu možnú kvalitu, ale je aj najnáročnejšie na výpočet. Testovali sme v default nastavení - rozlíšenie 1280x1024, bez AA/AF.

vyťaženie CPU v 1. a 2. GPU teste:


vyťaženie CPU v 2. a 3. GPU teste:





Čiastkové 3Dmark 2006 výsledky: Radeon HD 3870 Radeon HD 3870 @ CF GeForce 8800 GTX
Fill Rate - Single-Texturing 6510,461 MTexels/s
12828,796 MTexels/s
6909,842 MTexels/s
Fill Rate - Multi -Texturing 12311,284 MTexels/s
23990,219 Mtexels/s
18019,008 MTexels/s
Pixel Shader 358,592 fps
676,565 fps
497,400 fps
Vertex shader - Simple 350,397 MVertices/s
713,982 MVertices/s
228,357 MVertices/s
Vertex shader - Complex 183,559 MVertices/s
357,829 MVertices/s
102,979 MVertices/s
Shader Particles (SM 3.0) 92,319 fps
165,125 fps
133,404 fps
Perlin Noise (SM 3.0) 173,211 fps
339,090 fps
159,290 fps

Napriek tomu, že má 3DMark2006 testovať hlavne výkon grafických kariet je dosť limitovaný výkonom procesora aj v GPU testoch. Výnimku predstavuje jedine test HDR 1 - "Canyon Flight". Okrem toho si potrpí tento 3DMark na vertex shader výkon. CrossFire zapojeniu sa podľa očakávania darí, nakoľko sú ovládače optimalizované na tento často používaný benchmark. Radeon HD 3870 neprekvapuje takisto a je so svojim celkovým scóre rovnako ako staršia HD 2900 XT veľmi blízko pri GeForce 8800 GTX. Nižší výsledok CPU testu so zapojeným CF, napriek tomu, že bol použitý rovnaký procesor s 3,4 GHz pracovnou frekvenciou môžme pripísať jedine väčšej záťaži, ktorú produkuje CrossFire zapojenie. Výsledky ale netreba preceňovať, viac ako výkon v 3DM06 neukazujú.



Call of Duty 4: Modern Warfare

ilustračný obrázok

Tretí diel legendárnej 3D First-person shooter série pre PC od Infinity Ward (CoD 3 bolo pre konzoly), vydaný koncom minulého roka priniesol mnoho nových prvkov.V prvom rade presun do „fiktívnej súčastnosti“ čo hre rozhodne pomohlo. Bojuje sa na blízkom východe, v Rusku, na Ukrajine v okolí Černobylu, či dokonca na lodi uprostred mora. Arzenál opäť tvoria zbrane z reálneho sveta, každú si môžete v multiplayeri prispôsobiť podľa vlastných potrieb. Podobnosť s predchádzajúcim dielom je poznať hlavne v hernom štýle - stála akcia. Hra si našla určite aj vďaka tomu veľa fanušíkov a nadšencov.

DirectX9 engine vlastnej výroby využíva okrem už medzičasom bežného HDR-renderingu aj dynamické tiene, dynamické osvetlenia, depth of field (hĺbkovú neostrosť), parallax mapping a veľmi vydarenú simuláciu dymu. Voči predchádzajúcim dielom bola pridaná vlastná „physics“ engine, ktorá vypočítava priebeh letu guliek (je možné strieľať cez rôzne materiály) a simuluje pád tiel na zem pomocou ragdoll fyziky a predsimulovaných animácií. Engine je optimalizovaný aby využíval aj viac jadrové procesory.

Vďaka vstavanej funkcii multiplayer módu, zaznamenať timedemo sme nahrali vlastné na DM (death match) serveri a mape „Wet Works“. Všetky detaily boli nastavené na maximum a okrem toho sa v danej dobe nachádzalo množstvo hráčov na serveri – o grafickú náročnosť teda bolo postarané.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Z jednotlivých grafov vyťaženia CPU vidieť, že naše timedemo je limitované hlavne grafickou kartou, pre množstvo bojových scén, výbucho, vrtulníkov a súperov. Na multiplayer sa len ťažko optimalizuje, lebo sú jednotlivé bojové scény skoro vždy jedinečné, naše testy teda odrážajú veľmi dobre skutočný výkon v COD4. GeForce 8800GTX je suverénne najvýkonnejšia karta a ani CrossFire sa nedarí ju ohroziť. Okrem toho nie sú rozdiely medzi jednou a dvoma HD 3870 512 veľké. Možno z tohoto dôvodu predpokladať, že CrossFire nemôže svoj pravý výkonu ukázať pre neexistujúci alebo zlý CF profil. Do pozornosti by som dal ešte ďalší ukazovateľ, ktorý toto potvrďuje - pomerne veľké prepady výkonu a nízke minimálne FPS.

Call of Juarez

ilustračný obrázok

Poľský tvorca Techland siahol po veľmi netradičnom žánre „wester shooter“, navyše berúc na mušku meno iného First-person shooteru. Zahráte si za kňaza Raya McCalla, Billyho Candelu a jeho otca „Juareza“, ktorý stojí na čele tlupy banditov. Vybúriť sa môžete ako v šesťdesiatich rokoch 19. storočia - zajazdiť si na koni, vykradnúť vlak a nebude núdza ani o množstvo pištolníckych súbojov. Titul bol vydaný ešte v roku 2006 a beží na modifikovanom Chrome engine, ktorý dostal o rok neskôr aj podporu Direct3D 10. Hráča presvedčí vďaka hĺbkovej neostrosti (DOF), vydareným particle efektom využívajúce geometry shader, kvalitným textúram s vysokým rozlíšením, FP-16 HDR-renderingu, Parallax Occlusion Mappingu, shadow mapám, veľmi dobrým postavám a efektom. Po grafickej stránke sa preto nemusí za nič hanbiť a obstojí aj v ťažkej konkurencii. Nie je prekvapením, že dá poriadne zabrať moderným grafickým kartám. Pre naše testy sme využili Direct3D10 benchmark demo s maximálnymi detailami a vypnutým zvukom.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Call of Juarez sedí viac Radeon grafickým kartám, nakoľko bol jeho engine upravený v spolupráci s AMD/ATi. To sa nám potvrdilo aj teraz Jednotlivé scény majú v priemere ~ 1 milión polygonov, čo je naozaj veľa a sú limitované skoro vždy grafickou kartou. Podstatný je hlavne pixel, vertex a geometry shader výkon. Pokiaľ teda porovnáme len priemerné Avg. hodnoty FPS, tak sa dokáže CrossFire zapojenie výrazne presadiť. Časté sú ale veľké prepady FPS na jednomiestne hodnoty. GeForce 8800 GTX a Radeon HD 3870 grafické karty dosahujú celkovo nižšie amplitúdy a majú dosť často aj vyššie minimálne FPS.

Clive Barkers Jericho

ilustračný obrázok

Je First-person shooter od Mercury Steam, vydaný spoločnosťou Codemasters v minulom roku. Za námetom stojí Clive Barker, anglický spisovateľ hororových kníh, ktorý napísal aj námet pre Undying. V oboch prípadoch budete hrôzou cvakať zubami.

V hre bojujete so svojím tímom v rôznych časových líniach, od Nemecka počas druhej svetovej vojny, cez stredovek a križiacke výpravy až do dôb starovekého Ríma. Napriek tomu, že hráči a stránky nevenovali „Jericho“ veľkú pozornosť, má po grafickej a hernej stránke čo ponúknuť. Vidieť cit pre detail od programátorov, nakoľko je „content“ (prostredie, okolie, textúry) celkom kvalitný a originálny. Využívané sú aj rôzne particle a post processing (depth of field, motion blur) efekty v kombinácii s FP16 HDR-renderingom a parallax mappingom. Majitelia starších grafických kariet, ktoré nedokážu antialiasing v spojení s FP16 renderingom sa preto budú musieť zriecť vyhadzovania hrán.

Na testovanie výkonu sme využili úvodnú sekvenciu vstupu do podzemných tunelov. Detaily boli v hre nastavené na maximum.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Jericho je hra, ktorá potrebuje texelfillrate, pixel shader výkon a pripomína vo viacerých scénach OpenGL hru Pray. CrossFire sa darí presadiť voči jednej HD 3870 hlavne so zapnutým 4xMSAA, 16xAF, keď je nutný grafický výkon. GeForce 8800GTX si suverénne drží od ostatných kariet výkonnostný odstup.

Colin McRae: DIRT

ilustračný obrázok

Predstavuje šieste pokračovanie známej série závodov Rallye od Codemasters z polovice roka 2007. Colin McRae Rallye Dirt je poháňané DirectX 9 „Neon“ enginom vlastnej výroby, ktorý nemá vo svojej kategórii konkurenciu. FP16 HDR-rendering, dynamické tiene, pekné textúry, vydarené particle efekty a detailné okolie sú charakteristické pre závody.

V hre sa jazdí na asfalte ale aj špinavších povrchoch ako je štrk, piesok, blato. Trate sú navrhnuté podľa skutočnosti. Vďaka kvalitnému audiovizuálnemu poňatiu má hráč pocit ako by bol sedel v skutočnom aute. Na testy sme využili začiatok buggy závodu „Bark River“ v USA.

Kvality obrazu sme boli nútený nastaviť v hre na „high“, nakoľko Radeon HD 3800 grafické karty zobrazovali len čierny obraz s nastavením „ultra“. Okrem toho vykazovalo CrossFire zapojenie so zapnutým vyhladzovaním hrán v hre ako aj v CCC blikajúce, trhajúce textúry divákov na tribúnach. Tento bug v grafických ovládačoch Catalyst je AMD/ATi už dlhšie známy, avšak stále neodstránený.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Hra je veľmi zaťažená na silné viac jadrové procesory a dokáže ich naplno využiť. Dôkazom sú určite aj grafy vyťaženosti CPU. S narastajúcim rozlíšením a AA, AF sú rozdiely medzi grafickými kartami stále väčšie. Veľmi veľký prepad výkonu CrossFire zapojenia v 1280x1024 so zapnutým 4xMSAA, 16xAF voči ostatným kartám si vieme vysvetliť len tak, že ho spôsobuje bug v ovládači a nie práve najvhodnejší CrossFire profil.

Company of Heroes Opposing Fronts

ilustračný obrázok

Je stand-alone datadisk na veľmi dobrú a obľúbenú RTS (real time strategy) Company of Heroes od Relic Entertainment z prostredia 2. svetovej vojny, ktorý vyšiel ešte v septembri 2007.

Napriek len minimálnym znemám v engine oproti pôvodnej hre má stále čo ponúknuť po grafickej stránke. Na najvyšších detailoch dáva celkom slušne zabrať aj súčasným grafickým kartám. Engine Opposing Fronts obsahuje automaticky okrem DirectX9 aj Direct3D 10 path, ktorý umožňuje HDR-rendering, normalmapping, dynamické osvetlenia, percentage closer filtering pre soft shadows, lepšie particle efekty, vyššie rozlíšené textúry a alpha to coverage pre všetky stromy, kríky a pod. aby boli aj tieto vyhladené

Grafické karty sme testovali v úvodných scénach misie „Wolfheze“ s Direct3D 10 a maximálnymi nastaveniami kvality obrazu.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








V našich testoch bolo väčšinou vyťažené len jedno zo štyroch jadier, napriek tomu, že engine dokáže využiť aj viac jadier. CrossFire zapojenie dvoch HD Radeon 3870 má často problémy, aby bola hra plynulá. Veľké výkivy spôsobujú, že celkový dojem plynulosti je ešte horší. Na rozdiel od CF nemá jedna GeForce 8800GTX žiadne problémy a hra je plynule hrateľná aj v najvyššom rozlíšení 1280x1024 a zapnutým 4xMSAA, 16xAF. Nie je čudo, hra je v TWIMTBP programe a potrebuje okrem aritmetického výkonu aj dosť texelfillrate.

Crysis

ilustračný obrázok

Názov hry hovorí asi za všetko. First-person shooter Crysis, neoficiálny pokračovateľ Far Cry, lebo využíva jeho ďalej vyvinutý engine s názvom „Cryengine2“, bol už dlho pred vydaním v pozornosti hráčov. Vývojárskym štúdiom je aj v tomto prípade nemecký Crytek, na čele s bratmi Yerli. Spolu s Hellgate: London patrí medzi veľké D3D 10 tituly, ktoré neboli vyvinuté Microsoftom. Hráte úlohu špeciálne vycvičeného amerického vojaka s kódovým označením „Nomad“, využívajúceho oblek „nanosuit“, ktorý bol vysadený so svojím tímom na krásnom ostrove s palmami, patriaci Servernej Kórei. Rovnako ako vo svojej dobe Far Cry, nasadil Crysis myslenú latku grafiky opäť tak veľmi vysoko, že to iným hrám bude trvať určitú dobu, pokiaľ sa k nej priblížia. Engine ponúka po grafickej stránke asi všetko momentálne dostupné a je navrhnutý tak, aby sa v budúcnosti dal ďalej rozširovať pomocou patchov. D3D 10 a 9 path, geometry shadery, dynamické tiene s vysokým rozlíšením, ambient occlusion maps, subsurface scattering,motion blur (neostrosť pri pohybe) & depth of field (hĺbkovú neostrosť), mormal maps, parallax occlusion maps, soft particles, HDR-rendering, pokročilé shadery a množstvo iných ľahôdok sa využíva v hre. Ďalšia informácie ku Cryenginu2 nájdete na oficiálnej stránke Crysis. Nie je prevkapujúce, že aj najsilenjším zostavám dáva hra zaberať.

Naše grafické karty karty sme testovali s nastavením detailov na „very high“, bez anti-aliasingu a anizotropného filtra v 2 rôznych testoch, využívajúce timedemo funkciu. Prvý test „Contact“ predstavuje vstavaný GPU-benchmark. Druhý test s názvom „Paradise Lost“ je vlastné timedemo nahrané v snežnej krajine a je preto extrémne náročné.

vyťaženie CPU:







vyťaženie CPU:







ilustračný obrázok


vyťaženie CPU:







vyťaženie CPU:








CrossFire zapojeniu sa nedarí presadiť v teste "Contact" a dosahuje veľké prepady FPS pod úroveň jednej HD 3870. Dôvod bude asi chýbajúci CF profil v ovládačoch a fakt, že v Crysis majú jednotlivé snímky medzi sebou veľkú nadväznosť, teda globálne to budú mať CF a SLI ťažké. Na rozdiel od toho sa GeForce 8800 GTX darí a dosahuje hratelné hodnoty FPS v teste Contact. Celá situácia sa mení v druhom teste "Paradise Lost", kde dosahuje CrossFire zapojenie prekvapivo veľmi dobrý výkon. GeForce 8800 GTX sa drží v závese na druhom mieste. Avšak posledný test v rozlíšení 1280x1024 nedokáže žiaden kandidát zobrazovať plynule.

Enemy Territory: Quake Wars

ilustračný obrázok

Nasledovník Wolfenstein – Enemy Territory je poháňaný modifikovaným OpenGL Doom 3 enginom, ktorý bol doplnený o MegaTexture technológiu od známeho Johna Carmacka, soft particles, dynamické tiene, moderné shader efekty, prepočet fyziky a iné. Vďaka MegaTexture je možné aplikovať na statický terén obrovské textúry (až niekoľko GiB veľké s rozlíšením 32768×32768pix) namiesto veľkého množstva menších. Na rozdiel od Doom3 či Quake4 sa preto v ET:QW bojuje na rozsiahlych otvorených priestranstvách. Dynamiku hry dávajú rôzne bojové vozidlá.

Naše grafické karty sme testovali s nastavením kvality obrazu na „high“, okrem shaderov, ktoré boli nastavené na „ultra“ vo vlastnom, pre tieto účeli vyrobenom timedeme. Shadows, soft particles a smooth foliage bolo zapnuté pre dosiahnutie maximálnej kvality obrazu. Timedemo zachytáva tuhé boje vojakov ale aj ozbrojených vozidiel.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Potešujúca je skutočnosť, že engine dokáže vyťažiť všetky naše 4 jadrá Intel QX9650 procesora. GeForce 8800GTX je vo všetkých testoch na prvej pozícii, nakoľko sa jedná o OpenGL engine, ktorý potrebuje veľa texelfillrate a VRAM. CrossFire zapojenie dvoch HD 3870 neprináša oproti jednej HD 3870 512MiB veľký nárast výkonu, napriek tomu, že má teoreticky dvojnásobnú texelfillrate, priepustnosť a aritmetický výkon. Hlavný dôvod vidíme v nie najlepšom CF profile pre hru.

FEAR: Perseus Mandate

ilustračný obrázok

Je druhý datadisk po „Extraction point“ na známy hororový First-person shooter F.E.A.R. (First Encounter Assault Recon) vydaný koncom roka 2007. Dej Perseus Mandate sa odohráva súbežne s hlavným dejom FEAR a zmeny sa dočkal hlavne singleplayer. Pridali sa nové misie, postavy, mapy a zbrane. Z grafického hľadiska sa ale skoro nič nezmenilo. Naďalej je využívaný Lithtech DirectX 9 Jupiter EX engine s jeho technikou - parallaxmapping vytvárajúci diery po strelách v povrchoch, bloom spolu s farebnými filtrami na vytvorenie atmosféry, volumetric lighting & lightmapping dovoľujúce komplexné svetelné efekty, podpora Havok physics a kvalitné shadery, textúry. Testy výkonu grafických kariet sme uskutočnili v integrovanom benchmarku s maximálnymi detailami okrem možnosti „soft shadows“.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:







Žiadne nastavenie nespôsobovalo našim testovaným grafickým kartám väčšie ťažkosti, lebo hra využíva trochu starší engine, ktorý už zaostáva po grafickej stránke za novými. Aj s jednou Radeon HD 3870 by bolo možné hrať FEAR: Perseus Mandate plynule v 1280x1024 so 4xMSAA, 16xAF. CrossFire sa dokázalo presadiť voči jednej GeForce 8800 GTX, avšak minimálne FPS mala GeForce o dosť vyššie.

Lost Planet: Extreme Condition

ilustračný obrázok

Predsavuje jednu z technicky najvyspelejších First-person shooterov vydaných v roku 2007. Ani skutočnosť, že PC verzia vznikla ako kvalitný port z Xbox 360 verzie na tom nič nemení, nakoľko bol MT Framework engine ďalej upravený. Bolo doňho implementovaných množstvo features ako motion blur, depth of field s vyššou kvalitou, „fur“ shadery, FP-16 frame buffer, vylepšený shadow map filtering, ambient occlusion, soft particles, advanced parallax mapping a dostal podporu Direct3D 10. Demo vydané v strede roka 2007 predstavovalo prvé hrateľné Direct3D 10 demo. Dej hry sa odohráva na "snežnej púšti", presnejšie na povrchu planéty E.D.N.III, z ktorej je ľudská kolónia vytláčaná hmyzoidnou rasou Akridov. V úlohe hlavného hrdinu sa dostávate na planétu, vyriešiť tento problém. Zastrieľate si na rozľahlých snežných pláňach, ale aj v temných interiéroch.

Výkonnostné testy sme uskutočnili pomocou vstavanej benchmark funkcie v Direct3D 10 s maximálnymi detailami. Nakoľko obsahuje benchmark dve scény – „snow“ a „cave“, sme testovali len v graficky limitovanom „snow“.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Lost Planet sme boli nútení testovať v menej používaných rozlíšeniach, nakoľko neposkytovala hra s Radeon grafickými kartami na výber rozlíšenia 1280x1024 a 1024x768. Počet polygonov v jednotlivých scénach je len priemerný, okolo 85 000, zaťaženie procesora je malé a počet draw calls je veľmi premenlivý, od 1000 do 4000. V benchmarku sú veľmi vyťažované hlavne TMUs a ALUs. CrossFire zapojenie dvoch HD 3870 ponúka podobný výkon ako jedna GeForce 8800 GTX. Výkonnostný nárast CF je úctihodný a jedna HD 3870 viditeľne zaostáva.

Need For Speed: Pro Street

ilustračný obrázok

Predstavuje už jedenáste pokračovanie "autíčkarskej" série Need For Speed, vydané 22. novembra 2007. Za Ryana Coopera si tentoraz zajazdíte legálne závody na Pro Street tratiach cez deň. Autá po dlhej dobe dostali model poškodenia, takže svojmu miláčikov môžete divou jazdou poriadne ublížiť. D3D 9 engine vlastnej výroby bol prepracovaný a trochu viac lesku mu dávajú particle & glow efekty, motion blur, dynamické osvetlenie, nové modely aút a detailné textúry. Preteky sú klasicky doplnené pomerne chytľavou hudbou.Testovali sme v úvodnej scéne preteku „Nevada Highway – Speed Challenge“ s maximálnymi detailami.
vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Engine dokáže vyťažiť všetky štyri jadrá procesora, čo hodnotíme kladne. V testoch sme sa ale stretli naraz s viacerými prekvapeniami. GeForce 8800 GTX podávala vo všetkých nastaveniach veľmi podobný výkon a presadiť sa voči konkurencii sa jej podarilo až v rozlíšení 1280x1024 so zapnutým 4xAA, 16xAF. Slabé výsledky v ostatných nastaveniach pripisujeme ovládačom. Zaujímavý výsledok nám predviedlo aj CrossFire zapojenie, ktoré sa výrazne vzdialilo konkurentom len v prvom, najmenej náročnom nastavení. Aj tu vidíme rovnaký dôvod - ovládač, konkrétne chýbajúci CF profil.

PT Boats: Knights of the Sea

ilustračný obrázok

PT Boats: Knights of the Sea je Direct3D 10 techdemo s benchmark funkciou od ruského vývojárskeho štúdia Akella, ktoré by sa malo čoskoro pretaviť v plnohodnotný „námorný simulátor“. Budete mať na starosti flotilu nemeckých, ruských a spojeneckých lodí počas 2. svetovej vojny. Tvorcovia si dali záležať na jednotlivých detailoch a modely lodí, lietadiel, kopírujú presne to, s čím sa bojovalo. Engine využíva pokročilý systém renderovania povrchu oceánu (advanced ocean rendering), soft particles vytvárané pomocou geometry shadera, soft shadows, simulácie odrazov (reflections), svetelných lúčov, HDR-rendering pre streľbu z diel a slnečné odrazy. Hra patrí do nV TWIMTBP programu a vyhovuje preto viac GeForce grafickým kartám. Výkon grafických kariet sme testovali v Direct3D 10 s maximálnymi detailami.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Kvôli veľkému poklesu výkonu so zapnutým programom FRAPS sme neboli schopný vyhotoviť krivky FPS v čase. Scény majú okolo 350 000 polygonov, potrebujú veľmi veľa VRAM a vyťaženie CPU je na nízkej úrovni. Počet draw calls je prekvapivo nízky z dôvodu viacerých optimalizácií. CrossFire zapojenie sa nedokázalo výraznejšie presadiť oproti jednej HD 3870. Potešujúci je ale určite fakt, že na rozdiel od minulosti prinesie v určitých nastaveniach nárast výkonu. GeForce 8800GTX sa drží počas všetkých testoch na čele.

Unreal Tournament 3

ilustračný obrázok

Unreal Tournament 3 je štvrtý diel z kultovej 3D First First-person shooter série „Tournament“ od Epic Games založený na novom „state of art“ Unreal Engine 3, ktorý si licencovalo množstvo vývojových štúdií pre svoje hry. Celkovo je tento diel ladený tak, aby nadväzoval na „jednotku“.

Unreal Engine 3 predstavuje prepracovaný DirectX 9 engine (D3D 10 renderpath je na ceste), ktorý je pastvou pre oči, nakoľko využíva HDR-rendering, kvalitné particle efekty, dynamické tiene, množstvo rôznorodých textúry a v neposlednom rade aj deferred shading. Z toho však vyplýva jeden nedostatok - nemožnosť zapnúť anti-aliasing priamo v hre. NVidia ako aj AMD/ATi tento nedostatok odstránili na svojich Direct3D 10 grafických kartách pomocou hacku v ovládačoch. Oficiálne je to možné až keby engine podporoval D3D 10.1. Výrazný je aj shimmering. Shannon a Nyquist by sa asi v hrobe otáčali, keby to videli. Viac sa o technických detailoch môžete dozvedieť priamo na unrealtechnology.

Na otestovanie výkonu našich grafických kariet sme použili integrovanú funkciu – Flyby (prelet) CTF mapou s názvom „Suspense“. Merania sa uskutočnili pomocou programu FRAPS. Detaily v hre boli nastavené na maximum, V-sync (bSmoothFrameRate = False) bola vypnutá.
vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








Ako vidieť aj na grafoch vyťaženia procesora, UT3 je multithread optimalizovaný, aby vyťažil aj viac jadrové procesory. S narastajúcim rozlíšením a AA,AF klesá postupne vyťaženie CPU, nakoľko sa už grafická karta stáva limitujúcim komponentom. V rozlíšení 1024x768 s 1xAA, AF vidieť ešte jasnú limitáciu procesorom.

Všetky testované nastavenia sa dajú plynule hrať aj na jednej HD 3870 512. GeForce 8800GTX a CrossFire pozostávajúce z dvoch HD 3870 512MiB si nedarujú veľa, až v rozlíšení 1280x1024 so 4xMSAA, 16xAF kde nelimituje procesor sa dokáže CrossFire presadiť vďaka vyššiemu aritmetickému výkonu, priepustnosti a optimalizáciám anizotropného filtra.

World in Conflict

ilustračný obrázok

Dnešné stratégie vyzerajú po grafickej stránke oveľa lepšie ako tie zpred pár rokmi, first-person shootery si však stále držia prvenstvo v použitej technike. Realtime strategy od švédskeho Massive Entertainment vydaná v roku 2007 je ale výnimočná v každom smere. Nielen po hernej, ale aj vizuálnej stránke. Masstech Game Engine obstojí v porovnaní s inými kvalitnými enginami, nakoľko ponúka Direct3D 10 spolu s anti-aliasingom, veľmi vydarené shader efekty (svetelné lúče prechádzajúce cez oblaky, tzv. God Rays, len v D3D 10), realistické soft shadows, detailné textúry s vysokým rozlíšením a animácie na vysokej úrovni. Spolu s medzisekvenciami rozprávajúcimi príbeh je vytvorená filmová atmosféra. Fiktívny dej o tom, že studená vojna začiatkom 90. rokov neskončila, ale vyústila v masívnu sovietsku inváziu na pôdu USA pridáva ďalej na atraktivite hry. Naše grafické karty sme testovali v integrovanom benchmarku s maximálnymi detailami.

vyťaženie CPU:







vyťaženie CPU:






vyťaženie CPU:






vyťaženie CPU:








V nastaveniach, kde limitoval procesor, sú len veľmi malé rozdieli medzi jednotlivými grafickými kartami. Pri zapnutí 4xAA a 16xAF už ale narastá grafická záťaž a CrossFire zapojenie ukáže oproti jednej Radeon HD 3870 svoj výkon. Na GeForce 8800GTX to ale nestačí, nakoľko je hra optimalizovaná na GeForce karty a patrí do TWIMTBP programu. Engine dokáže využiť všetky jadrá procesora a v určitých scénach je záťaž CPU nadpriemerná, čo je logické, lebo sa jedná o RTS.

Hlučnosť, teploty, spotreba

Hlučnosť:

Moderné grafické karty by nemali byť len výkonné, ale aj ich chladič by nemal pri práci (2D, 3D) vydávať vysoký hluk. Často je hlučnosť štandardného chladiča dôvod pre zákazníka sa rozhodnúť práve pre určitú kartu. V teste rozlišujeme tri kategórie – 2D, 3D a 100%, lebo všetky testované karty si regulujú otáčky ventilátora závisle od teploty.Hlučnosť v sme vo všetkých troch prípadoch merali pomocou hlukomeru „Voltcraft SL-100“, ktorý bol umiestnený v rovnakej výške, 1m od meraného zdroja hluku - grafickej karty. Nakoľko naša zostava nemá skrinku, merali sme s vypnutými ventilátormi. Jediným prídavným zdrojom hluku bol pevný disk a zdroj.

Pomocou alikácie RivaTuner sme manuálne prinútili pracovať ventilátor na 100% a následne zmerali hlučnosť.


Charakteristické úrovne hluku: dBA:
štart lietadla (60m) 120
stavba 110
krik (2m) 100
nákladné vozidlo (15m)  90
mestský chodník  80
interiér auta  70
normálny rozhovor (1m)  60
kancelária  50
obývačka  40
spálňa cez noc  30
nahrávacie štúdio  20
šuchot lístia  10

Subjektívne pracuje grafická karta GeForce 8800GTX v 2D a 3D najtichšie. Je to síce prekvapivé, lebo čísla hovoria inou rečou. Dôvod bude asi iná farba hluku a fakt, že jej ventilátor skoro nikdy nemusí zvýšiť otáčky. Hodnota hluku HD 3870 je síce podľa hlukomeru nižšia, ale časté zrýchlenia a spomalenia otáčok kazia v reálnom nasadení tento dojem. CrossFire zapojenie bolo jednoznačne najhlučnejšie. Hlavne prvá karta, ktorá bola čiastočne zakrytá druhou, zvyšovala pravidelne otáčky ventilátora. Globálne možno povedať, že hlučnosť kariet v 2D bola veľmi prijateľná. V 3D sa obraz mení.

Teploty:

Hlučný chladič by grafická karta nemala mať. Podobne je to ale s teplotou – tá by nemala vystúpiť so štandardným chladičom príliš vysoko. Vyššou teplotou sa skracuje životnosť všetkých súčiastok a takisto má negatívny dopad ďalšie zvyšovanie frekvencií - pretaktovanie. Teplotám jednotlivých častí grafických kariet sme sa preto venovali pomerne komplexne. V tabuľke vidieť päť rôznych údajov. 2D merania sa uskutočnili 5 minút po nabootovaní systému do Windows Vista so zapnutou Aero plochou. Merania „pamäť“ a „vzadu“ sme uskutočnili pomocou laserového teplomera „Voltcraft IR-280“ na zadnej strane PCB. Pod pojmom „vzadu“ myslíme zadnú stranu jadra. Hodnota „jadro 2D“ bola vyčítaný pomocou aplikácie RivaTuner. Rovnakým spôsobom sme uskutočnili 3D merania po 30 minútach zaťažujúceho testu HDR 1 – „Canyon Flight“ v 3DMark2006.

Nájsť dobrý pomer medzi hlučnosťou chladiča a teplotou jadra nie je vôbec jednoduché. V 2D sa to v podstate podarilo všetkým kandidátom. Teplotné rozdiely pamäte RAM sú spôsobené rozdielnym typom - GDDR3 vs. GDDR4 a z toho vyplývajúcich pracovných napätí. Napriek vysokým otáčkam ventilátora vystúpi teplota jadra Radeon HD 3870 veľmi vysoko, na ~ 90°C.
Ďalej sa už teplota nezvyšuje ani počas dlhšieho hrania. Chladič GeForce 8800 GTX pracuje aj v 3D relatívne ticho a teplota 90nm jadra G80 nevystúpi ani po dlhom zaťažení nad 75°C.

Spotreba:

Nemohli sme zabudnúť ani na merania spotreby. Pomocou "Voltcraft Energy Monitor 3000" meracieho prístroja sme najprv 5 minút po nabootovaní operačného systému Windows Vista 32bit Ultimate so zapnutou Aero plochou zmerali spotrebu celej zostavy . Tento údaj je označený ako 2D. Maximálna spotreba v 2D, teda "peak 2D" je uvedená pre zaujímavosť. Pre zistenie spotreby v 3D sme nechali 30 minút bežať HDR 1 test "Canyon Flight" v 3DMark2006. Maximálna spotreba v 3D je v tabuľke označená ako "peak 3D".


Veľké rozdiely spotreby medzi jednou GeForce 8800 GTX a Radeon HD 3870 v 2D a 3D sú spôsobené hlavne rozdielnym výrobným procesom grafických čipov G80 a RV670. 55nm RV670 má okrem toho funkciu PowerPlay, vďaka ktorej sa znížia napätie jadra a vypnú sa nepotrebné výpočtové jednotky. Čip G80, ktorý bol vyrábaný v 90nm (EOL od februára 2008) sa musí zaobísť bez takejto funkcie z čoho logicky vyplýva vyššia spotreba. Vďaka manuálnemu podtaktovaniu pracovnej frekvencie jadra pomocou aplikácie RivaTuner sa ale dá znížiť celková spotreba v 2D až o 20W. PowerPlay pomohol aj CrossFire zapojeniu udržať celkovú spotrebu systému v 2D pod hodnotou 8800 GTX. V 3D, kedy je potrebný celý výkon systému sa už prejaví viac grafických čipov vo vyššej spotrebe.



Zhrnutie, záver



AMD/ATi spravila vďaka čipu RV670 správny a v danej situácii asi najlepší ťah. Vylepšila viaceré nedostatky R600 naraz, zmenou výrobného procesu. Tento krát mala AMD/ATi aj šťastie, lebo pôvodne mal byť 55nm proces u TSMC a teda aj RV670 dostupný až oveľa neskôr. Všetky nedostatky nová HD 3000 séria neodstraňuje, lebo architektúra čipu vychádza z R600. Veľké zmeny za taký krátky čas sme ale ani nemohli očakávať. Keď sa nedá konkurovať výkonom, tak aspoň cenou. To je politika oddelenia ATi v posledných mesiacoch, lebo im nič iné neostáva. Koncový zákazník sa ale môže tešiť. Radeon HD 3870, ako najvýkonnejšia single čip grafická karta v portfóliu AMD/ATi, ponúka výborný pomer cena/výkon. Nízku spotrebu v 2D na úrovni low-end karty vďaka Powerplay a prijateľnú spotrebu v 3D. Potvrďujú to aj naše merania. nVidia by mala tiež implementovať z technického hľadiska pomerne jednoduchý mechanizmus zníženia pracovných frekvencií a napätia. Chladiaci systém HD 3870 sa tiež vydaril. V 2D pracuje ventilátor skoro nepočuteľne, zato v 3D mierne ukáže svoju silu. Pre koncového zákazníka ešte ostáva určitá rezerva na zvýšenie frekvencií, teda aj overclockeri sa môžu tešiť. Kvalita vyhladzovania je rovnako ako v prípade R600 na vysokej úrovni, zmeny sa žiaľ nedotkli AF. Oproti konkurencii v tomto ukazovateli mierne zaostáva. RV670 ale poskytuje Direct3D 10.1. Momentálne to nepredstavuje veľkú výhodu, lebo neexistujú hry, ktoré by využili nové možnosti API a v budúcnosti tiež neočakávam ich väčší príliv. Prednedávnom dostal jedine Assassin's Creed vďaka patchu podporu D3D 10.1, následne mu ale bola stiahnutá. Pre nátlak nVidie? To nevieme.



Výkon RV670 je celkovo na úrovni s dobou, veď má vyššie pracovné frekvencie ako R600 a rovnaký počet výpočtových jednotiek. Dostatok priepustnosti na Radeon HD 3870 zabezpečuje prepracovaná 256bit externá zbernica v spojení s GDDR4 pamäťou. Keď si zosumarizujeme výkon Radeon HD 3870, tak zistíme, že len v určitých testoch a nastaveniach sa dokázala priblížiť k GeForce 8800 GTX. Celkovo je dosť výrazne za ňou. Hlavne keď sa zapne AA, AF. Nie je to prekvapením, 8800 GTX ani nepredstavuje priameho konkurenta. Porovnanie s priamym konkurentom GeForce 8800 GT je oveľa lepšie, celkové výkonnostné rozdiely pri pohľade na výsledky iných stránok sú bez AA, AF relatívne malé. Pri zapnutí 4xMSAA,16x AF je to už horšie, cena však hovorí v prospech Radeon a to je dobré. Kto chce vyšší výkon musí siahnuť po CrossFire zapojení. Existujú viaceré možnosti, buď CrossFire zapojenie na jednej karte – Radeon HD 3870X2, dve Radeon HD 3870, alebo potom extrém – tri, štyri grafické karty zapojené v CF. Na druhé riešenie sme sa bližšie pozreli.




Očakávať s dnešnými multi-GPU riešeniami nárasty výkonu okolo 120% ako to bolo s Voodoo 5 6000 je veľmi nereálne. Dôvodom sú komplikované render techniky, efekty a s nimi spojené zložité výpočty. Záťaž sa dnes oveľa ťažšie rozkladá medzi jednotlivé grafické karty. Znovu platí zákon klesajúcich výnosov. CrossFire zapojenie dvoch Radeon HD 3870 sme porovnávali s jednou HD 3870 hlavne v graficky najnáročnejšom nastavení – rozlíšenie 1280x1024 s 4xMSAA a 16AF, kde nelimituje výrazne procesor. Ukázalo sa nám, že v hrách ktoré sedia R(V)6x00 architektúre a pre ktoré má ovládač dobré CF profily, môže byť nárast výkonu aj 90% a viac. Call of Juarez, UT3 a Lost Planet: EC medzi takéto hry určite patria. Predstavujú ale skôr výnimku ako pravidlo. Väčšina hier ukázala len priemerný nárast výkonu, od 24 do 55%. Aj pre závažný nedostatok – nemožnosť vybrať render mód a vytvárať,upravovať CF profil, je nárast výkonu v určitých hrách veľmi nízky. Najhoršie sa ukázalo CrossFire zapojenie v hrách Jericho, NFS: Pro Street a CMR: Dirt, kde neprinieslo (skoro) žiaden výkonnostný nárast, ba dokonca výkonnostný prepad. Dôvod je jasný, chýbajúci CF profil, teda zlý ovládač. Priemerný nárast výkonu CrossFire zapojenia v graficky najnáročnejšom testovanom nastavení je len ~ 40% oproti jednej HD 3870. Bez výsledkov v hre CMR: Dirt sa celkový nárast zvýši na 47%. Stále menej ako polovica.



Keby sme spravili priemer výkonu, tak by bol výkon CF zapojenia HD 3870 asi podobný jednej GeForce 8800 GTX. Podľa mňa ale nie sú priemerné hodnoty najlepšie, často skresľujú a vysoké max. FPS dokážu prevážiť oveľa podstatnejšie min. FPS. Jednu tabuľku, kde je porovnaný priemerný výkon všetkých testovaných kariet zo všetkých hier, preto zámerne vynecháme. Sme názoru, že jednotlivé výsledky sú lepším ukazovateľom.

Odporučiť CrossFire v momentálnej podobe pre množstvo nedostatkov nemôžeme. Kto chce vyšší výkon s AMD/ATi grafickou kartou ale iné riešenie nemá. Za dvojnásobnú cenu dostanete ani nie 50% výkonu naviac a lepšie tzv. SuperAA varianty. Pri pohľade na momentálne ceny HD 3870 to nie je až také hrozné. Nemožno ale zabudnúť na negatíva - vyššia spotreba a väčší hluk. Testované ovládače Catalysty 8.3 priniesli oproti 8.2 ktoré sme testovali tiež, ~9% nárast výkonu CF a nové AA módy. Problémy s výkonom, CF profilmi stále ostali. Fakt, že sa dá vždy niečo vylepšovať a CF profily nie sú optimálne dokazuje aj najnovší "Vantage hotfix" Catalyst, prinášajúci zvýšenie výkonu CF - odkaz na test. Keďže chce AMD/ATi aj v budúcnosti vsádzať na CF zapojenie v high-end, budú musieť byť skôr alebo neskôr odstránené väčšie nedostatky, medzi ktoré určite patrí micro stuttering. Výrazne degraduje výkon CF zapojenia, keď aj nižšie FPS grafickej karty s jedným čipov sú oproti FPS CF zapojenia oveľa plynulejšie. Veríme, že sa to časom zlepší. FPS nie sú všetko, podstatná je ich kvalita.

Radeon HD 3870 robí všetko lepšie ako HD 2900 XT. Môžme ju preto s kľudným svedomím odporučiť. Oproti GeForce 8800 GT stráca výkon hlavne so zapnutým 4xAA, 16xAF. Porovnania s 8xMSAA vyhráva už Radeon. Dosahované FPS sú však veľmi nízke pri už dnes štandardnom rozlíšení 1280x1024 a preto sú hry len výnimočne hrateľné s týmto nastavením AA. Kto sa rozhoduje medzi GeForce 8800 GT a Radeon HD 3870 nespraví ani s jednou kartou zlé rozhodnutie. Obidve si nedarujú veľa. Ja osobne by som sa priklonil k GeForce, kvôli vyššiemu výkonu s 4xMSAA, 16xAF. Negatívom je ešte stále vyššia cena. Konečné rozhodnutie je preto na zákazníkovi.

Na záver by som sa chcel poďakovať spoločnosti Sapphire za vypožičanie dvoch Radeon HD 3870 512MiB GDDR4, vďaka ktorým sme mohli túto recenziu uskutočniť. Ďakujeme.

 




Komentáre (30)
amd_sk
Matej "crux2005" Koleják musim pochvalit. Vyborny test. proste nadhera.
Wild
krasna recenzia, takto by to malo vyzerat. Vzor recenzii...
A2C
Už som ti to písal ale musím ešte raz je to super ukážková recenzia
GABO
Tak ako trvalo to, ale tak výsledok je výborný...
palee
výsledok je myslím viac ako výborný :)
Rincewind
Tak za toto si zasluzis medailu. Len keby takych recenzentov bolo viac, na ceskych weboch o min fps nechcu ani pocut...
Pavel Čech
Super recenzia. Rozsahom aj kvalitou. Ine servery mozu o takych recenziach iba snivat...
miseno
ako ste rátali priemerné fps? Či len ako max a min delené dvoma, alebo ste použili štatistiku? Lebo takéto priemerné fps je dosť zavádzajúce. Napríklad extrem, nex nám minimálne fps klesne na 1 ale maximalne fps je 100, priemerne fps je 50. Ale napríklad ked minimalne fps neklesne pod 25 a max nevystupi na nad 75 tak takisto máme priemerné fps 50, ale myslím že tento drasticky rozdiel kazdy spozná.
baqq
priemerne fps test vyrata priebezne, nie ze minimum maximum x2, a ved predsa tam mas vzdy uvedene aj minimal FPS (co je velmi dobre, pretoze toto je asi najzaujimavejsia hodnota) takze lahko si to mozes overit podla udaja min., kt. tam je spomenuty.
quicky
akoze pekna recenzia,diky...ale jedna vec ma dost trapi....vseobecna vec,ze maximalne vyuzitie CF/SLI je pri rozliseniach 1600x1200 a viac...preco su teda robene testy v max 1280?to ako keby testujes jednu ati3870...sory ale toto je myslim najviac podstatne
Laci
Pekna recenzia. Vsimol som si malu chybicku: V tabulke technickych udajov su prehodene priepustnosti pamate medzi 3870 a 3850.
crux2005
@ miseno: vážený priemer je síce teoreticky pekný, ale prakticky je to 1.) komplikované 2.) znovu skreslujúce 3.) všeobecne nepoužiteľne. To čo je priemer v tabuľke je naozaj priemer zo všetkých nameraných FPS. Preto je okrem toho min, max údaj v tabuľke a máš aj priebeh FPS s časom. ;-) @ quicky: pokiaľ nemáme display s väčším rozlíšením k dispozícii, nemôžme ani testovať vo vyššom rozlíšení. Môžeš mi veriť, že sme sa pokúšali vybaviť 24" a viac palcové LCD, alebo CRT, ktoré podporuje aspoň 1600x1200. Nikto nám nechcel na testovacie obdobie - zhruba 2 týždne (5 kariet, 20 testov, opakované atď) vypožičať takýto monitor. CRT, ktoré malo prísť sa pokazilo. Teší nás, že sme vôbec dostali produkty od spoločností ako je Intel, Alphacool, Gigabyte, Asus, Sapphire, Microsoft, X-Spice @ www.bostar.cz, MSI @ www.agem.sk. Je mi jasné, že CF/SLI je hlavne pre vyššie rozlíšenia, 1280x1024 so 4xMSAA a 16xAF by ale mali zvládať tiež, nie ? hlavne keď je HD 3870 "len" performance karta s cenou mainstream karty a má 512MiB VRAM
Fragrance
niet čo dodať len že dakujem :)
quicky
mat by mali zvladat ,ale neprejavi sa plny potencial....hmmm ved uz len lok2 je z BA ,tak co ste sa nedali s nim dokopy ma ten isty monas ako ja 24" HPcko 1920x1200..samozrejme ak sa neda tak sa neda,len to b ol postreh no ,ze vlastne ste z toho CF nevytrieskali maximum a preto su aj vysledky take ake suu
quicky
samozrejme to neber ako kritiku alebo podobne:) len postreh,skvela praca:)
lacikaboss
:) hotova diplomovka..
mefi
tieto karty nie sú určené na hranie v rozlíšení 1680x1050 a nižšie, testovať ste mali na rozlíšení 1920x1200, pozrite sa napríklad na DD, EXHW, tam po ovládacoch 8.3 uznali a po 8.4 ešte aj viac potvrdilo, že 3870 X2 prekonáva 8800ULTRA, buď vaše testy boli nesprávne, alebo je to zámerna recenzia, čo dúfam, že nie, stačí si len trochu prezrieť a porovnať tie testy, pozor karta ktorá prekonáva 3870 X2 je 9800GX2 :), nedávam sem priamo linky, alebo presne ich názvy, aby ste nepovedali, že propagovanie atď., pls porovnajte tie testy :)
A2C
Neboj sľubujem že na ďalší test jeden monitor 24" zabezpečím možno Eizo :-)
lkuzman
Maťo, gramatika a občasné preklepy sú vedľajšie. Výpovedná hodnota Tvojej recenzie je sto bodov zo sto v rámci možností. Viem veľmi dobre koľko mravčej práce, nervov a voľného času ktorý bárs kto radšej strávi v krčme alebo kritizovaním Ťa to stálo. Keby som mal na ten 24" monitor, tak Ti ho kúpim - tomu ver. To že niekto niekde uvedie iba priemerné FPS, najlepšie v rozlíšení 640*480 :D svedčí o jeho neprofesionalite, nevedomosti problematiky a hrať sa? Asi to v živote na PC neskúsil. Prihrievanie polievočky sponzorom v podobe "grandiózneho vedeckého výsledku" - dvojdňovej "recenzie" je obyčajný alibizmus ... ako niečo zohnať zadara, resp ako si chytro zarobiť obyčajným treťotriednym ballastom. Milí sponzori, "recenzanti" a čitatelia, toto je recenzia hodná Vášich investícií, času. Teším sa na tú vo vyššom rozlíšení a dúfam že raz bude. Poklona. Ľ
GABO
"tieto karty nie sú určené na hranie v rozlíšení 1680x1050 " akosi som to odporúčanie od výrobcu nikde nenašiel ;-).
mefi
ked si takú kartu kupim tak chcem hrat na vyšších rozlíšenia a k tomu určite mám minimálne 22 monitor niečo iné je 3850
GABO
Takže to bol tvoj pohľad na vec? Mne ide o to, že hodnotíš recenziu na základe tvojich požiadaviek. Treba sa uvedomiť aj v uvádzaní webov ako príklad, lebo evidentne jeden z nich má charateristiku ako si napísal na nás...
cpy
FPS je vidno v každej recenzii, ale v tejto vidno aj scalovanie CPU čo sa málokedy vidí. Konečne vidno, že aj 4 jadrové CPU dokáže vyžrať novšia hra, pekne len tak ďalej. Každy si v tejto recenzii niečo nájde čo sa mu páči.
mefi
no já vam tu nebudem hovoriť rozumy, ked chcete vymazte to, ale len sa na ten test pozrite http://www.extrahardware.cz/megatest-grafickych-karet-ii-herni-testy-3dmark?page=0,1 EXHW poatrí k najlepším cz/svk webom :)
Gudas
mefi: recenzia pekná a čo? tu sa testovali 2x 3870 a nie 3870X2 vs. 88Ultra. Stále netuším, čo nám chceš povedať.
r1z1ko
Toto nieje megatest graf. kariet ale test CF 3780tiek...tak čo tu pletieš rozdielne testy... Táto recka je ako má byť prehľadná, rozsiahla, podrobná a každý si tak nájde podľa mňa to čo potrebuje vedieť o Ati Radeon 3870 a jej CF zapojení...
crux2005
Normálne ani neodpisujem na takýto typ odpovedí ... Nezdajú sa ti výsledky 2x HD 3870 @ CF dosť nízke, čo sa týka FPS ? Okrem toho, nevšimol si si, že EXHW testuje len s 3.2GHz E6750 a my s 3.4GHz QX9650 ? keď si pozrieš výsledky v 1280x1024, 4xMSAA, 16xAF tak zistíš, že ani jeden nie je limitovaný procesorom. CrossFire sa teda mohlo prejaviť. CF z dvoch HD 3870 nie je to isté ako jedna HD 3870X2 ;-). Plus, EXHW použil iné ovládače pre GeForce grafické karty ... Viem si dobre predstaviť, že ti si so svojím CrossFire zapojením spokojný a hráš všetky hry "plynule" v rozlíšení 1920x1200. Nie každý vie zniesť kritiku, keď ide o jeho obľúbenú firmu, okrem toho mám asi "zlú" národnosť.
GABO
Zacinas liez na nervy, pretoze nemas argumenty. Proti extrahardware nemam nic, ale ked uz pises odkazy na nejaky test tak si najprv pozri co bolo obsahom a co vlastne autori sledovali. Tusim ze by sa ti vysmiali aj samotní autori testu na extraharware, ze miesas hrusky a jablka. Ja ta opet upozornovat nebudem, ale uz ani reagovat. Sa uvedom ze si neprisiel DO HNOJA, ale na serioznu stranku, ktora ma za sebou 8 rokov historie. Okrem toho SKUS NAM NEJAKE TIE ROZUMY HOVORIT radi si ich vypocujeme, alebo ja osobne, akurat mam pocit, ze by ten tvoj rozum bola bohapusta slama a hluposti bez Argumentov. Takze sa uz uvedom chlapce...
mefi
nedalo mi to a prečítal som si tu recenziu ešte raz, ale teraz som pekne každé slovo podstive, nebudem taký, že si nepriznám chybu, ano chyba na mojej strane, zle som pochopil váš test a ospravedlnujem sa, dufam, že sa mi taká moja zbraklá reakcia už nestane :),
srewq
No nemozem suhlasit ze je tato recenzia dobra a na jednicku,vsetko by bolo ok az na to archaicke rozlisenie.pri tomto rozliseni sa viac trapi CPU nez GPU.Ale inac myslienka dobra,sposob testovania tiez len nema to moc velku vahu kvoli tomu rozliseniu.Drzim palce aby to nabuduce dostalo novy a lepsi rozmer.
Pridať nový komentár
TOPlist