AMD/ATi Radeon HD 3870 (CrossFire)

Čip RV670


(očistené jadro RV670 bez chladiča)


RV670 vychádza z čipu R600 a predstavuje jeho evolúciu. Z tohoto dôvodu sa pozriem len na novinky a rozdiely voči R600. Odporúčam preto prečítať aj článok "R600 pod drobnohľadom”, kde je architektúra čipu R600 kompletne rozobratá.

Problémy R600 boli hlavne: vysoká spotreba – z toho vyplývajúca vysoká teplota jadra, hlučný chladič a v neposlednom rade aj výkon, ktorý neohromil ľudí, tak ako to očakávali. Tieto problémy si v AMD/ATi uvedomili a preto vznikol RV670. „V“ v názve značí „Value“ - teda cenovo výhodný čip. Výkonom možno zaradiť RV670 do „performance“ triedy ako svojho času známu RV570. Na výkon sa pozrieme v časti „Benchmark výsledky“. Cenou možno čip zaradiť do mainstream kategórie.

Kľúčovým faktom pre vznik RV670 bol výrobný proces. AMD/ATi vsadilo opäť na veľmi mladý half node 55nm proces “55GT” v TSMC, ktorý predstavuje optický shrink 65nm procesu. Prechod bol taký úspešný, že aj pracovníci ATi boli prekvapení. Ďalším pozitívnym vedľajším účinkom bolo, že sa predstavenie RV670 mohlo posunúť o ~2 mesiace dopredu z 1.Q 2008 na 4.Q 2007. Vďaka menšiemu výrobnému procesu, ktorý nemá okrem toho vysokú static power leakage ako 80HS sa výrazne zlepšili tepelné vlastnosti čipu – menšia spotreba a TDP. 400mm^2 obor R600 sa razom zmenšil o viac ako polovičku. Veľkosť jadra RV670 je len 193mm^2 (~ 13,8x13,8mm).


Celkovo bol návrh jadra R600 uprataný. Redundantné tranzistory boli vyhodené a došlo k viacerým optimalizáciám. Prístup k pamäti cache sa urýchlil, shader resolve v ALUs bol vylepšený a zvýšný bol aj geometry shader výkon. Presné čísla, ako je zvykom, AMD/ATi nemenuje. Špekulácie existujú aj o tom, že frekvencia ALUs je vyššia ako zbytok čipu – išlo by teda o “shader doménu” ako ju poznáme z G80. Či je to pravda nevieme. Vylúčiť to ale nemôžeme, nakoľko vlastní AMD/ATi už dlhšie podobný patent.

RV670 obsahuje rovnaký počet sampler, aritmetických a rasterizačných jednotiek ako R600, nakoľko predstavuje jeho shrink s určitými vylepšeniami. Vyjadrené v číslách – 4 sampler jednotky, 320 (64x5D ALUs) stream processing units a 4 quady rasterizačných jednotiek. Vďaka menšiemu výrobnému procesu môžu pracovať na HD 3870 s 11% vyššou frekvenciou – 775MHz. Tesselačná jednotka samozrejme ostala v desinge. Počet tranzistorov napriek tomu klesol. Zo 700 miliónov na 666 miliónov :-) (tu si môže každý doplňiť svoj vlastný vtip).


Technické parametre čipu "RV670"
Výrobný proces:
55nm @ TSMC
Počet tranzistorov: ~ 666 miliónov
Plocha a rozmery jadra: 193 mm2; 13,8 x 13,9 mm
Obal jadra: "Flipchip"
Základná konfigurácia: 16 textúr/ 16 pixelov/ 32x Z
Zbernica: 256-bit
8 x 32-bit
Podpora Direct3D: 10.1
Pripojenie k systému: PCI-Express 2.0 x16
Výstupy: 2x Dual-link DVI, HDMI, HDCP

Do vienka dostal RV670, ako prvý desktop consumer čip, podporu double precision IEEE 754. Presnejšie povedané 4/5 (256 SPUs) všetkých ALUs – tie “chudšie” môžu počítať s Double precision (DP) = 64bit presnosť spracovania všetkých dát so ¼ rýchlosťou. Preto klesne MADD aritmetický výkon na 1/5 (99,2 GFLOPs). Pokiaľ počítajú 4/5 ALUs s DP môže 1/5 = tie “výkonnejšie” počítať so single precision (SP). V tomto “mixed” móde je aritmetický výkon okolo 200 GFLOPs. Veľkú výhodu môže mať DP pre vedcov a iné skupinky ľudí, ktorý potrebujú 64bit presnosť pre svoje (GPGPU) aplikácie, nakoľko nie je 32bit presnosť dostačujúca.

Zmenšená voči R600 bola jedine šírka zbernice. V prípade R600 bol kladený dôraz na FP-16 výkon a tomu bol podriadený celý návrh. Napríklad: sampler jednotky, šírka zbernice, ALUs. Počaš života nepomohla 512bit zbernica R600. V budúcnosti sa to pravdepodobne zanedbateľne zmení. To už bude ale nezaujímavé, nakoľko aj výkon bude nedostačujúci. RV670 má preto “len” 256bit (512bit interný, dvojsmerný RingBus) zbernicu, ktorá je však mierne vylepšená a ďalej zoptimalizovaná. Hlavne arbiter jednotky boli mierne prepracované. V spojení s podporovanou GDDR 4 pamäťou má jadro vo väčšine prípadov dostatočnú priepustnosť k dispozícii aj preto, že vie lepšie narábať s priepustnosťou. Len v extrémnych situáciách má R600 s viac ako 100 GB/s priepustnosťou navrch.

Miesta na jadre ešte stále ostalo, tak prečo nepridať UVD (Unified Video Decoder), ktorý R600 neobsahuje ? UVD zaberajúci na 65nm čipoch RV630/610 len 4,5mm^2, urýchluje tri hlavné HD video formáty H.264, VC-1 a MPEG2. Vďaka tomu odbremeňuje CPU od výpočtov. V prípade RV670 dostal nový názov “UVD+” a podporuje rozlíšenia do 2560x1600.


Do čipu bola pridaná aj podpora najnovšieho Direct3D 10.1, ktoré bolo len nedávno vydané spolu so Service Packom 1 pre Windows Vista. Direct3D 10.1 predstavuje mierne vylepšené Direct3D 10, zjednodušuje programovanie vývojárom a podporuje nové rendering features. Pôvodne mali byť tieto features integrované už do Direct3D 10. Kvôli tlaku iných strán, hlavne nVidie sa MS rozhodol pre takýto posun.

Hlavné vylepšenia Direct3D 10.1 sú:

  • TextureCube Arrays which are dynamically indexable in shader code
  • The ability to select the MSAA sample pattern for a resource from a palette of patterns, and retrieve the corresponding sample positions
  • The ability to render to block-compressed textures
  • More flexibility with respect to copying of resources
  • Support for blending on all unorm and snorm formats

Zmeny to nie sú veľké, avšak umožňujú jednoduchšie vytvoriť content. Napr. Cube Map Arrays sa dajú využiť veľmi dobre na Global Illumination. Konečne by mal byť podporovaný MSAA v Deffered Rendering enginoch ako UT3 a pod. bez hackov zo strán nV/ATi.

Direct3D 10.1 prináša automaticky so sebou nový Shader Model. Tentoraz vo verzii 4.1. Zaujímavý je určite aj fakt, že D3D 10.1 ako prvý prikazuje podporu MSAA s minimálne 4 samplami pre všetky 32 aj 64bit formáty. Okrem toho majú 2x, 4x, 8x a 16xMSAA predpísané pozície samplov. Vyžadovaná je aj podpora FP-32 filteringu v TMUs a Int16 blendingu v ROPs.

Ak sa pozrieme na konkurenčné čipy od nVidie – G8x a G9x, zistíme, že im úplné podpora D3D 10.1 chýba. G92 nikdy nemal byť D3D 10.1 čip a teda ani ďalšie jeho deriváty nemajú túto podporu. Prečo sa tak nVidia rozhodla ? Nevieme to s úplnou 100% istotou, dá sa však predpokladať, že nV nepripisovala D3D 10.1 taký význam a tieto tranzistory radšej zainvestovala do niečoho iného. Konkrétne do “custom tranzistorov”, ktoré sú ručne navrhnované, upravované, aby Shader Core mohol pracovať na svojich vysokých frekvenciách. Pre lepší obraz o situácii ešte treba vedieť, že G92 sa nVidii nevydaril, tak ako chceli, obsahuje pomerne veľa tranzistorov, nedosahuje očakávané pracovné frekvencie. Okrem toho si ním nV strelila do vlastného kolena, keď predstavila GeForce 8800GT.

Ešte zreteľnejšie je vidieť ako nVidii nezáleží na podpore D3D 10.1 a snaží sa ho rôznymi cestami bojkotovať v rozhovore s CEO Cryteku - Cevat Yerli:

"We pride ourselves on being the first to adopt any important new technology that can improve our games so you would expect us to get with DX10.1 right away but we've looked at it and there's just nothing in it important enough to make it needed. So we have no plans to use it at all, not even in the future.”

(Crytek je v nVidia TWIMTBP programe)

a v nVidia dokumente o D3D 10.1

DirectX 10.1 is a minor extension of DirectX 10 that makes a few optional features in DirectX 10 mandatory”

Je teda logické, že AMD/ATi sa snaží robiť v tomto smere osvetu. Na svojich stránkach zverejnila dokument o Direct3D 10.1. Prednedávnom bolo zverejnené aj D3D 10.1 techdemo pre HD 3000 grafické karty. Techdemo má názov “Ping Pong” a v hlavnej úhlohe sú okrem loptičiek - Global Illumination, Dynamic Ambient Occlusion a MSAA s Deferred Shadingom.


Majitelia Radeon HD 3000 karty s operačným systémom Windows Vista a SP1 si môžu stiahnuť a nainštalovať timedemo zo stránky AMD/ATi. Pre nás ostatných bolo vytvorené video, ktoré si môžete buď stiahnuť, alebo pozrieť na YouTube.com.

(klikni pre zväčšenie)

Ako to vyzerá s D3D 10.1 hrami ? V najbližšom roku neočakávam väčšie množstvo hier, ktoré by využívali tento najnovší API (Application programming interface), nakoľko nVidia ešte nemá čip s plnou podporu. Zmení sa to pravdepodobne až s príchodom nového čipu GT200. nVidia bude nútená podporovať D3D 10.1, nakoľko Direct3D 11 bude oficiálne predstavené až s ďalším operačným systémom Windows Seven (7). MS hovorí oficiálne až o roku 2010. Väčšie množstvo D3D 10.1 hier, keď vôbec, očakávam preto v roku 2009.

S novinkami v čipe RV670 ešte neskončíme. Ako vidieť aj v tabuľke, čip RV670 podporuje najnovšiu verziu zbernice PCI-Express 2.0 zavedenú s Intel X38 čipsetom.Táto prináša zdvojnásobenie priepustnosti oproti PCI-Express 1.1 na 16GB/s pre oba kanály. Niečo podobné sa uskutočnilo aj v minulosti s AGP 4x – 8x. Na rozdiel od nVidie, hovorí AMD/ATi vo svojich dokumentoch až o 10% navýšení výkonu, vďaka vyššej priepustnosti novej zbernice. Na rozdiel od chýrov, poskytuje PCI-Express 2.0 rovnako ako staršia verzia maximálne 75W pre grafickú kartu. RV670 aj PCI-Express 2.0 sú spätne kompatibilné so staršími verziami, teda ani majitelia dosiek s PCI-Express 1.0, 1.1 slotom sa nemusia obávať o nekompatibilitu. Tú spôsobujú skôr (VIA) čipsety.


Na ohlasy nVidie o Quad-SLi a Tripple-SLi musela samozrejme zareagovať aj AMD/ATi a poskytnúť podobné riešenie. Výsledkom je podpora “CrossFire X” v čipoch RV670. Jedná sa v podstate o CrossFire, ktoré podporuje zapojenie viacerých – dvoch, troch a štyroch čipov.


(Štyri Radeon HD 3850 zapojené v CrossFireX)

Pre dual-CrossFire zapojenie dvoch čipov stačí jeden CF mostík. CF mostíky sa veľmi podobajú na nVidia SLI mostíky, sú len širšie a s nápisom “CrossFire”. Pre zapojenie troch čipov (kariet) je nutné využiť oba mostíky, aby boli všetky tri karty navzájom prepojené. Prvý čip s druhým, druhý s tretím. V prípade Quad CF pozostávajúceho zo štyroch kariet, ktoré je v 99% možné len zo štyroch Radeon HD 3850, je princíp zapojenia podobný ako v prípade troch kariet (čipov). Technicky by sa dali zapojiť aj štyri HD 3870, problém tu však nastáva pre dvojslotový chladič. Nie všetky základné dosky majú 8 slotov, z ktorých sú štyri PCI-Express. (výnimka existuje od spoločnosti Foxconn) Pre zapojenie dvojčipových kariet Radeon HD 3870X2 do CF stačí jeden CF mostík.



(klikni pre zväčšenie)


V ATi si zobrali spotrebu čipu RV670 k srdcu, preto obsahuje aj feature s názvom “PowerPlay”. PowerPlay je názov pre ďalšiu generáciu power management technológie, teda ekvivalent k Intel Speed Step na GPUs, ktorá bola doposiaľ integrovaná len do mobilných Radeon čipov pre notebooky. Dovoľuje dynamické zníženie frekvencie jadra, zníženie pracovného napätia a deaktiváciu výpočtových jednotiek, pokiaľ nie je potrebný maximálny výkon. O tom rozhoduje grafický ovládač, lebo vie zistiť vyťaženie jadra. Výsledkom je veľké zníženie spotreby v 2D režíme. Medzistupňom je nastavenie pre tzv. "light gaming" v ktorom pracuje len časť výpočtových jednotiek. Okrem toho garantuje AMD/ATi, že PowerPlay bude pracovať vždy synchronizovane s Vista power management profilmi.



Toto všetko teda získate v čipe RV670. Aby si ľudia nespájali nový RV670 so starým R600, nakoľko nebol najlepším čipom v histórii, bola zavedená nova séria Radeon HD 3000. RV670 ako najvýkonnejší čip patrí do Radeon HD 3800 sérii. Ako ste si mohli všimnúť, označenia XT, Pro vypadli a boli nahradené číslami. xx70 je ekvivalent k XT a xx50 k Pro. Vidieť tu vplyv od AMD, ktorá takéto označenia používa už dlhšie pre svoje procesory.



Komentáre (30)
amd_sk
Matej "crux2005" Koleják musim pochvalit. Vyborny test. proste nadhera.
Wild
krasna recenzia, takto by to malo vyzerat. Vzor recenzii...
A2C
Už som ti to písal ale musím ešte raz je to super ukážková recenzia
GABO
Tak ako trvalo to, ale tak výsledok je výborný...
palee
výsledok je myslím viac ako výborný :)
Rincewind
Tak za toto si zasluzis medailu. Len keby takych recenzentov bolo viac, na ceskych weboch o min fps nechcu ani pocut...
Pavel Čech
Super recenzia. Rozsahom aj kvalitou. Ine servery mozu o takych recenziach iba snivat...
miseno
ako ste rátali priemerné fps? Či len ako max a min delené dvoma, alebo ste použili štatistiku? Lebo takéto priemerné fps je dosť zavádzajúce. Napríklad extrem, nex nám minimálne fps klesne na 1 ale maximalne fps je 100, priemerne fps je 50. Ale napríklad ked minimalne fps neklesne pod 25 a max nevystupi na nad 75 tak takisto máme priemerné fps 50, ale myslím že tento drasticky rozdiel kazdy spozná.
baqq
priemerne fps test vyrata priebezne, nie ze minimum maximum x2, a ved predsa tam mas vzdy uvedene aj minimal FPS (co je velmi dobre, pretoze toto je asi najzaujimavejsia hodnota) takze lahko si to mozes overit podla udaja min., kt. tam je spomenuty.
quicky
akoze pekna recenzia,diky...ale jedna vec ma dost trapi....vseobecna vec,ze maximalne vyuzitie CF/SLI je pri rozliseniach 1600x1200 a viac...preco su teda robene testy v max 1280?to ako keby testujes jednu ati3870...sory ale toto je myslim najviac podstatne
Laci
Pekna recenzia. Vsimol som si malu chybicku: V tabulke technickych udajov su prehodene priepustnosti pamate medzi 3870 a 3850.
crux2005
@ miseno: vážený priemer je síce teoreticky pekný, ale prakticky je to 1.) komplikované 2.) znovu skreslujúce 3.) všeobecne nepoužiteľne. To čo je priemer v tabuľke je naozaj priemer zo všetkých nameraných FPS. Preto je okrem toho min, max údaj v tabuľke a máš aj priebeh FPS s časom. ;-) @ quicky: pokiaľ nemáme display s väčším rozlíšením k dispozícii, nemôžme ani testovať vo vyššom rozlíšení. Môžeš mi veriť, že sme sa pokúšali vybaviť 24" a viac palcové LCD, alebo CRT, ktoré podporuje aspoň 1600x1200. Nikto nám nechcel na testovacie obdobie - zhruba 2 týždne (5 kariet, 20 testov, opakované atď) vypožičať takýto monitor. CRT, ktoré malo prísť sa pokazilo. Teší nás, že sme vôbec dostali produkty od spoločností ako je Intel, Alphacool, Gigabyte, Asus, Sapphire, Microsoft, X-Spice @ www.bostar.cz, MSI @ www.agem.sk. Je mi jasné, že CF/SLI je hlavne pre vyššie rozlíšenia, 1280x1024 so 4xMSAA a 16xAF by ale mali zvládať tiež, nie ? hlavne keď je HD 3870 "len" performance karta s cenou mainstream karty a má 512MiB VRAM
Fragrance
niet čo dodať len že dakujem :)
quicky
mat by mali zvladat ,ale neprejavi sa plny potencial....hmmm ved uz len lok2 je z BA ,tak co ste sa nedali s nim dokopy ma ten isty monas ako ja 24" HPcko 1920x1200..samozrejme ak sa neda tak sa neda,len to b ol postreh no ,ze vlastne ste z toho CF nevytrieskali maximum a preto su aj vysledky take ake suu
quicky
samozrejme to neber ako kritiku alebo podobne:) len postreh,skvela praca:)
lacikaboss
:) hotova diplomovka..
mefi
tieto karty nie sú určené na hranie v rozlíšení 1680x1050 a nižšie, testovať ste mali na rozlíšení 1920x1200, pozrite sa napríklad na DD, EXHW, tam po ovládacoch 8.3 uznali a po 8.4 ešte aj viac potvrdilo, že 3870 X2 prekonáva 8800ULTRA, buď vaše testy boli nesprávne, alebo je to zámerna recenzia, čo dúfam, že nie, stačí si len trochu prezrieť a porovnať tie testy, pozor karta ktorá prekonáva 3870 X2 je 9800GX2 :), nedávam sem priamo linky, alebo presne ich názvy, aby ste nepovedali, že propagovanie atď., pls porovnajte tie testy :)
A2C
Neboj sľubujem že na ďalší test jeden monitor 24" zabezpečím možno Eizo :-)
lkuzman
Maťo, gramatika a občasné preklepy sú vedľajšie. Výpovedná hodnota Tvojej recenzie je sto bodov zo sto v rámci možností. Viem veľmi dobre koľko mravčej práce, nervov a voľného času ktorý bárs kto radšej strávi v krčme alebo kritizovaním Ťa to stálo. Keby som mal na ten 24" monitor, tak Ti ho kúpim - tomu ver. To že niekto niekde uvedie iba priemerné FPS, najlepšie v rozlíšení 640*480 :D svedčí o jeho neprofesionalite, nevedomosti problematiky a hrať sa? Asi to v živote na PC neskúsil. Prihrievanie polievočky sponzorom v podobe "grandiózneho vedeckého výsledku" - dvojdňovej "recenzie" je obyčajný alibizmus ... ako niečo zohnať zadara, resp ako si chytro zarobiť obyčajným treťotriednym ballastom. Milí sponzori, "recenzanti" a čitatelia, toto je recenzia hodná Vášich investícií, času. Teším sa na tú vo vyššom rozlíšení a dúfam že raz bude. Poklona. Ľ
GABO
"tieto karty nie sú určené na hranie v rozlíšení 1680x1050 " akosi som to odporúčanie od výrobcu nikde nenašiel ;-).
mefi
ked si takú kartu kupim tak chcem hrat na vyšších rozlíšenia a k tomu určite mám minimálne 22 monitor niečo iné je 3850
GABO
Takže to bol tvoj pohľad na vec? Mne ide o to, že hodnotíš recenziu na základe tvojich požiadaviek. Treba sa uvedomiť aj v uvádzaní webov ako príklad, lebo evidentne jeden z nich má charateristiku ako si napísal na nás...
cpy
FPS je vidno v každej recenzii, ale v tejto vidno aj scalovanie CPU čo sa málokedy vidí. Konečne vidno, že aj 4 jadrové CPU dokáže vyžrať novšia hra, pekne len tak ďalej. Každy si v tejto recenzii niečo nájde čo sa mu páči.
mefi
no já vam tu nebudem hovoriť rozumy, ked chcete vymazte to, ale len sa na ten test pozrite http://www.extrahardware.cz/megatest-grafickych-karet-ii-herni-testy-3dmark?page=0,1 EXHW poatrí k najlepším cz/svk webom :)
Gudas
mefi: recenzia pekná a čo? tu sa testovali 2x 3870 a nie 3870X2 vs. 88Ultra. Stále netuším, čo nám chceš povedať.
r1z1ko
Toto nieje megatest graf. kariet ale test CF 3780tiek...tak čo tu pletieš rozdielne testy... Táto recka je ako má byť prehľadná, rozsiahla, podrobná a každý si tak nájde podľa mňa to čo potrebuje vedieť o Ati Radeon 3870 a jej CF zapojení...
crux2005
Normálne ani neodpisujem na takýto typ odpovedí ... Nezdajú sa ti výsledky 2x HD 3870 @ CF dosť nízke, čo sa týka FPS ? Okrem toho, nevšimol si si, že EXHW testuje len s 3.2GHz E6750 a my s 3.4GHz QX9650 ? keď si pozrieš výsledky v 1280x1024, 4xMSAA, 16xAF tak zistíš, že ani jeden nie je limitovaný procesorom. CrossFire sa teda mohlo prejaviť. CF z dvoch HD 3870 nie je to isté ako jedna HD 3870X2 ;-). Plus, EXHW použil iné ovládače pre GeForce grafické karty ... Viem si dobre predstaviť, že ti si so svojím CrossFire zapojením spokojný a hráš všetky hry "plynule" v rozlíšení 1920x1200. Nie každý vie zniesť kritiku, keď ide o jeho obľúbenú firmu, okrem toho mám asi "zlú" národnosť.
GABO
Zacinas liez na nervy, pretoze nemas argumenty. Proti extrahardware nemam nic, ale ked uz pises odkazy na nejaky test tak si najprv pozri co bolo obsahom a co vlastne autori sledovali. Tusim ze by sa ti vysmiali aj samotní autori testu na extraharware, ze miesas hrusky a jablka. Ja ta opet upozornovat nebudem, ale uz ani reagovat. Sa uvedom ze si neprisiel DO HNOJA, ale na serioznu stranku, ktora ma za sebou 8 rokov historie. Okrem toho SKUS NAM NEJAKE TIE ROZUMY HOVORIT radi si ich vypocujeme, alebo ja osobne, akurat mam pocit, ze by ten tvoj rozum bola bohapusta slama a hluposti bez Argumentov. Takze sa uz uvedom chlapce...
mefi
nedalo mi to a prečítal som si tu recenziu ešte raz, ale teraz som pekne každé slovo podstive, nebudem taký, že si nepriznám chybu, ano chyba na mojej strane, zle som pochopil váš test a ospravedlnujem sa, dufam, že sa mi taká moja zbraklá reakcia už nestane :),
srewq
No nemozem suhlasit ze je tato recenzia dobra a na jednicku,vsetko by bolo ok az na to archaicke rozlisenie.pri tomto rozliseni sa viac trapi CPU nez GPU.Ale inac myslienka dobra,sposob testovania tiez len nema to moc velku vahu kvoli tomu rozliseniu.Drzim palce aby to nabuduce dostalo novy a lepsi rozmer.
Pridať nový komentár
TOPlist