Špekulatívne preview G200: high-end ako sa patrí?

Necelé 2 týždne nás delia od oficiálneho uvedenia novej generácie grafických čipov u AMD/ATi a nVidie. Na rozdiel od G200, neboli zatiaľ (podľa mojich vedomostí) o AMD/ATi čipe RV770 zverejnené na internete skoro žiadne pravdivé informácie. V tomto preview si teda predstavíme niekoľko technických detailov a noviniek G200, ktoré máme potvrdené z viacerých zdrojov a mali by byť pravdivé. Komplexný článok venovaný novej architektúre je naplánovaný s určitým časovým odstupom po vydaní grafických kariet ...

(GeForce GTX 280 bez chladiča, zdroj: pcinlife.com diskusné fórum)

Grafické karty založené na čipe G200 sa budú nazývať GeForce GTX 280 a 260, pričom predstavuje GTX 280 znovu 10 clusterový čip - so všetkými výpočtovými jednotkami a GTX 260 je osekaná a lacnejšia varianta s 8 clustermi. Samostatné karty - teda ich PCB bude veľmi podobné tomu, ktoré poznáme z GeForce 8800 GTX, s rovnakou dĺžkou 10,5" = zhruba 27cm. Samozrejme, komplexnosť PCB narástla, kvôli ďalej zmieneným technickým zmenám. Predpokladá sa znovu nasadenie NVIO externého čipu, nakoľko bude čip G200 veľký. Veľké vyjadrené v číslach je 576mm^2. Pre porovnanie, G80 mal ~ 484mm^2. nVidia týmto ťahom, presunúť určitú časť I/O jednotiek do externého čipu, ušetrila tranzistory a plochu jadra.


(jadro G200 vo flipchip dizajne s HS na ochranu)

G80 bol vyrábaný 90nm výrobným procesom 90GT u TSMC. Jeho počet tranzistorov bol danú dobu naozaj ťažko uveriteľných ~ 681 miliónov. U G200 ide nVidia ďalej a vsadila na 65nm proces, ktorý bol už vyskúšaný s čipmi G92/G94. Preto mohol aj narásť počet tranzistorov, ktorý je podľa viacerých zdrojov okolo 1.4 miliardy! Podobný počet tranzistorov majú serverové procesory od Intelu. Je tu ale jeden veľký rozdiel, v prípade grafických čipov zaberajú skoro celý počet logické tranzistory na rozdiel od procesorov, kde je to pamäť cache. Náročnosť pri výrobe je teda niekde úplne inde. Oproti G92 je to skoro zdvojnásobenie. Takýto veľký počet tranzistorov investovala nVidia do výpočtových jednotiek. Podľa jednoduchej logiky by mal mať G200 zdvojnásobené všetky najpodstatnejšie výpočtové jednotky G92. 8 clusterový G92 ich mal: 64 TMUs, 128 SPs, 16 ROPs, 256bit zbernica. Čisto teoreticky samozrejme. Reálne tomu úplne tak nie je.


(jadro G200 pod mikroskopom)

G200 na GTX 280 bude obsahovať pravdepodobne 80 TMUs (textúrovacích jednotiek), nie je ešte celkom jasné, či má 80 TFUs (filtrovacích) a 80 TAUs (adresovacích), alebo má polovičný počet TAUs v cluteroch ako G80. V konečnom dôsledku je to pri reálnych hrách jedno, pretože sa minimálne trilineárne filtrovanie často využíva. Rozdiel je jedine v "číselku", ktoré stojí za čistým texelfillrate-om. Bližšie sme o venovali problematike v diskusnom fóre a technických detailoch grafických kariet. GTX 260 má aktívnych len 8 clusterov. Každý cluster obsahuje 8 TMUs, dokopy 64 aktívnych TMUs. V hrách narastá potreba aritmetického výkonu oveľa rýchlejšie ako potreba texelfillrate, preto nemusela nV zvýšiť počet TMUs výrazne. Výkon shader-core by si ale zaslúžil poriadny nárast výkonu oproti G9x. Tak sa aj stalo. GTX 280 obsahuje 240 marketingovo nazvaných "stream procesorov", čo sú vlastne "skalárne" ALUs. Skalárne v uvodzovkách preto, lebo reálne sú to stále Vec jednotky. Len vďaka riadiacim jednotkám sa ale tvária ako skalárne. Shader-core GTX 280 pozostáva reálne z desiatich Vec 24 jednotiek (G80 obsahoval 8 * Vec 16 ALUs) s plnou podporou double precision - 64bit presnosť spracovania údajov. GTX 260 má aktívnych len osem Vec 24, dokopy 192 ALUs. O podpore Direct3D 10.1 možno len špekulovať. Okrem ALUs by musela nVidia upraviť aj TMUs, či tak spravila je viac ako otázne. Aritmetický výkon by sa teda aspoň podľa počtu jednotiek ani nezdvojnásobil. Skutočnosť je ale iná. Prečo to je tak, nám ukáže až ďalšie vylepšenie G200 oproti G80/G92. Každá ALU alebo SP, dokázala od G8x cez G9x - 3 floating point operácie za takt = MAD + MUL.

3 FLOPs/s * počet ALUs * ich pracovná frekvencia = aritmetický výkon.

Reálne v hrách sa dali na general shading využiť ALUs G8x/G9x ale len na 2 floating point operácie za takt - teda len MAD. Dôvod je ten, že druhá MUL (MAD pozostáva z ADD + MUL) bola využívaná na korekcie perspektív, interpoláciu. Len vo veľmi MUL intenzívnych testoch ju bolo možné od ovládača ForceWare 158.19 využiť na 15% aj na general shading. V hrách je toto vyťaženie samozrejme menšie. Reálne majú preto všetky GeForce 8/9 grafické karty založené na G8x/G9x aritmetický výkon o 1/3 menší ako je udávané na "papieri". V prípade G200 to ale neplatí. nVidia "našla" missing MUL, vďaka tomu, že ju odbremenila a pridala ďalšie sub-jedotky do shader-core, ktoré sa teraz starajú o tieto vyššie zmienené operácie.
Keď si teraz porovnáme aritmetický výkon nám vychádza, že GTX 280 ho má zhruba trojnásobný oproti 8800 GTX (933 GFLOP/s vs. 345 GFLOP/s). Dostali sme sa k hodnote aritmetického výkonu G200, ktorá je zhruba 933 GFLOP/s. O pár GFLOP/s pod magickou a psychicky dosť podstatnou hranicou 1 TFLOP/s.
Dôvod prečo sa tak nVidia rozhodla možno len dedukovať. Pracovné frekvencie sa určujú až relatívne na konci vývojového štádia a závisia od veľkého množstva faktorov. G200 si zachovala schopnosť, že jej shader-core pracuje na vyššej frekvencii ako zvyšok čipu. Toto je možné len vďaka ručne optimalizovaným custom tranzistorom. Vráťme sa ale k frekvencii, ALUs G200 budú pracovať s frekvenciou okolo 1297 MHz a na docielenie 1 TFLOP/s by bola minimálne nutná frekvencia 1389 MHz. S vyššou frekvenciou sa ale zvyšuje stratové teplo produkované čipom, jeho vyťaženosť pri výrobnom procese atď. Okrem jedného pozitíva - mierne vyššieho aritmetického výkonu to má viaceré negatíva. nVidia sa preto asi rozhodla proti.


Na "konci" render pipeline sú ROPs, na ktoré sa teraz pozrieme. G200 so všetkými výpočtovými jednotkami ich má mať 32. Osekaná verzia 28. Oproti G80 sa dočkali viacerých vylepšení, ktoré aspoň z časti poznáme. ROPs G200 obsahujú rovnaké vylepšenie oproti G80 týkajúce sa lepšej kompresie Z/stencil a inteligentnejšieho z-cullingu ako má G92. Zvýšené boli aj schopnosti blender jednotiek v ROPs, ktoré sú oproti G80 až 3x výkonnejšie. Nakoľko má mať G200 stále crossbar a šírka zbernice závisí priamo úmerne od počtu ROPs, vyplýva nám, že GTX 280 bude mať 512bit zbernicu. Osekaná verzia GTX 260 bude mať preto len 448bit zbernicu (16*28). Predpokladá sa znovu rozdelenie kanálov na 64bitové, lebo sú 32bit príliš drahé na počet tranzistorov. Z toho nám vyplýva 16 pamäťových čipov na PCB (512/32 = 16). 8 na prednej strane a 8 na zadnej. Celková kapacita VRAM GeForce GTX 280 má byť 1GiB, ako sa pre high-end kartu patrí. GTX 260 sa bude musieť uspokojiť so 896MiB VRAM. G200 potrebuje podľa testov okolo 140 GB/s priepustnosť. Priepustnosť sa dá dosiahnuť viacerými spôsobmi. Vďaka zbernici a frekvencii pamäte. nVidia sa kvôli otáznej dostupnosti GDDR 5 pamätí, rozhodla pre 0,83ns GDDR 3 pamäte. Nutná bola preto 512bit zbernica. Grafická karta GeForce GTX 280 bude mať preto k dispozícii ~ 140 GB/s priepustnosť.

Pri pohľade na čisto papierové technické parametre, nie je G200 dvojnásobný G80/G92. Vďaka viacerým vylepšeniam, ale bude dosahovať aj trojnásobný výkon oproti G80 a ešte väčší oproti G92, keď menovanej budú limitovať ROPs a veľkosť VRAM. Medzi takéto vylepšenia, ktoré som ešte nespomenul patria: väčšie cache pamäte, ktoré by v spojení s veľkou priepustnosťou mali zaručiť oveľa nižší prepad výkonu s 8xMSAA ako to bolo na G80. Zlepšený triangle setup, na "začiatku" čipu. Vďaka nemu by sa mal zvýšiť geometry a vertex shader výkon, ale aj iné, súvisiace veci - ako už vyššie zmienený 8xMSAA.


(výkonnostné údaje nových G200 grafických kariet oproti Radeon HD 3870X2, nenechajte sa oklamať veľkosťou stĺpca, ktorá je zavádzajúca, podstatný je nárast výkonu uvedený vľavo)

Keďže má G200 takéto veľké množstvo jednotiek a shader-core bežiaci na vyššej frekvencii, nemusela sa oproti G80 veľmi zvyšovať frekvencia. V porovnaní s G92 je dokonca znížená na 602 MHz v prípade GTX280 a 576 MHz na GTX 260. Napriek tomu je TDP veľmi vysoké, až 236W u GTX 260 a 182W u GTX 260. Reálne očakávam nižšiu spotrebu, pohybujúcu sa na GTX 280 ~ 180W v záťaži a ~ 130W s GTX 260. Samozrejmosťou sa tak stáva dvojslotový chladič, ktorý je svojim výzorom veľmi podobný tomu na GeForce 8800 GTX . Oproti predchádzajúcim grafickým kartám je to značný nárast v spotreba, kto chce ale maximálny výkon, musí túto skutočnosť akceptovať. Dvoj až trojnásobný G80 výkon za ~ 50% vyššiu spotrebu. Tomu hovorím veľmi dobrý pomer výkon/W. Som zvedavý, či sa konkurencii podarí priblížiť, alebo nie.


Vysoký výkon, veľký čip, vysoké teoretické parametre, viaceré interné vylepšenia v čipe, veľká VRAM a mierne vyššia spotreba. High-end ako sa patrí ? Podľa mňa určite áno, v zmysle výkonného single-čipového riešenia, ktoré je zatiaľ stále lepšie ako dvojčipové karty typu GeForce 9800 GX2, Radeon HD 3870 X2 a iné. Pre množstvo nedostatkov a v neposlednom rade aj pre ovládače, nevidím tieto karty ako alternatívu. 17. júna 2008 padnú tieto karty rýchlo do zabudnutia, lebo ich vystrieda na výkonnostnej špici nová generácia, aspoň u nVidie, ktorá ponúka vo všetkých smeroch "viac". Vysoká bude logicky aj cena. nVidia udáva ako odporúčanú cenu pre GeForce GTX 280 $650 a pre GTX 260 $449. V Európe sa tieto ceny pravdepodobne prerátajú 1:1 na Euro. Ak k tomu pridáme v prvých dňoch nižší počet dostupných kariet, sa môže cena GeForce GTX 280 vyšplhať aj na 24 000 SK. GTX 260 bude mať už od začiatku oveľa prijateľnejšiu cena a ďalšia výhoda je, že nie je v pomere tak veľmi osekaná ako bola svojho času GeForce 8800 GTS oproti GTX.


(vybrala nVidia správny termín vydania ? o tom by sa dalo určite polemizovať ;-) ...)

Zdroje: rôzne

Príbuzné články:
Odporúčame:


Komentáre (18)
doomed
Super clanok,sakra ta cena ma od teh 280gtx dost odradza aj ked to nie je finalne..keby sa zmestila do 20 litrov by bolo ok ved uvidime.
Tomus
podla mna tato karta ziadnu revoluciu nespravi... par freakov si ju kupi ale pre ostatnych je proste prilis draha + ta spotreba...
Bmw_case
Dufam ze to ovplyvni ceny kariet.. V semptembri/oktobri sa chystam postavit komp tak dufam ze dovtedy bude trh it inde ako teraz .. Len tak dalej..:) Este si pockame co pre nas pripravi ATi.. :)
Bmw_case
..len aby sa nezabdlo...
Tom2871989
no tak cena vychadza "iba" na 13000SK ale to zas nie je tak vela v porovnani s 8800 Ultra ked stala okolo 20000SK
doomed
akoze vychadza iba 13 000 ?...
tom247
tak to s mojou ManLi GeForce FX52OO 128MB sa asi nechytam, ze? :-D
Sapphire
No, tato karta urcite revoluciu nespravi, je proste prilis draha a suhlasim s Tomusom. Myslim, ze ked budu superit AMD/ATI HD4870 a nVidia GTX 280, tak urcite bude na trhu vyhravat predavanostou ATIcka, lebo ta nVidia to s tymi cenami akosi prehana, vlastne im platime polovicu ceny len za reklamy v hrach.
dexter
jo problém je cena... jediná výhoda je že ten výkon nie je dosahovaný SLI zatiaľ podľa tohto bude na tom HD4870 oveľa lepšia
NaP0LeOn
to co je za blbost ! preco sa to prerata 1:1 ?? Sak 650 $ je okolo 13 000 sk s DPH skladova cena bude nizsia :) a v Eurach je to okolo 18 500 sk ! dpc to aby som si to siel kupit do ameriky ! toto je svinstvo . pche. 20 000 sk , no urcite. to uz mam Ati HD 4870 v CFx Je to moc. Preco nVIDIA neskusila 55nm proces ? ked je lacny ? preco nedala DDR5 ? ked je to lacne ? Ati uz davno to ma ..
Gudas
2NaP0LeOn: Prečo sa to prerátava 1:1? Lebo zisk. Skladová cena nebude nižšia, v Európe určite nie. Prečo nedala nvidia gddr5 pamäte? lebo je problém s dostupnosťou (viď oneskorenie HD4870).
dexter
no jaksi platí 1USD = 1EURO :o/ to že by bolo GPU 55nm neznamená automaticky nižšiu cenu ale len vyššie zisky pre NV ... a prečo DDR5??? čo pomohli DDR4 HD3870 ??? nič okrem väčšej ceny... obávam sa že DDR5 nebude moc extra dostupné...
NaP0LeOn
hanba. A co myslite ? kto si kupit GTX 280 ? asi len 5 - 10 percent z hracov PC celeho sveta. ATi ta bude mat zisky. ajaaaj :) Ale sak pozrite DDR5 ma dost dobru rychlost ( priepustnost 122 gb ) u HD4870 co je len o 20gb menej ako u GTX 280 ! Keby mala GTX 280 DDR5 tak by mala priepustnost okolo 200 gb co by bol Excelentny H-E na 3 roky !
crux2005
"Keby mala GTX 280 DDR5 tak by mala priepustnost okolo 200 gb co by bol Excelentny H-E na 3 roky !" vidieť, že sa vyznáš a objasníš nám, prečo by vďaka "200gb" bola GTX 280 high-end grafická karta na "3 roky !" :-)
lavak
ASUS ENGTX280/ HTDP 1G sa uz da objednat za 15500Sk, celkom prijatelna cena.
skipi
cena by nemusela byt taka hrozna, prvy e-shop v ktorom ju zbadal na SVK bola karta za 15 tis., samozrejme ta cena sa este moze zmenit,ak bude velky zaujem a malo kariet ako to bolo u 88GT
baqq
rofl high end na tri roky :D to bol fakt skvely vyrok :)))
FragStop2
GTX280 bude trhač, neviem prečo s tým majú niektorí problém :)... ale musíme pochopiť, že chalanisko (napoleon) sem prišiel z ddworldu, tak sa netreba čudovať, fanATIci rlz...:))))
Pridať nový komentár
TOPlist