Bulldozer a Bobcat, nová éra AMD

O nových architektúrach procesorov hovorí AMD v poslednej dobe často. Niet divu, za posledné roky to bude jedna z najdôležitejších udalostí, od úspechu ktorej sa bude odvíjať celá budúcnosť firmy. Túto budúcnosť chce AMD stavať na jadrách Bulldozer a Bobcat.

Úvod

Dnešná generácia procesorov od AMD je nazývaná aj architektúrou K10. Tá má korene ešte v slávnej K8, ktorá v časoch Pentium 4 (Netburst) dobre „nakopávala“ konkurenciu po stránke výkonu a hlavne spotreby. V K10 sa implementovali mnohé viac či menej radikálne zmeny, ktoré vylepšili výkon oproti predošlej generácii. Spomeňme napríklad cache tretej úrovne, nová 128-bit floating point jednotka (dvojnásobok oproti K8), fetch jednotka schopná spracovať 32 bajtov za takt (dvojnásobok oproti K8), zlepšený Branch prediction alebo aj vylepšené usporadúvanie inštrukcii (out-of-order execution). Nový bol aj pamäťový radič, teraz nezávislý od taktu procesora a všetky jadrá sa mohli taktovať osobitne pre úsporu energie (v skutočnosti sú jadrá nezávisle taktovateľné len v Phenom I (65nm) a Phenom II X6 (45nm)).

Vo svojej prvej iterácii – 65nm Phenom I procesoroch, nedosiahli tieto čipy až taký veľký komerčný úspech ako by si možno v AMD predstavovali, nepríjemnou udalosťou bolo aj objavenie „TLB bug-u“ v predajnej revízii B2. Napriek tomu, že problém sa prejavoval len vo veľmi zriedkavých prípadoch a mnohým sa ho vôbec nikdy nepodarilo reprodukovať, medializovanie dohnalo AMD ku konaniu – oprava sa dala vykonať cez aktualizovaný BIOS. Ten však dokázal ukrojiť podstatnú časť z výkonu, ktorý už aj tak trocha zaostával voči konkurencii (Core 2, hlavne kvôli 65nm výrobe – nižšie takty a malá L3 cache).
Oprava v podobe B3 revízie prišla o niekoľko mesiacov neskôr, avšak to, čo K10 architektúra najviac potrebovala – vysoký takt, nižšiu spotrebu a poriadnu L3 cache, dostala až s 45nm procesom.

Dnes predávané Phenom II a Athlon II procesory ešte stále zaostávajú za konkurenciou v disciplíne nízkej spotreby a to predovšetkým kvôli absencii high-k materiálov v tranzistoroch, ktoré zabraňujú lepšie stratovým prúdom, ale taktiež kvôli absencii technológie power-gating-u, ktorá nevyťažené jadrá takmer úplne odpája od napájania. Avšak čo sa výkonu týka, AMD nielen dobehlo 45nm Intel Core 2 procesory, ale svojou stratégiou viac jadier za nižšiu cenu dokáže úspešne konkurovať aj novým Core i3 / i5 / i7 čipom. Nehovoriac o stále mierne lepšej cene celej platformy (CPU + základná doska).

Jedna vec však pre AMD stále dobre nefunguje. K10 ako architektúra sa rozprestiera cez celé spektrum ponuky firmy – teda od najvýkonnejších serverov, cez šesťjadrové Phenom-y II X6 pre desktop až po notebookové procesory či dokonca čipy so zameraním pre čo najnižšiu spotrebu pre ultra-thin notebooky. Je celkom jasné, že jedna architektúra nemôže fungovať celkom ideálne úplne všade. Tou oblasťou kde AMD aj dnes stráca na konkurenciu celkom výrazne sú práve mobilné procesory. Spotreba je oproti Intel CULV čipom či Atom-u jednoducho privysoká. Napriek tomu že v poslednom kvartáli AMD zaznamenáva nárast na poli mobilných zariadení, chcelo by to niečo lepšie.

A práve tu sa dostávame k téme Bulldozer a Bobcat.





Na prelome rokov 2010 a 2011 sa AMD vydá celkom novou cestou. Pre každú oblasť trhu bude mať samostatný dizajn jadra. Každá oblasť teda dostane to, čo potrebuje. Bulldozer bude určený pre ten najvyšší výkon v serveroch, pracovných staniciach a desktopoch vyššej triedy, stredná trieda dostane Llano s integrovaným grafickým jadrom a procesorovými jadrami typu K10, najúspornejšie notebooky a prenosné zariadenia zas Bobcat. Bulldozer a Bobcat sú pritom celkom nové architektúry, postavené úplne od základov nanovo.



Bulldozer

Bulldozer má byť hodný svojho mena – veľký a silný. Fakt, že pôjde o high-end, môže dokladať aj to, že sa vôbec neobjaví procesor s takýmto jadrom a integrovanou grafickou časťou. To je parketa pre strednú triedu. Podľa zástupcov AMD sa však samozrejme na neskôr plánujú aj Fusion procesory Bulldozer + grafické jadro, to je však zatiaľ iba hudba budúcnosti.

Z najvyššieho pohľadu bude procesor s Bulldozer jadrom vyzerať nasledovne:





U Bulldozer-a prichádza AMD s tzv. modulmi. Každý jeden modul obsahuje dve „jadrá“. V uvodzovkách preto, lebo nepôjde o úplne plnohodnotné jadrá. V podstate sa dá predstaviť jeden Bulldozer modul ako niečo medzi jednojadrom s HyperThreadingom a skutočným dvojjadrom. U HyperThreadingu sa jedno fyzické jadro procesora tvári pre operačný systém ako dvojjadro, podobne Bulldozer. Avšak na rozdiel od Hpyerthreadingu, ktorý využíva rôznu tranzistorovú logickú „mágiu“ na to, aby poslal cez jednu pipeline dve výpočtové vlákna a vyťažil jadro tak čo najviac, má Bulldozer zdvojenú celú integer jednotku, vrátane shedulerov a L1 cache. Spracovanie dvoch vlákien teda vyzerá zjednodušene takto:





Integer jednotky sú v každom module dve, ostatné časti sú zdieľané. Ak by ste sa pýtali, prečo práve integer jednotky sú zdvojené a nie napríklad jednotky Floating Point, AMD má odpoveď – podľa výskumu viac než 80% všetkých bežných vykonávaných úloh využíva Integer jednotky, preto má najväčší zmysel pre zvyšovanie výkonu práve viac Integer častí procesora. Naopak, rozhodnutie použiť zdieľané prvky dáva výhodu v menšej ploche čipu a aj nižšej spotrebe.

Na konferenčnom hovore padla aj otázka, ako bude AMD nové Bulldozer procesory označovať – napríklad pri dvojmodulovom čipe so štvoricou Integer jednotiek. Možnosti sú dve, že buď ako štvorjadrový CPU (štyri integer jednotky), alebo ako dvojjadrový CPU (dva moduly). Odpoveď bola jednoznačná – jeden modul je pre operačný systém viditeľný ako dve jadrá, preto aj procesory bude označovať firma rovnako. Teda ak uvidíte v cenníku AMD procesor označený ako štvorjadrový, bude to znamenať že má dva Bulldozer moduly.

Ktoré časti sú zdieľané na úrovni jedného modulu a na úrovni celého procesora vidno na nasledujúcej grafike:





Veľmi horúcou témou je spätná kompatibilita. Socket pre Bulldozer procesory sa dnes označuje ako AM3r2, teda by sa zdalo že táto „revízia 2“ by mohla znamenať že dnešný AM3 socket by akceptoval aj Bulldozer čip. Odpoveď od AMD nie je zatiaľ celkom jednoznačná. Ak aj kompatibilita bude zachovaná, má to byť na úkor niektorých funkcií a technológií, možno teda aj výkonu.

Bulldozer pridá aj nové inštrukcie – pribudne rodina AVX, tiež niekoľko inštrukcií pre akceleráciu šifrovacieho AES algoritmu. AMD údajne spolupracuje s Intel-om na tom, aby tieto inštrukcie boli navzájom kompatibilné, čo by znamenalo podstatné uľahčenie práce vývojárom softvéru. Rodina SSE5 by mala byť implementovaná iba z časti.

Prvé procesory s novým jadrom budú vyrábané 32nm SOI procesom. U neho sa už ráta aj s nasadením high-k metal gate u tranzistorov, čo by malo znamenať podstatné zníženie stratových prúdov, ktoré sa stávajú pri menších procesoch stále väčším problémom. AMD údajne zavedie aj nové funkcie pre šetrenie energie, predpokladám že sa bude jednať o určitý ekvivalent power-gatingu. Všetko toto už mal Intel od prvých 45nm čipov (Core 2 – high-k materiály, Core i7 – power-gating).

K modelovým označeniam sa AMD zatiaľ nevyjadruje, podobne je firma skúpa na slovo aj pri zmienke výkonu. Naznačené bolo iba takéto porovnanie:





V skratke – 33% viac jadier a k tomu 50% viac výkonu pri rovnakej spotrebe. Najvyššie desktop modely Bulldozer čipov budú mať štvoricu modulov, teda 8 jadier. Podobne ako je dnes serverový Magny-Cours dvojicou šesťjadrových čipov (12 jadier), tak sa dá očakávať pre servery aj dvojnásobný Bulldozer – teda 16 jadrový procesor. Toto predstavuje presne spomínaných 33% jadier navyše. Tieto čísla však AMD dosiahlo v neuvedených interných benchmarkoch, na prvé závery si teda musíme ešte počkať.

V Phenom II X6 procesoroch zavádza AMD novú funkciu TurboCore. Všetci teda očakávame, že niečo také sa objaví aj u chystaných noviniek. Podľa správ priamo z AMD sa podobná technológia bude v Bulldozer čipoch nachádzať, pôjde však o bližšie neurčený ekvivalent. Určité časti procesora by sa teda podľa záťaže mali frekvenčne prispôsobovať – pretaktovať.



Bobcat

Namiesto toho, aby v AMD upravovali pre najmenšie a najmobilnejšie notebooky niektoré z existujúcich procesorových jadier, rozhodli sa vytvoriť celkom nové. Podobne ako Intel už dávno má svoj Atom, bude aj Bobcat pre AMD želiezkom v ohni na stále rastúcom trhu mobilných počítačov a zariadení.

Bobcat je dizajn, ktorý berie ohľad hlavne na nízku spotrebu a sústredí sa výhradne na svoj cieľový segment. Je to teda niečo celkom iné, ako vidíme dnes, keď architektúra v mobilných procesoroch je rovnaká ako u desktopových Athlon-och či Phenom-och.





Bobcat procesor by mal byť schopný dosiahnuť spotrebu iba 1W a menej, takéto produkty sa však na trhu podľa vyjadrenia zástupcov AMD nedostanú. Tvrdenie o
Na rozdiel od Intel Atom, má Bobcat Out-Of-Order dizajn. Znamená to, že procesor si vie inštrukcie pred samotným spracovaním usporiadať do čo najlepšieho a najefektívnejšieho poradia. Zvýši sa tým zložitosť, no na druhej strane je tu prínos vyššieho výkonu. Podobné low-power x86 jadro s Out-Of-Order exekúciou inštrukcií má napríklad VIA.
Zlepšením mala prejsť aj technika predikcie vetvenia programu (branch prediction), čo takisto mierne prispeje k vyššiemu výkonu. Samozrejmosťou je podpora 64-bit inštrukcií a teda aj 64-bit operačných systémov s možnosťou využitia viac ako 4GB RAM pamäte.
Podporované budú inštrukčné rodiny SSE1, SSE2, SSE3 a SSSE3 ISA, nebude chýbať virtualizácia.





Po stránke redukcie spotreby urobili inžinieri v AMD niekoľko krokov. Okrem „povinných“ vecí ako Clock Gating (podtaktovanie v stave nečinnosti) a Power-Gating (takmer úplné odpojenie od napájania pri nečinnosti jadra) je pre nižšiu spotrebu uspôsobená aj samotná architektúra. Tá napríklad minimalizuje zbytočné presuny dát, ktoré by „zobúdzali“ výpočtové jednotky, vykonávanie inštrukcií má byť takisto lepšie optimalizované.

Bobcat jadro je uspôsobené na to, aby bolo ľahko integrovateľné do SoC (System on Chip) – teda kombinácie spolu s inými čipmi (napríklad bezdrôtovými čipsetmi a podobne). Tiež má byť prechod medzi rôznymi výrobnými procesmi jednoduchý, čo by mohlo znamenať, že si AMD môže nechať vyrábať Bobcat jadrá u viacerých výrobcov, prípadne poskytovať architektúru pre výrobcov SoC.

Bobcat však nie je iba x86 jadro. Na jednom čipe integruje aj pamäťový radič, grafické SIMD jednotky a UVD časť pre akceleráciu videa (Unified Video Decoder). Ide teda o prvú APU - accelerated processing unit na trhu. Aký výkon bude grafická časť poskytovať je zatiaľ neznáme, dá sa však odhadnúť že spolu s x86 jadrami bude minimálne na HD video a Adobe Flash postačovať. Viac ale ani od netbookov a tabletov nemožno očakávať.





O výkone AMD opäť hovorí iba v nejasnom porovnaní. Procesor založený na Bobcat jadre by mal poskytovať približne 90% výkonu zo súčasnej strednej triedy notebookových čipov. To pri menej ako polovičnej veľkosti a iba zlomku spotreby. Ktorý procesor má predstavovať súčasnú strednú triedu ja naozaj ťažké odhadnúť, môže to byť niečo na spôsob 1,8GHz až 2,0GHz dvojjadrového, 45nm Athlon II.

Predstavenie Bobcat procesorov by malo nasledovať už čoskoro, zrejme ešte tento rok. Prvé reálne dostupné produkty potom môžeme očakávať v roku 2011.



Záver, alebo kde je Llano

Do obrazu kompletnej ponuky nám ešte chýba stredná trieda – Llano. Tieto procesory sa na trhu objavia až v priebehu prvej polovice roka 2011, dôvodom je pár problémov s výrobným procesom. Aj kvôli tomu ešte AMD o týchto čipoch ešte moc nehovorí.

Llano poslúži ako stredná trieda jednak pre desktop, kde sa ráta so štvorjadrami (architektúra K10 s miernymi vylepšeniami) s integrovaným grafickým jadrom (údajne až do 480 stream procesorov), ale aj pre notebooky. V mobilnom segmente sa integrácia relatívne výkonnej grafiky celkom hodí, výrazne sa zníži počet čipov na doske a tým aj spotreba a rozmery. Rátať treba ale s novým socketom, práve kvôli videovýstupom z procesora. Bližšie som sa venoval téme socketov v tejto aktualite.
Téme Llano sa budeme ešte určite venovať, podrobnejšie zrejme až tesne pred predstavením, keď už budú známe (a hlavne potvrdené) bližšie detaily.





Na budúci rok teda budeme svedkami postupného prerodenia AMD do novej éry. Pribudnú dva sockety pre bežné desktopové procesory, na poli mobilných počítačov sa jednak začne s adopciou Llano čipov, pre ultra-thin notebooky, netbooky a ešte menšie počítače tu bude celkom nové jadro Bobcat. Na výkonnostný trón AMD zasadne architektúra Bulldozer, s veľkými vylepšeniami pre viacvláknový výkon. Určite sa je na čo tešiť, keďže podobné plány má aj Intel – SandyBridge s novým grafickým jadrom, nová high-end platforma a aj ešte lepšie mobilné Core procesory, kvôli ktorým údajne výrobcovia notebookov už ani nechcú nakupovať tie dnešné. Je sa na čo tešiť, čaká nás veľmi zaujímavý rok 2011.
 



Komentáre (4)
kocour
super článok, dobré čítanie k raňajkám ... ;)
emPORiO
V novinke na pc.sk bol obrázok, že Bulldozer 4/8 jadier. Čiže sa budú robiť všetky 8 jadrové a tie 4 jadrové budú mať zamknuté 4 jadrá, ako to je aj u dnešných AMD procesoroch ?
flanker
nevíme, zda budou i 2 modulové Bulldozery, spíš jde o to, že modul je základní stavební složka a není problém rozšířit velikost L3 cache...takže směrem nahoru to nebude problém ,-). Domnívám se, že 4 jádro nebdue třeba, jelikož bude současně dostupný Thuban, který by mezeru měl vyplnit
jk2
A ja si už brúsim zuby a chystám mešec na nejaký notebook s Lianom. Nech mám k svojej stolnej mašine aj niečo prenosné, čo bude stáť za to :-).
Pridať nový komentár
TOPlist