Intel Nehalem - prvý test na Slovensku!

Intel Nehalem, Core i7, Bloomfield, Quick Path Interconnect, X58, triple chanel...tieto a mnoho ďalších slov sa stali v posledných mesiacoch najčastejšie skloňovanými v IT priemysle. Niet divu – najvýznamnejší výrobca polovodičových čipov na svete uviedol na trh svoju novú architektúru procesorov v ktorej zaviedol mnoho radikálnych zmien. O aké ide a aký majú vplyv na výkon v porovnaní so súčasnými Core 2 procesormi sa pozrieme v dnešnej recenzii.

Tock

Možno zvláštny názov prvej kapitoly, no v podstate presne vystihuje Nehalem.
Začnime ale po poriadku.

Určite si všetci pamätáme éru procesorov Pentium 4. Ich architektúra bola vyvinutá s myšlienkou dosiahnutia vysokých frekvencií no práve tu nastávali viaceré problémy – tieto frekvencie, keď by sa ukázala ich sila, bola len ťažko dosiahnuteľná a aj to za cenu veľmi vysokej spotreby. Posledné čipy NetBurst architektúry sa zastavili na taktoch 3,8GHz, pričom v pláne vývoja boli aj vyššie frekvencie.
Nový veliteľ kolosu menom Intel – Paul Otellini, však vzal riadenie firmy "od kraja" a celkom jasne naznačil nové smerovanie procesorového biznisu. Zaviedol aj tzv. Tick-Tock model, ktorý treba uznať – funguje skvele.



Podľa tohto modelu, sa každé dva roky udejú dve významné zmeny :
Tick – vezme sa súčasná architektúra a prejde sa s ňou na nový, menší výrobný proces
Tock – na zavedenom výrobnom procese sa uvedie celkom nová architektúra

Prvým krokom bolo teda "zmenšenie" Pentium 4 procesorov na 65nm jadrá, pričom už vtedy Intel ukázal, ako budú vyzerať procesory budúcnosti – uviedol prvé dvojjadrové CPU - Pentium D.
Ďalší krok spočíval v celkom novej architektúre na 65nm procese – tu Intel siahol, v rámci novej stratégie energetickej úspornosti, po architektúre svojich mobilných procesorov Pentium M. Z nich sa odvodili desktopové čipy Core 2 Duo, Core 2 Quad atď. ako aj serverové Xeon-y.

Situácia na trhu sa vtedy výrazne zmenila a Intel mal teraz po všetkých stránkach vynikajúce procesory na desktopovom ako aj mobilnom trhu. Kde však bol stále trocha problém, boli servery. Hlavne vo viacprocesorových systémoch, kde architektúra konkurencie v podobe integrovaného pamäťového radiča či HyperTransport zbernice bola jednoducho vhodnejšia.

Práve na toto sa Intel pri návrhu Nehalema zameral, a teda nebudeme sa pretvarovať – Nehalem alias Core i7 je hlavne serverový procesor. Tentoraz pôjde teda Intel opačným smerom – zo serverového čipu odvodí celú procesorovú radu – desktopové ako aj mobilné.
Dnes sa však na trhu objavili iba prvé tri desktopové modely so štyrma jadrami, ďalšie môžeme očakávať v priebehu budúceho roka.


Nehalem alias Core i7 s rozptyľovačom tepla a bez neho


Jadro

Jadro Nehalema je z veľkej časti prevzaté od predchádzajúcej architektúry Core 2. Už to je veľmi výkonné, no často sa "flákalo" a zmeny v architektúre sa sústredili predovšetkým na tento problém.

Pozrime sa však najprv na samotné jadro:



Tento diagram popisuje jedno procesorové jadro, v Bloomfield čipoch sú takéto štyri a okrem tohto aj ďalšia časť nazývaná ako un-core. Execution engine, teda časť jadra vykonávajúca výpočtové operácie, nezaberá ani len jednu tretinu plochy jadra, zvyšok je logika out-of-order plánovania (vykonávanie inštrukcií mimo poradia zadaného v programe kvôli lepšiemu využitiu jadra), ďalšia 1/3 je L1 a L2 cache a posledná časť patrí predikcii, usporiadaniu a stránkovaniu pamäte. Je teda zrejmé, vďaka čomu je Intel Atom tak malý – tam sa jedná o in-order architektúru.

Okolie jadra, alebo ako to nazýva Intel – Un-core, pozostáva z masívnej L3 cache, pamäťového rodiča, novej zbernice QPI (Quick Path Interconnect) a I/O logiky (Input/Output).



Nehalem je stavaný ako modulárna architektúra, podľa potreby bude možné pridať ďalšiu QPI zbernicu (pre viacprocesorové serverové systémy na priame prepojenie medzi čipmi), zvýšiť alebo znížiť počet jadier (až do 8 pre servery resp. 2 pre low-end desktop a mobilné počítače) alebo dokonca integrovať grafické jadro. Vtedy sa už ale v podstate nebude dať hovoriť o procesore ale skôr o SoC (System on Chip). Grafické jadro však nemá byť založené na chystanom Larrabee ale má byť modifikáciou jadra súčasných čipov v G45.
Tu vidieť smerovanie Intelu – viac jadier a zvýšenie integrácie.

Jednotka Front-end, ktorá slúži na získavanie (fetch) a dekódovanie inštrukcií má 4 dekodéry (tri pre jednoduché a jeden pre zložité inštrukcie), teda táto vlastnosť ostala zachovaná z architektúry Core 2. Procesor môže teda spracovávať až 4 tzv. micro-ops (malé povely, ktoré vzniknú rozložením celej inštrukcie) zároveň, no u Core 2 procesorov bolo toto často nevyužité. Práve na plné vyťaženie sa pri návrhu Nehalemu kládol veľký dôraz, teda žiadne ďalšie rozširovanie sa na tomto mieste nekonalo.

Už u Core 2 architektúry bola zavedená operácia tzv. Macrofusion, keď sa dvojica x86 inštrukcií "spojila" a ďalej sa spracovávala iba ako jedna. V určitých prípadoch tak došlo k zvýšeniu výkonu ako aj zníženiu spotreby.
U procesorov Nehalem sa táto funkcionalita rozšírila o niekoľko ďalších inštrukcií ktoré môžu byť takto spojené:



Okrem týchto sa však pridáva po prvý krát aj podpora macrofúzie 64-bitových inštrukcií, zatiaľ čo u Core 2 to bolo možné iba pre 32-bitové. 64-bitový softvér tak môže na Nehalem-e bežať o niečo rýchlejšie.

Mierne vylepšenie sa dostalo aj jednotke LSD (nie, nejde o žiadnu psychotropnú látku :-) ) – teda Loop Stream Detector. LSD slúži na detekciu stavu, keď CPU vykonáva v programe slučku (opakujúcu sa časť kódu, cyklus). Ak sa takýto stav zistí, inštrukcie sa "ťahajú" priamo z LSD a predchádzajúce časti čipu sa jednoducho vypnú. Zníži sa tak spotreba, ako aj riziko chybnej predikcie (ušetrí sa čas).
Na rozdiel od Core 2 architektúry je u Nehalma LSD posunutý za dekódovaciu jednotku, takže sa môže pri detekcii slučky v programe vypnúť aj táto časť. LSD teda neuchováva inštrukcie ale už samotné micro-ops.



Pri zmenách Core architektúry pre nový Nehalem inžinieri Intelu prišli na spôsob, ako vylepšiť už aj tak vynikajúci Brach predictor (predpovedanie vetvenia programu, skoku). Nejde ale o žiaden magický trik, jednoducho bol pridaný Branch predictor druhej úrovne. Ten je síce pomalší, no má objemnejší buffer pre ukladanie štatistík vetvení a preto má lepšiu hĺbku analýzy resp. "pozná" väčšiu históriu vetvení. Môže tak včas "opraviť" chybnú predpoveď a zabrániť tak väčším zdržaniam. V bežných aplikáciách sa to však pravdepodobne prejaví len veľmi málo (ak vôbec), no výhoda Branch predictora druhej úrovne sa preukáže pri aplikáciách s rozsiahlou veľkosťou kódu – ako napríklad pri databázach.
Efektivita predikcie je zvýšená aj upravením Return Stack Buffer-a (jednotka, ktorá sleduje kde v pamäti má CPU pokračovať po skončení vykonávaní niektorej funkcie).

Výkonná časť jadra (Execution engine) zostala v podstate nezmenená oproti Core 2, zvýšila sa však kapacita niektorých dátových štruktúr, vrátane tzv. inštrukčného okna (množina micro-ops, ktoré sú spracovávané v pipeline procesora, platí že čím väčšie okno – tým vyšší možný paralelizmus operácií):




Out-of order inštrukčné okno teraz pojme až 128 micro-ops, čo je o 33% viac ako u predošlej architektúry Core 2 vychádzajúcej z mobilného čipu Merom (96 micro-ops). V súvislosti s tým sa zväčšili aj iné jednotky ako napr. buffer-y a Reservation Station (posiela micro-ops priamo do výkonných jednotiek, (execution units)).
Tieto jednotky tu boli už aj pred Nehalem-om, no problém bol ten, že boli jednoducho málo "zásobované" (pomalá FSB, pamäťový radič v NorthBridge, vysoké latencie,...). S príchodom integrácie pamäťového radiča do CPU, znovuzavedením Hyper Threding-u či novou zbernicou QPI sa tento problém odstraňuje, no architektúra Core bola už natoľko dobre pripravená, že ju netrebalo pre Nehalem príliš radikálne upravovať.

Okrem druhej úrovne Branch predictor-a sa u Nehalem-a objavuje aj druhá úroveň TLB - Translation lookaside buffer. TLB je rýchla cache, ktorá má na starosti mapovanie virtuálnych a fyzických pamäťových adries. Využitie, opäť, hlavne v serverovom prostredí.

Veľkou zmenou prešla Cache.
Kapacita cache 1. Úrovne, teda L1 cache, zostáva nezmenená – 64kB (32kB dátová, 32kB inštrukčná cache). L1 je však o jeden cyklus pomalšia ako u Core 2 – 4cykly vs. 3 cykly. Odhad Intel-u je, že výkon kvôli tomuto klesne o 2 až 3%.

L2 cache bola u posledných Core 2 čipov veľmi veľká a zdieľaná medzi jadrami. Dvojjadrové čipy mali 6MB, štvorjadrové 12MB. U nehalem-u sa však podobne ako u konkurenčného Phenom-a objavuje cache v celkovo troch úrovniach. L2 cache nových Intel procesorov je teraz iba 256kB veľká (pre každé jadro) ale pomerne rýchla (10 cyklov).
Malá L2 cache môže mať niekedy dosť veľký vplyv na výkon aplikácií, predovšetkým hry ťažili z veľkej a rýchlej L2 cache u Core 2.

Cache L3 je posledná pamäť pred pamäťou RAM a je zdieľaná pre všetky jadrá. U dnes testovaných štvorjadrových čipov je veľká 8MB, neskôr sa zrejme dočkáme aj modelov s väčšou resp. menšou kapacitou, v závislosti od počtu jadier či výrobnej technológie.
Rozdiel oproti L3 cache u AMD procesorov je, že L3 cache Nehalem-a je inkluzívna. To znamená, že dáta ktoré sú v L1 a L2, sú zapísané aj v L3. Výhoda takejto štruktúry spočíva v tom, že ak CPU hľadá nejaké dáta v L3 cache a nenájde ich, je okamžite jasné, že nebudú tieto dáta ani v L1 a L2 cache ostatných jadier. Ušetrí sa tak čas, ktorý by sa strávil prehľadávaním cache vyššej úrovne u susedných jadier.



L1 a L2 cache sa týka aj ďalšia zmena, ktorá súvisí so spotrebou. U týchto dvoch úrovní cache je použitý výrobný proces 8 tranzistorových SRAM pamäťových buniek. Tento krok prinesie oproti 6-tranzistorovému dizajnu hlavnú výhodu v podobe nižšieho napätia a teda aj zníženej spotreby. Nevýhoda je mierne zväčšená celková fyzická veľkosť, možno aj preto nie je touto technikou vyrobená aj 8MB L3 cache – bolo by nutných veľa tranzistorov a podstatne viac priestoru.


Cache pamäť u Core i7



Cache pamäť u Core2 Quad


Pridaných bolo aj sedem nových SIMD inštrukcii pod súhrnným názvom SSE 4.2. Tie sú trocha odlišného zamerania ako SSE 4.1 a hovorí sa im aj Applications Targeted Accelerators. V rámci tohto konceptu tranzistory v procesore nemusia byť použité iba na univerzálne funkcie, ale aj na niektoré špecifické úlohy, čím sa zvyšuje výkon iba v určitých konkrétnych aplikáciách.
Päť nových inštrukcií akceleruje spracovanie XML súborov, ďalšie dve sú CRC32 a POPCNT.


Približne 1 milión tranzistorov Intel použil na špeciálnu jednotku na riadenie spotreby: PCU – Power Control Unit. Čiže takmer toľko tranzistorov, čo obsahoval procesor 486, je použitých iba na kontrolu spotreby – tu pôjde o niečo dômyselné.
PCU má vlastný vstavaný firmware a zbiera informácie v reálnom čase o teplote, prúde, spotrebe a požiadavkách operačného systému. Každé jadro potom dokáže dynamicky podtaktovať, znížiť mu napätie, prípadne takmer úplne odpojiť od napájacej zbernice – vtedy sa spotreba takéhoto jadra blíži takmer k nule.



Na odpojenie jadier od napájania bol vyvinutý špeciálny materiál, ktorý sa správa ako hradlo medzi napájacou zbernicou a samotným jadrom. Výhodou takéhoto riešenia priamo v CPU je, že nie je nutné nijak špeciálne upravovať napájacie obvody na základnej doske. Ďalšou nepochybnou výhodou je, že takto podtaktované/podvoltované/vypnuté môže byť každé jadro osobitne. Vďaka PCU je implementovaná aj funkcia Turbo Boost, o ktorej si povieme neskôr.

Pokiaľ ide o spotrebu, nedá sa nespomenúť pravidlo, ktorým sa Intel pri návrhu nových procesorov riadi. To spočíva v pomere 1:2 – teda pokiaľ má určitá funkcia zvýšiť spotrebu o 1%, musí pridať na celkovom výkone aspoň 2% navyše. Pokiaľ je pre akúkoľvek funkciu tento pomer horší, jednoducho sa z návrhu vyhodí, pričom je jedno ako veľmi bola dôležitá.

Integrovaný pamäťový radič, QPI

Nehalem je prvá architektúra Intel-u s integrovaným pamäťovým radičom, ktorá uzrela svetlo sveta. Prečo nie úplne prvá? Intel mal ešte na konci 90-tych rokov v pláne projekt Timna, ktorý mal integrovať práve pamäťový radič a aj grafické jadro. Timna sa ale nikdy nedostala do výroby a projekt bol zrušený.
Pamäťový radič integrovaný v procesorovom jadre používa AMD už od čias prvých procesorov Athlon 64, Intel doteraz mal radič vždy v osobitnom čipe NorthBridge. Takéto usporiadanie malo ale tú nevýhodu, že ďalší čip medzi RAM pamäťou a procesorom vnášal do prenosu vysokú latenciu a taktiež používaná zbernica FSB už dosahovala svoje limity (dôkazom toho sú aj posledné základné dosky s čipsetom P45, kde sa objavujú už veľmi pokročilé voľby na stabilizáciu vysokého taktu FSB).

V un-core Nehalema, teda „okolí“ jadra, sa nachádza DDR3 pamäťový radič, ktorý je v zmysle myšlienky modulárnosti architektúry škálovateľný. Pri prvých štvorjadrových Core i7 čipoch je radič trojkanálový, neskôr sa na trh dostanú aj čipy s dvojkanálovým radičom. Všetky budú mať ale jednu spoločnú vlastnosť, a to podporu už iba DDR3 pamätí.
Tu Intel znova funguje v pozícií pretláčania nových technológií, keď aj prvé DDR2, aj napriek vtedy vysokej cene a malému nárastu výkonu, začal používať u svojich čipsetov.
Dnes sa situácia neopakuje úplne presne. Ceny DDR3 sú zatiaľ pomerne vysoko nad cenami DDR2, no treba poznamenať, že pre dosiahnutie vysokej pamäťovej priepustnosti vôbec nie je treba drahé DDR3 moduly, vysoké čísla sa získajú aj najlacnejšími 1066MHz DDR3 pamäťami. Priepustnosť ale nie je hlavnou výhodou, tou je podstatné zníženie latencie (odozvy) pamäťového subsystému.

Namiesto slov praktický dôkaz:


Priepustnosť a latencia u Core2Quad (DDR2 1066MHz, 5-5-5-15, dual-channel)



Priepustnosť a latencia u Core i7 (DDR3 1066MHz, 7-7-7-20, triple-channel)


Priepustnosť takmer dvojnásobná, latencia skoro o polovicu nižšia.

So zavedením integrovaného pamäťového radiča potreboval Intel nejaké rýchle prepojenie medzi jednotlivými čipmi. Práve preto vznikla “nová“ zbernica QPI (Quick Path Interconnect). V podstate sa presunutím radiča z NorthBridge do procesora zbernica uvoľní a mohla by tak postačovať aj FSB (Front Side Bus), no to iba pre jednoprocesorové systémy (desktop-y, notebooky). QPI je teda opäť prvok, ktorý je tu hlavne kvôli serverovému nasadeniu, “ na škodu“ ale samozrejme nebude ani u dnes testovaných procesorov.

QPI je veľmi podobná zbernici HyperTransport, ktorú AMD taktiež ako integrovaný pamäťový radič používa už niekoľko rokov.
QPI je vlastne sériové rozhranie CSI (Common System Interface), ktoré pozostáva z dvoch, 20-bit-ových liniek prenášajúcich dáta dvoma smermi. 16-bitov je pre dáta a zvyšné 4 pre réžiu prenosu (korekcia chýb). Najvyššia rýchlosť QPI je 6,4GT/s (GigaTransfers/second), čo je 12,8GB/s každým smerom, celkovo teda má QPI priepustnosť až 25,6GB/s. To je o kúsok viac ako HyperTransport 3.0 (24GB/s) a podstatne viac ako u 1600MHz FSB (12,8GB/s).
V závislosti od cieľového trhu môžu byť procesory Nehalem vybavené jednou QPI (desktop), alebo aj viacero, pre priame spojenie so susedným procesorom vo viacsocketových serveroch.

Radič v Core i7 9xx procesoroch podporuje celkovo dve trojkanálové zapojenia RAM (spolu 6 modulov) o maximálnej kapacite 24GB, teda maximálna veľkosť je 4GB/modul.

Hyper Threading

Hyper Threading je Intel-ovský názov pre SMT (simultaneous multi-threading). SMT (alebo ak chcete HT) funguje tým spôsobom, že umožňuje jednému procesorovému jadru spracovávať naraz dve výpočtové vlákna. Tým sa efektívnejšie vyťažujú výkonné časti jadra (execution units), pretože časti, ktoré by ináč práve nič nespracovávali a čakali na dokončenie práce iných jednotiek, sú vďaka SMT zamestnané spracovávaním iného vlákna. Prostriedky jadra sa takto vlastne zdieľajú.

Všetci máme v čerstvej pamäti Hyper Threading u procesorov Pentium 4, u ktorých zavedenie tejto technológie zvýšilo v niektorých prípadoch výkon o až 10%. Nehalem je však oproti NetBurst oveľa "širšia" architektúra a má k dispozícií neporovnateľne viac pamäťovej priepustnosti, nehovoriac o tom, že dnes je už viac aplikácií, ktoré dokážu využiť viac jadier resp. paralelné výpočty.
Rovnako ako pri Atom-e, aj u Nehalem-a pridanie funkcie HyperThreadingu nezabralo veľa tranzistorov – zdvojené boli iba niektoré jednotky, väčšina je buď rozdelená napoly keď je HT aktivované, alebo sú kompletne zdieľané.

Operačný systém "vidí" jednojadrový procesor s HT ako dvojjadrový, čo u štvorjadrového Core i7 znamená celkovo 8 výpočtových jadier. Po spustení správcu úloh v systéme Windows sa nám teda naskytne takýto pohľad:



Výkon by mal u aplikácií ktoré dokážu viac jadier využiť citeľne stúpnuť, no môžu nastať aj situácie, keď výkon poklesne. Je to spôsobené hlavne prácou operačného systému, ktorý nerozlišuje medzi fyzickým a "virtuálnym" HT jadrom a zvykne úlohy "prehadzovať" medzi nimi, čo samozrejme zaberá určitý čas.

Ako sa na vzorke benchmarkov prejavila funkcia Hyper Threadingu, vidíte v nasledujúcej tabuľke. Funkcia Turbo (o tej v nasledujúcej kapitole) bola ponechaná aktivovaná.



V priemere teda, ak vypneme HyperThreading, stratíme na výkone vyše 10%. Najväčší prínos má samozrejme u programov, ktoré dokážu naplno využiť všetky dostupné jadrá, ako napríklad u testu 3DMark Vantage - Core i7 procesory budú teda tým pravým na trhanie rekordov :-)

Turbo

Tento názov vyvolal v mnohých spomienky s ešte väčšou nostalgiou ako u predchádzajúceho Hyper Threading. Tu ale nejde o žiaden mechanický prepínač na počítači ako kedysi :-)

HyperThreading zvyšuje výkon pri aplikáciách využívajúcich viac jadier, čo ale ak aplikácia využije iba jedno jadro? Kvôli tomu Intel zaviedol novinku v podobe technológie Turbo Boost, ktorá je vlastne pretaktovaním od samotného výrobcu!
Turbo Boos dokáže dočasne pretaktovať jednotlivé jadrá o 133MHz, prípadne jedno jadro až o 266MHz. Nie je to síce veľa no aspoň čosi. Toto pretaktovanie sa deje na základe zvýšenia násobiča o jeden, resp. dva stupne nahor. Nenechajte sa však zmiasť, okrem extrémnej edície Core i7 965XE nemajú Core i procesory odomknutý násobič smerom hore.
Pretaktuje sa však procesor iba vtedy, keď jednotka PCU nezistí prekročenie nastaveného TDP, ako napríklad v prípade vyťaženia iba jedného jadra – ostatné sú v úspornejšom režime a tak je možné jedno jadro pretaktovať aj o 266MHz, pričom hodnota tepelného vyžarovania procesora ostáva v dovolených medziach.

Aký vplyv na výkon má táto funkcia ilustruje nasledovná tabuľka:



Nárast výkonu teda nie je nijak ohromujúci, no v každom prípade stúpne, a v priemere prinesie približne 4% navyše. Intel tak nepriamo naznačil, že vie o pretaktovacom potenciáli svojich procesorov a nebojí sa ho využiť.


Corei7 965XE v stave bez záťaže, v základom stave a v stave s aktívnou funkciou Turbo


A čo chladiče?

Toľko zmien v jadre a architektúre si vyžiadalo aj zvýšenie počtu pinov procesora – tých je teraz 1366. Kvôli tomu sa zmenil tvar procesora a spolu s ním aj socket.


LGA 1366 naľavo, LGA 775 napravo



Priame porovnanie procesorov na LGA775 a na LGA1366 päticu


Zmena fyzických rozmerov socketu má za následok, že chladiče kompatibilné so súčasným LGA775 nie je možné osadiť na novú platformu.
Väčšina výrobcov to však bude riešiť tak, že pribalí ku svojim existujúcim chladičom nový montážny kit, vďaka ktorému budú chladiče kompatibilné.

Jeden z vôbec prvých výrobcov, čo ponúka takýto montážny kit, je Noctua a na ten sa pozrieme trocha bližšie.

Naša testovacia vzorka pozostávala z klasického balenia high-end chladiča Noctua NH-U12P, o ktorého kvalite ste sa mohli presvedčiť aj na našich stránkach v podrobnej recenzii, a LGA 1366 kit-u dodaného osobitne:



V dodávke nájdeme samotná kit a veľmi názorne spracované inštrukcie k inštalácií. Uchytenie je riešené pomocou backplate, čo sa nedá hodnotiť ináč ako pozitívne.
Na backplate pre LGA 775 a LGA 1366 sa dá ukázať zmena rozmerov:


Na hornom obrázku: LGA1366 vľavo, LGA775 vpravo
Na dolnom obrázku: LGA775 backplate položený na LGA1366 backplate


Kit je uspôsobený tak, aby bolo možné chladič na sockete natočiť podľa požiadaviek v uhle 90°:


Po osadení backplate a vrchnej časti nasleduje pripevnenie úchytných skrutiek na základňu chladiča a potom už ostáva celý chladič iba priložiť na socket a priskrutkovať dodávaným skrutkovačom. Treba pochváliť Noctuu za tento dômyselný a hlavne stabilný systém, nedalo sa to totiž povedať o uchytení chladiča Thermaright Ultra 120 Extreme, ktorý bol súčasťou novinárskeho balíka Intel Nehalem.







Zmenou prešli samozrejme aj BOX chladiče, ktoré dostanete pri kúpe procesora v balení. Ak vedľa seba postavíme BOX chladič z prvých Core2 Duo procesorov na 65nm výrobnom procese a nový BOX pre Core i7, nezdá sa chladič pre procesor so 130W TDP až o toľko väčší:



Ak ale s novým BOX-om porovnáme chladič dodávaný k poslednej generácií Core2 Quad na 45nm výrobnom procese, je ihneď jasné, že Corei7 aj napriek rovnakej výrobnej technológii bude mať podstatne vyššiu spotrebu:



Testovacia zostava, základná doska

Na testovanie architektúry Nehalem Intel pripravil pre novinárov veľký balík, ktorý obsahoval dva Core i7 procesory, základnú dosku s X58 čipsetom, DDR3 pamäte, SSD disk a aj chladič Thermalright Ultra 120 Extreme s LGA 1366 montážou. My sme porovnali nové procesory s dvoma zástupcami tých terajších – jedným dvojjadrovým – E8400, a jedným štvorjadrovým – Q9400, ktorý je cenovo veľmi blízko najlacnejšiemu Core i7 920.


*- Core i7 940 bol nasimulovaný zmenou parametrov Core i7 965XE

V tabuľke si zhrňme prvé tri modely Core i7 a ich špecifikácie:





Základná doska ktorú Intel predáva ako prvú pre svoje nové procesory, patrí do najvyššej triedy z ponuky tohto výrobcu. Je samozrejme vybavená čipsetom Intel X58, ktorý je zatiaľ jediným podporujúcim nové Core i7.

Samotná doska má, nazvime to, "zaujímavé" rozloženie komponentov:



Hlavne usporiadanie socketu, RAM slotov a čipsetu je veľmi netradičné. Intel tu zrejme myslel na správne chladenie a prúdenie vzduchu, keď studený vzduch prichádza z prednej časti skrinky, ochladzuje čipset, následne ho nasáva chladič procesora a vyfukuje smerom k zadnej časti skrinky. V smere prúdenia sú usporiadané aj RAM moduly, ktoré by mali byť takto efektívnejšie ochladzované.
Týmto usporiadaním však veľmi utrpel samotný layout, kde je mnoho prvkov na veľmi nevhodných miestach – napríklad prídavný 8-pin napájací konektor pre procesor je pod čipsetom a ďalší prídavný napájací konektor na ešte horšej pozícií pri zadných portoch. Pri zapojení káblov zo zdroja tieto dosť nepríjemne zavadzajú.

Na doske už nenájdeme žiadne P-ATA konektory a ani konektor pre disketovú mechaniku, Intel takisto vypustil už takmer všetky PCI sloty – ostal iba jeden:



Dva PCIexpress X16 sloty podporujú iba CrossFire od ATi, nVidia technológiu SLI pre túto dosku necertifikovala (ale tu je zrejme skôr "politický" dôvod ako technický).

Chladenie je riešené štandardnými pasívami, ktoré Intel používa u svojich základných dosiek, MOSFET-y v napájacom obvode procesora sú vybavené samostatnými chladičmi.
Tepltoty NorthBridge sa držali okolo 60°C v záťaži, SouthBridge mal do 50°C a napäťové regulátory 43°C bez záťaže procesora a 55°C v záťaži.



Umiestnenie S-ATA portov je vcelku dobre vyriešené, rovnako ako konektorov pre pripojenie dodatočných USB a predného panela skrinky – sú v rohu dosky. Nachádza sa tu aj tlačidlo pre zapnutie:



Zadný panel je, dá sa povedať, prázdny, celkom tu chýbajú PS/2 konektory pre myš a klávesnicu, nájdeme tu len 8xUSB, 2xeS-ATA, 1xFireWire, 1xLAN a výstupy zvukovej karty:



BIOS dosky Intel DX58SO síce nie je tak „nadupaný“ ako BIOS-y od iných výrobcov, pretaktovať sa však dá slušne, čo potvrdili aj výsledky v príslušnej kapitole. Teraz si len ukážeme ako BIOS vyzerá a čo ponúka:


Základná obrazovka, meniť možno počet aktívnych jadier (všetky,2,1) a zapnúť či vypnúť HT



Advanced Chipset Configuration – oproti predchádzajúcej platforme teraz len veľmi chudobná sekcia




Performance je časť BIOS-u, ktorá bude pre overclockerov najzaujímavejšia.
Failsafe Watchdog má za úlohu zistiť nepodarený POST a naštartovať dosku s bezpečnými hodnotami. Hneď potom nasleduje voľba pre ručné zadanie základnej frekvencie, od ktorej sú odvodené všetky frekvencie v systéme pomocou násobičov.
V menu Processor Overrides je možné meniť násobič smerom dole (bohužiaľ aj u extrémnej edície Core i7 965XE nie je možné s touto doskou dvihnúť násobič vyššie ako je základných 24, viac v kapitole pretaktovanie), v prípade osadenia 965XE je možné meniť aj násobiče pre Turbo Boost ako aj limity TDP a TDC. Tie sú dôležité pri pretaktovaní, nakoľko jednotka PCU kontroluje či nebol prekročený limit TDP a v prípade ak bol, procesor podtaktuje. Ak sa použije výkonnejšie chladenie, je možné tieto hodnoty zvýšiť.

Memory Configuration ponúka nastavenia časovaní pamätí a ich napätia, a nachádzajú sa tu aj násobiče pre RAM a pre UCLK – to jest frekvencie un-core, čiže aj pamäťového radiča. To bude samozrejme dôležité sledovať pri pretaktovaní, keď príliš vysoká frekvencia RAM či un-core môže viesť k nestabilite. Násobičom sa potom ich frekvencia zníži. U Core i7 920/940 však voľba násobiča un-core uzamknutá, v predajných verziách však má byť bežne dostupná.

V poslednej časti je možné pridávať napätia pre IOH (NorthBridge) a QPI zbernicu, prípadne meniť jej rýchlosť.


Regulácia otáčok ventilátorov je umiestnená na vcelku neštandardnom mieste



Doska monitoruje otáčky, napätia a teploty



Pri niektorých položkách sa nachádza aj užitočná nápoveda



Nastavenia hesiel a technológií XD a virtualizácie



Nastavenia správy napájania a úsporných režimov procesora



Možnosti bootovania



Bohužiaľ, žiadne ukladanie do profilov sa nekoná



Intel X58Čo sa týka čipsetu X58, nie je toho veľa, čo by sa dalo o ňom napísať. Zrejmé to je už z tohto diagramu:



Pamäťový radič sa presunul do procesora a tak sa z NorthBridge stáva iba akýsi prepojovací člen. Stará sa o pripojenie 36 PCIexpress liniek pre grafické karty, jeho ostatné funkcie spočívajú v spojení s procesorom cez novú zbernicu QPI a so SouthBridge cez už starú známu DMI zbernicu. Aj Intel už nazýva tento čip iba ako IOH (Input/Output Hub).
Novinkou však je okrem podpory Crossfire aj podpora nVidia SLI, a to vďaka licenčnému systému nVidie.



Syntetické testy

Od teoretizovania sa presuňme k reálnym testom výkonu. Začneme populárnymi benchmarkmi od firmy Futuremark, konkrétne 3DMark 2006, 3DMark Vantage a PCMark 05 – vo všetkých bola zvolená iba časť testu vyťažujúca procesor. V tomto nastavení dokážu benchmarky veľmi dobre využiť všetky dostupnú jadrá, očakávať preto môžeme vysoký nárast výkonu u nových Core i7 procesorov s "dvojnásobným" počtom jadier vďaka technológii HyperThreading.
PCMark 05 simuluje reálnu záťaž testom kompresie a dekompresie súborov, šifrovania a dešifrovania, dekopresie obrázkov, kompresie zvuku a dvoma viacvláknovými testami – s využitím dvoch a štyroch operácií zároveň. "Hrubý výkon" procesora bol overený testom SiSoftware Sandra – Processor Arithmetic.










Očakávané výsledky sa dostavili, možno nie až tak vysoké rozdiely v teste PCMark 05 sú zrejme spôsobené tým, že viacvláknový test využíva iba štyri paralelné úlohy, a tak náskok Core i7 je tvorený iba prínosom zmeny architektúry oproti Core2Quad a nie aj využitím ôsmich vlákien.
Overclockerov ktorí radi lámu rekordy v 3DMarkoch poteší vysoký výsledok v teste Vantage, v aritmetickom teste podali nové Core i7 doslova "gigantické" výsledky, Q9400 je ďaleko za nimi.

Praktické testy

Do praktických testov boli vybrané aplikácie WinRAR, Adobe Photoshop CS3 a Microsoft Excel.WinRAR obsahuje integrovaný test výkonu, ktorý využíva buď iba jedno vlákno alebo všetky dostupné.Pre Photoshop bol použitý test z dielne retouchartists.com, ktorý spočíva v zložitej manipulácií s fotografiou v rozlíšení 3504x2336 pixlov. Výkon v tabuľkovom procesore Excel bol preverený spracovaním približne 300 000 iterácií Monte Carlo simulácie, ktorá využíva veľmi známy model finančníckej teórie, tzv. Black-Scholes model. Pracovný hárok má približne 50 000 riadkov a veľkosť 70,1MB. Druhý test Excel-u je založený na asi 28000 aritmetických a štatistických výpočtoch.











Vo všetkých testoch s prehľadom dominujú nové Core i7, a to aj v prípade testovania iba jedným jadrom vo WinRAR-e. Core i7 920 zvládol úlohu vo Photoshope o dve sekundy rýchlejšie ako rovnako taktované štvorjadro Core2Quad Q9400 aj napriek tomu, že test nevyťažil úplne všetky jadrá a nevyužil tak výhodu HyperThreading-u.

Rendering

Rendering je oblasť, kde sa čas vykonania úlohy vyvažuje zlatom, a teda aj softvér je uspôsobený na čo najlepšie využitie všetkých dostupných výpočtových jadier. Iste mnohí tušia, v akom svetle sa Core i7 ukáže. Cinebench R10 je test využívajúci renderovací engine od firmy Maxon - Cinema 4D. Do renderovania scény sa dá zapojiť buď jedno jadro, alebo všetky dostupné. Druhý renderovací test je populárny 3dsmax vo verzii 9, kde je meraný čas do dokončenia vykreslenia jedného snímku scény v HD rozlíšení. Blender je ďalším z najpoužívanejších softvérov v tejto oblasti, výkon procesorov sme porovnali spracovaním modelu flyingsquirrel.blend. Posledný test je integrovaný benchmark v programe PovRay 3.7, ktorého výstupom je hodnota PPS – pixels per second, do výpočtov je opäť možné zapojiť jedno alebo všetky jadrá.


















Renderovanie je jednoznačne silnou doménou nových procesorov. Viac paralelných vlákien znamená viac výkonu, a aj v prípade vyťaženia iba jediného jadra je 2,66GHz jadro Core i7 približne rovnako rýchle ako jadro Core2Duo E8400 na 3GHz.
Zvláštny prípad nastáva však v PovRay teste s využitím všetkých jadier – ten zaťaží iba polovicu z ôsmich dostupných vlákien u Core i7 a neblahá vlastnosť operačného systému, o ktorej sme hovorili v kapitole HyperThreading, sa "postará" o prehadzovanie výpočtov medzi jadrami fyzickými aj virtuálnymi, čo má za následok pokles výkonu. 2,66GHz Core2Quad je teda o kúsok výkonnejšie ako 2,66GHz Core i7 s HyperThreadingom. Pokiaľ programátori zapracujú na oprave, aj tu sa dočkáme pekného nárastu výkonu.

Enkódovanie videa

Enkódovanie videa je úloha, ktorú veľmi často spracovávajú aj domáce počítače – ako príklad možno uviesť konverziu DVD filmu do DivX formátu pre pozeranie na mobilných zariadeniach či spracovávanie videa z dovolenky a jeho archivácia v HD kvalite a podobne.
V teste enkódingu videa boli vybrané niektoré najznámejšie kodeky a programy používané bežne v komerčnej sfére. TMPGEnc konvertoval videoklip z HD rozlíšenia do formátu WMV (Windows Media Video), rýchlosť práce s x.264 kodekom bol preverený testom x264 HD Benchmark od tvorcov zo servera Tech ARP, ktorý konvertuje 720p zdrojový súbor kodekom vo verzii 0.59.819. Nezabudli sme ani na DivX v najnovšej verzii 6.8, ktorý dokáže využiť všetky jadrá a HyperThreading, ako aj SSE 4 inštrukcie. V x264 teste je meraný počet spracovaných snímkov za sekundu, v ostatných testoch je dôležitý čo najnižší čas.











Spracovanie videa je s novými procesormi radosť. Ak by sme nebrali do úvahy cenu za platformu, tak Core i7 920 ktorý je približne rovnako drahý ako Core2Quad Q9400 ponúkne v priemere o vyše 25% vyšší výkon. Veľmi slušné...

Vedecké výpočty

Pre záujemcov o zhodnotenie výkonu v profesionálnych matematických a simulačných aplikáciách boli vybrané niektoré známe či menej známe testy: ScienceMark 2.0, Mathematica 6 (výpočet vzorového súboru MMA6.0-Test.nb), Euler 3D (výpočty simulácie obtekania vzduchu okolo krídla lietadla), pre overclockerov známe testy Super Pi (1M) a wPrime (32M) a nakoniec integrovaný test CPU v BIONC manažéri.

Niektoré z testov zamestnávajú iba jedno jadro, bude sa teda dať celkom dobre ukázať prípadný rozdiel v samotných architektúrach a ich vplyvoch na tieto aplikácie.






















Na výsledkoch ScienceMark-u, ktorý vyťaží dve jadrá, a Mathematic-y, ktorá iba jedno, sa dá ukázať vcelku veľký pokrok – 2,66GHz Nehalem jadro je približne tak rýchle ako 3GHz jadro Penryn.
Euler3D, ktorý je optimalizovaný na paralelné výpočty dosahuje podľa očakávania na Core i7 krásne výsledky, rovnako ako viacvláknový test wPrime. Ani výpočet jedného milióna desatinných miest čísla pí nedopadlo pre Core i7 zle – skôr naopak, ak nové procesory budú tak dobre pretaktovateľné ako súčasné Core 2, môžeme očakávať rýchle prepísanie tabuliek rekordov.

Hry

Na čo je asi najviac čitateľov zvedavých, je výkon v hrách. Tie majú celkom radi veľkú a rýchlu L2 cache u Core2 procesorov, otázka teda je, ako sa prejaví výkon u Nehalem-a, kde je cache podstatne menšia, no zato o kúsok rýchlejšia. Kompenzácia veľkosti L2 môže byť v podobe L3 cache (aj keď omnoho pomalšej) a integrovaného pamäťového radiča. Na overenie vôbec nebolo potrebné preverovať mnoho hier, výsledok je zrejmý aj z týchto troch benchmarkov (1280x1024, medium detaily):









Rozdiel medzi rovnako taktovanými štvorjadrami na architektúre Core2 (Q9400) a Nehalem (Core i7 920) je buď žiaden alebo iba v jednotkách percent. Ak ste sa teda báli že výkon v hrách bude s Core i7 menší, máme dobrú správu – nie je to tak. Ak ste ale dúfali v citeľný nárast FPS, máme správu "zlú" – revolúcia sa nekoná.

Výsledky testov viacerých hier vám chýbať nemusia – aj v recenziách zahraničných kolegov sa dočítate to isté – výkon rovnaký alebo len mierne vyšší. Limitujúcom faktorom je aj tak grafická karta.
Architektúra Nehalm-a teda akoby spravila "pár krokov späť" (malá L2 cache) a znova "pár krokov vpred" (L3 cache, pamäťový radič) a hry teda bežia rovnako ako na súčasných dvoj a štvorjadrách.

Multitasking

Testy multitaskingu – teda spracovávania viacerých reálnych úloh naraz, sú inšpirované požiadavkou jedného nášho čitateľa (ďakujem flanker). Prvý test pozostáva z integrovaného benchmarku v komprimačnom programe WinRAR 3.71, renderovaní scény v programe 3dsmax 9 a so súčasným prehrávaním náročného videa v HD rozlíšení (1080p). Meraný bol čas dokončenia renderu, čím menší čas, týl lepší výkon. Druhý test je zameraný na enkódovanie HD videoklipu do WMV formátu a súčasnom spustení hry Far Cry 2. Sledovaný je čas do dokončenia konverzie videa ako aj vplyv na počet snímkov za sekundu v hre.



V prvom multitasking teste si jednoznačne držia citeľný náskok nové Core i7 procesory, nasledované s odstupom 31% štvorjadrom Q9400. Jasný je prínos HyperThreadingu, ktorý lepšie zamestnáva výpočtové jednotky a svoj podiel na zásobovaní dátami má aj vyššia priepustnosť pamätí.



Konverzia videa pri súčasnom hraní hry priniesla veľmi zaujímavé výsledky.
Všetky tri Core i7 procesory si držia takmer rovnaké FPS v hre, zatiaľ čo čas do dokončenia úlohy s videom sa mierne predlžuje s klesajúcou frekvenciou čipu.
U Core2Duo a Core2Quad je však situácia zložitejšia – tu už systém nemá k dispozícií toľko jadier a teda sa musí rozhodnúť, ktorému procesu priradí viac procesorového času. Ako je z tabuľky zrejmé, u dvojjadra FPS v hre príliš výrazne nekleslo, no čas enkódingu videa je veľmi vysoký. Štvorjadro stihlo spracovať video za tretinový čas, no FPS pokleslo o niečo výraznejšie.
Pri viacnásobnom testovaní by sa možno pomery otočili, no stále by utrpel buď čas enkódingu alebo plynulosť hry. U nových Core i7 sa však takéto problémy až tak citeľne neprejavujú.

Pretaktovanie

"Rozmaznaný" pretaktovacím potenciálom procesorov Core2Duo a Core2Quad, keď zvýšenie frekvencie o 1GHz sa považovalo za celkom bežné nastavenie pre dlhodobé používanie, sa mnohí obávali o možnosti pretaktovania u nových Core i7. Pred uvedením sa internetom dokonca šírili "zaručene neoverené" informácie o tom, že Intel nejakým spôsobom úplne pretaktovanie zatrhne. Samozrejme to tak nie je, a nakoniec aj sám výrobca zakomponoval do procesorov funkciu automatického pretaktovania (Turbo Boost).

Pretaktovanie Core i7 sa však v mnohom líši od toho, na ktoré sme zvyknutí u dnes predávaných Core2Duo/Quad. Ak vynecháme pre drvivú väčšinu užívateľov nezaujímavý Core i7 965XE s otvoreným násobičom smerom hore a astronomickou cenou, ostávajú nám čipy Core i7 940 a 920. Tie majú násobič obmedzený do 22, resp. 20 a pretaktovanie sa teda bude realizovať rovnako ako u iných procesorov – zvyšovaním frekvencie zbernice. Pred tým, než sa pustíme do samotného taktovania, vysvetlíme si ako to u Nehalem čipov vyzerá s frekvenciami a násobičmi:



Na blokovom diagrame vyššie je znázornený celý systém frekvencií na novej platforme – všetky takty jednotlivých súčastí sú odvodené od základnej frekvencie 133MHz (BCLK – Base Clock), pričom pokiaľ sa vyžaduje iná frekvencia, je upravená pomocou tzv. násobiča na vyššiu.
Čo nás ale bude zaujímať najviac, sú pomery frekvencií v jadre, keďže tu sa nachádzajú okrem samotných výpočtových jadier ktoré chceme pretaktovať aj pamäťový radič a zbernica QPI.



Schéma ktorú vidíte vyššie popisuje všetky dôležité násobiče v systéme. Je zrejmé, že zmenou základnej frekvencie zo 133MHz na vyššiu ovplyvníme všetky ostatné časti. To o čo nám predovšetkým ide – teda frekvencia jadier procesora, sa vypočíta ako súčin základnej frekvencie a násobičov jednotlivých jadier (u Core i7 podobne ako u AMD Phenom sú všetky jadrá taktované zvlášť, nastaviť však možno iba všetky súčasne).

L3 cache a pamäťový radič pracujú vždy na nižšej frekvencií ako samotné jadrá, majú preto oba spoločný násobič. Aj frekvencia novej zbernice QPI samozrejme závisí od základnej frekvencie, má svoj vlastný násobič – no ten je možné meniť len u Core i7 965XE a to smerom dole. Tento model má totiž ako jediný QPI na 6,4GT/s a zvoliť teda možno nižšie hodnoty, ostatné modely majú 4,8GT/s a tak je nutné u nich zvyšovať QPI iba pomocou základnej frekvencie.

Nesmieme zabudnúť ani na RAM pamäte, ktoré sú opäť závislé od základnej frekvencie. Jej zvyšovaním sa zvyšuje aj ich frekvencia a tak je v prípade nutnosti treba znížiť ich násobič. U bežných Core i7 sú dostupné voľby 8 a 6, pri 133MHz zákl. frekv. to teda znamená takt 800MHz resp. 1066MHz. Keďže sa už dnes predávajú moduly s oveľa vyššími zaručenými taktami, tieto násobiče bohate pre pretaktovanie postačia.


1. Takt jadier, 2. Násobič jadier, 3. Základná frekvencia (BCLK), 4. Takt QPI (x2)



1.Takt L3 cache a pamäťového radiča, 2. Takt pamätí


Od teórie poďme rovno k výsledkom, ako prvý bol na skúšku odomknutý Core i7 965XE. Ako som už v časti o základnej doske spomínal, s touto nie je možné zmeniť priamo násobič na vyšší ako je pre tento procesor základných 24. Na dvihnutie násobiča je nutné použiť funkciu Turbo – nastaviť vyššie násobiče pre všetky jadrá a v operačnom systéme zvoliť profil napájania "Vždy zapnutý" (Windows XP) alebo "Vysoký výkon" (Windows Vista). Potom stačí procesor zaťažiť a násobiče sa zdvihnú na nastavenú úroveň.
Takýmto spôsobom sa podarilo extrémnu edíciu Core i7 popohnať iba na 3867MHz, čo je navýšenie taktu o vyše 660MHz. Vcelku slušné, no človek by od tohto čipu čakal viac, hlavne keď sa taktuje iba zmenou násobiča čiže ostatné systémové frekvencie sú nenarušené.
Akýkoľvek pokus čo i len o ďalšie malé zvýšenie taktu cez zmenu základnej frekvencie sa skončil neúspechom.



O niečo zaujímavejšie bolo pretaktovanie najlacnejšieho modelu – Core i7 920. Tu je násobič uzamknutý a tak sa taktuje iba zvýšením základnej frekvencie zo 133MHz na vyššiu. Tu sa takt zastavil na 185MHz, aj keď o stabilite sa už hovoriť nedalo, na validáciu to plne postačovalo. Výsledný takt bol dosiahnutý pri zapnutých všetkých "šetriacich" funkciách (C1E, EIST) a taktiež za pomoci automatického zvýšenia násobiča vďaka funkcii Turbo:



Základná doska Intel DX58SO už na vyšších taktoch odmietala pracovať, za stabilnú možno považovať základnú frekvenciu okolo 170MHz.

Nové štvorjadrá od Intel-u teda v podstate nemajú problém s pretaktovaním, ich rezerva je približne rovnaká ako u súčasne predávaných, 45nm čipoch architektúry Core2, keď takty blízke 4GHz so vzduchovým chladením sú celkom bežné.

Určitý problém však pri pretaktovaní nových čipov predstavuje integrovaný pamäťový radič. Tu sám výrobca odporúča neprekročiť napájacie napätie RAM modulov nad hodnotu 1,65V. To by vraj mohlo znížiť životnosť alebo dokonca poškodiť samotný procesor. Momentálne nie je tento jav podrobne preskúmaný, no tvrdí sa, že pokiaľ sa dodrží správny pomer medzi napätím pre RAM a časti čipu un-core (rozdiel medzi QPI/DRAM a DRAM Voltage maximálne 0,5V), malo by byť bez problému použiteľné aj vyššie napájanie ako 1,65V.

Spotreba, teploty

Presunutie pamäťového radiča z čipu NorthBridge priamo do jadra ako aj mnohé zmeny v architektúre a pridané jednotky sa musia zákonite podpísať aj na výslednej spotrebe. Tá je v porovnaní so súčasne predávanými štvorjadrami Core 2 Quad veľmi vysoká, a to aj napriek rovnakému pokročilému 45nm výrobnému procesu:



Spotreba počítačovej zostavy v stave bez záťaže procesorov nie je až natoľko rozdielna, niečo cez 20W navyše u Core i7 oproti Core 2 je vcelku akceptovateľných. Horšie to však už je v záťaži, keď sa síce ukáže sila nových procesorov, no zároveň si to vyžiada daň v podobe veľkého nárastu celkovej spotreby. Svoje robí samozrejme aj automatické pretaktovanie Turbo Boost, ktoré u Core 2 procesorov prítomné nie je.
Tieto grafy však nemusia byť definitívne, nakoľko sa jednalo o predprodukčné vzorky procesorov aj základnej dosky, spotrebu čipov a dosiek dostupných v predaji odhadujem o niečo nižšiu.

Pri diskusii, aké testy by chceli čitatelia vidieť v tejto recenzii, zaznela aj otázka, či bude možné chladiť Core i7 pasívne. Už pri pohľade na predchádzajúci graf sa črtá odpoveď, teplotné výsledky myslím potvrdia ak poviem, že pasívne to proste nepôjde.
Pre meranie teplôt bol použitý chladič Noctua NH-U12P a Intel BOX na automatickej regulácií základnou doskou. Treba však poznamenať, že IHS (tepelný rozvádzač na procesore) trpel dosť veľkými nerovnosťami a tak nebol zabezpečený ideálny kontakt so základňou chladiča.

Intel BOX:




Noctua NH-U12P:




Pomerne hrubá vrstva teplovodivej pasty nutná na prekrytie nerovnosti zabránila účinnému prenosu stratového tepla a tak Noctua podala iba o 6°C lepší výsledok v stave bez záťaže a cca o 10°C v záťaži. Zvukový prejav Noctu-i bol ale pri tom podstatne kultivovanejší ako BOX chladiča.

Záver

Zhrňme si teda, čo sme sa o nových procesoroch Core i7 dnes dozvedeli.
Intel spravil mnoho zmien, medzi inými po prvý krát presunul pamäťový radič z čipsetu priamo do procesora, ako to spravila konkurencia už dávno, a opäť "vzkriesil" technológiu HyperThreading. Už pomaly ale isto dosluhujúce FSB nahradila zbernica QPI. V podstate sa Intel s týmito novinkami ponáhľať nemusel, keďže aj jeho súčasné procesory mu zabezpečujú náskok nad konkurenciou vo výkone a konkuruje teraz skôr sám sebe, no Nehalem je hlavne o prínose pre serverovú oblasť. Väčšina zmien v architektúra sa zameriava hlavne na zlepšenie pozície v tomto segmente.

Pre hráčov alebo bežných užívateľov neprinesie Nehalem architektúra takmer nijaké výrazné zmeny, pre koho sú ale takmer povinným nákupom sú profesionáli v biznise týkajúceho sa renderingu či spracovania videa. Tu sú rozdiely oproti rovnako taktovaným a drahým procesorom Core 2 Quad niekedy takmer dych berúce, je vidno že HyperThreading nachádza dnes už podstatne lepšie uplatnenie. Výkon ale stúpol aj pri jednovláknových aplikáciách. Jednoznačne ale vidno, že Intel chce nasmerovať celý IT biznis smerom k väčšiemu paralelizmu. Tentoraz spravil veľký krok vpred, ostáva na vývojároch komerčného softvéru, ako toto využijú.


Core i7 – prvé natívne štvorjadro Intel-u


Pokiaľ ide o pretaktovanie, nové Core i7 nezaprú svoj pôvod v populárnych Core 2 procesoroch, navýšenie taktu o 1GHz u týchto štvorjadier by opäť nemal byť veľký problém. Veľkým talentom sa javí práve najlacnejší model Core i7 920.

Keď sme už pri tej cene, tá bude hlavným problémom, aspoň teda v tomto čase. Ak by sme vzali do úvahy najatraktívnejší spomedzi trojice nových procesorov – Core i7 920, tak ten je cenou približne na úrovni Core 2 Quad Q9400 s rozdielom iba niekoľko sto korún, čo je v tejto cenovej triede zanedbateľné.

Situácia však komplikuje, keď začneme vyberať základnú dosku a pamäte. Momentálne je na trhu iba pár základných dosiek so zatiaľ jediným Core i7 kompatibilným čipsetom Intel X58, a tie sú všetky z najvyššej high-end triedy, teda aj s vysokou cenou. Najlacnejšia doska pre Core i7 je teraz (v čase písania článku) GIGABYTE EX58-DS4 za približne 7500,- Skk, zatiaľ čo pri výbere základnej dosky pre napríklad spomínaný Core 2 Quad Q9400 máme dostupné riešenia už od približne 1500,- Skk, aj keď kvalitou sa samozrejme nevyrovná high-end-u. Doska z rovnakej série od Gigabyte (DS4) čipsetom X48 pre Core2 architektúru stojí asi o 1500,- Skk menej ako DS4 s X58 pre Nehalem.

Ďalší problém je cena RAM pamätí. 1GB DDR2 modul na bežných 800MHz je dnes takmer „zadarmo“ (už od 300,- Skk), no 1GB DDR3 stojí stále pomerne veľa – nad 800,- Skk. Pritom pre dual-channel zapojenie, ktoré je štandardom u súčasných platforiem Intel aj AMD, postačia dva DDR2 moduly, no u Nehalem platformy je ideálne mať moduly tri do triple-channel.


Cenoví rivali z rovnakého tábora – Intel Core i7 920 a Core2Quad Q9400


Ceny DDR3 budú samozrejme ďalej klesať, už v priebehu tohto roka klesli dosť významne, no ceny základných dosiek s X58 sa asi až tak veľmi neznížia, pretože ide o high-end čipset a teda aj high-end dosky. O čipsete strednej triedy pre Core i7 9xx sa zatiaľ neobjavili žiadne informácie, na pláne je asi jedine P55, ale ten nebude určený pre LGA1366 ale pre LGA1156 pre iné varianty Nehalem procesorov.

Či je upgrade na novú platformu správny krok musí uvážiť každý sám, hlavne podľa toho, s akými aplikáciami pracuje a či sa vyššia investícia navyše oproti počítaču s Core 2 procesorom v konečnom dôsledku vyplatí.



V konečnom verdikte sme chceli procesoru Core i7 920 udeliť ocenenie najlepší pomer cena/výkon, no to mu ušlo iba tesne a to hlavne kvôli pomerne vysokým nákladom za celú platformu (základná doska a DDR3 RAM). Keď neskôr ceny týchto produktov poklesnú, stane sa tento procesor určite veľmi obľúbeným, možno sa bude dať prirovnať k už legendárnemu Core2Quad Q6600 – ktorý za priaznivú cenu ponúka štyri jadrá s výborným pretaktovacím potenciálom.
Dnes si nové Core i7 procesory od nás odnášajú "iba" ocenenie za vysoký výkon:




Za zapožičanie testovacieho balíku Intel Nehalem ďakujeme spoločnosti Intel



Za zapožičanie chladiča Noctua NH-U12P pre LGA 1366 ďakujeme spoločnosti Noctua



Za poskytnutie základnej dosky Gigabyte EP45-DS3R ďakujeme spoločnosti Gigabyte



V článku boli použité niektoré informácie zo serverov AnandTech a X-bit labs.
Komentáre (4)
eXistenZ
Sila nehalemu nemá pri štandardných grafických riešeniach naviac čo povedať. Pri SLi, či CrossFire najvýkonnejších riešení ale jeho priepustnosť a výpočetná sila dokážu ukázať súčasnému Core2 zadnicu. Inak pekný článok :)
crux2005
v jednej z budúcich recenzii... ;-)
prepelica
celkom pekna cena...za tu najnisiu verziu zaplatite len necelych 10 000sk xD....to uz ozaj vidim buducnost v GPGPU
A2C
prosím vysvetli kde ukáže chrbát v SLI alebo CF? 3D Mark alebo normálne v hrách? ak mi povieš že v v hrách tak sa ti zasmejem lebo evidentne nevieš čo trepeš, ak v 3D Markoch tam máš pravdu a to ma teší ako Ocera ale reálne nemá pre ľudí zaťiaľ prechod na Core i7 platformu zmyseľ a dovolil by som si tvrdiť že ani pre Ocerov nakoľko CPU a MB ešte nie sú odladené a tak nedokážu podávať ten výkon na ktorý sme sa tešili a dúfali, nepochybne pre profíkov ako serveri alebo grafici čo používajú primárne výpočtovú silu CPU a nie GPU pre nich ten výkon navyše stačí ako dôvod na prechod ale treba si počkať a bude to zaujímavejšie pre hráčov nevidím dôvod prechádzať z QX9770 na Core i7 965, vidím to maximálne pre tých čo majú teraz tak max dvojjadrá
Pridať nový komentár
TOPlist