Intel Core i7-6700K a i5-6600K Skylake proti Haswell i5-4690 – prišiel už čas na upgrade?

 
5.8. predstavil Intel oficiálne prvé 2 procesory Core i7-6700K a Core i5-6600K novej Skylake architektúry a oba tieto kúsky máme dnes v teste! Tieto novinky si dobre rozoberieme a porovnáme ich s procesorom z generácie Haswell i5-4690. Chýbať nebudú rýchle DDR4 pamäte a to všetko sa bude odohrávať na novučičkej základnej doske MSI Z170A Gaming M7, ktorú si otestujeme taktiež.

Dnešný článok mal byť v podstate klasickou recenziou na základnú dosku od MSI, no vzhľadom na prítomnosť oboch nových procesorov by bol hriech neporovnať ich výkon a nepredstaviť si novú platformu. Času na otestovanie som mal pomerne málo, no pokúsil som sa priblížiť vám výkon nových procesorov čo najlepšie. Čaká náš vyčerpávajúca recenzia, takže sa pohodlne usaďte, ideme na to.
 

Intel Skylake sa predstavuje

 
5.augusta 2015 Intel oficiálne uviedol prvé 2 procesory najnovšej generácie Skylake. Táto v poradí už 6. generácia architektúry Core predstavuje takzvanú tock fázu z tick-tock rytmusu uvádzania Intel procesorov. Tick fáza predstavuje uvedenie nového, menšieho výrobného procesu, zatiaľ čo tock fáza prináša novú architektúru s nemeniacou sa výrobnou technológiou. Skylake používa rovnako ako Broadwell 14nm výrobný proces a Skylake by tak mal priniesť prekopanejšiu architektúru. Intel však žiaľ zatiaľ (k dátumu 17.8.) nezverejnil detaily novej architektúry.
 
Prvými dvoma zástupcami Skylake rodiny sú procesory Intel Core i7-6700K a Intel Core i5-6600K, ktoré boli predstavené 5.augusta. Tieto modely majú spoločné viaceré parametre, pekne si však každý zvlášť opíšme nech je v tom poriadok.
 
 
Core i5-6600K má 4 jadrá a nepodporuje HyperThreading. Má odomknutý násobič a L3 cache je veľká 6MB. Základný takt je 3,5GHz, s Turbo Boost 2.0 technológiou však poskočí na 3,9GHz. Integrovaný je pamäťový radič pre dual-channel zapojenie DDR3L pamätí s frekvenciou 1600MHz alebo DDR4 pamätí s frekvenciou 2133MHz. Vieme však, že to sú oficiálne čísla a nebude problém dostať sa vyššie. Grafickou častou je Intel HD Graphics 530 (GT2) so základnou frekvenciou 350MHz a Turbom 1,2GHz. TDP je stanovené na 91W.
 
 
Core i7-6700K má taktiež 4 jadrá, no podporuje HyperThreading a v operačnom systéme tak vystupuje ako 8-jadrový. L3 cache je veľká 8MB a procesor má taktiež odomknutý násobič. Základný takt je rovných 4000MHz, s Turbom poskočí na 4,2GHz. Procesor má tiež dvojkanálový pamäťový radič pre DDR3L/DDR4 pamäte s frekvenciou 1600MHz resp. 2133MHz. Grafická časť je rovnaká, Intel HD Graphics 530 s rovnakými taktami ako u predchodcu. TDP má taktiež 91W.
 
 
 
Podobne ako u predošlých generácii bude mať aj Skylake rozdelené skupiny procesorov podľa určitých vlastnosti. Procesory skupiny i7 budú podporovať Turbo Boost 2.0 aj HyperThreading. i5 procesory už nebudú mať HyperThreading a procesory i3 by mali mať maximálne 2 jadrá, táto informácia však ešte nie je potvrdená.
 
Čím nás však Intel sklamal je, že medzi čipom a tepelným rozvádzačom (IHS) nepoužil pájku, ale opäť iba pastu. Portál PC Watch sa pozrel procesoru i7-6700K „pod sukňu“ a tento fakt potvrdil. Tento materiál s prímesami striebra (TIM – Thermal Interface Material) však nemá tak dobré vodivé vlastnosti ako pájka a pri jeho zmene pastou Prolimatech PK-3 či profesionálnou pastou Cool Laboratory Liquid Pro sa teploty procesora znížili o 20°C pri pretaktovaní! Škoda tak, že sa Intel rozhodol pre pastu, pretaktovanie procesorov mohlo byť tak ešte o kúsoček lepšie. Ak patríte medzi úplných extrémistov môžete si pastu vymeniť doma, no odstránenie IHS nie je vôbec jednoduché a môžete nadobro poškodiť procesor nehovoriac o tom, že prichádzate automaticky o záruku. Tento krok tak neodporúčam. Zaujímavosťou je, že samotný čip je menší aj ako i7-5775C Broadwell, ktorý je taktiež vyrábaný 14nm procesom. Ten má však väčšiu grafickú časť a 128MB SRAM pre iGPU.
 
    
    
 
 
Intel u Skylake procesorov tiež zmenil spôsob, akým sa narába s napätím a vrátil ho späť do rúk základných dosiek. FIVR (Fully Integrated Voltage Regulator) regulátor sa už priamo v procesore nenachádza a činnosť regulácie napätia má na starosti základná doska tak ako tomu bolo pred Haswell procesormi. To by malo zabezpečiť nižšie teploty procesorov, na druhej strane sa to môže prejaviť vyššími cenami základných dosiek.
 
 
Výraznou zmenou malo prejsť integrované grafické jadro, ktoré nesie názov Intel HD Graphics 530. Intel zatiaľ neposkytol žiadne informácie o architektúre tohto jadra a urobí tak zrejme na IDF 18.8., zatiaľ tak spomeniem informácie, ktoré presiakli na verejnosť. Nový čip nepodporuje už D-Sub (VGA) porty a ich prítomnosť tak na doskách bude asi minimálna a musí byť zabezpečená patričným čipom tretej strany na doske. Miesto toho nová grafika podporuje zapojenie až piatich monitorov cez HDMI, DisplayPort či Embedded DisplayPort. HD 530 podporuje DirectX 11.2 či DirectX 12 a OpenGL 4.4 či OpenCL 2.0. Grafika pretlačí obraz v rozlíšení 4K pri 60Hz a to buď cez DisplayPort 1.2, ale nie cez HDMI 2.0, nakoľko to nie je natívne podporované a treba ho zabezpečiť prevodníkom. Nechýba tiež podpora WIDI (Intel Wireless Display) technológie a vylepšený je Quick Sync dekóder. Prítomný je už aj plnohodnotný HEVC dekóder. Na hranie náročných hier vo vysokých rozlíšeniach a so maximálnymi detailmi táto grafika najvhodnejšia nie je, no staršie či menej náročné hry HD 530 bez problémov zvládne.
 
 
Celkovo bude v Skylake procesoroch 6 variantov Intel HD 530 grafiky:
 
  • GT1 – 12 execution units
  • GT1.5 – 18 execution units
  • GT2 – 24 execution units
  • GT3 – 48 execution units
  • GT3e – 48 execution units so 64 MB eDRAM
  • GT4e – 72 execution units so 64 alebo 128 MB eDRAM
 
Procesory majú rovnako ako Broadwell či Haswell 16 PCIe 3.0 liniek, ktoré môžu byť rozdelené v pomere x8/x8 alebo x8/x4/x4. Poslednou výraznou zmenou u Skylake je možnosť taktovania cez BCLK tak ako tomu bolo kedysi. Intel úplne oddelil frekvenciu PCIe od taktu BCLK a hodnotu BCLK je tak možné dvíhať ľubovoľne v krokoch po 0,1MHz.
 
 
Nové Skylake procesory sa predávajú v pestrých baleniach, ktoré sme vám ukázali už dávnejšie. Okrem procesora a manuálu v krabici nenájdete Intel Stock chladič ako tomu bolo zvykom predtým. Nie je však veľká tragédia nakoľko kompatibilita s chladičmi pre LGA115X patice zostáva a váš starý chladič by ste tak bez problémov mali nainštalovať aj na nové Skylake procesory. Dobrou správou je tiež fakt, že oba procesory už plnej sile dorazili do slovenských e-shopov. Výkonnejší i7-6700K sa predáva od necelých 360€, zatiaľ čo jeho súrodenec i5-6600K stojí asi 260€.
 
Komentáre (21)
Pjetro de
Strucne: upgrade znamena komplet zmenu platformy: fosna, CPU, RAMky a chladic (ktory sa nedodava). Ideme odzadu, chladic: kto chce vykon ozaj vyuzivat, BOX atrapu musi aj tak nahradit, starej mame staci aj BOXovy, stara mama ale nema Ci7 4790K a ani nebude mat 6700K a bola by nacisto blba, keby 4790K "upgradla" na 6700K. RAM: DDR4 zacina a VZDY VZDY VZDY VZDY VZDY to bolo tak, ze ked zacinala nova generacia DDR, tak v zaciatkoch bola pomalsia jak zabehnute rychle modely predoslej generacie. Okrem toho RAM NIE JE uzke ziadneho systemu ani take dva 16 MiB 66,6 MHz 72pin SIMM moduly pri Pentiu MMX ci K5 s priepustnostou par stoviek MB/s (latencie su stale 50-70 ns, to sa nezmenilo 2 dekady, stupaju iba kontinualky, detto pri HDD ... marketingove hausnumera 8,9 ms sa uz pri HDD ani neuvadzaju, lebo to nikoho nezaujima), ked cache system CPU bol mnoho desiatok nasobne pomalsi jak dnes a Ultra ATA 33,6 ci 66,6 disk mal vtedy teoreticku priepustnost 33 ci 66 MB/s, prakticky mali take disky kontinualku 10-12 MB/s. RAM nie je v ziadnom systeme uzke hrdlo, ani moja 1066 MHz CL5 DDR2 ekvivalentna 1333 CL7 DDR3 alebo 1600 MHz CL9. RAM moze byt brzda jedine kapacitou, ale nie rychlostou. Upgrade RAM kvoli rychlosti je blbost najhrubsieho zrna. CPU: no comment. Samozrejme sa upgrade neoplati. Nepribudla JEDNA JEDINA instrukcna sada, len tusim fixli TSX. IPC vyssie v porovnani s Haswellom o par %? No uplne uzane. Signifikantne stupol iba vykon iGPU, co je 99% userom suma-fuk. Hrac a GPGPU drtic ma dedikovanu grafiku (pretoze tam je to nutnost) a na svetko ostatne (okrem 4K H265) staci aj 3-rocne APU ! Fosna s novym chipsetom: to je to jedine, kde ma zmysel uvazovat o upgrade. Ale uograde kvoli fosni? Doteraz bolo pojmom upgrade vzdy myslene kvoli vykonu/kapacite a nie vymozenostiam fosne.
Uzivatel
Pozeram ze procesor vyzera ako stare athlony xp v strede kusok kovu a zvysok kuprexid setria na materialy?Dost ma sklamalo ze ziadne nove instrukcie nesu nejake sse5 x265 hardwerove dekodovanie enkodovanie no vyzera to tak ze ja stale ostanem pri mojom sandy bridge par percet v hrach nepotrebujem ja potrebujem hgardwerove enkodovanie starych x264 na x265 tento chip ma nema cim oslovit na to co potrebujem je nepouzitelny
Pjetro de
O "x265 hardwerove dekodovanie enkodovanie" sa stara iGPU v APU, nie CPU cast. Skylake je prve APU Intelu, kde je HW podpora standardu HEVC H265 uplna (farebka hlbka, faberny priestor, rozlisenie, fps). Ak by si chcel na dekodovanie (t.j. pozeranie) a enkodovanie (t.j. vytvaranie) videi pouzivat CPU cast, tam je zatial vrchol SSE4 family.
Legend
Znie to zaujímavo :) ale oplatí sa mi prejsť z i5 2500K na nejaký tem Skylake? či radšej počkať na niečo novšie?
Pjetro de
A) IPC vykon je velmi podobny, pravda SandyBridge je na rovnakych frekv. o nejakych 15% menej vykonny. Ale to neni ziadna tragedia to neni ziadny dovod na upgrade. Ani Duron 700 MHz nikto neupragoval na Duron 800 MHz, bol by blb. Ked mal taku psychicku potrebu, radsej tu 700vku pretaktoval. Upgrade si dal az na nejaky 2-3x vykonnejsi Athlon XP 2000+ a viac. B) Na CPUworld si porovnaj instrukcne sady 2500K a 6700K, a porozmyslaj, ci ti vyhovuje rozdiel vo vybave instrukcnych sad a ako vyuzijes tento rozdiel v podpore instrukcnych sad. Teda inak ci nejako intenzivne vyuzijes tie sady, ktore ma navyse 6700K oproti 2500K. Netusim ci nieco ubudlo ale skor nie. Ak ano, porozmyslaj ci ti nebude chybat nejaka sada, ktoru 2500K ma a 6700K nie. Napoveda: AES = HW podpora sifrovania (dobre napr. pri pouzivani TrueCrypt) ale to ma aj 2500. Rovnako ma aj SSE4. Neviem o nikom, kto by zivotne potreboval veci ako AVX, AVX2, BMI1, BMI2, F16C, FMA3 a novu a novo-opravenu TSX, ktoru snad nevyziva ziadny softver.
Kalo
b)práve tie vektorové inštrukcie určujú IPC procesorov.
Pjetro de
Heeeeee? To je ako keby znacka pneumatiky mala urcovat znacku auta ...
Kalo
To prirovnanie je mimo rovnako ako všetky prirovnania áut k pc a pc k autám. Ale vskratke, operácie nad vektormi alebo FMA (fused multipy add) sú spôsobom, ako zvýšiť IPC procesora. Pretože jeho IPC je nemožné zvýšiť spracovaním "náhodných"(presnejšie nesúvisiacich) dát náhodnými inštrukciami (v takom prípade bude mať najnovšia i7 rovnaký výkon ako pentium 4 alebo obyčajný Atom). Ale ak sa využije to, že tie inštrukcie dokážu spracovať 6-8 operácií povedzme za takt, tak sa dostávame niekde úplne inde. Veľmi dobre to je vidieť na optimalizáciách v Intel kompilátore. Ak sa zistil Intel genuine procesor, tak sa použije AVX/SSE, inak sa to počíta "klasicky". Výsledok: 2GHz i3 >= 5GHz AMD.
Pjetro de
A nemylis si ty nahodou IPC s vyuzivanim instrukcnych sad? 1) Aj AES mi zrychli spracu so zasifrovanym TrueCrypt imidzom asi 10-12 nasobne oproti CPU, ktory instrukcnu sadu AES nema. Ale tam cele caro AES konci. Nepomoze mi pri enkodovani videa. Detto ostatne vyvinute a v CPU hardverovo "zadrotovane" instrukcne sady. Napr. ked je kodek optimalizovany na vyuzivanie SSE4 family, tak moze byt enkodovanie videa s presne tymi istymi nastaveniami kodeku 2-3x rychlejsie ako na CPU, ktory SSE4 family nepodporuje. 2) Specifikacie jedneho modelu Core 2 Duo (arch. Conroe): hhttp://www.cpu-world.com/CPUs/Core_2/Intel-Core%202%20Duo%20E6600%20HH80557PH0564M%20%28BX80557E6600%29.html Specifikacie jedneho modelu Pentia 4 (arch. Netburst): http://www.cpu-world.com/CPUs/Pentium_4/Intel-Pentium%204%20640%203.2%20GHz%20-%20JM80547PG0882MM%20-%20HH80547PG0882MM%20%28BX80547PG3200F%29.html Aky tam vidis rozdiel v istrukcnych sadach? Kde je jake AVX, AVX2, FMA3, FMA4 .... napriek tomu ako dobre vieme, v 2006 nastala mala revolucia na poli CPU (aka sa uz nestane), ked IPC stuplo skokovo o 70-80%, SuperPI benchmark (vyuzivajuci x87 jednotku) napovie jake casy malo Pentium 4 a jake Core 2. Jedno jadro Core 2 na 2,4 GHz drtilo jedno jadro Pentia 4 na 3,6 GHz jak salat. IPC znaci jak CPU vnutorne pracuje a Pentium 4 pracovalo sakramentny blbo (navrhnute bolo pre vysoke frekvencie a dlha pipeline = nizke IPC). S IPC vlastne suvisi aj zakladny princip prace CPU na baze von Neumanovej/Turingovej architektury a boolovej algebre. A tam uz sme tiez na hranici.
Kalo
A ako si myslíš, že sa dnes IPC zvyšuje? 1- Však jasné, tie inštrukcie majú obmedznenú využiteľnosť, ale aj tak napríklad v prípade AVX alebo SSE je myslím dosť široká. Navyše sa stačí pozrieť na testy a recenzie: drvivá väčšina ich používa benchmarky na nich založené. Konkrétne tuto, rendering(SSE), Sandra(stavím sa že inplementuje AVX) a zvyšok sú testy pamätí. A tam sa končí vedenie Skylake proti ostatným procesorom. 2- Core 2 implementovalo SSE 4/4.1 (alebo ako si to pomenovali), Pentium 4 nie. Povedal by som že to bol ten rozdiel v renderovaní a ostatných multimediálnych aplikáciách (aj hrách). A ak som správne pochopil tak aj implementácia algoritmu v SuperPI využije SIMD.... Aké ďalšie rozdiely v nich boli? Povedal by som že veľa nie. IPC neoznačuje, ako procesor vnútorne pracuje. Dlhá pipeline sa automaticky neznamená nízke IPC. Dokonca, ak nedochádza k výpadkom cache, tak bude dlhšia pipeline výkonnejšia (koniec koncov, sám Intel ju posledných pár rokov rozširuje). Viď asic čipy kde by som povedal dlhšia pipeline = vyšší výkon (samozrejme nedá sa to úplne preniesť na procesory). Súvislosť IPC a základného princípu práce cpu? Myslím že nerozumiem... A čo s tým má Neuman a Turing? IPC súvisí len so schopnosťou vykonať viac inštrukcií za jeden takt. Bodka. Žiadna architektúra, žiaden Turing. Dosiahne sa to len paralelizáciou na úrovní inštrukcií. A to: a) superskalárne: viac rôznych inštrukcií- implementačne náročné, je nutné riešiť závislosti pred aj po vykonaní, závažnejšie výpadky cache... b) SIMD: rovnaká inštrukcia nad celým vektorom- závislosti rieši kompilátor alebo samotný algoritmus, dá sa predvídať ktoré dáta majú byť v cache... Naozaj netuším ako inak si predstavuješ ten skok v IPC.
Pjetro de
Predsa len, nemylis si IPC s vyuzivanim instrukcnych sad? Prirodzene ze SIMD sady zrychluju vypocty mnoho-mnoho-nasobne, kedze sa rovnaka instrukcia vykonava nad mnohymi datami. IPC spociva vo zvyseni efektivity prace CPU, bez uvazovania o instrukcnych sadach. Ako uz bolo vysvetlene na jednom nemenovanom SK-IT portali, je par krokov, ktore procesor potrebuje k tomu, aby vyplul nejaky vysledok, co je exactly a presne tychto 5: fetch instruction, decode instruction, execute instruction, access memory, write result. V idealnom pripade si schopny spravit tychto 5 ukonov naraz pre rozne ulohy v jednom jedinom takte. Teda, pekne povedane, v idealnom pripade, ze vsetko idealne bezi, si schopny dosiahnut idealne IPC exactly a presne rovne, prekvapivo, rovnych 5, kedze tychto 5 uloh sa urobi naraz. Samozrejme pri SIMD ti staci urobit jedna jedina z tych 5 na velikanskom mnozstve dat a aj tak je to efektivne jak svina, lebo je to SIMD. Ale neexistuje CPU, ktory by mal pre jedno vlakno tuto hodnotu nie 5, ale 10 alebo 20 alebo 50 alebo 100. https://en.wikipedia.org/wiki/Instructions_per_cycle Ako vysvetlis 50-60% rozdiel v IPC medzi AMD stavebnymi strojmi a Intel Ci7/5/3? Instrukcne sady maju takmer totozne. Odpoved: presne rovnako ako 80% rozdiel v IPC medzi Pentoim4 a Core2: samotna vnutorna mikroarchitektura CPU. Pr.: Intel Core 2 ma IPC 4 a AMD K10 ma IPC 3 (uzke hrdlo je dekoder). A postNehalem CPU tuto hodnotu posunul na samotnu teoreticku hranicu. Tazko niekto uvedie x86 CPU na sucasnom koncepte, ktoreho jedno jadro/vlakno na 2 GHz rozdrti jedno jadro/vlakno Ci7 na 5 GHz. To proste uz nejde. Tu mas hodnoty IPC niektorych dalsich kuskov od Pentia1 po Pentium4: Pentium 1 1.1 Pentium MMX 1.2 Pentium 3 1.9 Pentium 4 (Wil) 1.5 Pentium 4 (Nor) 1.6 Pentium 4 (Pre) 1.8 Pentium 4 (Gal) 1.9 Pentium D 2 Pentium M 2.5 Core 2 3 K6 II 1.1 K6 III 1.3 Athlon B 1.9 Athlon C 1.9 Athlon XP 2 Athlon 64 2.3 Athlon 64 X2 2.5 Via C3 0.85 Via C7 0.9 zdroj: http://brej.org/blog/?p=15
Kalo
Skôr sa obávam, že celkom nechápeš princíp pipeline :/ https://upload.wikimedia.org/wikipedia/commons/thumb/c/cb/Pipeline,_4_stage.svg/375px-Pipeline,_4_stage.svg.png Jedna pipeline nedokáže dosiahnuť IPC rovné 5. Dokáže sa len blížiť 1 pretože k poslednej fáze (write-back) sa dostane vždy len jediná inštrukcia, ostatné inštrukcie v pipeline využívajú to, že keď je predošlá inštrukcia v neskoršej fáze, môže byť fáza decode/execute už idle. Tým sa zvyšuje IPC ale nie z 1 na X, zvyšuje sa z 1/X na ->1. Je vlastne nelogické že počet stupňov pipeline = IPC, potom by také Pentium 4 malo IPC cez 20 :D Na to aby si dosiahol IPC vyššie ako 1 potrebuješ viac pipeline teda superskalárny procesor. https://upload.wikimedia.org/wikipedia/commons/thumb/4/46/Superscalarpipeline.svg/300px-Superscalarpipeline.svg.png Len tak sa dostanú k poslednej fáze dve inštrukcie naraz. 60% rozdiel v IPC by som pripísal tomu, že Stavebné stroje zdieľajú jednu FPU na 2 jadrá (+ tá FPU je jasne slabšia). Takže má 2 dispatchre na 1 FPU, teda jeden z nich čaká. Inak samozrejme, sú tam rozdiely aj v logike procesorov, ale nie také, ktoré by spôsobili taký rozdiel IPC. Tiež rozdiel medzi Pentiom 4 a Core 2. Nechápem ako tomu môžeš pripisovať taký význam. Bola to len normálna evolúcia, niečo vyhodili, niečo posilnili... Prejavilo sa to v benchmarkoch a na tom aj zaožili reklamnú masáž, ale žiadna revolúcia v konštrukcii CPU to nebola. A IPC sa môže ešte bez problémov zvýšiť. Dokonca si som istý, že ak by v Skylake implementovali natívne 512 bitové AVX/SSE, tak by mal v benchmarkoch značný náskok. To sa ale asi nedozvieme keďže Intel bude bez schopnej konkurencie len ďalej ryžovať ako doteraz. To ale neznamená že sme sa dostali na nejaký limit ktorý už nebude možné súčasnou koncepciou prekonať. ps.: "Ale neexistuje CPU, ktory by mal pre jedno vlakno tuto hodnotu nie 5, ale 10 alebo 20 alebo 50 alebo 100." Rusi nedávo propag(and)ovali cpu čo mal pri stovkách MHz vyšší výkon ako i7. Viem že sa jednalo o VLIW archtektúru ale nevidím dôvod, prečo by aj x86 nemôhla prebrať jej vlastnosti rovnako ako ich prebrala architekrúram RISC.
Pjetro de
Jo, v niecom mas pravdu, s tou pipeline je to jasne. A ak niekto vyda CPU na par 100 MHz co so svojim IPC rozdrti Ci7 a v SuperPI da 1M za 1/4 sekundy miesto 8-10 sekund, asi bude "troska" odlisny od Ci7. No a Netburst vs. Core 2? Nezartuj. To bola najvacsia udalost po roku 1993, ked prislo nieco podobne prevratne a superskalarne Pentium P5 na 75 MHz drtilo 486 DX4 na 100 MHz jak salat. Toto boli DVE najvacsie IPC revolucie v CPU svete: 1993 (486 vs. 586 aka Pentium) a 2006 (Pentium 4 Netburst vs. Core 2). K tym stavebnym strojom: je to blbe zapojenie a vykon mizivy, nechapem ze to nevideli uz pred vydanim. Ked to urobia v Zene jak hovori clanok: http://diit.cz/clanek/amd-zen-diagram-fpu, IPC razom stupne kvoli vacsiemu poctu pipeline a ako aj preto, ze je to konecne bude zasa plnohodnotne jadro s rozumnym zapojením fetch a decode a hlavne FPU vykon by mal byt vo vascine pripadov 4x (!!!!!!) vacsi (vo zvysku pripadov aj tak 2x vacsi), ponivac nebudu dve 128 bitove FPU na 2 jadra, ale dve 256 bitove FPU na jedine jadro! V stabevnom stroji sa sice pri jednom vlakne dokazali dve 128 bitove FPU spojit a byt ako jedna 256 bitova, to ale neni treba furt. S tymto si dokazem predstavit dorovnanie vykonu Ci7.
Kalo
Nemusel by byť až tak odlišný. Vravím, stačilo by, ak by dostatočne posilnili FPU, ALU... samozrejme by bolo nutné prispôsobiť logiku k obsluhe toľkých queue, ale pri SIMD by to nemusel byť až taký problém... Potom by v IPC drvil všetky predošlé i7 (samozrejme, adekvátne tomu posilneniu) pretože drvivá väčšina dnes používaných benchmarkov z toho bude profitovať (pretože sú paralelné, s počtom prostriedkov zrýchľujú takmer lineárne, či už na úrovni vlákien alebo inštrukcií). Česť výnimkám ako SuperPI, ktoré budú z IPC profitovať len do určitého bodu, daného algoritmom ( https://en.wikipedia.org/wiki/Gauss%E2%80%93Legendre_algorithm ), ale takých benchmarkov je dnes veľmi mááálo a na priemernom IPC (udávanom Intelom) sa podpíšu minimálne. Nežartujem. Rozdiel medzi Pentium 4 a Core 2 alebo 486 a Pentium bol rovnaký, ako medzi napr Sandy a Ivy bridge. Hlavnú rolu tam ale hrala reklama: "Starý bol zlý, ale tuto je úplne nový ktorý s ním nemá nič spoločné a je dobrý". Technicky je ale prvé Pentium len 486 s viac (dvoma) pipeline a lepšími ALU. Samozrejme sa museli vysporiadať s novými problémami, ktoré to prinieslo, ale nebolo to nič nové ako keď sa to riešilo v 80' rokoch na RISC prosecoroch (presne, Pentium nebolo prvé superskalárne a revolučné v IPC). To isté Core 2. Tá zmena sa len môže zdať výrazná ale len preto, že na ňu mali v predošlých architektúrach priestor a boli k tomu donútení trhom, ale stále to bola len bežná evolúcia. O stavebných strojoch myslím nemá cenu diskutovať. Je jasné že neodhadni pomer medzi integer a float jednotkami (predpokladali, že to doplnia pomocou GP-GPU). Zaujímavejšie sú teórie o Zene :D Totiž, môže sa stať že to opäť neodhadli. Úvaha: majme rok 2016-17, uvedú Zen s IPC ako i7, alebo vyšším (vďaka HBM, ak by bola náhodou DDR pre i7 limitujúca) a Intel sa dostane do "šachu" (eDRAM drahá, 3dxpoint nedostupná). Čo môže robiť? Uvedie nový revolučný procesor s obrovským počtom pomalých ale zato vysokoefektívnych jadier (priepustnosť bude riešiť šírka zbernice). AMD tak bude môcť mať procesor s vysokým IPC, ale to mu nebude nič platné, pretože ním nemá šancu konkurovať hrubému výkonu stoviek menších jadier (dnes CPU vs GPU). Viem si celkom živo predstaviť, ako väčšina benchmarkov migruje s instruction na thread level paralelization. A dôsledok? Recenzentmi (opäť) odpísaný procesor, utopené miliardy vo vývoji a výrobe, ďalších pár rokov stratených vývojom novej architektúry... Viem, na tej úvahe je vidieť že je už sobota večer ( :D ), ale môže to byť celkom reálne. Stačí sa pozrieť, na to čo Intel v posledných rokoch robí: Zmenšuje jadrá, minimálne implementácie nových inštrukcií, zrušenie AVX512 v Skylake, snaha o Knights landing...
Pjetro de
1993 a 2006 revolucia imho bola. A dost velka pre beznych pouzivaletov PC. Sak vykon na rovnakej frekvencii stupol vtedy vzdy takmer na 2-nasobok. Nie kvoli instrukcnym sadam, ale kvoli navrhu CPU. Napr. take Pentium P5 a Pentium P55 MMX sa lisili instrukcnou sadou MMX (a tusim vyrobnym procesom). MMX umoznovalo na rovnakej frekv. CPU az o 50% rychlejsie mutimedia (vlastna skusenost napr. zo zatazenia CPU pri prehravani 128 kbps mp3). Aj to bolo vtedy vitane, 50% narast vykonu pri multimediach. A SandyB vs. IvyB? SandyB vs. IvyB nebolo absolutne ale absolutne ale absolutne nic, iba die shrink. S tym mozno suvisia nejake energeticke naroky, TDP a veci okolo, ale v ziadnom pripade nie vykon. Nezda sa mi ze by jedno jadro IvyB bolo na rovnakej frekvecnii o 100%, o 50% ci dokonca ani o 10% vykonnejsia jak jedno jadro SandyB. Co sa tyka mnoho-desiatok-jadrovych CPU v netobooku/PC s malinkymi malo vykonnymi jadrami: myslim ze to nam nehrozi. To nebol ziadny problem hardverovo urobit/vyrobit aj pred par rokmi a mat nejaky 16-jadrovy 32-vlaknovy CPU s DTP 80W a s malilililinkatymi jadierkami jak najnovsieout-of-order Atomy a rozumnym mnozstvom cache. Taky CPU je ale pouzitelny jedine pri vysoko paralelizovanom nasadeni, kde bezi plno vysoko-narocnych uloh naraz. A to normalne pouzivanie PC/notebooku neni. Koniec koncov Knihght/Larabee je toho dokazom - cca 60 jadier ale je to len ako specificky akcelerator na specificke ucely.
Kalo
Stojím si za tým, že jediná revolučná vec pri tých procesoroch bola reklama. To že bolo MMX v multimédiách rýchlejšie vďaka tomu, že implementovali SIMD inštrukcie je predsa v súlade s tým, že ak by v i7 zdvojnásobili šírku SIMD registrov tak by tiež podobne zvýšili výkon. Alebo nie? Podobne s počtom pipeline. Ak by ho k tomu niekto prinútil tak prečo by rovnaké zvýšenie paralelizácie, ktoré už pár krát použil neviedlo k zvýšeniu IPC? Medzi Sandy a Ivy (aj medzi všetkými ostatnými i7) bolo omnoho viac rozdielov, ako len napájanie. Nerobím v Intel assembly takže si celý zoznam nepamätám, ale na 100% je tam vždy zmena cache pamätí takže aj logiky, ktorá ich využíva, čo je pri out-of-order už prakticky celý procesor. Ďalej napríklad RR, čo je silne previazané s RoB, ktorý tvorí značnú časť logiky i7. A tak by sa dalo pokračovať až by ich bolo možno viac ako v tých "revolučných" procesoroch. Len to niesú tie také zmeny ktoré majú značný dopad na IPC. Dokážeš vymenovať aspoň 5, alebo ešte lepšie, jedinú úlohu ktorá sa nedá riešiť paralelne a potrebuje ju bežný používateľ? Ja začnem: Video? Ťažko. Hudba, rendering, web? Aj hry. Veď aj SuperPi, ktorý je prezentovaný ako single thread benchmark profitule z paralelizácie. Prakticky, každý program, ktorý požaduje procesor s SSE, alebo profituje so superskalárnych procesorov je vlastne paralelizovaný na úrovni inštrukcií. Dnes sa to obmedzuje na ILP pretože tam má Intel najvyšší výkon (v efektivite thread level pralelizacie môže byť na úrovni 10 rokov starých architektúr SPARC) ale ak by ho niekto donútil k tomu aby uviedol 100 jadrový procesor tak prečo nie? Prečo by sa to nemalo používať?
Pjetro de
Pretoze dnes je vyhodne mat 8-jadrovy CPU a vykonnymi jadrami ako 100-jadrovy a prtavymi nevykonnymi jadierkami.
x3m
Z 2500K sa neoplati upgradovat, pokial teda nechces nejaku brutalnu masinu za 100 000. Inak su rozdiely vo vykone CPU fakt na urovni par percent, co si v reali ani nevsimnes. Konecne by sa mohlo zobudit AMD a vypustit nejaky super CPU, ktory by to natrel vsetkym Intelom, aby sa konecne aj v Inteli zobudili, lebo to co posledne generacie predvadzaju sa uz neda ani evoluciou nazvat. Stale je to len tak preslapovanie na mieste.
Kalo
Test jak remeň :D btw. čo si myslíte o tom, že Intel opäť posiela recenzentom golden samply? Respektíve aj do predaja, čo je dôvod, prečo je ich vo svete teraz taký nedostatok(kvôli recenziám amatérov-fanatikov). Mne to až príliš pripomína prvé testy Broadwellu, 4790k, toho pentia atď... teda že všetky mali ísť stabilne cez 5GHz. A najzaujímavejšie, že sa nad tým takmer nik nevzrušuje.
VašeMeno
Posledná hra, čo ma bavila bol Half-Life 2. Tak isto ma už nebaví neprehľadná húšť intelovských procesorov, lebo tam marketing už dávno zvíťazil nad rozumom. V podstate to vždy boli šunty - a to už od 4004 a 8008, ktoré nikto na nič rozumné nepopužil. 8080 a 8085 dostali drvivo na frak od Z80, a tí amatéri z IBM zobrali do PC 8088 len preto, že nemali peniaze na M68000 (nemali ani na 8086). 80186/80188 boli prepadáky bez komentára, 80286 sa síce vydaril, ale zae Mkvosofťáci sa v tom čase len učili programovať, takže zmršili, čo sa dalo. 80386 bol katastrofa, ale tu sa začala úspešná politika Intelu výpredajom odpadu pod názvom 80386SX. Pokračovalo to skutočne drzým 80486SX, čo bol už nezakryte vadný výrobok marketingovo zabalený do predajného produktu. "Pokrok" pokračoval praskajúcimi 5V Pentiami vo veľkosti kachličky do kúpeľne a potom neskutočnými čudami Pentium II a Pentium III v pdobe krabíc na topánky - zrajme najneslýchanejšia drzosť, akej sa ktorýkoľvek výrobca dopustl na svojich zákazníkoch. Keď ich to omrzelo, tak sa síce vrátili k normálnym čipom, ale znovu vadným, tentokrát pod názvom Celeron. Chvíľka normality zavládla pri Pentiu 4 Northwood s hyperthreadingom, vzápätí však prišli vykurovacie Prescotty. Hoci prvým dvojjadrovým procesorom už bol - v skutočnosti hybridný integrovaný obvod - PentiumPro v desivom púzdre. Rast výkonu však stále v skutočnosti primárne zabezpečovalo zvyšovanie pracovnej frekvencie, unmožnené zjemňovaním litografie, no to beznádejne skončilo, lebo takt zamrzol po dobrodružnej ceste z 1,88 MHz (u 8080) na cca 4000MHz a tak zo zúfalstva prišli po Pentiách 4 všetky tie nezmyslené viacjadrá, keďže viac robotníkov nevykope jamu rýchlejšie, ale si čakanmi navzájom porozbíja hlavy. Je to ale perfektný odrb, lebo dvojprocesor skutočne pracuje skoro dvojnásobne rýchlejšie a tak si trtkovia mysleli, že to tak bude aj so štvor, osem, šestnésť, či 256-procesorom. Čo je pdobný podvod, ako cache pamäť. V skutočnosti štvrté jadro pridá nanajvýš 20% lebo tam u6 je bitka o zbernice. A v starších operačných systémoch (AT&T Unix SVR4) dokonca pridanie ôsmeho jadra už výkon zmenšilo. A to bol systém, ktorého licencia sa predávala v stotisícoch dolárov. Netvrdím, že operačný systém sa nedá ešte viac zoptimalizovať a že neexistujú špeciálne výskumné softy, ktoré na špecilány účel využijú všetky jadrá (napr. dolovanie bitcoinov, rendrovanie, či rátanie matíc) - len to už je stroj dobrý akurát tak na rátanie atómovej bomby. Každopádne Intel v tichosti zjavne prišiel na podobnú metódu varenia kremíka, ako na púti, či výrobni kebabov. Obežníku ktorý náhodou zvládne celý výrobný proces, tak, že neiktoré čipy aspoň ako tak fungujú je hneď pridelné nové typové označenie a je marktingom okamžite rozpredávaný, ako najväčšie výpočtové delo od poľudštenia opice. Reálny Windows ich však umne dokáže hravo všetky zbrzdiť tak, že medzi lacným Atomom a aj tou najnadupanejšou semičkou je relevnatnejší rozdiel v spotrebe elektriny (ktorý jasne vidno na účte z elektárne) než v pocitovom náraste výkonu. A to sa môžu všetky testy postaviť na hlavu ...
Igor010
Čaute. Momentálne mám Core i5 760 2,8GHz + 8GB ram. Mal by pre mňa zmyslel upgrade čo sa výkonu týka na i5-6600K ?
Pridať nový komentár
TOPlist