Bitcoin pod lupou, časť 2/2

Grafické karty, FPGA, ASIC

Tu to začína byť omnoho zaujímavejšie, a pravdepodobne riešenie pre väčšinu minerov. Grafické karty poskytujú niekoľkonásobne vyšší výkon než procesory.

nVidia

ModelVýkon (MH/s)
8800GT25
9800GTX32
GTX 28553
GTS 45045
GTX 480100
GTX 560 Ti67
GTX 57098
GTX 580156
GTX 590193
GTX 670112
GTX 680120
GTX Titan340

 

AMD

ModelVýkon (MH/s)
HD 485075
HD 487090
HD 557073
HD 5750116
HD 5770156
HD 5850250
HD 5870340
HD 6750170
HD 6850250
HD 6870300
HD 6970385
HD 6990740
HD 7770190
HD 7850300
HD 7870400
HD 7950500
HD 7970650
HD 79901200

Pri pohľade na tabuľku nVidie a AMD si mnoho ľudí povie, že je tam nejaká chyba, veď taký Titan predsa nemôže byť rovnako výkonný, ako 2 generácie starý Radeon HD 5870. A tiež prečo je GTX 680 pomalšia ako jej predchodca, a zároveň podáva pätinový výkon ako jej rival, HD 7970?

Čím to teda je, že karty od nVidie podávajú, v porovnaní s Radeonmi, zlomkový výkon? Môže za to odlišná architektúra čipov oboch výrobcov a zároveň povaha riešeného problému. Veľmi dobrý článok, ktorý sa práve touto problematikou zaoberá, bol uverejnený na webe Extremetech.

V provom rade, grafické operácie prebiehajú s číslami v plávajúcej desatinnej čiarke, (FP16/32), no naproti tomu, kryptografické operácie sú vyslovene celočíselné operácie. Jedným z krokov pri výpočte hashu pomocou SHA256 sú pravé bitové rotácie nad 32-bitovými celými číslami - zjednodušene povedané, vezmeme jeden bit sprava, celé 32-bitové číslo posunieme o 1 doprava. Najpravejší bit, ktorý sme v prvom kroku vybrali, vložíme zase ako prvý zľava. Táto operácie nie je v moderných procesoroch či grafických kartách riešená takto naivne, napr. také GPU od AMD má pre túto operáciu natívnu inštrukciu (v jednom kroku o N bitov), ktorej vykonanie trvá 1 takt. Karty nVidie, okrem GTX Titanu, však toto správanie musia riešiť troma inštrukciami - dvoma posunmu (shift) a jedným sčítaním.

Radeony a GTX Titan majú taktickú výhodu - tzv. funnel shifter, súčasť ALU, ktorá dokáže vykonávať akýkoľvek druh posunov alebo rotácií za jeden takt. Tento funkčný blok pozostáva z jedného registra o 2x väčšej dĺžke (v našom prípade má 64 bitov). Pokiaľ by sme chceli rotovať určité 32-bitové číslo napravo, nakopírujeme ho do oboch polovíc tohto registra, a potom pomocou 32-bitového okna "vysekneme" z neho časť, ktorá nás zaujíma.

(schéma bitovej rotácie doprava o "offset" bitov pomocou funnel shiftera)

Pokiaľ by sme chceli urobiť bitovú rotáciu doprava o 1, nastavíme výsekové okno úplne doprava a pohneme s ním raz doľava. Nakoľko obe polovice registrov sú rovnaké, úplne naľavo sa objaví najpravejší bit a celok je zároveň posunutý doprava. Pokiaľ rotujeme o N bitov, operácia vyseknutia zaberie stále len 1 takt.

Vďaka tomu je Titan schopný vykonať 2x viac bitových posunov na (a rotácií) na multiprocesor (SMX) za takt, než GTX 680 - 32 VS 64. Titan má dohromady 14 SMX, čo dáva teoreticky 896 bitových posunov za takt. Výkon Radeonov je tiež 64 shiftov na jeden Compute Unit (CU, približne ekvivalent SMX). Lenže AMD má granulárnejšiu architektúru (=viac jednoduchších elementov), CU neobsahujú toľko výpočtových procesorov ako nVidia, no na druhej strane má viac takýchto jednoduchších CU - a to až 32. Čipy Tahiti v kartách HD 7970 zvládnu teoreticky až 2048 shiftov za takt, 2.2x viac ako Titan a 8x viac ako GTX 680, ktorá má 8 SMX.

 

Porovnanie výkonu kariet v shift operácii

ČipSM/CUpočet integer shift op. na jeden SM/CU za taktshifts na celý čip za takt
Radeon HD 797032642048
GeForce GTX 5801616256
GeForce GTX 680832256
GeForce GTX Titan1464896


Ako vidno v tabuľke, teoretický výkon GTX 580 (Fermi) a GTX 680 (Kepler) je rovnaký, no podľa zozbieraných údajov je nižší. Problém však je optimalizácia kernelu (=programu bežiaceho na GPU). Obe architektúry sú do značnej miery odlišné, pokiaľ by bol v testoch kernel správne napísaný na GTX 680, pravdepodobne by podávala vyšší výkon než GTX 580. Na rozdiel od procesorov sú grafické karty vzájomne veľmi odlišné a často musia mať program napísaný doslova na mieru.
 

Porovnanie ceny a výkonu niektorých kariet

ModelCena (€)Výkon (MH/s)€/MH
Radeon HD 79703706500.57
Radeon HD 79502855000.57
Radeon HD 78702254000.56
Radeon HD 78501803000.6
Radeon HD 77701201900.63
Radeon HD 7750901350.66
GeForce GTX Titan9803402.88
GeForce GTX 6804501203.75
GeForce GTX 660200782.56
GeForce GTX 650 Ti130552.36

Najlepší pomer cena/výkon majú prvé Radeony HD 7970/7950/7870, slabšie modely sa držia pomerne tesne v závese. nVidia je vzhľadom na nízky výkon úplne mimo, kupovať akúkoľvek GeForce špeciálne na Bitcoin mining sa vôbec neoplatí. Výber kariet je teda jasný - pre mining (a všeobecne pre použitie v kryptografii) jednoznačne karty AMD.

FPGA, ASIC

Grafické karty však rozhodne nepodávajú najvyšší výkon pri počítaní. Obvody na mieru sú, čo sa výkonu týka, úplne iná liga. V praxi ich môžeme rozdeliť na programovateľné hradlové polia (FPGA) a špecializované čipy (ASIC). Takýchto produktov je pomerne málo, no ich výkon (a samozrejme cena) je úplne niekde inde, najmä u ASIC.

FPGA čo do výkonu skôr konkurujú grafickým kartám, no sú ďaleko úspornejšie - tak napr. X6500 FPGA Miner podáva výkon 400MH/s, no spotrebuje len 17W energie, čo je neporovnateľne menej, než zostava s HD 7870, ktorá má približne rovnaký výkon.

FPGA

ModelVýkon (MH/s)Spotreba (W)Cena (€)
Icarus38019438
ModMiner Quad80040820
X6500 FPGA Miner40017420
ZTEX USB-FPGA Module 1.15b90?250
ZTEX USB-FPGA Module 1.15x215?310
ZTEX USB-FPGA Module 1.15y860?1000

Oveľa zaujímavejšie však sú špecializované čipy. Majú nielen výrazne vyšší výkon než grafické karty, ale aj nižšiu spotrebu. Je to to najvýkonnejšie, čo si môžte pre mining v súčasnej dobe zaobstarať. Mnohé z nich sa ešte nezačali predávať.
 

(Block Errupter Blade)

ASIC

ModelVýkon (MH/s)Spotreba (W)Cena (€)
Avalon ASIC batch 1660006201000
BitForce SC 5GH/s500030210
BitForce SC 25GH/s25000?960
BitForce SC 50GH/s50000?1920
BitForce Mini Rig SC1500000?23000
Block Errupter Blade107527049.99BTC (cca 5500€)


Niektoré ASIC riešenia sú dokonca stand-alone, t.j. nepotrebujú byť pripojené k počítaču, ako napr. Avalon ASIC či Block Errupter, ktoré majú vstavané sieťové adaptéry, v prípade Avalonu či Mini Rigu dokonca Wifi adaptér. Zvyšok sa pripája cez USB k počítaču. Nehovoriac o spotrebe, ktorá je oproti ekvivaletnému systému postaveného na Radeonoch zlomková.

Komentáre (3)
risoo
... mala otazka: ake su naroky na BitForce 5 GH/s SC mozem to napojit na staru sunku, ktora ma spotrebu 50W ?? alebo k notebooku ? mozme mat pripojene 2ks BitForce 5 GH/s SC na 1 pc ? stalo by to za kupu :-)
daddino
Kapitola "Ziskovosť alias elektrika (väčšinou) nie je zadarmo" je dost zavadzajuca. Vobec nepocita so stupajucou zlozitostou. Ta dosahuje az 126% narast zlozitosti za posledny mesiac !!! Aj ja som povodne zvazoval mining ale ked som som zapocital prave tu zvysujucu sa obtiaznost tak sa mining uz neoplati. Prave naopak Investicia do HW sa uz nevrati. Doporucujem pouzit na vypocet Profitu stranku http://mining.thegenesisblock.com/ ktora aj zapocitava zlozitost a potom tie cisla uz nevyzeraju tak ruzovo. To este neratam ze sa na tie ASIC caka niekolko mesiacov.
veron
ked si citam taketo stare clanky, az ma zaraza, kolko informacii uz na nete bolo davno pred tym ako vypukol tento masovy krypto osial... myslim, ze dneska sa uz pre beznych ludi tazit vobec neoplati (zaplatite za elektrinu viac), ale dnes mame velmi vela roznych kryptomien (https://kriptomat.io/sk/virtualne-meny/), s ktorymi sa da nieco zarobit nakupom a predajom - aspon kym sa kurz ustali, takze skor by som isla tymto smerom
Pridať nový komentár
TOPlist