Technológie NVIDIA: DLSS a ray-tracing (1. časť)

Kalifornskú spoločnosť NVIDIA nie je potrebné nijako zvlášť predstavovať. Vo svete počítačov ju mnohí poznáte ako výrobcu, alebo presnejšie dizajnéra, grafických procesorov. Za vyše 30 rokov, čo spoločnosť pôsobí na trhu, sa jej pôsobenie rozšírilo aj o oblasť superpočítačov (HPC), SoC pre automobilový priemysel, umelú inteligenciu (AI) ale aj vydávanie rôznych API, pomocou ktorých dokážu vývojári využívať masívny paralelný výkon grafických procesorov práve od tejto spoločnosti.

Úvod a testovacie zostavy

Popri grafických procesoroch priviedla na svetlo sveta NVIDIA aj množstvo zaujímavých technológií, vďaka ktorým sa grafická stránka hier posúva neustále vpred. Práve v úvode tejto minisérie si predstavíme dve z nich – DLSS a ray-tracing.

V roku 2018 vydala NVIDIA novú sériu grafických čipov, kde zmenila zaužívané označenie GTX za RTX. Ako iste tušíte, zmena prvého písmena na „R“ značí podporu práve ray-tracingu (Ray-Tracing Texel eXtreme). Hoci ray-tracing nie je nová technológia, bola to práve NVIDIA, ktorá uviedla na trh ako prvá grafické karty s hardvérovou akceleráciou ray-tracingu v reálnom čase.
RTX čipy priniesli na trh aj masívne nasadenie AI, ktoré využíva technológia DLSS na vylepšenie rozlíšenia renderovaných snímkov. To sa časom rozšírilo ďalšie technológie ako Ray Reconstruction a Frame Generation, o ktorých si bližšie povieme v ďalšej kapitole.

Článok nebude iba o teórii, ale ukážme si prínos spomínaných technológii aj prakticky. Testovacie notebooky nám poskytla spoločnosť Alza.cz, ktorej samozrejme patrí veľká vďaka. Jedná sa o herné notebooky GIGABYTE a AORUS osadené aktuálnou generáciou GPU NVIDIA GeForce RTX 4070 a GeForce RTX 4050. Tie si aj v krátkosti predstavíme v niekoľkých riadkoch nižšie.

AORUS 15 BSF

Prvým z dvojich testovacích notebookov je AORUS 15 BSF. Komu nie je značka AORUS úplne známa, tak dodám, že spadá pod spoločnosť GIGABYTE a zameriava sa na herný segment počítačov a komponentov. Základné špecifikácie uvádzam nižšie:

  • NVIDIA GeForce RTX 4070 laptop GPU, 8 GB GDDR6
  • Intel Core i7-13700H (5 GHz, 6 P-cores / 8 E-cores)
  • 16 GB DDR5 RAM
  • 15,6“ QHD (2560x1440) LCD, 16:9, 165 Hz, DCI-P3
  • RGB podsvietená klávesnica
  • 99 Wh batéria
  • 2,39 kg hmotnosť

Hardvérovou výbavou sa notebook radí do vyššej triedy vďaka použitej karte GeForce RTX 4070 s 8 GB GDDR6 a procesoru Core i7-13700H. Osadená operačná pamäť má kapacitu 16 GB. Tu by som rozhodne uvítal vyššiu hodnotu, avšak s ohľadom na podporu až 64 GB by nemal byť problém s rozšírením. Výrobca siahol po rýchlom 165 Hz paneli s pekným rovnomerným podsvietením a veľmi dobrými pozorovacími uhlami. Telo notebooku je pevné kovové a zahrieva sa iba v prednej časti pod obrazovkou a po bokoch klávesnice, takže ani pri dlhšom používaní nie je nepríjemné na dotyk. 
Jediná výčitka smeruje k chladeniu a jeho zvukovému prejavu. Stačí spustiť hoci nenáročnú aplikáciu alebo prehliadač a už sa ozve fučanie, ktoré sa ešte zintenzívni po spustení náročnej hry. Bohužiaľ, toto je typické snáď pre väčšinu výkonných notebookov v tomto rozmere, kde je potrebné do obmedzeného priestoru vtesnať výkonné komponenty. Tu je to však umocnené ešte nastavením ventilátora, ktorý pri miernej záťaži skokovo mení otáčky pokojne aj každú pol minútu. Na obranu Aorusu dodám, že sa rozhodne nejedná o najhlučnejšie chladenie, avšak pri používaní by som rozhodne odporúčal slúchadlá.

GIGABYTE G5 MF

Špecifikácie:

  • NVIDIA GeForce RTX 4050 laptop GPU, 6 GB GDDR6
  • Intel Core i5-13500H (4,7 GHz, 4 P-cores / 8 E-cores)
  • 8 GB DDR5 RAM
  • 15,6“ FHD (1920x1080) LCD, 16:9, 144 Hz
  • podsvietená klávesnica štandardnej veľkosti s numerickým blokom
  • 54 Wh batéria
  • 2,08 kg hmotnosť

Druhý z dvojice notebookov predstavuje cenovo dostupnejšiu alternatívu osadenú základným modelom RTX 40 série grafických kariet, teda RTX 4050 so 6 GB GDDR6 a procesorom Core i5 so štyrmi výkonnými jadrami a taktom až 4,7 GHz. Osadená operačná pamäť má kapacitu iba 8 GB, čo sa negatívne prejavilo aj pri testovaní hry Alan Wake 2 – bližšie si o tom popíšeme ďalej v článku. Opäť však nie je problém s upgradom a možné je osadiť až 64 GB RAM. 
Telo notebooku je vyrobené z plastu, avšak pôsobí robustným a odolným dojmom, až som si v prvej chvíli myslel, že výrobca použil kov aspoň na vrchnej strane. Použitý displej dosahuje obnovovaciu frekvenciu 144 Hz. Jedná sa opäť o kvalitný LCD panel, ktorý netrpí na typické neduhy a má rovnomerné podsvietenie bez fľakov. Opäť nemôžem pochváliť zvukový prejav chladenia, aj keď oproti prvému testovanému modelu, má tento notebook príjemnejšie nastavený profil a v prostredí Windowsu a nenáročných aplikácii budete zväčša počuť pomerne znesiteľné šušťanie. Pri záťaži môžem opäť odporučiť iba slúchadlá.

Celkovo vo mne zanechali oba notebooky prijemný dojem, najmä čo sa týka mechanického spracovania aj použitých LCD displejov.

DLSS a ray-tracing – teória a podrobnosti

DLSS technológia prišla v roku 2018 spolu s uvedením nových GeForce RTX čipov. Skratka znemená Deep Learning Super Sampling a jedná sa o škálovanie renderovaného obrazu z nízkeho a teda výkonovo menej náročného rozlíšenia pomocou strojového učenia. Toto presne robila prvá verzia DLSS, avšak implementácia bola náročná, pomalá a v konečnom dôsledku ju podporovalo iba niekoľko málo hier. Verzia DLSS 2 robila prakticky to isté, výpočtové jadrá však už vedeli „rozmýšľať“ samostatne a AI upscaling už fungoval na akejkoľvek hre. Výsledkom tak bol zvýšený výkon bez, alebo iba s minimálnym vizuálnym rozdielom v obraze.

Ďalším veľkým krokom bol príchod DLSS 3 a DLSS 3.5. Tie už síce nemajú príliš spoločného s pôvodnou skratkou, no technologicky využívajú AI jednotku a tak sa pravdepodobne v NVIDII rozhodli zachovať zabehnuté označenie.

DLSS s označením 3 prinieslo novinku v podobe Frame Creation, čo znamená tvorbu snímkov (framov) medzi jednotlivými vyrenderovanými snímkami. Vo výsledku tak AI zo skutočného snímku, ktorý vypočítala GPU, odhadne, ako by mal vyzerať nasledujúci snímok. Dochádza teda k zdvojnásobeniu snímkovej frekvencie hry striedaním reálneho a AI snímku. Túto funkciu však podporujú iba grafické karty generácie RTX 40. 

Predikcia odhadu pohybu, Zdroj: NVIDIA

DLSS 3.5 Ray Reconstruction taktiež využíva AI, avšak tento krát na vylepšenie ray-tracingu. Ako?
Samotný ray-tracing využívaný v hrách nie je zďaleka dokonalý, pretože na renderovanie scény sa ani zďaleka nesleduje odraz lúča od každého pixelu na scéne – na to jednoducho súčasné procesory nemajú výkon. Scéna sa generuje pomocou niekoľkých vybraných lúčov, ktoré „nasvietia“ vymodelovanú scénu v nízkom rozlíšení.

Ako funguje tradičný ray-tracing, Zdroj: NVIDIA

Následne sa pomocou rôznych techník na škálovanie a redukciu šumu (de-noising) vygeneruje výsledná scéna, a tá sa opäť škáluje na požadované rozlíšenie – toto je samozrejme veľmi zjednodušene napísané. Jednotlivé scény sa ručne optimalizujú tak, aby výsledný obraz neobsahoval artefakty, defekty a nedochádzalo k prepadom výkonu.

Tu prichádza na scénu AI, ktoré analyzuje scénu, použité efekty a množstvo ďalších dát, na ktorých bola trénovaná. Dokáže tak v reálnom čase aplikovať vhodné odšumovacie a škálovacie algoritmy a podľa rozpoznaného obsahu vylepšiť výslednú scénu či odstrániť nežiadúce artefakty, takže odpadá potreba ručnej optimalizácie.

Ako funguje Ray Reconstruction, Zdroj: NVIDIA

Screenshoty z hier a porovnanie

DLSS a ray-tracing som otestoval v dvoch hrách – Alan Wake 2 a Cyberpunk 2077. Obe patria medzi aktuálne graficky najnáročnejšie hry a podporujú ray-tracing aj DLSS 3.5. 

Prvý screen pochádza z hry Alan Wake 2, kde je vidno rozdiel v zobrazení odleskov na mokrej ceste. Ľavá strana obrázku má vypnutý ray-tracing (RT). V pravej časti si všimnite aj odlesky na kapote auta.

Ďalšia dvojica zachytáva výrazný rozdiel vo vykreslení protisvetla a zobrazenie tieňov v interiéri.

  

Rozdiely je vidno aj v detailoch tieňov, hoci sú minimálne. Tiene v spodnej časti snímky vykreslené pomocou RT sú jemnejšie.

 

Posledná dvojica obrázkov z hry Alan Wake 2 zachytáva opäť odlesky na ceste. Všimnite si však aj rozdiely vo vykreslených tieňoch na budove vpravo. Celkovo pôsobia obrázky vykreslené pomocou RT prirodzenejšie a hra dostala úplne iný nádych.

 

Druhým v poradí je Cyberpunk 2077. Odlesky na vode sú opäť vďačným objektom na porovnanie. Rozdiel je aj v tieňoch v interiéri auta.

  

  

Sú však aj miesta, kde sa ray-tracing prejaví len minimálne a scéna má na prvý pohľad iba iný kontrast.

  

  

Vplyv DLSS a ray-tracingu na výkon v hrách

V nasledovných riadkoch si ukážeme, ako sa prejaví zapnutie ray-tracingu na výkon v hre. Opäť som testoval hry Alan Wake 2 a Cyberpunk 2077. Keďže testované notebooky majú výrazne rozdiely výkon, rozhodol som sa grafy rozdeliť a neporovnávať priamo výkon týchto notebookov, ale skôr poukázať na vplyv jednotlivých nastavení.

Prvým v poradí je AORUS 15 BSF s RTX 4070. Hra bola renderovaná v natívnom rozlíšení 2560 x 1440 a úrovňou detailov nastavenou na HIGH a zapnutým DLSS Frame Generation. Riešením, ako získať cenné snímky, je zníženie renderovaného rozlíšenia, čo sa vizuálne na 15,6" obrazovke takmer neprejaví. 

Ray-tracing v Cyberpunk 2077 zhltne obrovské množstvo výkonu. Tu sa ukážkovo prejavuje DLSS Frame Generation, hoci sa hra úplne nevyhla občasným dropom až k 18 FPS. Priemer v podobe 61 snímkov je však prijateľný.

Notebook GIGABYTE G5 MF si počínal podľa očakávania o niečo horšie, avšak stále veľmi obstojne, keďže výrobca neosadil displej so zbytočne vysokým rozlíšením, ktoré by inak bolo príliš náročné na výkon celého systému. RTX 4050 je aktuálne najdostupnejším modelom RTX 40 série, čo sa samozrejme prejavilo na celkovom výkone.

Bohužiaľ, v prípade hry Alan Wake 2 sa ako obmedzenie ukázala 8 GB systémová pamäť RAM, ktorá jednoducho nestačila na spustenie. Hra Alan Wake pri pokuse o spustenie iba vyhodila vyskakovacie okno s hlásením o vyžadovanej 16 GB systémovej pamäti. To je celkom škoda, pretože v hre Cyberpunk 2077 si RTX 4050 počínala relatívne dobre a papierovo by mala stačiť aj na spustenie Alan Wake 2 so zapnutým ray-tracingom.

Pri Cyberpunku 2077 však už oproti výkonnejšiemu súrodencovi bolo potrebné kalkulovať a pohrať sa s nastaveniami. Hral som v natívnom rozlíšení 1920 x 1080 a detailami na HIGH. Keďže som nechcel uberať z úrovne detailov samotnej hry, prepol som DLSS render z AUTO na Ultra Performance, ktorý nahnal potrebné FPS. Minimom tak bolo 32 snímkov a priemer celkom akceptovateľných 65 FPS.

 

Technológie NVIDIA: zhodnotenie a záver

Iste mi dáte za pravdu, že prínos ray-tracingu na vizuálny zážitok z hry je nezanedbateľný. To vlastne nie je žiadna novinka, keďže počiatky ray-tracingu ako verného a realistického vykreslenia obrazu v počítačovej grafike siahajú až do 60. rokov minulého storočia. Čo sa však zmenilo je spôsob, akým ho dnes využívame. Kedysi bolo potrebné na vyrenderovanie iba jediného snímku niekoľko hodín práce výkonného počítača. Tu prichádza NVIDIA ako inovátor, ktorý priniesol v roku 2018 ray-tracing spolu s DLSS mimo profesionálnu a business oblasť a dotiahol ho do dnešnej podoby. Hoci má ďaleko od dokonalosti a výkon je stále o menších či väčších kompromisoch, oplatí sa pohrať s nastaveniami a dopriať si úplne iný vizuálny zážitok z hry.

Nemalý podiel na úspešnom nasadení DLSS a ray-tracingu má masívne nasadenie AI, ktorá dokáže za pomoci šikovných trikov dotiahnuť výsledný obraz takmer do dokonalosti. A čo môžeme očakávať v budúcnosti? Už pri predstavení prvej verzie DLSS naznačili zdroje z NVIDIE, že by sme sa v budúcnosti mohli dočkať úplného vykresľovania grafiky pomocou ray-tracingu za pomoci AI, ktorá by vedela efektívne aplikovať pokročilé algoritmy.

Kým sa tak stane, zostáva nám k dispozícii aktuálna verzia DLSS 3.5, vďaka ktorej sa ray-tracing stáva dostupným pre širšie masy už v súčasných hrách a aplikáciách. Tých je mimochodom už viac než 500 a ich počet sa neustále zvyšuje.

V ďalšom pokračovaní článku si ukážeme použitie ray-tracingu a DLSS v profesionálnej oblasti – v tvorbe a úprave videa a digitálneho obsahu.

Na záver sa chcem opäť poďakovať partnerovi projektu spoločnosti Alza.cz za poskytnutie testovacích notebookov.

Pridať nový komentár
TOPlist