RTX 4080 16 GB - Recensione

15 novembre 2022

Nvidia torna sul mercato poco dopo l'annuncio delle nuove RX 7000 e il de-annuncio della RTX 4080 da 12 GB.

Ads

L’architettura Ada Lovelace #

Sin dalla fondazione dell’azienda, le architetture NVIDIA portano sempre il nome di grandi scienziati del passato. In questo caso la scelta è ricaduta su Ada Lovelace, nome con cui è meglio conosciuta Augusta Ada Byron, contessa di Lovelace, figlia del poeta Lord Byron e della matematica Anne Isabella Milbanke. Ada Lovelace è annoverata tra i più influenti pionieri della storia dei computer: è suo il primo algoritmo per computer ad essere mai stato pubblicato, inteso per essere eseguito dalla macchina analitica ideata da Charles Babbage. Dopo Marie Curie (GeForce 6 e 7) ed insieme alla matematica ed informatica Grace Hopper (serie Hopper per datacenter e HPC), è la seconda donna a cui è dedicata un’architettura della casa verde.

Ada Lovelace nel 1836

Specifiche dei chip Ada Lovelace - AD103 #

Dal punto di vista tecnico, l’architettura Ada Lovelace presenta alcune similarità con Ampere ma anche molte differenze.
La prima è il passaggio ad un nodo molto più avanzato, N4 di TSMC: i chip Ampere erano su 8nm Samsung, che nonostante il nome è un processo produttivo di “classe” 10nm, mentre N4 di TSMC rappresenta una versione leggermente migliorata di N5, ovvero un processo di classe 5nm. Ciò permette al chip AD103 di ospitare 45.9 miliardi di transistor, rispetto ai 28.3 miliardi del chip GA102 usato per RTX 3080 e 3090, che ha un’area quasi doppia; questo significa che AD103 vanta 2.6 volte i transistor del GA104, chip di dimensioni comparabili usato per RTX 3070 e 3070 Ti, che ne possiede 17.4 miliardi.
Inoltre, dopo una “stagnazione” delle frequenze rimaste all’incirca stabili dai tempi di Pascal al di sotto dei 2000 MHz, grazie al nuovo nodo le RTX 40 hanno frequenze di boost di oltre 2500 MHz, attestandosi sui 2800 MHz in gioco sulla RTX 4080.

Il chip AD103 completo. Sulla RTX 4080, 8 SM sono disabilitati tra quinto e sesto GPC

La struttura degli SM (Streaming Multiprocessor) è rimasta simile ad Ampere: un RT Core, quattro tensor core e 128 CUDA core, di cui 64 unità esclusivamente FP32 e le altre 64 capaci di eseguire alternativamente operazioni FP32 o INT32; sono inoltre presenti, ma non mostrate nei diagrammi, due unità FP64 per SM. Sul chip AD103 completo sono presenti 84 SM raggruppati in 7 GPC (Graphics Processing Clusters) per un totale di 10752 CUDA Core, 84 RT Core, 336 tensor core e 336 texture unit. Sulla RTX 4080 i GPC sono tutti attivi, ma con 8 SM disattivati: quindi 76 SM, 9728 CUDA core, 76 RT core, 304 tensor core e 304 texture unit.
La cache L2 è inferiore a quella sull’AD102 (96 MB) ma rimane di dimensioni considerevoli, 64 MB, cosa che dovrebbe aiutare non poco a risoluzioni “inferiori” come 1080p e 1440p, in cui Ampere soffriva di uno scaling non ottimale.

Se confrontato all’AD102, l’AD103 ha circa il 40% in meno di unità di calcolo; questo porta ad un gap tra RTX 4090 e 4080 molto maggiore rispetto alle schede equivalenti della scorsa generazione. Considerando che né la 4090 né la 4080 utilizzano i rispettivi chip completi, viene naturale pensare all’arrivo di versioni Ti nei prossimi mesi, in particolare in seguito all’uscita delle RX 7900 XT ed XTX, che dovrebbero attaccare proprio la RTX 4080 e lo “spazio vuoto” tra quest’ultima e la 4090.

Tensor e RT core #

Tensor core e RT core sono aggiornati rispettivamente alla quarta e terza generazione, portando grossi vantaggi nel calcolo tensoriale e nelle performance in raytracing.

I tensor core Ada forniscono oltre il doppio del throughput FP16, BF16, TF32, INT8, e INT4, ciò si riflette ovviamente sul calcolo tensoriale ed applicazioni AI ed HPC. Le migliorie dal lato degli RT core sono ancora maggiori:

  • throughput doppio per intersezioni raggio-triangolo;
  • alpha traversal due volte più veloce: il nuovo Opacity Micromap Engine può testare direttamente la geometria alfa e ridurre i calcoli alfa basati sugli shader, utile per descrivere in modo compatto oggetti di forma irregolare o traslucidi e tracciarli direttamente e in modo più efficiente;
  • build delle BHV 10 volte più veloce in 1/20 dello spazio.

Alcune delle feature di Lovelace

Gli RT core di terza generazione supportano inoltre il SER (Shader Execution Reordering), che permette di riorganizzare le operazioni di shading divergenti, le quali tendono ad essere molto comuni in caso di path tracing, riflessi multipli e materiali dalle superfici complesse. Con questo meccanismo, simile allo scheduling out-of-order presente sui core CPU ad alte prestazioni, si può ridurre di molto l’overhead e quindi aumentare il throughput. In generale, l’impatto prestazionale del raytracing sulle GPU Lovelace è molto inferiore rispetto alle generazioni precedenti.

Questi miglioramenti su tensor ed RT core sottolineano come NVIDIA stia puntando molto su raytracing e DLSS, anziché esclusivamente sulla forza bruta.

Encoder e sottosistema di memoria #

Sulle GPU Ada dalla RTX 4080 in su, si trovano inoltre due nuovi encoder NVENC ed un decoder NDEC entrambi compatibili con il codec AV1, che è ormai destinato a rimpiazzare il più diffuso H264 nello streaming di contenuti video. Sul chip AD102, in realtà, sono presenti tre decoder e tre encoder, ma sono totalmente attivi solo sulle schede professionali (le ex Quadro, per intenderci).

Caratteristiche generali RTX 4080 #

39aa1d97-420a-4d37-872f-8fceb2a4333b.jpeg

Temperature, consumi e frequenze #

Per quanto riguarda la custom abbiamo deciso di dedicare un articolo completo alle sue prestazioni, riferendoci in particolare ai canoni che la distinguano dalle altre come temperature, consumi e frequenze.

🔗 RTX 4080 Gigabyte Gaming OC

Testbench #

Per testare la RTX 4080, come già fatto con la RTX 4090, abbiamo utilizzato un 12900k Abbiamo rifatto i test con i nuovi Driver Nvidia disponibili per noi recensori nel pre-lancio della RTX 4080, però per utilità di riferimento abbiamo comunque usato il 12900k al posto del 13900k, da cui comunque cambia molto poco per gli applicativi di nostro interesse.

La testbench è composta da

Le schede video sotto test sono

Benchmark delle prestazioni vs RTX 4090, RTX 3090 e RTX 3080 #

Per quanto ci siano abbastanza dati sul piatto da guardare, purtroppo non abbiamo schede video di casa AMD con cui fare il confronto di queste schede. Tuttavia abbiamo le controparti della casa verde e questo ci permette di capire le differenze sostanziali portate da Nvidia sul mercato con questa nuova generazione.

A partire dalla VRAM, la RTX 4080 prende margine dalla RTX 3080 10 GB in maniera considerevole con un incremento del 60%, che giova sicuramente in ambito di produttività. Oltre a ciò migliora ogni ambito, dalla cache fino alle unità di accelerazione per Ray Tracing e DLSS.

3D Mark #

I primi test che eseguiamo sempre nel nostro roster sono quelli di 3D Mark, una suite incredibilmente precisa e completa per valutare in maniera generale quale sarà il posizionamento delle nuove schede rispetto alle generazioni precedenti.

Con 3D Mark si possono testare le prestazioni in raster della scheda video, il Ray Tracing, il DLSS 2 e 3 così come eseguire stress test.

Gaming 4k #

La RTX 4080 nasce come una scheda video dedicata al gaming in 4k e 1440p ad alti FPS. Non ha le prestazioni fenomenali della RTX 4090, ma si difende molto bene di fronte alle top di gamma della generazione precedente.

I titoli che abbiamo scelto si differenziano per vari aspetti tra di loro: abbiamo titoli più leggeri sulla scheda video che richiamano situazioni simili a quelli del mondo esports e giochi tripla A massacranti.

Gaming 1440p #

Il 1440p è una risoluzione tutt’ora rilevante anche se il mondo del gaming sembra averla saltata in favore del più denso 3840x2160p incoronato dalle console sin dalla precedente generazione.

Su PC risulta particolarmente piacevole da usare grazie alle prestazioni ridotte necessarie rispetto al 4k, ma sopratutto grazie alla densità maggiore rispetto al 1080p, che la porta a nostro dire vicina allo sweetspot ideale per il gaming su 27" alla classica distanza dal monitor che garantisce una postazione da gioco per PC (solitamente ben sotto il metro).

Ray Tracing #

Non poteva mancare una sezione sul Ray Tracing dedicata alla 4080, forse uno degli aspetti più remunerativi per la nome di Nvidia in questi anni grazie anche al fatto che AMD non sia al passo con le prestazioni offerto dal comparto della casa verde.

Produttività #

Non ci si può assolutamente dimenticare della produttività. La RTX 4080 ha 16 GB di VRAM e questa la rende ideale per chi voglia spendere leggermente meno della 4090 ma avere comunque un quantitativo di memoria utile per i lavori più esigenti su programmi di compositing e 3D Modeling. Il tutto accompagnato dalle prestazioni interessanti offerte dalla scheda.

Adobe Suite #

Indigo Renderer e Vray Benchmark #

Prestazioni per Watt #

Una aspetto che abbiamo iniziato a prendere in considerazione di recente, visto l’incremento di consumi delle ultime 2 generazioni di schede video (in particolare dal lato di Nvidia), è il rapporto prestazioni/watt. Questo ci permette di valutare se le schede siano efficienti nonostante gli incrementi di consumi.

8b54a5be-35e3-4785-98cc-e3941a03f007.jpeg

Ed effettivamente la RTX 4080 e RTX 4090 si dimostrano particolarmente buone sotto questo aspetto, distaccandosi dalla RTX 3090 che ora sembra essere quasi un’esagerazione (o forse lo è sempre stata?)

Conclusioni #

La RTX 4080 si presenta sul mercato con un parco prestazioni e un’offerta tecnologia piuttosto interessante. Grazie anche all’incremento di cache e vram rimane molto competitiva nell’ambito della produttività rispetto alla 3080.

Il prezzo indicativo per la RTX 4080 è di 1479€ per il modello Founders, accompagnate da custom oscillante tra i 1450 e i 1550 euro in base al modello, con picchi anche superiori per custom particolari.

Questo fattore potrebbe scoraggiare i più considerato un distacco medio del 20-30% tra la RTX 4080 e la RTX 3090. Non un valore da poco, ma il prezzo, anche se andrebbe aggiustato anche quello della RTX 3090 con l’inflazione, si avvicina parecchio e in alcuni ambiti gli 8 GB di Vram in più potrebbero fare comodo.