RTX 4070 12 GB - Recensione
13 aprile 2023
Nvidia torna sul mercato con la RTX 4070, una scheda da 12 GB di VRAM e l'intento di dominare il mercato 1440p ma anche oltre grazie al DLSS 3. Vale la pena comprarla?
L’architettura Ada Lovelace #
Sin dalla fondazione dell’azienda, le architetture NVIDIA portano sempre il nome di grandi scienziati del passato. In questo caso la scelta è ricaduta su Ada Lovelace, nome con cui è meglio conosciuta Augusta Ada Byron, contessa di Lovelace, figlia del poeta Lord Byron e della matematica Anne Isabella Milbanke. Ada Lovelace è annoverata tra i più influenti pionieri della storia dei computer: è suo il primo algoritmo per computer ad essere mai stato pubblicato, inteso per essere eseguito dalla macchina analitica ideata da Charles Babbage. Dopo Marie Curie (GeForce 6 e 7) ed insieme alla matematica ed informatica Grace Hopper (serie Hopper per datacenter e HPC), è la seconda donna a cui è dedicata un’architettura della casa verde.
Specifiche dei chip Ada Lovelace - AD104 #
Dal punto di vista tecnico, l’architettura Ada Lovelace presenta alcune similarità con Ampere ma anche molte differenze.
La prima è il passaggio ad un nodo molto più avanzato, N4 di TSMC: i chip Ampere erano su 8nm Samsung, che nonostante il nome è un processo produttivo di “classe” 10nm, mentre N4 di TSMC rappresenta una versione leggermente migliorata di N5, ovvero un processo di classe 5nm. Ciò permette al chip AD104 di ospitare 35.8 miliardi di transistor su un die di 295 mm²: il doppio rispetto ai 17.4 miliardi del chip GA104 usato per le precedenti RTX 3070 e 3070 Ti, che peraltro è più grande (392 mm²).
Inoltre, dopo una “stagnazione” delle frequenze rimaste all’incirca stabili dai tempi di Pascal al di sotto dei 2000 MHz, grazie al nuovo nodo le RTX 40 hanno frequenze di boost di oltre 2500 MHz, attestandosi intorno ai 2700 MHz in gioco sulla RTX 4070.
La struttura degli SM (Streaming Multiprocessor) è rimasta simile ad Ampere: un RT Core, quattro tensor core e 128 CUDA core, di cui 64 unità esclusivamente FP32 e le altre 64 capaci di eseguire alternativamente operazioni FP32 o INT32; sono inoltre presenti, ma non mostrate nei diagrammi, due unità FP64 per SM. La 4070 è equipaggiata con un cutdown del chip AD104, su cui sono attivi 46 SM raggruppati in 4 GPC (Graphics Processing Clusters) per un totale di 5888 CUDA core, 46 RT core, 184 tensor core e 184 texture unit.
La cache L2 è ridotta a 36MB, il 25% in meno rispetto a quella sul chip AD104 completo (48 MB) della RTX 4070 Ti; questo quantitativo dovrebbe poter aiutare a risoluzioni “inferiori” come 1080p e 1440p, in cui Ampere soffriva di uno scaling non ottimale, ma è probabile che il taglio a dimensioni così limitate possa restringere l’effetto pratico solo intorno ai 1080p. Il bus da 192 bit, come sulla versione Ti, limita la banda verso i 12 GB GDDR6X a 504 GB/s, inferiore a quella della 3070 Ti di oltre 100 GB/s.
Il taglio di unità di calcolo rispetto al chip AD104 completo risulta complessivamente di circa il 24%, al quale si aggiunge un lieve calo nelle frequenze. Considerando che le prestazioni non scalano linearmente all’aumentare delle unità di calcolo, la 4070 risulta più lenta di circa il 15-20% rispetto alla 4070 Ti nei giochi, al netto di alcune eccezioni come Hitman 3 (maggior differenza) o The Riftbreaker (minor differenza).
Tensor e RT core #
Tensor core e RT core sono aggiornati rispettivamente alla quarta e terza generazione, portando grossi vantaggi nel calcolo tensoriale e nelle performance in raytracing.
I tensor core Ada forniscono oltre il doppio del throughput FP16, BF16, TF32, INT8, e INT4, ciò si riflette ovviamente sul calcolo tensoriale ed applicazioni AI ed HPC. Le migliorie dal lato degli RT core sono ancora maggiori:
- throughput doppio per intersezioni raggio-triangolo;
- alpha traversal due volte più veloce: il nuovo Opacity Micromap Engine può testare direttamente la geometria alfa e ridurre i calcoli alfa basati sugli shader, utile per descrivere in modo compatto oggetti di forma irregolare o traslucidi e tracciarli direttamente e in modo più efficiente;
- build delle BHV 10 volte più veloce in 1/20 dello spazio.
Gli RT core di terza generazione supportano inoltre il SER (Shader Execution Reordering), che permette di riorganizzare le operazioni di shading divergenti, le quali tendono ad essere molto comuni in caso di path tracing, riflessi multipli e materiali dalle superfici complesse. Con questo meccanismo, simile allo scheduling out-of-order presente sui core CPU ad alte prestazioni, si può ridurre di molto l’overhead e quindi aumentare il throughput. In generale, l’impatto prestazionale del raytracing sulle GPU Lovelace è molto inferiore rispetto alle generazioni precedenti.
Questi miglioramenti su tensor ed RT core sottolineano come NVIDIA stia puntando molto su raytracing e DLSS, anziché esclusivamente sulla forza bruta.
Encoder e sottosistema di memoria #
Sulle GPU Ada dalla RTX 4070 in su, si trovano inoltre due nuovi encoder NVENC ed un decoder NVDEC entrambi compatibili con il codec AV1, che è ormai destinato a rimpiazzare il più diffuso H264 nello streaming di contenuti video. Sul chip AD104 e AD103, in realtà, sono presenti quattro decoder e due encoder, ma sono totalmente attivi solo sulle schede professionali (le ex Quadro, per intenderci). Sulla AD102, invece, ci sono tre decoder e tre encoder.
Il passo indietro sull’alimentazione #
Questa nuova scheda di Nvidia arriva con una novità particolare: l’alimentazione sarà infatti di due tipi almeno sui modelli custom. Abbiamo una versione “Premium” da 220 W di TDP contraddistinta dalla nuova porta 12 pin di Nvidia e una versione “Normale” da 200 W di TDP con il classico cavo di alimentazione 6+2 in varie configurazioni.
Probabilmente il più dei brand distinguerà con questa caratteristica quelle che da sempre sono le proprie ammiraglie, come nel caso della Gaming X Trio che abbiamo in prova. I modelli meno costosi invece sono interessati dal grande ritorno del cavo 6+2 canonico, come nel caso della serie Ventus per quanto riguarda MSI.
Nvidia ha dichiarato: “Con il connettore di alimentazione PCI Express Gen 5, dotato di due connettori a 8 pin, forniamo ulteriore spazio di alimentazione per l’OC. Per coloro che non desiderano avere questo margine di manovra, alcuni partner avranno schede che funzionano a 200W TGP e che richiedono solo un connettore di alimentazione a 8 pin.”
RTX 4070 Gaming X Trio: come se la cava #
Per quanto riguarda la custom abbiamo deciso di dividere il contenuto in 2 articoli in modo da dare il giusto spazio al valore della Gaming X Trio in termini di temperature, estetica, offerta e novità.
L’articolo è qui sotto.
Prestazioni - Test Sintetici #
I test “sintetici” (termine che non troviamo particolarmente esatto in tempi odierni) di 3D Mark ci permettono di valutare a grandi linee una scheda prima di procedere con quelli sul campo. In generale le prestazioni sono danno una direzione che rivedremo anche dopo: una RTX 3080 su per giù.
Prestazioni - Produttività #
Sul piano della produttività la RTX 4070 parte con una leggera differenza rispetto a quanto proporrà dopo in gioco. Infatti abbiamo una scheda che sul pacchetto Adobe dimostra una prestazioni leggermente inferiore rispetto alla RTX 3090 ma non troppo lontana. Forse complici anche i 12 GB di VRAM, le prestazioni sono generalmente migliori di quelle in gaming, anche se di poco.
Prestazioni - Gaming #
Questa scheda è chiaramente improntata per il gaming 1440p di ottimo livello e le sue prestazioni lo confermano. Il 4k è un appiglio che è possibile raggiungere solo grazie al supporto delle tecnologie di Super Sampling come DLSS 2 e DLSS 3, quest’ultimo in maniera particolare.
1440p #
Il piano prestazionale nudo e crudo è paragonabile a quello di una RTX 3080 da 10 GB di VRAM (Attenzione: la versione da 12 GB performa meglio) se parliamo di semplice raster. Anche nei risultati del Ray Tracing non ci allontaniamo di tanto. Il valore aggiunto di questa scheda rimane nella presenza dell’Encoder Av1, nei consumi nettamente più bassi e quindi minori temperature, quanto nel poter utilizzare il DLSS 3.
4k #
Ray Tracing #
DLSS 3: recuperare prestazioni assenti #
Non parlare del DLSS 3, l’asso nella manica di Nvidia, sarebbe comunque sbagliato. Che lo si voglia ammettere o meno, la tecnologia ha un suo spazio di interesse. Le prestazioni della versione quality si avvicinano più o meno a quella del DLSS 2 in profilo “Performance”, con una resa grafica apparentemente simile, se non leggermente migliore.
Il punto è questo: la RTX 4070 non è una scheda da 4k stabile nei più recenti titoli AAA. Almeno non nativamente. Almeno non su tutti. Ma può diventarlo grazie al DLSS 3, che come dimostrato qui sotto e sopra porta la situazione da invibile (meno di 20 FPS) a decisamente buona (60+ FPS) quando confrontiamo la scheda con una CyberPunk 2077 in 4k, dettagli grafici ad Alto e Ray Tracing sempre al massimo delle sue possibilità.
Non è esattamente come giocare, per dire, con una RTX 4090, che nativamente ottiene queste performance prima ancora di chiedere il supporto alle tecnologie di upscaling di Nvidia. Si nota qualche caso qua e là di stutter, ma è decisamente un’esperienza migliore rispetto a quella dove il DLSS 3 non viene utilizzato.
In pratica funge da carta d’accesso o di miglioramento ad una risoluzione migliore per chiunque voglia sperimentare.
Prezzi e disponibilità #
La scheda sarà disponibile dal 13 Aprile 2023 alle 15:00 sui principali retailer.
Il prezzo MSRP per la versione Founders Edition è di 669€ iva inclusa.
Per quanto riguarda MSI, ci sono stati comunicati i seguenti prezzi
- GeForce RTX 4070 VENTUS 2X: 669€
- GeForce RTX 4070 VENTUS 3X 12G OC: 699€
- GeForce RTX 4070 GAMING X TRIO 12G: 759€
La nostra opinione #
La RTX 4070 è una scheda che si propone in maniera complessa: da una parte inizia ad avviare il processo di democratizzazione di tecnologie come AV1 e DLSS 3, oltre all’ottima efficienza energetica di Ada Lovelace.
Fornisce prestazioni da RTX 3080 10 GB, qualcosa di più in ambito di produttività. Ma lo fa con un costo decisamente importante per essere avanti di una generazione. Offre di più, costa di più. Ma non affronta quel salto che la caratterizzebbe come una scheda di grande valore fatto da schede come la RTX 3070 o GTX 1070 ai loro tempi, ovvero affrontare la top di gamma da un gradino nettamente più basso.
Ciò non la sminuisce come scheda. Ma al tempo stesso non spinge il mercato nella direzione che vorremo vedere ora, lasciando ancora un po’ stantie le prestazioni/prezzo che possono venir offerte in questa fascia.
A pari prezzo sarebbe assolutamente consigliabile come scheda rispetto alla RTX 3080 10 GB, anche solo per approfittare delle novità che comporta, la maggiore VRAM (o pari nel caso della versione da 12 GB) e dei consumi inferiori a una RTX 3070. Ma al tempo stesso bisogna anche valutare il passo indietro sulla dimensione sul bus e il fatto che per un po’ probabilmente non potrà imporsi sul prezzo prima di stabilizzarsi sul mercato.