RTX 4060 TI 8 GB - Recensione

25 maggio 2023

Nvidia torna sul mercato con la RTX 4060 TI da 8 GB, poco prima di rinnovare ulteriormente la sua line-up con la RTX 4060 TI da 16 GB e la minore 4060.

Ads

L’architettura Ada Lovelace #

Sin dalla fondazione dell’azienda, le architetture NVIDIA portano sempre il nome di grandi scienziati del passato. In questo caso la scelta è ricaduta su Ada Lovelace, nome con cui è meglio conosciuta Augusta Ada Byron, contessa di Lovelace, figlia del poeta Lord Byron e della matematica Anne Isabella Milbanke. Ada Lovelace è annoverata tra i più influenti pionieri della storia dei computer: è suo il primo algoritmo per computer ad essere mai stato pubblicato, inteso per essere eseguito dalla macchina analitica ideata da Charles Babbage. Dopo Marie Curie (GeForce 6 e 7) ed insieme alla matematica ed informatica Grace Hopper (serie Hopper per datacenter e HPC), è la seconda donna a cui è dedicata un’architettura della casa verde.

Ada Lovelace nel 1836

Specifiche dei chip Ada Lovelace - AD106 #

Dal punto di vista tecnico, l’architettura Ada Lovelace presenta alcune similarità con Ampere ma anche molte differenze.
La prima è il passaggio ad un nodo molto più avanzato, N4 di TSMC: i chip Ampere erano su 8nm Samsung, che nonostante il nome è un processo produttivo di “classe” 10nm, mentre N4 di TSMC rappresenta una versione leggermente migliorata di N5, ovvero un processo di classe 5nm. Ciò permette al chip AD106 di ospitare 22.9 miliardi di transistor su un die di 190 mm²: quasi due volte i 12 miliardi presenti sul chip GA106 (RTX 3060 e 3050) e il 30% in più rispetto ai 17.4 miliardi del chip GA104, che peraltro è grande il doppio (392 mm²), usato per le precedenti RTX 3060 Ti, 3070 e 3070 Ti.
Gli oltre 100 mm² in meno dell’AD104, tuttavia, sono legati ad un sensibile calo del numero di unità di calcolo (-40%) e della cache L2 (-33%).

Dopo una “stagnazione” delle frequenze rimaste all’incirca stabili dai tempi di Pascal al di sotto dei 2000 MHz, grazie al nuovo nodo le RTX 40 hanno frequenze di boost di oltre 2500 MHz, attestandosi intorno ai 2750 MHz in gioco sulla RTX 4060 Ti.

Il chip AD106 completo. Sulla RTX 4060 Ti sono attivi 34 SM su 36 e viene disabilitato uno dei due decoder NVDEC

La struttura degli SM (Streaming Multiprocessor) è rimasta simile ad Ampere: un RT Core, quattro tensor core e 128 CUDA core, di cui 64 unità esclusivamente FP32 e le altre 64 capaci di eseguire alternativamente operazioni FP32 o INT32; sono inoltre presenti, ma non mostrate nei diagrammi, due unità FP64 per SM. La 4060 Ti è equipaggiata con un leggero cutdown del chip AD106, su cui sono attivi 34 SM raggruppati in 3 GPC (Graphics Processing Clusters) per un totale di 4352 CUDA core, 34 RT core, 136 tensor core e 136 texture unit.
La cache L2 è di 32MB, stesso quantitativo di cache di ultimo livello che troviamo, ad esempio, su Navi23 (RX 6600 e 6600XT); questo quantitativo dovrebbe poter aiutare a risoluzioni “inferiori” come 1080p e 1440p, in cui Ampere soffriva di uno scaling non ottimale, ma è probabile che il taglio a dimensioni così limitate possa restringere l’effetto pratico solo intorno ai 1080p. Il bus da 128 bit limita la banda verso gli 8 GB GDDR6 a 288 GB/s, inferiore a quella della precedente 3060 Ti di 160 GB/s. Stando ad NVIDIA, il sottosistema di memoria dovrebbe avere prestazioni simili a GPU Ampere con 554 GB/s di banda passante di picco per molti carichi di lavoro, sulla base della cache L2 più grande, dell’elevato hit rate della cache e del traffico VRAM ridotto.

Tensor e RT core #

Tensor core e RT core sono aggiornati rispettivamente alla quarta e terza generazione, portando grossi vantaggi nel calcolo tensoriale e nelle performance in raytracing.

I tensor core Ada forniscono oltre il doppio del throughput FP16, BF16, TF32, INT8, e INT4, ciò si riflette ovviamente sul calcolo tensoriale ed applicazioni AI ed HPC. Le migliorie dal lato degli RT core sono ancora maggiori:

  • throughput doppio per intersezioni raggio-triangolo;
  • alpha traversal due volte più veloce: il nuovo Opacity Micromap Engine può testare direttamente la geometria alfa e ridurre i calcoli alfa basati sugli shader, utile per descrivere in modo compatto oggetti di forma irregolare o traslucidi e tracciarli direttamente e in modo più efficiente;
  • build delle BHV 10 volte più veloce in 1/20 dello spazio.

Alcune delle feature di Lovelace

Gli RT core di terza generazione supportano inoltre il SER (Shader Execution Reordering), che permette di riorganizzare le operazioni di shading divergenti, le quali tendono ad essere molto comuni in caso di path tracing, riflessi multipli e materiali dalle superfici complesse. Con questo meccanismo, simile allo scheduling out-of-order presente sui core CPU ad alte prestazioni, si può ridurre di molto l’overhead e quindi aumentare il throughput. In generale, l’impatto prestazionale del raytracing sulle GPU Lovelace è molto inferiore rispetto alle generazioni precedenti.

Questi miglioramenti su tensor ed RT core sottolineano come NVIDIA stia puntando molto su raytracing e DLSS, anziché esclusivamente sulla forza bruta.

Encoder e decoder #

Anche sul chip AD106 ritroviamo gli stessi nuovi decoder NVDEC ed encoder NVENC presenti sulle GPU di fascia più alta, con supporto completo al codec AV1. A differenza dei chip più grandi, però, in totale sono presenti solo un encoder e due decoder; dei due decoder, solo uno è abilitato sulle schede consumer GeForce, mentre l’abilitazione completa sarà probabilmente esclusiva delle schede di fascia professionale (le ex “Quadro”).

Caratteristiche tecniche #

Anche questa volta abbiamo tra le mani una delle custom top di gamma di MSI, la RTX 4060 TI Gaming X Trio. Tre ventole, design accattivante e lunghezza simile a quella delle generazioni RTX 30.

56c0fd70-7837-4482-b662-ec3117843028.jpeg

Per l’approfondimento sulla custom, abbiamo creato un articolo apposito.

🔗 RTX 4060 TI Gaming X Trio - Recensione

Testbench #

Per testare la RTX 4080, come già fatto con la RTX 4090, abbiamo utilizzato un 12900k Abbiamo rifatto i test con i nuovi Driver Nvidia disponibili per noi recensori nel pre-lancio della RTX 4080, però per utilità di riferimento abbiamo comunque usato il 12900k al posto del 13900k, da cui comunque cambia molto poco per gli applicativi di nostro interesse.

La testbench è composta da

Prestazioni - Test Sintetici #

I test “sintetici” (termine che non troviamo particolarmente esatto in tempi odierni) di 3D Mark ci permettono di valutare a grandi linee una scheda prima di procedere con quelli sul campo. In generale le prestazioni sono danno una direzione che rivedremo anche dopo: una RTX 3070 e poco meno.

Prestazioni - Gaming 1080p e 1440p #

Prestazioni - Motori di Render, Adobe Suite, DaVinci Resolve Studio #

Sul piano della produttività la RTX 4060 TI non è una scheda eccellente, ma nemmeno è pensata per questo. Performa in maniera simile alle 2 schede di contorno (RTX 3070 e RTX 3060 TI) esattamente come in gaming, complice forse anche la limitazione della VRAM in certi casi. Ha qualche piccolo rispetto alla precedente 70, ma niente di eclatante.

Abbiamo incluso dei test di produttività con DaVinci Resolve per quanto riguarda il render, usando la versione studio e renderizzando a 80 Mbps H264 un nostro video recente. Oltre a questo troviamo anche Octane Renderer per le prestazioni in path tracing e direct lightning e Blender, come richiesti.

Su Blender possiamo vedere una prestazione particolarmente interessante in Monster e Classroom. A questo siamo anche abbastanza sicuri che After Effects sia troppo influenzato e procederemo a rimuoverlo dalla suite di test se non per riferimento. I risultati sono molto instabili.

Prestazioni per Watt #

Una aspetto che abbiamo iniziato a prendere in considerazione di recente, visto l’incremento di consumi delle ultime 2 generazioni di schede video (in particolare dal lato di Nvidia), è il rapporto prestazioni/watt. Questo ci permette di valutare se le schede siano efficienti nonostante gli incrementi di consumi della prima RTX 4090.

8bbf473c-f49b-48d5-a6de-6108eb1eb1b6.jpeg

Prezzi e disponibilità #

La scheda è già disponibile dal 23 maggio 2023.

b381d463-321c-41f5-9f68-50153a785f64.jpeg

MSRP #

  • Nvidia Founders Edition: a partire da 449€
  • MSI RTX 4060 TI Gaming X Trio: 519€
  • MSI RTX 4060 TI Gaming X: 499€
  • MSI RTX 4060 TI Ventus 3X OC: 479€
  • MSI RTX 4060 TI Ventus 2X Black OC: 449€


La nostra opinione #

La RTX 4060 TI arriva sul mercato in maniera un po’ confusionaria. Da una parte sostituisce bene la RTX 3060 TI, aggiungendo tecnologie come l’encoding Av1, il DLSS 3 e un’efficienza energetica nettamente migliore.

Dall’altro lato non supera nemmeno la RTX 3070, lasciando un ampio margine tra questa scheda e la RTX 4070, anche se non è per forza un male. I giocatori si troveranno nuovamente a giocare con 8 GB di VRAM. Per il 1080p possono anche bastare, ma grazie alle tecnologie di upscaling questa scheda è capace di andare ben oltre. La longevità con questa quantità di VRAM rimane dubbia.