Windows 11: come usare DeepSeek con CPU e GPU AMD

Ieri alle 16:21

AMD ha pubblicato le istruzioni per eseguire il modello AI DeepSeek R1 su prodotti Ryzen AI e Radeon con accelerazione AI, rendendo semplice l’utilizzo del nuovo chain-of-thought model direttamente su PC. Questo permette di sfruttare le capacità di calcolo locale senza dover ricorrere a servizi cloud, offrendo maggiore controllo e reattività nell’elaborazione dei dati. Diverse varianti di LLM basate su R1 sono compatibili con le GPU desktop della serie RX 7000 e con alcune CPU Ryzen dotate di NPU XDNA. Tuttavia, per poterle eseguire correttamente, è necessario installare il driver opzionale Adrenalin 25.1.1, che abilita il supporto specifico per l’accelerazione AI. AMD ha reso disponibile il driver attraverso il proprio sito ufficiale, consentendo un’installazione rapida e senza complicazioni.

Ads

I reasoning models appartengono a una nuova generazione di Large Language Models (LLM) sviluppati per affrontare compiti complessi attraverso il chain-of-thought (CoT) reasoning. Questo metodo permette di ottenere risposte più articolate, ma comporta tempi di elaborazione più lunghi rispetto ai LLM tradizionali.

Tra i modelli più recenti c’è DeepSeek R1, da cui sono state sviluppate varianti più compatte che mantengono comunque prestazioni degne di nota. Possiamo sfruttare questi modelli facilmente su AMD Ryzen AI e schede grafiche Radeon grazie a LM Studio.

A differenza degli LLM convenzionali, che generano risposte immediatamente, i reasoning models introducono una fase di analisi prima di produrre il risultato finale. Espandendo la finestra “thinking”, possiamo osservare il processo di elaborazione.

Questo approccio migliora le capacità analitiche del modello, rendendolo più efficace nella risoluzione di problemi complessi, in particolare in ambiti scientifici e matematici. Tuttavia, questa metodologia comporta un aumento del tempo necessario per generare il primo token della risposta.

Questi modelli possono elaborare migliaia di token prima di fornire una soluzione definitiva, consentendo un’analisi più approfondita del problema. Le prestazioni dipendono dall’hardware utilizzato, ma ogni configurazione assicura un certo livello di capacità di ragionamento su AMD Ryzen AI e schede Radeon.

a9aeb8ac-c190-405a-85c2-31234091e696.jpeg

Come usare i modelli DeepSeek R1 Distilled su AMD Ryzen AI e Radeon RX 7000 #

Seguendo questa procedura, possiamo configurare e utilizzare i modelli di DeepSeek R1 in pochi minuti.

Prima di iniziare, assicuriamoci di avere installato il driver Adrenalin 25.1.1 o una versione successiva. Possiamo scaricarlo direttamente dal sito ufficiale AMD.

  1. Controlliamo che il driver Adrenalin sia aggiornato alla versione 25.1.1 o successiva.
  2. Scarichiamo LM Studio 0.3.8 o una versione più recente da lmstudio.ai/ryzenai.
  3. Installiamo LM Studio e ignoriamo la configurazione iniziale.
  4. Accediamo alla scheda Discover.
  5. Selezioniamo il modello DeepSeek R1 Distill desiderato. I modelli più piccoli, come Qwen 1.5B, garantiscono tempi di risposta ridotti e sono consigliati per iniziare, mentre quelli più grandi offrono capacità di ragionamento più avanzate.

Processori suportati #

Processore Modello supportato (DeepSeek R1 Distill)
AMD Ryzen™ AI Max+ 395 (32GB¹, 64GB² e 128GB) DeepSeek-R1-Distill-Llama-70B (solo 64GB e 128GB)
DeepSeek-R1-Distill-Qwen-32B
AMD Ryzen™ AI HX 370 e 365 (24GB e 32GB) DeepSeek-R1-Distill-Qwen-14B
AMD Ryzen™ 8040 e Ryzen™ 7040 (32GB) DeepSeek-R1-Distill-Llama-14B

¹ Richiede l’impostazione Variable Graphics Memory su Custom: 24GB.

² Richiede l’impostazione Variable Graphics Memory su High.

GPU supportate #

Scheda Grafica Modello supportato (DeepSeek R1 Distill)
AMD Radeon™ RX 7900 XTX DeepSeek-R1-Distill-Qwen-32B
AMD Radeon™ RX 7900 XT DeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7900 GRE DeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7800 XT DeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7700 XT DeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7600 XT DeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7600 DeepSeek-R1-Distill-Llama-8B

Nota: Tutti i modelli devono essere eseguiti con Q4 K M quantization.

  1. Impostiamo Q4 K M come metodo di quantizzazione e avviamo il download.
  2. Una volta completato, accediamo alla scheda Chat e selezioniamo il modello DeepSeek R1 Distill dal menu a tendina. Attiviamo l’opzione Manually select parameters.
  3. Nella sezione GPU Offload Layers, impostiamo il valore massimo.
  4. Clicchiamo su Model Load.
  5. Il reasoning model è ora pronto per essere utilizzato direttamente sul nostro hardware AMD.

Fonte: Tom’s Hardware, TechPowerUp, AMD Community