AMD Radeon Vega: Architettura gaming 4K con memorie HBM2

AMD Vega chip

La rivoluzionaria architettura Vega di AMD, permette alle GPU di fare epocali passi in avanti.

Come annunciato, AMD ha presentato durante il CES 2017 la sua nuova architettura per GPU: Vega, evoluzione della serie Fury per utenti enthusiast che dovrà prendere il posto delle attuali soluzioni Polaris rappresentate dalle AMD Radeon RX 460, RX 470 e RX 480.

Caratteristiche di AMD Vega

Vega si mostra molto promettente sia in ambito professionale che in ambito gaming, aspetto che maggiormente ci interessa in questa sede. Tuttavia, rispetto a ciò che ci aspettavamo, non c'è stata una vera e propria presentazione di nuovi modelli di schede video, ma "solo" una serie di slide molto tecniche che, in termini videoludici, non ci danno dati precisi sull'effettiva "potenza bruta" delle GPU made in AMD di prossima generazione, pur dicendoci moltissimo sulle innovazioni tecnologiche che segneranno il futuro prossimo del gaming sia PC che console, in particolare per quanto riguarda Xbox Scorpio, che dovrebbe montare un SoC derivato proprio dall'architettura Vega appena presentata.

Architettura AMD Radeon Vega

Vega amplia ulteriormente il discorso di innovazioni già viste nella Polaris di PS4 Pro, come i calcoli FP16 affiancati a quelli FP32, aggiungendo alla ricetta un'incredibile serie di ottimizzazioni che promettono un'efficienza mai vista prima d'ora, in particolare per quanto concerne la memoria, consentendo maggiore capacità e minore consumo di banda, ma anche promettendo minori consumi energetici e maggiore velocità di clock.

Come si traduce tutto questo in-game lo abbiamo già visto nel dicembre 2016, quando è stato mostrato come girava DOOM in 4K con un sample di Radeon Vega: 60/70 fps a Ultra con le API Vulkan (la GTX 1080 non regge i 60 fps con quei settaggi grafici). In seguito fu mostrato Star Wars: Battlefront in 4K, durante la presentazione delle CPU Ryzen in combinazione con la GPU Vega: 60 fps stabili a Ultra (dove la GTX 1080 si ferma a 50 fps).

Adesso, cercando di semplificare ed evirare il più possibile da tecnicismi un discorso di carattere abbastanza tecnico, ecco quali sono le novità introdotte dalla nuova architettura.

Velocità ed efficienza della memoria HBM 2

AMD Vega: HBM2, velocità doppia

Le informazioni divulgate da AMD profilano un'architettura nuova di zecca e caratterizzata da alcune innovazioni tecniche interessanti. Innanzitutto è stata confermata la presenza delle HBM2 (High Bandwidth Memory), che rispetto alle HBM di prima generazione montate su Fury, raddoppiano la velocità di trasferimento dei dati fino a 2 GT/s (Gigatransfer al secondo). Un altro vantaggio delle nuove HBM, è l'aumento della capacità, prima limitata a 4GB e adesso incrementata fino a 8GB o 16GB complessivi.

In soldoni, l'utilizzo di memorie HBM, ovvero di chip di memoria disposti l'uno sull'altro e collegati in parallelo, consente di diminuire le dimensioni fisiche dei chip, consumare meno energia elettrica e aumentare considerevolmente la larghezza della banda passante (bandwidth). Questi vantaggi diventano particolarmente importanti quando si parla di applicativi intensivi come la Realtà Virtuale o il rendering 4K in tempo reale.

Più memoria e meno consumi grazie a HBC e HBCC

AMD Vega: High-Bandwidth Cache con 512TB di memoria virtuale

Vega introduce una versione avanzata del framebuffer tradizionale: High-Bandwidth Cache (HBC), memoria a basso consumo ed elevata capacità interna alla GPU che andrà ad affiancare le memorie L1 e L2 già presenti, e sarà gestita da un High Bandwidth Cache Controller (HBCC) che si occuperà di interfacciare la memoria on-chip a tutti gli altri tipi di memoria a disposizione come NVRAM, DRAM di sistema e storage di rete. Quest'ultima possibilità è riconducibile alla tecnologia, sempre ideata da AMD, chiamata Solid State Graphics (SSG) e che consentirebbe di integrare un'unità a stato solido (SSD) direttamente sulla scheda video, in maniera tale da incrementare ulteriormente, oltre alla velocità di elaborazione, anche la quantità di memoria a disposizione fino a 1TB.

Memoria grafica utilizzata dai giochi moderni: The Witcher 3 e Fallout 4

Per evidenziare l'importanza dell'HBCC, sono stati fatti gli esempi di The Witcher 3: Wild Hunt e Fallout 4, che allocano una quantità di memoria video due volte superiore a quella effettivamente utilizzata durante l'esecuzione del gioco. Il nuovo controller si occuperà di ottimizzare il lavoro con grandi quantità di dati, fornendo fino a 512TB di memoria virtuale (esatto, TeraByte). Questo significa che una GPU Vega dotata di 4GB di HBM2 potrebbe potenzialmente comportarsi come se fosse dotata di 8-12GB di memoria, così come un modello dotato di 8GB reali, sarebbe paragonabile a una scheda con 16-24GB di VRAM.

Le future genrazioni di giochi potranno trarre vantaggio da questo nuovo design della memoria per rendere disponibile al processore grafico una grande quantità di dati senza doversi più preoccupare di "dosarli" manualmente come oggi.

Next-gen CU: maggiore frequenza di clock e IPC a FP8 e FP16

AMD Vega: Next-gen Compute Unit o NCU

Così come accade con la memoria, i videogiochi moderni possono allocare fino a 100 volte più poligoni di quelli effettivamente visibili dal giocatore sullo schermo durante una scena. Per risolvere questo tipo di problema, Vega utilizza una nuova pipeline grafica programmabile, che consente di raddoppiare il throughput (la capacità di trasmissione) per ciclo di clock, affiancandole un sistema di bilanciamento del carico chiamato Intelligent Workgroup Distributor.

AMD Vega: Primitive Shader

Quando una scena viene renderizzata, si attiva un processo complesso in cui la scheda grafica elabora i vertex shader (istruzioni di calcolo) prima di passare le informazioni al motore geometrico per il lavoro supplementare. Vega accelera questo lavoro tramite l'utilizzo di shader primitivi che identificano quali sono i poligoni non visibili a schermo evitando di passarli al motore geometrico.

A completare la dotazione di novità, è stato progettato un compute engine (CU) di nuova generazione (NCU), capace di eseguire:

  • 512 operazioni per clock (IPC) a 8 bit (FP8);
  • 256 operazioni per clock (IPC) a 16 bit (FP16);
  • 128 operazioni per clock (IPC) a 32 bit (FP32).

AMD Vega: NCU ottimizzato con doppie operazioni contemporanee

Seppure le operazioni a 8 e 16 bit siano utili soprattutto nel machine learning (apprendimento automatico) delle intelligenze artificiali o nel campo della computer vision (visione artificiale), la possibilità di effettuare operazioni FP16 (a mezza precisione) con l'architettura di PS4 Pro, lascia intendere che sussistono alcuni vantaggi lato gaming, in particolare a livello di ottimizzazione, nel relegare a FP16 alcuni calcoli che richiedono una precisione meno stringente per risparmiare spazio e incrementare l'efficienza. I nuovi NCU di Vega ampliano quella possibilità, consentendo di programmare insieme ed eseguire fino due operazioni FP16 contamporaneamente.

Gli sforzi ingegneristici di AMD si sono concentrati sull'incremento delle performance single thread delle CU in modo tale da ottimizzare la circuteria di Vega e consentire di aumentare la frequenza di clock finale e mantenere inalterati o addirittura abbassare i voltaggi. Non si parla di frequenze di clock precise, ma le premesse lasciano ben sperare.

Nuovo Pixel Engine per ridurre il consumo di banda

AMD Vega: NCU ottimizzato con doppie operazioni contemporanee

Sulla stessa scia dell'ottimizzazione, inerente soprattutto la diminuzione del consumo della bandwidth della memoria, lavora il nuovo Draw Stream Binning Rasterizer (DSBR), incorporato nel Pixel Engine dinamico di Vega che lavora in combinazione con il controller HBCC per migliorare le prestazioni e risparmiare energia elaborando in modo più efficiente la scena. Dopo che il motore geometrico ha eseguito il suo compito, Vega identifica quali sono i singoli pixel sovrapposti che non saranno visibili risparmiando il lavoro finale alla GPU. AMD pensa che questo rasterizer migliorerà molto le performance in particolari situazioni in cui la HBM o l'HBC si presentano come colli di bottiglia, velocizzando i calcoli con Depth Buffer estremamente complessi come quelli che si basano sui deferred shading.

Possibili specifiche tecniche di Vega