Nvidia introduce Volta cu Tesla V100
Nvidia a dezvăluit în cadrul GPU Technology Conference prima și cea mai puternică mostră a noii tehnologii Volta, pe care va fi bazată următoarea serie de plăci video a companiei. O tehnologie pentru a cărei dezvoltare Nvidia a cheltuit 3 miliarde de dolari.
Tesla V100 este cea mai nouă unitate de compute a companiei, construită pe procesul de 12 nanometri. GPU-ul este mult mai mare decât era cel folosit pentru Tesla P100, având o suprafață de 815 milimetri pârați, în loc de 610. De ce? Fiindcă deși este construit folosind tehnologie miniaturizată, Tesla V100 are 5120 de nuclee CUDA, nu doar 3484. Practic, GPU-ul complet ar 5376 de nuclee, dar numai o parte din ele sunt activate pentru acest model.
Asta înseamnă că deși această placă de accelerare rulează la 1455 de MHz, cu 25 MHz mai puțin ca generația trecută, are o putere teoretică de calcul de 15 TFLOPS, în timp ce predecesorul abia dacă trecea de 10.
Dacă vreți o comparație mai detaliată cu generațiile anterioare, am împrumutat tabelul de mai jos de la Videocardz, unde V100 este pus cot la cot cu generațiile din anii precedenți.
| NVIDIA Tesla | ||||
|---|---|---|---|---|
| Tesla Product | Tesla K40 | Tesla M40 | Tesla P100 | Tesla V100 |
| GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) | GV100 (Volta) |
| SMs | 15 | 24 | 56 | 80 |
| TPCs | 15 | 24 | 28 | 40 |
| FP32 Cores / SM | 192 | 128 | 64 | 64 |
| FP32 Cores / GPU | 2880 | 3072 | 3584 | 5120 |
| FP64 Cores / SM | 64 | 4 | 32 | 32 |
| FP64 Cores / GPU | 960 | 96 | 1792 | 2560 |
| Tensor Cores / SM | NA | NA | NA | 8 |
| Tensor Cores / GPU | NA | NA | NA | 640 |
| GPU Boost Clock | 810/875 MHz | 1114 MHz | 1480 MHz | 1455 MHz |
| Peak FP32 TFLOP/s* | 5.04 | 6.8 | 10.6 | 15 |
| Peak FP64 TFLOP/s* | 1.68 | 2.1 | 5.3 | 7.5 |
| Peak Tensor Core TFLOP/s* | NA | NA | NA | 120 |
| Texture Units | 240 | 192 | 224 | 320 |
| Memory Interface | 384-bit GDDR5 | 384-bit GDDR5 | 4096-bit HBM2 | 4096-bit HBM2 |
| Memory Size | Up to 12 GB | Up to 24 GB | 16 GB | 16 GB |
| L2 Cache Size | 1536 KB | 3072 KB | 4096 KB | 6144 KB |
| Shared Memory Size / SM | 16 KB/32 KB/48 KB | 96 KB | 64 KB | Configurable up to 96 KB |
| Register File Size / SM | 256 KB | 256 KB | 256 KB | 256KB |
| Register File Size / GPU | 3840 KB | 6144 KB | 14336 KB | 20480 KB |
| TDP | 235 Watts | 250 Watts | 300 Watts | 300 Watts |
| Transistors | 7.1 billion | 8 billion | 15.3 billion | 21.1 billion |
| GPU Die Size | 551 mm² | 601 mm² | 610 mm² | 815 mm² |
| Manufacturing Process | 28 nm | 28 nm | 16 nm FinFET+ | 12 nm FFN |
La fel ca toată seria Tesla, acest model este menit pentru aplicații de server, compute, antrenare AI și multe alte lucruri care nu sunt importante pentru utilizatorul de rând. Dar, având în vedere cât de multe nuclee CUDA are, atunci am putea vedea încă un salt sesizabil de performanță din variantele sale ciuntite pentru seria GeForce. Cine știe, am putea vedea chiar un Titan XV peste doi ani care să se folosească de toate cele 5120 de nuclee.
Plăcile acestea probabil nu se vor folosi de HBM2, ci un GDDR6 mai economic, dar tot ar trebui să ofere extrem de multă putere grafică… poate de această dată fără ca prețul să crească din nou cu 50 de dolari. Nu au fost anunțate informații despre când vor sosi și plăcile video GeForce bazate pe Volta.


