AMD dévoile sa carte Instinct MI100 (CDNA) et mise tout sur le calcul haute précision

11,5 TFLOPS en FP64
AMD dévoile sa carte Instinct MI100 (CDNA) et mise tout sur le calcul haute précision

Après bien des périples, AMD fait son retour sur le marché des cartes graphiques professionnelles consacrées au calcul. Comme NVIDIA, le constructeur a désormais fait le choix d'une architecture dédiée : CDNA. La Instinct MI100 (ne dites plus Radeon) en est la première représentante.

Suite au départ de Raja Koduri chez Intel, le Radeon Technology Group (RTG) a été un brin désorganisé. Et cela s'est ressenti dans les gammes de produits. Après plusieurs années à stagner sur des architectures dérivées de GCN, Vega n'a pas su convaincre et s'est focalisée sur l'offre haut de gamme. C'est seulement l'année dernière avec RDNA, puis depuis la rentrée avec RDNA2 qu'AMD est enfin capable de revenir en force sur le terrain du GPU.

Après RDNA pour les joueurs, CDNA pour les serveurs

Mais cela s'est fait au prix d'un choix radical : la conception de produits qui visent avant tout les joueurs. De l'aveu même de la société dès les débuts de la gamme Radeon RX 5000 (Navi), elles n'ont pas été pensées pour le calcul. Les utiliser pour du calcul via OpenCL n'a jamais vraiment été une partie de plaisir (avec des bugs à la clé).

Ainsi, seuls des modèles Radeon Pro visant le rendu 3D ont été mis sur le marché. Les Radeon Insctinct destinées aux serveurs et au calcul haute performance exploitaient encore des puces de génération Vega. L'objectif était à terme de faire comme NVIDIA : produire des puces conçues pour ce marché, avec des unités dédiées.

AMD Radeon RDNA CDNA

C'est ainsi que CDNA est née. Elle est aujourd'hui officialisée avec un premier modèle : la MI100. S'opposant à l'A100 de NVIDIA (Ampere), elle fait comme les Radeon sur le marché des GeForce en misant tout sur la puissance de calcul brute. Avec une subtilité néanmoins : si elle n'a aucune unité dédiée au ray tracing, elle en a pour le calcul matriciel.

Plus de 11 TFLOPS en FP64

  • Introduction
  • Après RDNA pour les joueurs, CDNA pour les serveurs
  • Plus de 11 TFLOPS en FP64
  • Enfin du calcul matriciel chez AMD
  • MI100 face à l'A100 : gare aux détails
S'abonner à partir de 3,75 €
6 commentaires
Avatar de ashlol Abonné
Avatar de ashlolashlol- 16/11/20 à 17:23:01
#1

Je trouve le format TF32 de nvidia assez bancal au moins ici on a enfin du vrai calcul FP32 sur gpu dédié, déjà qu'il peux y avoir des soucis de précision avec du FP32.
Ca va peut être décider nvidia de proposer aussi du FP32 sur les tensor cores.

Avatar de SwAY256 Abonné
Avatar de SwAY256SwAY256- 16/11/20 à 18:07:05
#2

Merci pour l'article.

Pas évident de rattraper le retard. Au delà du matériel, ROCm est encore très loin de cuda, notamment sur certaines libs bien utilisées en gpgpu (LAPACK, FFT).

Donc d'après ce que tu dis, RDNA2 n'apporte rien en calcul par rapport à RDNA ? Il n'y aura donc aucune concurrence sur le segments des cartes calculs pour station de travail, pour petits labo ou gens qui utilisent leur PC à la fois pour jouer et programmer sur GPU. La GeForce 3090 a de beaux jours devant elle !

Avatar de auberjine Abonné
Avatar de auberjineauberjine- 16/11/20 à 19:23:59
#3

undefined

Avatar de SwAY256 Abonné
Avatar de SwAY256SwAY256- 16/11/20 à 20:18:25
#4

undefined

Oui effectivement, j'ai oublié de préciser FP32.

En FP64, comme le support des fonctions qui ont typiquement besoin de double précision (inversion de matrices, résolutions de systèmes linéaires, EVD..) n'est pas encore complet dans ROCm, ça laisse que la Titan V, et c'est bien dommage !

Avatar de David_L Équipe
Avatar de David_LDavid_L- 17/11/20 à 04:06:54
#5

undefined

J'attends de voir sur RDNA2, mais ça m'étonnerait qu'AMD ait inversé la tendance. Ils communiquent assez peu là-dessus d'ailleurs. Après rien n'empêche de faire du calcul dessus via OpenCL par exemple, mais ce n'est clairement pas le focus d'AMD (excepté pour la crypto, mais c'est une autre histoire).

D'une certaine manière c'est pareil chez NVIDIA avec les A100 qui sont dédiées au calcul alors que les cartes grand public non. Mais ces dernières peuvent tout de même exploiter leur 36 TFLOPS.

undefined

Le FP64 chez NV c'est Tesla (le nom n'étant plus utilisé) sinon rien : V100 avant, A100 désormais. Titan n'apporte rien en FP64 (excepté l'ancienne Titan V qui était en ratio 1:2). Les GeForce RTX de série 30 sont à un rapport de 1:64.

Idem pour la Radeon VII, AMD a tenté de réduire la puissance de calcul puis s'est ravisé (mais on est à 1:4 contre 1:2 possible). Elle reste néanmoins assez perf là-dessus si on sait l'exploiter (3,46 TFLOPS).

Avatar de SwAY256 Abonné
Avatar de SwAY256SwAY256- 17/11/20 à 08:40:54
#6

undefined

Oui je parlais de la vieille titan V, qui d'ailleurs doit avoir un ratio fp64flops/€ meilleur que la a100. Et de toute façon avec son refroidissement passif, la a100 n'est pas faite pour les station de travail.

Il n'est plus possible de commenter cette actualité.

2000 - 2020 INpact MediaGroup - SARL de presse, membre du SPIIL. N° de CPPAP 0321 Z 92244.

Marque déposée. Tous droits réservés. Mentions légales et contact