Téléchargez l'application
Tom's Hardware sur l'App Store
Toute l'actu informatique de référence sur votre iPhone
Oui Non

Rappel d’architecture, RV530 x 4 = R580 ?

par
Le R580 reprend l’ensemble des innovations introduites par le R520. Pour plus de détails nous vous invitons à lire notre article mais si vous souhaitez juste un aperçu dans les grandes lignes de cette architecture voici ses caractéristiques principales :

  • Architecture SM 3.0 optimisée pour les branchements dynamiques dans les pixel shaders via la présence d’une unité dédiée
  • Support du blending FP16 en conjonction avec l’AA
  • Contrôleur mémoire totalement programmable combinant un Crossbar 8x32 bits à un bus composé de deux anneaux 256 bits permettant de simplifier le routage tout en offrant une large bande passante
  • Caches entièrement associatifs pour une meilleure efficacité
  • ZBuffer hiérarchique amélioré
Sur ce dernier point le R580 va même encore plus loin vu que la taille du ZBuffer hiérarchique embarqué sur le GPU a été augmentée de 50 % afin d’être plus efficace dans les très hautes résolutions (1920x1200 et supérieures).

RV530 x 4 = R580 ?

Du point de vue de l’organisation des ALU de pixel shaders si le RV515 ressemblait sur de nombreux aspects à un quart de R520, le R580 pour sa part est quant à lui assez proche dans son organisation de quatre RV530. Cette image est sans aucun doute une grossière simplification de l’architecture interne du chip mais elle donne déjà une assez bonne idée de la façon dont sont organisées les 48 ALU.

On aurait pu imaginer plusieurs configurations possibles pour ces 48 ALU, l’une d’entre elles aurait pu être, un peu à l’image de NVIDIA avec son NV40 et son G70 et leurs ALU dual issue, de proposer des ALU triple issue en conservant quatre Quad Pixel Shader ALU. Cette solution aurait eu toutefois l’inconvénient de souffrir de dépendances entre les instructions.

Une autre hypothèse aurait pu être de reprendre l’organisation du R520 mais en proposant 3 groupes de quatre Quad Pixel Shader ALU. Finalement la solution qui a été choisie n’a été aucune de ces deux là : ATI a opté pour quatre groupes de trois Quad Pixel Shader Core.


Mais au final ce genre de détails a-t-il vraiment une réelle importance ? Oui car cette organisation a priori anodine, qui aurait pu résulter d’une volonté de simplifier la mise au point du chip en reprenant des blocs fonctionnels d’un GPU existant, a en réalité un impact sur la façon dont le chip va se comporter.

Première conséquence la taille des threads (dans le cadre d’un GPU le terme thread ou batch représente un groupe de pixels indivisible sur lequel un GPU applique une même instruction) est du coup identique à celle du RV530 à savoir 48 pixels. On s’éloigne donc un peu de la granularité extrêmement fine des threads du R520 et du RV515 qui pour rappel était de 16 pixels. Le RV530 tout comme le R580 devrait donc être légèrement moins performants que les autres GPU de la famille X1x00 lors des branchements dynamiques. ATI affirme que lors de mesures pratiques cette augmentation n’a qu’un impact négligeable sur les performances des branchements dynamiques.

Il convient toutefois de relativiser ce problème : la taille des threads du R580 reste toujours remarquablement petite, à titre de comparaison le G70 de NVIDIA opère sur des threads de 1024 pixels, quant au Xenos, le GPU qui équipe la Xbox 360, il travaille sur des threads de 64 pixels.

Toujours dans le domaine des threads, le R520 avait suffisamment de registres pour gérer 512 threads in flight c'est-à-dire en cours de traitement ; une des craintes avec les threads plus gros du R580 était que ce nombre diminue mais heureusement la quantité de registres a triplée par rapport au R520 et on conserve donc le même nombre de threads. Cette donnée est particulièrement importante car c’est la présence d’un grand nombre de threads qui permet de masquer la latence mémoire en conservant les ALU occupées le temps que la requête mémoire soit accomplie.

Cette organisation en groupe a également une conséquence sur la façon dont le shader est appliqué aux différents pixels. Jusqu’ici tous les GPU d’ATI ne fonctionnaient qu’en SIMD sur l’ensemble de leurs ALU de pixel shaders. Avec le R580 désormais les instructions sont toujours appliquées en lockstep sur plusieurs quads mais groupe par groupe et non plus sur l’ensemble des ALU. Ainsi chaque groupe travaille sur un thread différent et peut appliquer une instruction différente des autres.

Partager:
3
Commentaires
X
Valider

Commentaires
Lire les commentaires sur le forum
dydy88 03/02/2006 18:49
Masquer
-0+

Je suis un peu descu de testé la 1900xt avec une 7800 GTX classic
pq ne pas lavoir testé avec un GTX 512 mo ou en encore la Carte XFX GeForce 7800 GTX 512MB DDR3 XXX Edition
Fréquence du chipset 580 MHz
Nombre de chipsets graphique 1
Taille mémoire vidéo (Mo) 512
Fréquence mémoire vidéo 865 MHz
mais il y a un trés bon rapport qualité/prix même si le prix reste élever il n' atteind pas les 800€ de certainnes gtx
j'atten la reponse de nvidia :p

Florian c 03/02/2006 19:07
Masquer
-0+

Lis l'article.

Alfa321 09/02/2006 15:17
Masquer
-0+

J'ai envie d'avoir une carte NVIDIA mais ca sera pas possible dommage

Les offres du moment

Newsletters


OK