Le prédécesseur
Cette fois pas question de vous refaire la description de l’architecture X1000 d’ATI, si vous êtes un fidèle lecteur de Presence-PC vous avez déjà lu nos précédents articles (sur l’architecture X1800 et X1900). Toutefois si vous souhaitez vous rafraîchir la mémoire sans vous replonger dans nos articles voici les principaux éléments qu’il faut retenir de l’architecture précédente d’ATI :
- Une architecture fortement threadée et découplée (ultra-threaded architecture et unités de textures séparées des ALU)
- Une gestion des accès mémoires revue pour plus d’efficacité et d’évolutivité (topologie en anneau notamment)
- Un rapport ALU/TEX inversé en favorisant les ALU par rapport aux instructions de texture (X1600 et X1900)
Direct3D 10
Là encore pas question de rentrer dans les détails de Direct3D 10 auquel nous avons réservé un article complet il y a quelques mois mais on peut résumer les apports de cette API en quelques points :
- Amélioration des performances en diminuant le surcoût de l’API
- Unification des fonctionnalités et des ressources entre les différents types de shaders
- Introduction des geometry shader pour se libérer de la contrainte "1 sommet entrant – 1 sommet sortant"
- Introduction du StreamOutput afin de pouvoir écrire dans la mémoire plus tôt dans le pipeline
R600
Et nous pouvons enfin nous intéresser au R600, mais rassurez-vous tout ce que nous venons de voir n’est pas inutile car le R600 est en quelque sorte la fusion du Xenos et du X1900 le tout étendu à DirectX 10 et avec bien plus de ressources de calculs.
| HD 2900 XT (R600) | |
|---|---|
| Fréquence GPU | 742 MHz |
| Fréquence RAM | 825 MHz |
| ALU | 320 |
| Unités de texture | 16 filtrées / 16 non filtrées |
| Color ROP | 16 |
| Z ROP | 32 |
| Contrôleur mémoire | 512 bits (8 canaux 64 bits) |
| Type de RAM | GDDR3 |
La première chose qui frappe lorsque l’on regarde le tableau ci-dessus c’est le nombre d’ALU : 320, mais comme avec le G80 il faut se montrer prudent : on ne parle plus ici d’ALU vectorielles mais d’ALU scalaires. En pratique cela correspondrait donc à 80 pipelines 4D vectoriels mais la réalité est plus complexe, nous y reviendrons très bientôt.
Autre élément intéressant : nous avons ici le premier GPU à disposer d’un bus 512 bits et ce 5 ans après l’introduction du bus 256 bits par Matrox ! Avec de la GDDR3 à 825MHz on obtient donc la bande passante assez délirante de près de 106 Go/s. En revanche, contrairement à son concurrent, AMD n’en a pas profité pour augmenter le nombre de ROP qui reste désespérément figé à 16 depuis le R420 en 2004. Idem pour le nombre d’unités de textures qui est lui aussi inchangé. AMD justifie pour sa part l’augmentation de bande passante comme étant nécessaire pour offrir enfin du HDR avec un impact le plus bas possible sur les performances. Le retour du "think less about more pixels and more about better pixels" en quelque sorte, David Kirk (Chief Scientist de nVidia) appréciera sûrement…
Au final ce GPU dont la conception aura durée près de 4 ans et aura impliquée jusqu’à 300 personnes comprend 700 millions de transistors selon AMD, ce qui lui permet de coiffer sur le poteau NVIDIA et son G80 avec ses 681 millions.
- Introduction
- Xenos, le précurseur
- Le précurseur (ALU, caches et texture arrays)
- Le précurseur (fonctionnalités GPGPU, tesselation)
- Le prédécesseur, DX10, R600
- Vue d’ensemble, communications CPU-GPU
- Command Processor, setup engine, arbitrer et sequencer
- Les ALU dans le détail, l’unité de tesselation
- Performances en vertex shading
- Performances en pixel shading
- Virtualisation des ressources
- Les unités de texture
- Les ROP, l’interface mémoire
- Antialiasing : 8X et CFAA
- Antialiasing : en pratique, filtrage anisotropique
- Vidéo ? HD !
- La Radeon HD 2900 XT
- Le test
- Test Drive Unlimited, Supreme Commander
- Age of Empires 3, Oblivion
- FEAR, Gothic 3
- STALKER
- Tests DirectX 10
- Tests DirectX 10 (suite)
- Test DirectX 10 (fin, Call of Juarez)
- Consommation, bruit, overclocking
- Conclusion