Téléchargez l'application
Tom's Hardware sur l'App Store
Toute l'actu informatique de référence sur votre iPhone
Oui Non

Le X1900 : symbole d'un changement (suite)

par

Dans son guide de programmation pour les chips X1x00 ATI suggère ainsi de s’orienter vers un ratio de 4 instructions arithmétiques pour une instruction de texture en moyenne dans le cas où l’on cible un GPU comme le R520 ou le RV515. Si la cible est un GPU comme le RV530 (ou le R580 par extension) ATI conseille un ratio de 8:1 ou plus si possible pour garantir une efficacité maximale !

Le nombre d’instructions arithmétiques utilisées dans les jeux augmente donc plus vite que le nombre d’instructions de textures, en soit cette observation n’a rien de surprenant vu que les algorithmes se complexifient et que les modèles d’éclairage plus évolués sont plus gourmands en puissance de calcul. Mais ce n’est pas le seul facteur à considérer, ainsi lorsque l’on regarde la tendance dans le domaine des GPU sur ces 5 dernières générations on observe un phénomène intéressant :


Comme on le voit la puissance de calcul progresse à un rythme bien plus soutenu que la bande passante mémoire. Le R300 apparaît ici comme une exception dans cette évolution du fait de l’introduction du bus 256 bits mais cela reste coûteux ce qui explique que l’on ne dispose pas encore de GPU à bus 512 bits. La principale preuve du coût d’un tel bus 256 bits est que si son utilisation s’est rapidement démocratisée dans le secteur haut de gamme, les GPU milieu de gamme et entrée de gamme doivent, pour leur part, se contenter de bus 128 bits et ce plus de 3 ans après l’introduction du bus 256 bits.

Les explications de cette évolution sont multiples, la première vient de la fameuse loi de Moore qui, contrairement à ce qui est souvent indiqué, ne dit pas que la puissance de calcul double tous les dix huit mois mais que le nombre de transistors qui peuvent être placé sur un die de silicium double durant cette même période. Non seulement le nombre de transistors augmente au fil du temps, mais en plus ils peuvent changer d’état plus rapidement ce qui permet d’augmenter la fréquence d’horloge des processeurs. En combinant l’augmentation du nombre de transistors et l’augmentation en fréquence on peut donc compter sur une augmentation de puissance de 71 % par an.

A l’inverse les performances des mémoires dynamiques (DRAM) n’augmentent pas aussi rapidement que celles des processeurs. Des observations ont ainsi démontrées que la bande passante augmente de 25 % par an alors que la latence ne diminue que de 5 % durant la même période. Comme les rapports entre la puissance de calcul, la bande passante et la latence changent au fil du temps, les fabricants de GPU doivent donc s’adapter et concevoir leurs puces avec de nouveaux impératifs. Ainsi de nombreuses techniques d’économie de bande passante ont été mises au point (compression de textures, du ZBuffer, des couleurs, ZBuffer hiérarchique, fast Z Clear…) et les architectures ont été développées afin de faire face à des latences de plus en plus longues (comme l’architecture Ultra Threaded des derniers GPU d’ATI).

Mais si parfois d’ingénieuses astuces permettent de repousser le problème pour quelques temps, il arrive un moment où il n’y a plus d’autres solutions que d’y faire face. Ainsi conscient de l’évolution « au ralenti » de la bande passante mémoire les ingénieurs ont mis au point des architectures découplées : il était en effet inutile d’ajouter de nouvelles unités consommatrices de bande passante si ce dernier point est déjà le facteur limitant. NVIDIA a donc été le premier à opter pour cette optique avec la 6600 qui disposait de deux fois plus d’ALU que de ROP. Ce schéma s’est ensuite propagé au haut de gamme avec la 7800 et ses 24 ALU pour 16 ROP. ATI a poussé plus loin le concept avec son RV530 en découplant non seulement les ALU des ROP mais également du nombre d’unités de textures. Et aujourd’hui, comme NVIDIA, le Canadien adopte la même stratégie sur son nouveau haut de gamme.

Et cette tendance n’est pas prête de changer si l’on en croît les estimations pour ces dix prochaines années :


Ainsi la puissance de calcul devrait être multipliée par plus de 40 en dix ans, alors que dans le même temps la bande passante ne serait multipliée que par 9. On atteindrait ainsi le chiffre de 4Tflops de puissance de calcul (programmable ! contrairement aux annonces farfelues de Microsoft et de Sony concernant leurs dernières consoles respectives).

Partager:
3
Commentaires
X
Valider

Commentaires
Lire les commentaires sur le forum
dydy88 03/02/2006 18:49
Masquer
-0+

Je suis un peu descu de testé la 1900xt avec une 7800 GTX classic
pq ne pas lavoir testé avec un GTX 512 mo ou en encore la Carte XFX GeForce 7800 GTX 512MB DDR3 XXX Edition
Fréquence du chipset 580 MHz
Nombre de chipsets graphique 1
Taille mémoire vidéo (Mo) 512
Fréquence mémoire vidéo 865 MHz
mais il y a un trés bon rapport qualité/prix même si le prix reste élever il n' atteind pas les 800€ de certainnes gtx
j'atten la reponse de nvidia :p

Florian c 03/02/2006 19:07
Masquer
-0+

Lis l'article.

Alfa321 09/02/2006 15:17
Masquer
-0+

J'ai envie d'avoir une carte NVIDIA mais ca sera pas possible dommage

Les offres du moment

Newsletters


OK