Fetch4 et DF24 (suite), conclusion
Fetch-4 ? Qu’est ce qui se cache encore derrière ce nom barbare ? Et bien il s’agit de la réponse d’ATI au PCF de NVIDIA. Comme vous le savez déjà si vous avez lu notre article sur le sujet les textures de profondeur ne peuvent pas être filtrées comme les autres textures. En effet, lors de l’échantillonnage, une telle texture ne retourne pas la valeur qui est stockée à une coordonnée (u, v) comme les autres textures traditionnelles mais elle retourne le résultat de la comparaison entre la coordonnée Z du fragment qui est en train d’être texturé et la valeur du texel stocké aux coordonnées X et Y de ce même fragment. Pour que le résultat du filtrage soit correct il ne faut donc pas faire la moyenne de 4 samples et ensuite faire la comparaison avec la valeur Z du fragment, mais faire 4 comparaisons et retourner la moyenne de ces 4 comparaisons. Un tel comportement demande donc des modifications au niveau du sampler de texture.
ATI n’était pas prêt à apporter ces modifications à ses samplers et n’a pas jugé ce comportement « caché » élégant et a donc préféré proposer une autre solution plus flexible le Fetch-4. Le Fetch-4 ne résout donc pas à proprement parler le problème du filtrage mais permet d’en réduire le coût tout en laissant au développeur le choix d’implémenter le kernel de filtrage qu’il souhaite. L’idée du Fetch-4 est simple : puisque la plupart des textures ont 4 composantes (R, G, B, A) et que les unités de textures sont conçues pour récupérer à partir d’une adresse ces 4 composantes autant exploiter cette particularité dans le cas des textures à une seule composante. Ainsi avec un seul échantillonnage de textures il est possible de rapatrier les 4 plus proches voisins de l’échantillon dans le cas des textures à une seule composante.
L’avantage de cette technique est qu’elle est flexible, le programmeur peut ensuite utiliser le filtrage qu’il souhaite, et de plus elle fonctionne avec toutes les textures à une composante et pas seulement les textures de profondeur. L’inconvénient principal est que le filtrage n’est plus « gratuit » vu qu’il doit être fait dans le shader. Ce dernier point étant compensé par le grand nombre d’ALU des RV530 et du R580 par rapport à leurs unités de textures. C’est d’ailleurs sur ces chips que le Fetch-4 prend tout son intérêt vu qu’il permet de limiter le nombre d’instructions de texture qui ont des implications directes sur les performances de ces architectures.
Le Fetch-4 ne fait bien évidemment pas parti de DirectX et par conséquent pour l’utiliser les développeurs doivent passer par des moyens détournés. En l’occurrence ils doivent vérifier que le GPU supporte le format DF24 et si c’est le cas passer un token « magique » au driver. Heureusement il devrait également être possible pour ATI d’utiliser le Fetch-4 par l’intermédiaire de son Catalyst AI en analysant certains shaders et en détectant les cas où cette fonctionnalité pourrait être utile.
Conclusion
Lors du lancement du R520 nous avions été emballé par toutes les innovations proposées mais en même temps nous regrettions l’absence de modification au niveau des ALU. Avec le R580 ATI nous a entendu et a fait les choses en grand en passant de 16 à 48 ALU sans passer par la case 32 et ce moins de 4 mois après le lancement de sa nouvelle architecture. En contrepartie ATI aura "sacrifié" le nombre d’unités de textures qui reste pour sa part inchangé. Alors certains esprits chagrins auraient peut être préféré une architecture 32/32, ces mêmes personnes regretteront aussi sans doute la maigre augmentation des fréquences. Mais l’approche d’ATI si elle a le défaut d’être un peu radicale a au moins le mérite d’être logique : les jeux sont de plus en plus gourmands en puissance de calcul et cette tendance n’est pas prête de s’arrêter.
Le canadien se plaît d’ailleurs à rappeler que le ratio 48 ALU pour 16 unités de texture est semblable à celui utilisé par le Xenos qui équipe la dernière console de Microsoft. Il faut toutefois relativiser la comparaison : l’architecture du Xenos est bien différente de celle du R580 même si les deux GPU partagent le même nombre d’unités d’exécution. Malgré tout l’idée est là : les jeux de demain mettront l’accent sur les instructions arithmétiques vu que dans tous les cas ils finiront par être bridés par la bande passante mémoire qui n’évolue pas aussi vite que la puissance de calcul du GPU.
NVIDIA pourra toujours rétorquer que son RSX, dérivé de l’architecture G70, équipe pour sa part la Playstation 3 de Sony, l’indiscutable leader actuel du marché. Le californien peut donc espérer lui aussi voir de nombreux jeux particulièrement adaptés à son architecture se développer dans le futur ce qui l’avait déjà bien aidé à l’époque de la Xbox. Alors si au final la guerre ne se jouait pas dans nos PC mais bien dans nos salons ?
Je suis un peu descu de testé la 1900xt avec une 7800 GTX classic
pq ne pas lavoir testé avec un GTX 512 mo ou en encore la Carte XFX GeForce 7800 GTX 512MB DDR3 XXX Edition
Fréquence du chipset 580 MHz
Nombre de chipsets graphique 1
Taille mémoire vidéo (Mo) 512
Fréquence mémoire vidéo 865 MHz
mais il y a un trés bon rapport qualité/prix même si le prix reste élever il n' atteind pas les 800€ de certainnes gtx
j'atten la reponse de nvidia
Lis l'article.
J'ai envie d'avoir une carte NVIDIA mais ca sera pas possible dommage