Téléchargez l'application
Tom's Hardware sur l'App Store
Toute l'actu informatique de référence sur votre iPhone
Oui Non

Performances synthétiques

par
GPU6800 Ultra6800 GTX800XTR9700 Pro
Fréquence GPU425 MHz (Asus)350 MHz520 MHz325 MHz
Fréquence mémoire550 MHz500 MHz560 MHz310 MHz
Largeur bus mémoire256 bits256 bits256 bits256 bits
Type de mémoireGDDR3GDDR3GDDR3DDR1
Nombre de Pixel Pipelines1616168
Nombre d'unités de Texture Sampling1111
Nombre de processeurs de vertex6664
Fillrate théorique6800 MPixels5600 Mpixels8320 MPixels2600 MPixels
Bande passante mémoire35,2 Go/s32 Go/s35,8 Go/s19 Go/s
Ratio fillrate / bande passante mémoire 182175232137
Nombre de transistors222 millions222 millions160 millions107 millions
Process0.13µ0.13µ0.13µ low-k0.15µ

Une constatation s’impose déjà à la vue de ce tableau : les nouvelles génération de GPU progressent bien plus au niveau de la puissance du GPU que de la bande passante mémoire. C’est une évolution logique maintenant que la bande passante mémoire ne constitue plus vraiment un goulet d’étranglement ; d’ailleurs Samsung est officiellement capable de produire des puces mémoires GDDR3 allant jusqu’à 800 MHz.

La X800XT est particulièrement impressionnante à ce titre, puisqu’elle double le nombre de pipelines par rapport à l’ancienne génération R3X0, tout en augmentant encore la fréquence GPU. Chez nVidia, le fillrate est un peu moins élevé du fait d’une fréquence GPU plus faible (222 millions de transistors…). Gardez cependant en tête que le fillrate ne fait pas tout. On notera que la 6800 GT est plus bridée par la fréquence mémoire que par celle du GPU, avec un ratio 4 % moins important que la 6800 Ultra

Fillrate

Commençons par mesurer le fillrate et observer un éventuel écart avec le fillrate théorique présenté.

Pas de surprise à ce niveau, la X800 XT confirme qu’elle possède un fillrate pur énorme.

Ce test met clairement en avant une des spécificités de l’architecture des nv3x/nv4x : la possibilité de doubler le fillrate lorsque les écritures dans le color buffer sont désactivées (d’où l’écriture de la configuration des pipes en « 32 x 0 »). Cette possibilité s’averera particulièrement utile dans les passes de rendu se chargeant du remplissage du ZBuffer et du stencil buffer. Les cartes ATI conservent quand à elles leur fillrate.

Ici, il faut noter la très bonne optimisation du 6800 Ultra, qui malgré un fillrate théorique inférieur à la X800 XT, parvient à rester au-dessus de celle-ci lors de l’application de textures. Notez que c’est ici l’unité de T&L qui est utilisée.

Pixel Shaders

Des choses très intéressantes sont à noter ici. Premièrement, sur des pixel shaders simples (à la fois en terme de technologie avec les PS 1.1 et 1.4, qu’en terme de nombre d’instructions), la X800 XT fait très fort avec 4000 MPixels/s. Pourtant, ce résultat était complètement prévisible. En fait, chez ATI les shaders de ces 4 tests s’exécutent en 2 cycles. Du coup le résultat correpond au fillrate divisé par deux, aussi bien avec la 9700 Pro qu’avec la X800 XT.

Sur les NV40, les résultats sont plus compliqués. Ici, seuls les deux tests « PS 1.4 » et « PS 2.0 » s’exécutent en 2 cycles. Les performances chutent au 2/3 avec un Pixel Shader de génération DirectX 8.0 (PS 1.1), et ce résultat est logique. En effet, ceux-ci étaient auparavant traités par les Registers Combiners qui sont désormais émulés à partir d’une unité flottante. Mais on note la même perte de performance avec les Pixel Shader 2.0 en précision partielle (16 bits), test prévu pour l’ancienne architecture nv3x. Soyons clair : cette perte n’a absolument aucun sens ; vu l’architecture du NV40 il est clair que la vitesse de traitement des PS 2.0 en précision partielle devrait être équivalente à celle des PS 2.0. On ne peut donc que mettre en cause les drivers sur ce point. Il faut noter que nVidia a réalisé des progrès à ce niveau, puisque initialement les PS 1.4 ne s’exécutaient pas plus rapidement que les PS 1.1. Gageons que les drivers continuent à améliorer ce point faible.

Avec des Pixel Shader 2.0 longs, les performances baissent puisque ces shaders nécessitent 4 cycles pour tous les GPU. En activant un éclairage par pixel, la hiérarchie reste identique. Par contre, les 6800 sont capables de bien améliorer le temps d’exécution quand on repasse à une précision partielle, ce qui est un héritage de la génération NV3x. Ce résultat reste surprenant quand on voit que sans éclairage par pixel, les 6800 perdent au contraire des performances en repassant en 64 bits.

Vertex Shaders

Ici, nous avons utilisé une scène assez chargée, avec un profil géométrique complexe et un éclairage Diffuse + Specular avec trois sources lumineuses.

En mode Fixed Function, c’est l’unité de T&L qui est utilisée. Rappelons que cette ancêtre des shaders n’est aujourd’hui plus câblée en hardware sur les GPU, mais qu’elle est émulée par les unités de Vertex Shaders. Et à ce petit jeu, la 6800 Ultra est clairement devant même si cela ne se remarque pas tellement ici, comparativement à la différence que l’on observe avec un profil moins complexe (la 6800 Ultra peut alors s’avérer presque deux fois plus performante que la X800 XT).

Dès que l’on utilise le branchement, les performances restent identiques sur l’architecture ATI, que l’on parle des Vertex Shaders de DirectX 8.0 (VS 1.1), DirectX 8.1 (VS 1.4) ou DirectX 9 (VS 2.0). Cela confirme la grande stabilité de l’architecture des unités de shaders, simple et sans surprise, comme nous le constations aussi avec les pixels shaders. On note même un très léger gain de performance en passant aux VS 2.0 ou aux VS 2.0 + PS 2.0.

Chez nVidia, seul le traitement des branchements statiques en VS 1.1 permet d’obtenir les pleines performances. Etrangement, le traitement des PS 1.1 ne pose plus de problème, mais ce sont cette fois les VS 2.0 qui ne s’exécutent qu’au 2/3 de la performance des PS 1.1 et 1.4. Notre hypothèse sur ce point est que notre scène de test utilise en réalité les VS 2.0 en flux de contrôle statique ou dynamique, qui s’exécutent effectivement au 2/3 des performance des VS 2.0 et des VS 1.1 sur NV40.

Bilan

En résumé, en matière de Pixel Shaders, la X800 XT est presque toujours en tête, sauf lorsque l’on active l’éclairage par pixel en précision partielle. Du côté des Vertex Shaders, les drivers ont bien améliorés les choses et les deux cartes sont désormais au coude à coude, avec un net avantage à nVidia concernant le T&L, mais un net désavantage avec certains VS 2.0 ! Nos résultats parfois légèrement contradictoires sur 6800, bien que parfaitement reproductibles, prouvent en tout cas que son architecture n’est pas encore totalement domptée. Soulignons toutefois que les progrès réalisés par rapport aux NV3X sont gigantesques, grâce au changement d’architecture. Nos tests sur ShaderMark 2.0 nous ont également montrés que dans de rares cas (2/23), la 6800 Ultra pouvait être plus rapide que la X800 XT.

HSR, Overdraw, Point Sprites, Procedural Texturing

Voyons maintenant le test HSR. Pour rappel, le Hidden Surface Removal est une fonctionnalité visant à économiser des cycles GPU en ne lui faisant pas effectuer le rendu des pixels qui seront cachés par d’autres pixels au premier plan.

Evidemment, l’architecture similaire du R300 et du R420 fait que la X800 XT ne peut compter que sur l’augmentation de sa fréquence pour bénéficier d’un meilleur framerate. Sa gestion du HSR n’a pas évoluée. En revanche les 6800 sont particulièrement efficaces sur ce plan.

Observons maintenant ce qui se passe en ce qui concerne la gestion de l’overdraw, avec VillageMark. VillageMark est une démonstration technologique mise au point par PowerVR afin de mettre en avant l’efficacité du Tile Rendering propres aux GPU PowerVR en la matière. Pourquoi plaçons nous ce test après le test HSR ? Parce que l’overdraw représente le nombre de fois où un même pixel va être écrit dans le frame buffer, là où le HSR mesure la faculté de rejeter ces pixels avant de les écrire dans le frame buffer. Plus le HSR est efficace, plus il permet de limiter l’overdraw, vu qu’il rejettera les pixels plus tôt dans le pipe et donc ne les écrira pas dans le frame buffer.

Ce test prouve donc l’écart entre la théorie et la pratique puisque les résultats vont dans le sens contraire du test HSR (comment ça on se la joue professeur ?). Cela dit, vu qu’on est ici en présence d’un test PowerVR, il est probable qu’il utilise un rendu ‘back to front’ pour justement maximiser l’overdraw, ce qui du même coup rendrait le HSR inopérant. Les résultats se joueraient donc plus au niveau du contrôleur mémoire, compression, etc.

Ironiquement, avec le même test en OpenGL les 6800 sont moins performantes alors que les GPU d’ATI restent au même niveau. Bref, ne cherchez pas l’explication du côté de l’efficacité des drivers OpenGL vis-à-vis de Direct3D…

Parlons maintenant des Point Sprites. Que sont ils ? Un type de primitive particulier. En ne spécifiant qu’un seul vertex (sommet), il permet de générer un quad (carré) centré sur ce sommet, ce qui permet d’économiser de la bande passante (un seul point est nécessaire au lieu de quatre !).

Pas de problème pour ATI ici, en fait les résultats sont clairement en rapport avec le fillrate de chaque carte. Encore fallait-il le vérifier…

Enfin, étudions les résultats dans des tests procéduraux.

Ici, la 6800 Ultra reste en tête : elle peut en effet utiliser ses deux unités ALU, alors que la X800 XT n’en a qu’une.

Antialiasing, filtrage anisotropique

Après avoir vu l’aspect qualitatif dans les sections dédiées, nous nous sommes ici attachés à observer la contrepartie quantitative que provoquait l’activation de l’antialiasing et du filtrage anisotropique sur chacune des cartes. Pour ce faire, nous avons ramené à 100 % la performance de chaque carte hors AA + aniso. La scène de test est la Vallée du Jaguar de Serious Sam : Second Contact, et la résolution est fixée à 1920 x 1440. Pour cette raison, nous avons exclu la 9700 Pro qui était surtout limitée par ses 128 Mo de mémoire. Notez que l’antialiasing et l’anisotropie ont été activés à partir des drivers, comme pour l’ensemble des jeux.

On le voit ici, l’algorithme d’ATI est bien plus efficace en terme de performances, puisqu’un antialiasing 4X s’effectue à 76 % du framerate, contre seulement 60,4 % pour la 6800 Ultra. La 6800 GT, du fait de sa puissance moindre, a encore un peu plus de mal à encaisser.

Le filtrage anisotropique est moins gourmand sur les performances, mais là encore ATI est en tête, ce qui est logique vu que son filtrage effectue moins de calculs.

Et le résultat final est logique, et correspond simplement à l’addition des deux résultats du dessus. Les écarts sont loin d’être négligeables ! Cela dit il convient de remarquer une chose : le filtage anisotropique d’ATI n’est qu’à peine plus rapide que celui de nVidia, alors que la contrepartie qualitative est réelle. En revanche, c’est surtout sur l’antialiasing qu’ATI creuse l’écart, alors que de ce côté il est bien plus difficile de trancher sur le plan qualitatif.

Partager:
30
Commentaires
X
Valider

Commentaires
Lire les commentaires sur le forum
Picsouu 25/08/2004 15:28
Masquer
-0+

Ben ca dit pas ce que disent d'autres sites
Mais ce test est infiniment + complet que les autre pseudo test avec un bench Doom3 et un bench Far Cry
Chapeau!

Picsouu 25/08/2004 15:29
Masquer
-0+

Au fait la config de test (d'occase donc) je l'achete 500€ avec la X800XT, ca vous va ?

Florian c 25/08/2004 15:29
Masquer
-0+

Prenez le temps de le lire :D

frodon1 25/08/2004 15:30
Masquer
-0+

moi je mets 501€ [:lol2]

frodon1 25/08/2004 15:31
Masquer
-0+

c long à lire et j'ai pas tout compris mais c'est très bien fait : félicitations pour ce test !

Picsouu 25/08/2004 15:34
Masquer
-0+

frodon1 a écrit :

moi je mets 501€ [:lol2]



Bon aller 700 fdp in mais c'est mon dernier mot! (toute facon j'ai plein d'offres comme ca, donc si c'est pas ok pour 700 je vais voir ailleur mais vous PERDREZ 700€)

omegamax 25/08/2004 15:40
Masquer
-0+

pfff mais c'est donc la config de monsieur tout le monde ça ! :lol:

Del Gro Badeu 25/08/2004 15:41
Masquer
-0+

Citation :Encore une fois, il est certain que le Shader Model 3.0 s’imposera à termes comme le Shader Model 2.0 est aujourd’hui utilisé par un nombre [g]croissant au jambon[/g] de jeux.


qui c'est qu'avait faim pendant l'écriture de la conclusion ! [:rofl]

Picsouu 25/08/2004 15:44
Masquer
-0+

omegamax a écrit :

pfff mais c'est donc la config de monsieur tout le monde ça ! :lol:



Ca aurait peut etre fait tache avec un celeron 2Ghz et 256 de ram ? [:nicodonald]
Pour ne pas que les GPU soient bridés, cela va de soit :wahoo:

dju 25/08/2004 16:15
Masquer
-0+

Del Gro Badeu a écrit :

Citation :Encore une fois, il est certain que le Shader Model 3.0 s’imposera à termes comme le Shader Model 2.0 est aujourd’hui utilisé par un nombre [g]croissant au jambon[/g] de jeux.


qui c'est qu'avait faim pendant l'écriture de la conclusion ! [:rofl]




j'l'ai vue aussi [:dawa']

faudra que certains s'expliquent, sinon c'est le peloton :o

dju 25/08/2004 16:17
Masquer
-0+

Ceci dit, voilà un comparo interessant, enfin argumenté techniquement et avec une batterie de tests (comme l'a dit picsouu, rien à avoir avec les pseudos tests faits entre Far Cry (opt NV) et Doom III (opt NV) et une conclusion à deux balles :o

Franchement chapeau PPC :jap: :o

Skyzoboy 25/08/2004 16:21
Masquer
-0+

Citation :nous nous sommes rabattus sur une configuration bas de gamme, car après tout il est logique qu’une fois que vous aurez payé ces cartes 3D, il ne vous restera plus rien pour le reste de la configuration.

Athlon 64 3800+
Asus A8V Deluxe (Via K8T800 Pro)
2 x 512 Mo PC4000 Kingston
Hitachi 7K400
TTGI 400W


OUI OUI, et la marmotte ... :lol:

Picsouu 25/08/2004 16:24
Masquer
-0+

:lol: j'avais pas lu l'intro de la config de test!

TNZ 25/08/2004 16:37
Masquer
-0+

Skyzoboy a écrit :

Citation :nous nous sommes rabattus sur une configuration bas de gamme, car après tout il est logique qu’une fois que vous aurez payé ces cartes 3D, il ne vous restera plus rien pour le reste de la configuration.

Athlon 64 3800+
Asus A8V Deluxe (Via K8T800 Pro)
2 x 512 Mo PC4000 Kingston
Hitachi 7K400
TTGI 400W


OUI OUI, et la marmotte ... :lol:


Boarf, ils auraient pu prendre une config basée sur la Tyan Thunder K8W avec 2 opterons 250 et 2 Go de Reg/Ecc aussi ! [:spamafote]

Patch 25/08/2004 16:47
Masquer
-0+

picsouu a écrit :

Bon aller 700 fdp in mais c'est mon dernier mot! (toute facon j'ai plein d'offres comme ca, donc si c'est pas ok pour 700 je vais voir ailleur mais vous PERDREZ 700€)


non, ils ne les gagneront pas, nuance.

Picsouu 25/08/2004 16:51
Masquer
-0+

Oh la faute que j'ai faite! Vivement la rentrée [:av68]

xav14 25/08/2004 18:03
Masquer
-0+

par contre les captures en 256 couleurs, c'est n'imp, surtout pour comparer les qualités d'images :/

Florian c 25/08/2004 18:10
Masquer
-0+

:??: Toutes les photos sont lossless, et cela suffit très largement pour montrer ce qu'on à a montrer.

xav14 25/08/2004 18:35
Masquer
-0+

le gif est limité a 256 couleurs (8 bits) :/

thral 25/08/2004 19:19
Masquer
-0+

Florian c a écrit :

Aujourd'hui, nous vous proposons de vous replonger dans les nouvelles cartes haut de gamme d'ATI et de nVidia. Au programme, description des architectures, analyse des performances sur tests synthétiques et enfin comparaison des cartes sur 10 moteurs de jeux incluant Doom 3 et Half-Life 2. Nous avons également attaché une importance toute particulière à la qualité d'image en la comparant pour chaque jeu et chaque carte. La X800 XT surpasse-t-elle la GeForce 6800 Ultra avec les pilotes actuels ? La réponse dans ce comparatif.





Bien expliqué, protocole de test crédible, impartial mais précis: c'est le meilleur test récent sur le haut de gamme actuel.
Bravo :jap:

NiahBoumPof is back 25/08/2004 20:06
Masquer
-0+

Citation :
Tous ces détails vous bourrent l’oignon ? Rassurez-vous, nous aussi. Mais il est malheureusement impossible de réaliser un comparatif équitable sans les prendre en compte.

[:rofl]

NiahBoumPof is back 25/08/2004 20:19
Masquer
-0+

[:rofl] doom3 pour la 9700Pro: suicide

dju 25/08/2004 21:07
Masquer
-0+

[:rofl]

sealbirman 25/08/2004 21:50
Masquer
-0+

Très bon article je trouve. Clair et Impartial, sans compromis. Il manque juste une 6800 et une X800Pro pour être complet mais c'est déjà très bien. Marc Prieur d'hardware.fr a participé à la rédaction de l'article ?? :D (c'est un compliment...);

KaISeR SoZEi 26/08/2004 01:38
Masquer
-0+

Entre nous moi je suis tout a fait content de ma 6800Ultra et les probèmes de qualité sur les X800 sont bien réél( j'ai pu m'en rendre compte chez un pote ki a une X800pro )

redshift 26/08/2004 01:40
Masquer
-0+

KaISeR SoZEi a écrit :

Entre nous moi je suis tout a fait content de ma 6800Ultra et les probèmes de qualité sur les X800 sont bien réél( j'ai pu m'en rendre compte chez un pote ki a une X800pro )




Quid du bruit ?

albator83 26/08/2004 03:01
Masquer
-0+

ce test me fait penser (dans sa structure) à un compte-rendu de TP bien fait (et oui je suis encore à l'école lol) : un schéma/courbe clair, des observations puis l'explication de ce que l'on observe...
bref chapeau les gars ça fait plaisir d'avoir un test bien complet et cohérent de temps en temps :jap:

XLOM 26/08/2004 16:45
Masquer
-0+

Il serait peut-être intéressant de refaire les mêmes tests avec un P4 : influence du type de CPU (AMD/INTEL) sur les pilotes ?

XLOM 26/08/2004 17:00
Masquer
-0+

http://www.xbitlabs.com/articles/c [...] 3-cpu.html

1- "from the numerous interviews of John Carmack, id Software’s Technical Director, at various Internet sites it seems that skinning and shadows are the CPU’s main responsibility in Doom 3."

2- "OpenGL driver also uses CPU resources"

Il faudrait que X-bit labs refasse les tests mais avec une ATI.

malik67 06/10/2004 21:10
Masquer
-0+

J'ai une question. Comment cela ce fait que la Asus A8V Deluxe (Via K8T800 Pro)soit montée avec 2 x 512 Mo PC4000 Kingston ??? Du PC4000 ??? elle ne prends pas que du PC3200 normalement ???

Les offres du moment

Newsletters


OK