Architecture
Après nous avoir présenté sa nouvelle architecture avec le NV40 au printemps dernier, nVidia fidèle à la tradition instaurée il y a quelques années nous offre avec le NV43 un dérivé milieu de gamme afin de toucher un plus large public. L’enjeu est ici bien différent de celui du NV40 car si le haut de gamme consiste avant tout en une question de prestige, c’est sur le milieu et le bas de gamme que la firme réalise le plus gros de ses profits. Pas question donc de faire des choix technologiques extrêmes au détriment de la réalité économique comme il semble que cela a été le cas lors de la conception des GeForce 6800 dont l’objectif était de regagner la couronne des performances à n’importe quel prix.
Mais cela ne signifie pas pour autant que le NV43 soit inintéressant, ou que nVidia ait commis les mêmes erreurs que par le passé. Contrairement à la GeForce 4MX qui offrait des performances acceptables mais les fonctionnalités d’une GeForce 2, ou à la GeForce FX5600 qui offrait toutes les fonctionnalités de la 5800 mais une puissance brute insuffisante pour les exploiter, la GeForce 6600 se présente comme une alternative intéressante pour les joueurs ne souhaitant pas se ruiner dans une carte graphique haut de gamme. nVidia a-t-il trouvé la formule magique permettant de combiner performances et fonctionnalités ? C’est ce que nous allons voir.
Dans cette partie nous n’allons pas détailler de nouveau toute l’architecture de la famille NV4x. Au lieu de cela nous allons nous attarder sur les spécificités du NV43 avant de revenir plus précisément sur des technologies déjà présentes dans le NV40 comme le Geometry Instancing ou l’Ultra Shadow mais qui méritent que l’on s’y attarde plus attentivement afin de savoir ce qui se cache derrière ces termes marketing.
La gamme GeForce 6
Avant l’arrivée du NV43, la gamme GeForce 6 était constituée de 4 modèles différents :
| La gamme GeForce 6800 | ||||
|---|---|---|---|---|
| 6800 Ultra | 6800 GT | 6800 | 6800 LE | |
| Fréquence GPU | 400 MHz | 350 MHz | 325 MHz | 300 MHz |
| Fréquence RAM | 550 MHz | 500 MHz | 350 MHz | 350 MHz |
| Unités de vertex shaders | 6 | 6 | 5 | 4 |
| Pixel pipelines | 16 (4 quad pipelines) | 16 (4 quad pipelines) | 12 (3 quad pipelines) | 8 (2 quad pipelines) |
| Unités de texture | 16 (1 par pixel pipeline) | 16 (1 par pixel pipeline) | 12 (1 par pixel pipeline) | 8 (1 par pixel pipeline) |
| Contrôleur mémoire | 256 bits (4 canaux 64 bits) | 256 bits (4 canaux 64 bits) | 256 bits (4 canaux 64 bits) | 256 bits (4 canaux 64 bits) |
| Type de RAM | GDDR3 | GDDR3 | DDR | DDR |
Contrairement à ce que laisse penser ce tableau, il faut bien garder à l’esprit que toute cette famille reste basée sur une seule puce : le NV40. C’est flagrant pour les 6800 Ultra et GT mais c’est également le cas pour les 6800 et 6800LE qui sont aussi des NV40 auxquels certaines unités sont désactivées.
Cette façon de créer toute une gamme de cartes autour d’une seule puce n’est pas nouvelle : ATI avait procédé de la même manière avec son R300. L’intérêt de cette stratégie est d’occuper rapidement le marché avec une nouvelle architecture, mais aussi de limiter les pertes engendrées par les puces défectueuses. Mais elle présente également des limitations qui la condamnent à rester une solution temporaire.
Les cartes étant basées sur des NV40, pour nVidia les coûts sont les mêmes pour toute la gamme ce qui lui interdit de baisser le prix de ses puces autant qu’il le souhaiterait. De plus la production est insuffisante pour alimenter le marché milieu de gamme, le marché haut de gamme ayant la priorité et celui-ci n’est déjà pas assez fourni.
C’est pour l’ensemble de ces raisons que nVidia ne pouvait se contenter de la 6800 (la version LE étant réservée aux OEM pour l’instant) pour occuper le marché milieu de gamme. Entre en jeu le NV43 utilisé dans les GeForce 6600GT et GeForce 6600.
| La gamme GeForce 6600 | ||||
|---|---|---|---|---|
| 6600 GT | 6600 | |||
| Fréquence GPU | 500 MHz | 300 MHz | ||
| Fréquence RAM | 500 MHz | Variable selon le fabricant | ||
| Unités de vertex shaders | 3 | 3 | ||
| Pixel pipelines | 8 (2 quad pipelines) | 8 (2 quad pipelines) | ||
| Unités de texture | 8 (1 par pixel pipeline) | 8 (1 par pixel pipeline) | ||
| Contrôleur mémoire | 128 bits (2 canaux 64 bits) | 128 bits (2 canaux 64 bits) | ||
| Type de RAM | GDDR3 | GDDR | ||
Une nouvelle puce, un nouvel équilibre
Cette fois il s’agit bien d’une nouvelle puce et cela se traduit dans le nombre de transistors utilisés : 143 millions contre 222 pour le NV40. Le NV43 ressemble à première vue à un demi NV40 : outre le nombre d’unités de vertex shaders réduit à 3, et le nombre de pixel pipelines qui passe à 8, le bus se retrouve réduit à 128 bits. En pratique toutefois nVidia a mis à profit l’expérience acquise avec le NV40 pour affiner légèrement son architecture et augmenter son efficacité. Ainsi selon les situations les pipes du NV43 seraient de 2 à 10 % plus efficaces que ceux du NV40 à fréquence égale.
Il faut également noter que, dans le but de réduire encore plus les coûts, le NV43 sera le premier GPU de chez nVidia à utiliser le processus de gravure 0.11µ de chez TSMC afin d’augmenter le nombre de puces par wafers (galettes de silicium).
Techniquement, si vous avez lu avec attention jusqu’ici et que vous suivez l’actualité des cartes 3D, quelque chose doit vous choquer. En effet si l’on compare l’ancien haut de gamme de nVidia (la GeForce FX 5950) à la toute nouvelle 6600 GT, on constate que le fillrate est prés de deux fois supérieur pour le nouveau venu (4Gpixels/s pour le NV43, 1.9GPixels/s pour le NV38) alors que sa bande passante elle est presque… deux fois inférieure ! (16 Go/s pour le NV43, 30.4 Go/s pour le NV38). Et ce genre de déséquilibre est en général bien mauvais signe pour les performances. Qui a oublié la GeForce 2 GTS dont le core avait augmenté de 80% comparé à la GeForce DDR alors que sa bande passante n’avait elle progressée dans le même temps que de 10% ?
Oui mais voilà, depuis les choses ont bien changées et le rendu s’est très nettement complexifié avec notamment l’apparition des shaders. Si dans un premier temps leur utilisation restait relativement limitée à certains effets bien spécifique, force est de constater qu’aujourd’hui les jeux commencent à utiliser des shaders de plus en plus complexes, demandant un nombre d’instructions toujours plus élevé. Far Cry et plus récemment Doom 3 ont ouvert la voie mais ce n’est qu’un début. Les shaders utilisés aujourd’hui restent encore relativement simples, mais déjà l’Unreal Engine 3 laisse présager des exigences des futurs moteurs 3D en terme de puissance de shading.
Vous vous demandez sans doute le rapport avec le problème qui nous préoccupe actuellement concernant la bande passante de la GeForce 6600 GT ? C’est simple : le temps où les jeux se contentaient d’appliquer deux textures par pixel et de les écrire dans le frame buffer est révolu, désormais les pixels doivent effectuer plusieurs passages dans le pipeline. Avec des shaders compris entre 50 et 100 instructions pour la prochaine génération de moteurs 3D il est clair que le goulet d’étranglement ne se situera plus au niveau du fillrate brut et de la bande passante mais bien au niveau de la puissance de shading.
Par ailleurs la flexibilité acquise à la génération précédente, et la puissance de traitement des nouvelles puces permet de réaliser des économies de bande passante : il est désormais possible de se passer de textures de pré calcul ou des fameux cube maps de normalisation hérités de l’époque du pipeline fixe. Aujourd’hui les programmeurs peuvent réaliser ces opérations avec de véritables calculs arithmétiques, sans gaspiller de la bande passante pour faire transiter ces textures.
Le choix de nVidia de doter sa puce de 8 pixel pipelines et d’augmenter dans le même temps la puissance de traitement de ses pipelines se comprend donc bien mieux, mais cette réflexion en amène une autre: puisque les pixels doivent effectuer plusieurs passages dans le pipeline, ce qui nécessitera invariablement plusieurs cycles, cela implique donc que dans la plupart des cas il n’y aura pas 8 pixels à écrire dans le frame buffer à chaque cycle. Dans ce cas là, pourquoi gâcher des transistors qui de toute façon resteront inutilisés la plupart du temps ? Nous touchons là à une des particularités du NV43 et pour bien la comprendre il est nécessaire de faire un petit rappel technique.
Il faut tout d’abord cesser de considérer le pixel pipeline comme un ensemble indivisible dans lequel les pixels arriveraient par un bout du setup engine, et ressortirait par un autre bout dans le frame buffer. En pratique derrière tout ça il y a deux unités bien distinctes. Pour être tout à fait exact dans la terminologie employée nous allons faire une distinction qui, si elle est utilisée par l’API OpenGL, n’est pas prise en compte par Direct3D. Techniquement il n’est correct de parler de pixels qu’au niveau du frame buffer, toutes les opérations qui sont effectuées auparavant le sont sur des fragments. Cette précision effectuée, reprenons notre chemin le long du pipeline graphique. Une fois les fragments générés (par quad) par le setup engine, ils passent par les unités de fragment shading et cette opération peut être répétée le nombre de fois nécessaire pour appliquer toutes les opérations du shader.
Après cette étape les fragments ne deviennent pas encore des pixels, ils doivent avant cela passer par une dernière unité : le ROP (Raster Operation Unit). Le rôle de cette unité est multiple : c’est en particulier à ce niveau qu’est effectué le FSAA ainsi que le test de profondeur qui détermine si le fragment est visible ou pas. Mais c’est aussi dans cette unité qu’à lieu le blending qui permet de mélanger la valeur d’un fragment avec celle contenue dans le frame buffer. Enfin c’est ici que se situe la fameuse astuce permettant de doubler le fillrate lorsque les écritures dans le frame buffer sont désactivées. En effet comme vous pouvez le constater sur le schéma ci-dessous, on trouve dans cette unité un ZROP qui réalise l’écriture des valeurs Z dans le ZBuffer mais aussi un CROP (C pour Color) qui se charge de l’écriture du pixel dans le frame buffer. nVidia a cependant doté ce CROP d’une capacité intéressante puisque dans le cas où il n’y a pas d’écriture dans le frame buffer il peut également fonctionner comme un second ZROP.
Maintenant que vous savez ce qu’est un ROP il est inutile de faire durer le suspense plus longtemps : le NV43 ne dispose que de 4 ROP ! 8 pixel pipelines ? 4 ROP ? Les ingénieurs de chez nVidia ont-ils consommés les substances hallucinogènes promises par leur CEO à leur concurrent canadien ? A priori non, et si vous avez bien suivi la partie qui précédait cela doit même vous sembler logique. Puisque dans la majeure partie des cas les unités de shading ne seront pas en mesure de fournir 8 fragments aux ROP et que même si c’était le cas ces derniers n’auraient pas la bande passante nécessaire pour les écrire dans le frame buffer, les ingénieurs ont donc décidé d’opter pour ce compromis.
Pour les jeux utilisant intensivement les shaders ça ne change donc pas grand-chose vu que le goulet d’étranglement ne se situera pas au niveau des ROP, mais que se passe-t-il dans le cas d’un rendu très simple ? Pour répondre à cette question il faut d’abord se poser une autre question : dans quelles conditions effectue-t-on un « rendu très simple » ? Dans une phase d’initialisation du ZBuffer par exemple, pour éviter de faire des calculs redondants sur des fragments qui ne seront pas affichés en utilisant au mieux le hardware d’élimination des parties cachés tôt dans le pipeline. Dans ce cas pas de problème : ce type de rendu peut s’effectuer à 8 valeurs par cycle grâce à l’astuce des ROP. Même principe pour le rendu des volumes d’ombre ou le rendu dans un shadow buffer. Que reste-t-il ? Et bien typiquement tous les anciens jeux. Et dans ce genre de situations inutile de tergiverser : effectivement les ROP constitueront le principal goulet d’étranglement du NV43. Mais soyons sérieux : vu la puissance dont disposent les puces actuels ce sacrifice n’est pas vraiment dérangeant.
D’autant que dans ce type de situations la configurations particulière du NV43 autorise une astuce intéressante : puisqu’il est inutile de fournir 8 fragments par cycle aux ROP qui seront vite saturés, autant faire deux passages dans le pipeline et donc fournir 8 fragments dual texturés tous les deux cycles. Le ROP est ainsi capable de retirer 4 fragments dual texturés à chaque cycle, ce qui signifie en clair que dans ce cas précis le NV43 se comporte comme une puce… 4x2 !
Alors évidemment, on peut regretter qu’il n’y ait pas 8 ROP, et on peut aussi regretter que le bus ne fasse pas 256 bits mais il faut quand même comprendre que les ingénieurs doivent composer avec un nombre de transistors limités (même si l’on dépasse allègrement les 100 millions dans le cas du NV43). C’est plus particulièrement vrai sur ce segment du marché et par conséquent ils ne peuvent pas se permettre de les gâcher pour accélérer des situations où le gain de vitesse aurait un intérêt des plus limités. Comment auriez vous réagi si l’on vous avait présenté des benchs sous Quake III par exemple ?
Le NV43 s’inscrit donc dans une vision à plus long terme impliquant un rééquilibrage total des ressources qui passent du ratio fillrate/bande passante, à la puissance de shading. Même s’il est plus que probable que vous ne jouiez pas aux jeux issus de l’Unreal Engine 3 sur une 6600GT, on ne peut pas reprocher à nVidia de poser dés aujourd’hui les bases de l’évolution de ses chips 3D.
ça confirme les preview, dès que ça sort je m'achète un nouveau pc pour aller avec
Il y a du monde qui l'attendait
) mais si je dois investir dans une carte prochainement, mon choix est fait 
J'ai survolé le test (très complet
On va quand même attendre la réponse d'ati...
Je n'ai pas vu si elle sort en version agp ?
si elle sortiront en octobre officiellement (donc novembre d'après hfr)
moi j'attend meme pas les x700, c'est trop long
Salut
Pour info les 65.76 fonctionne parfaitement chez moi avec une 5900, il faut tout simplement modifier l'INF pour qu'elle soit dans la liste des cartes supportées.
Bravo pour le test, complet et abordable, ça m'a permis de renouer avec certaines nouveautés
Salut
Pour info les 65.76 fonctionne parfaitement chez moi avec une 5900, il faut tout simplement modifier l'INF pour qu'elle soit dans la liste des cartes supportées.
Arf, bizarre qu'elle soit pas dans la liste alors. A piori de toute facon ca ne change strictement rien...
Ca aurait été intéressant de faire un test avec un plus vieux moteur graphique pour voir en pratique quelle est l'influence du choix technologique qu'ils ont fait avec ce ratio fillrate/bande passante atypique.

Et bvo pour le test ossi
Ca aurait été intéressant de faire un test avec un plus vieux moteur graphique pour voir en pratique quelle est l'influence du choix technologique qu'ils ont fait avec ce ratio fillrate/bande passante atypique.

Et bvo pour le test ossi
En fait on tient à bien distinguer les jeux des tests synthétiques, au niveau des jeux cela n'aurait clairement pas eut sa place dans notre protocole mais ca aurait été intéressant de le rajouter au niveau des tests ouais, bien que sur les vieux t'es surtout limité par le CPU donc pas très intéressant. Mais en gros sur les vieux jeux la 6600 GTsera moins à son aise que sur les nouveaux.
En fait on tient à bien distinguer les jeux des tests synthétiques, au niveau des jeux cela n'aurait clairement pas eut sa place dans notre protocole mais ca aurait été intéressant de le rajouter au niveau des tests ouais, bien que sur les vieux t'es surtout limité par le CPU donc pas très intéressant. Mais en gros sur les vieux jeux la 6600 GTsera moins à son aise que sur les nouveaux.
Moins à son aise à 200 img/s cela reste quand même très relatif
voila, c'est ca le truc.
Moins à son aise par rapport aux cartes traditionnelles.
Arf, bizarre qu'elle soit pas dans la liste alors. A piori de toute facon ca ne change strictement rien...
Je ne sait pas je n'ai pas comparé ces drivers sur GeForce FX, si tu le dis, tant mieux
Pour la liste à mon avis c'est juste parce que ce sont des drivers filés par NV. Peut être qu'ils ne veulent plus entendre parler du GeForce FX
Il me semble que sur ceux qui trainent sur le net les FX sont intégrées.
c'est bien foutu, mais les caps, ça serait bien de les mettre en 1600x1200, histoire de voir ce que ça donne.
superbe test , 6600 GT : grandiose.
je suis le seul a venir couiner quand a l'absence de comparaison avec la carte du moment: la 9800Pro ?
NON!
je suis le seul a venir couiner quand a l'absence de comparaison avec la carte du moment: la 9800Pro ?
Tu connais les perfs de la 5900XT par rapport à la 9800 pro, suffit d'extrapoler
Tu connais les perfs de la 5900XT par rapport à la 9800 pro, suffit d'extrapoler
tu parles que tu peux extrapoler avec 3cartes connues
c'est pas parce que Z>V et Z>W et que X>V que X>W
C'est drole la difference de puissance brute et celle dans un jeu est tres réduite...
OUI ma phrase doit avoir un sens!
N'y a-t-il pas tromperie sur la marchandise si le fillrate est de 1900 MTextels au lieu des 4000 annoncés?
je suis le seul a venir couiner quand a l'absence de comparaison avec la carte du moment: la 9800Pro ?
Ouais, on s'est plus penchés sur l'archi et la comparaison avec l'ancien milieu de gamme nVIdia et ATI. Le principale problème est d'ordre technique, la 9800 Pro est pas dispo sur PCI Express, donc il fallait mettre en place une plateforme AGP, vérifier que tous les résultats sont indépendants de la plateforme différente donc (y compris les tests synthétiques assez sensibles), et laisser tomber les tests synthétiques ou les screenshots pour chaque jeu vu le temps impartit. On a donc fait un choix ouais.
N'y a-t-il pas tromperie sur la marchandise si le fillrate est de 1900 MTextels au lieu des 4000 annoncés?
nVidia n'a pas annoncé officiellement le fillrate, nous l'avons calculé à partir de l'archi(fréquence, nbre de pipes et nbre de Texture Sampling). Il y aurait tromperie si il n'y avait que 4 pipes et 2 textures sampling, mais ce n'est pas le cas.
je suis le seul a venir couiner quand a l'absence de comparaison avec la carte du moment: la 9800Pro ?
Même le test de CLubic a fait l'impasse sur la 9800 Pro... Carte pourtant qui est le meilleur rapport qualité/prix du moment. Nvidia aurait-il donner quelques consignes ?
Ouais, on s'est plus penchés sur l'archi et la comparaison avec l'ancien milieu de gamme nVIdia et ATI. Le principale problème est d'ordre technique, la 9800 Pro est pas dispo sur PCI Express, donc il fallait mettre en place une plateforme AGP, vérifier que tous les résultats sont indépendants de la plateforme différente donc (y compris les tests synthétiques assez sensibles), et laisser tomber les tests synthétiques ou les screenshots pour chaque jeu vu le temps impartit. On a donc fait un choix ouais.
qu'est ce que la plate forme a a voir la dedans
desolé de ma critique mais je trouve que l'absence de 9800Pro pour comparer rend le test presque ininterressant. Ouais bon on a vu ce que ca donnait par rapport au milieu de gamme qui paraiterait il commence a etre depassé et on a vu ce que ca donnait face au super haut de gamme actuel.
9800 pro c'est depassé de toute facon... l'architecture a plus de 2 ans...![[:djoce]](http://img.infos-du-net.com/forum/images/perso/djoce.gif)
Perso je l'attendais pour car j'esperais beaucoup de cette carte, bah du coup je crois que je vais aller me prendre une 6800 cette semaine.
C'est certes un peu moins (la 6600 GT par rapport à la 6800 standard), mais c'est aussi un peu moins performant, donc c'est logique.
Et puis ca ne sort que dans deux mois, je prefere dépenser 50€ de plus aujourd'hui. Surtout que depuis que j'ai vu une X800 Pro tourner ce week end, ma vielle GeForce 4, je commence à la regarder de travers...
Avis perso, ca n'engage que moi.
qu'est ce que la plate forme a a voir la dedans
deja le PCIE est loin d'etre la norme d'aujourd'hui, l'agp a encore une bonne année devant lui voire plus. Qui aurait interet a s'acheter une carte pcie si ca implique de changer de mobo et donc de processeur
(seul le LGA775 dispose de PCIE actuellement, peut etre les nouvelles plateforme S939 vont le gerer mais vu le prix des processeurs ca ne sera pas pour tout de suite ou alors pour les friqués auquel cas je les vois mal se contenter d'une CG milieu de gamme
)
desolé de ma critique mais je trouve que l'absence de 9800Pro pour comparer rend le test presque ininterressant. Ouais bon on a vu ce que ca donnait par rapport au milieu de gamme qui paraiterait il commence a etre depassé et on a vu ce que ca donnait face au super haut de gamme actuel.
T'as rien compris : GeForce 6600 aujourd'hui = PCI Express => la 9800 Pro elle rentre pas dans le port PCI Express de la D925 de test
Désolé mais en 6 jours c'était pas jouable pour nous de rajouter une plateforme AGP avec donc un 9800 Pro, et de rajouter tous les tests qu'il fallait. Ce que tu captes pas c'est que cette carte se destine au milieu de gamme, et que donc elle remplace les milieux de gamme de l'ancienne génération, représentés ici par la X600 XT chez ATI et la 5900 XT chez nVidia, avec la présence de la 6800 GT comme point de comparaison par rapport au nouveau haut de gamme nVidia. Oui, l'ajout de la 9800 Pro aurait été un plus mais absolument impossible pour ce test.
9800 pro c'est depassé de toute facon... l'architecture a plus de 2 ans...![[:djoce]](http://img.infos-du-net.com/forum/images/perso/djoce.gif)
Dela a dire qu'elle est completement depassée
L'architecture est loin d'etre dépassé (surtout par rapport aux fx) D'ailleurs je suis surpris de voir que dans certains test la x600 domine la 5900xt. Et plus les jeux vont utiliser directX 9 plus on verra ce cas de figure.

Neanmoins la 6600GT rattrape bien le milieu de gamme nvidia. On attend la x700 pour la comparaison.
Bon test en tous cas
T'as rien compris : GeForce 6600 aujourd'hui = PCI Express => la 9800 Pro elle rentre pas dans le port PCI Express de la D925 de test
Désolé mais en 6 jours c'était pas jouable pour nous de rajouter une plateforme AGP avec donc un 9800 Pro, et de rajouter tous les tests qu'il fallait. Ce que tu captes pas c'est que cette carte se destine au milieu de gamme, et que donc elle remplace les milieux de gamme de l'ancienne génération, représentés ici par la X600 XT chez ATI et la 5900 XT chez nVidia, avec la présence de la 6800 GT comme point de comparaison par rapport au nouveau haut de gamme nVidia. Oui, l'ajout de la 9800 Pro aurait été un plus mais absolument impossible pour ce test.
C'est donc un test exclusivement PCI-E. Perso je pensais que la 5900XT était en AGP, d'ou mon interrogation
Cf le début de la page "Performances synthétiques"