Catégories:

Advanced Digital Media Boost (suite)

Fedy Abi-Chahla
Lundi 10 juillet 2006 à 00:00 par Fedy Abi-Chahla

Catégories: Processeur


Advanced Digital Media Boost (suite)

Comme on le voit l’histoire du SIMD sur processeurs x86 est particulièrement compliquée et ne donne pas l’image d’une réussite technologique à l’inverse de ce que l’on a pu voir sur processeurs PowerPC. Ainsi dés l’introduction de l’Altivec/VMX sur ses processeurs G4, Motorola a réalisé un sans faute en introduisant 32 registres 128 bit, et 4 unités dédiées aux instructions vectorielles, aussi bien entières que flottantes. Sur les 4 unités seule une était capable de réaliser des opérations arithmétiques flottantes, mais même sur ce point l’Altivec/VMX grâce au support d’une instruction de multiplication-addition fusionnée (FMAD) n’est pas en retrait par rapport aux deux unités du SSE.

Ainsi dans le cadre d’une succession de FMAD l’Altivec/VMX offre une performance de crête de 8 opérations flottantes par cycle comparé aux 4 des Pentium III et 4. Dans le cadre d’additions ou de multiplications là encore avec 4 instructions par cycle, l’Altivec/VMX des G4 et PowerPC 970 est supérieur aux implémentations du SSE des Pentium III et 4 qui sont limitées à deux opérations par cycles. Sans compter que dans le même temps l’Altivec permet d’exécuter une deuxième instruction en parallèle qui peut soit porter sur des entiers, soit être une permutation des éléments d’un vecteur.

Cette supériorité de l’implémentation est combinée à une supériorité architecturale, en effet là où les instructions MMX/SSE/SSE2 sont des instructions binaires spécifiant deux registres sources, et l’un des deux étant écrasé pour écrire la valeur du résultat les instructions Altivec/VMX sont des instructions ternaires spécifiant deux registres source et un registre destination, ainsi qu’un registre de modification optionnel.

Mais désormais Intel avec son architecture Core 2 a décidé de remettre ses processeurs au niveau en termes de calculs SIMD. Evidemment pour des raisons de compatibilité l’avantage de l’Altivec/VMX au niveau des instructions ternaires subsiste mais c’est bien le dernier vestige de la suprématie des processeurs PowerPC au niveau des calculs vectoriels.

Première modification et non des moindres, Intel a élargi l’ensemble des bus de données à 128 bits ce qui signifie que la décomposition des instructions SSE en deux micro-opérations n’est plus qu’un lointain et mauvais souvenir. Avec cette simple modification, Intel double le débit théorique de son processeur ! Mais ce n’est que la partie émergée de l’iceberg car en pratique ce changement a un impact à d’autres niveaux en termes d’efficacité. Ainsi en évitant de décomposer les instructions SSE en deux micro-opérations on évite de saturer artificiellement les ressources du hardware dédiés à stocker les instructions en attendant qu’une unité d’exécution soit disponible (Reservation Station) ou à les réordonner (Reorder Buffer) même si la micro-fusion des instructions SSE introduites dans le Yonah se chargeait déjà de limiter ce problème.


Mais ce n’est pas tout Intel a également doté sa dernière architecture d’une troisième unité SSE, le rôle de cette dernière n’est pas clair dans les documentations fournies car Intel ne précise pas les instructions qu’elle peut prendre en charge. On peut toutefois supposer qu’elle est incapable d’exécuter des instructions arithmétiques sous peine de quoi Intel n’aurait pas manqué de le faire remarquer, elle aurait donc un rôle un peu similaire à l’unité permute de l’Altivec/VMX en prenant en charge les instructions de manipulation des données au sein d’un vecteur. Signalons enfin qu’Intel en a profité pour ajouter le support des 16 instructions SSE4, précédemment connues sous le nom de code de TNI pour Tejas New Instructions étant donné qu’elles devaient apparaître avec le Tejas, une incarnation du Pentium 4 qui n’aura finalement pas vu le jour.

Au final chaque core du Core 2 Duo est donc capable d’effectuer 8 opérations flottantes simple précision par cycle en performance de crête, rattrapant ainsi son retard sur les processeurs PowerPC, mais il va même plus loin car grâce au jeu d’instruction SSE2 il offre la possibilité d’exécuter 4 opérations flottantes double précision par cycle ce qui est impossible avec le jeu d’instructions Altivec/VMX.


Annonces Google
Commentaires

christophe_d13 10/07/2006 11:22
Masquer
-0+
christophe_d13
:jap:
overclock3 10/07/2006 12:21
Masquer
-0+
overclock3
Bonjour,

L'article est très intéressant.

Lorsque vous effectuerez des tests pratiques, serait-il possible d'avoir des comparatifs entre processeurs AMD socket 939 et Core 2 Duo sur les jeux, en 1280x1024 et 1600x1200, filtrages activés ?

En effet, touts les tests sur les autres sites se focalisent sur des tests en 640x480 ou 800x600, ce qui est d'un intérêt nul pour les joueurs.

Je comprends qu'il est facile de tirer des conclusions lorsque la résolution est basse car la carte graphique n'est plus le facteur limitant mais pour la population de joueurs, 1280x1024 ou 1600x1200 sont les résolutions les plus utilisées.

Vu l'absence de tests de ce type, il est certain qu'un article de ce type serait fortement consulté par la population de joueurs.
Florian c 10/07/2006 12:23
Masquer
-0+
Florian c
Pour information depuis le début des tests de processeurs sur PPC, on test les jeux en hautes résolution (cf http://www.presence-pc.com/tests/Processeurs-6.html ). :o
SteffffDotCom 10/07/2006 16:26
Masquer
-0+
SteffffDotCom
baxter01570 a écrit :

Lorsque vous effectuerez des tests pratiques, serait-il possible d'avoir des comparatifs entre processeurs AMD socket 939 et Core 2 Duo sur les jeux, en 1280x1024 et 1600x1200, filtrages activés ?

En effet, touts les tests sur les autres sites se focalisent sur des tests en 640x480 ou 800x600, ce qui est d'un intérêt nul pour les joueurs.

Je comprends qu'il est facile de tirer des conclusions lorsque la résolution est basse car la carte graphique n'est plus le facteur limitant mais pour la population de joueurs, 1280x1024 ou 1600x1200 sont les résolutions les plus utilisées.




Facteur limitant ? Ca me semble logique le 640x480 : toutes les cartes arrivant à suivre tu peut vraiment comparer la machine, donc le proc. En 1600x1200 tu regardes la carte graphique ET le processeur... Pas évident d'y voir clair à ce moment là.
Florian c 10/07/2006 16:29
Masquer
-0+
Florian c
Certes mais la présence de ces 2 résolutions permet d'avoir une meilleure visibilité de la chose et de répondre à la fameuse question "Est-ce que le passage à ce processeur me ferra gagner quoi que ce soit dans les jeux en pratique ?"... :o
mixeur 10/07/2006 21:07
Masquer
-0+
mixeur
Excellent article, mais très technique.
Je doute que le quart des lecteurs ne comprennent tout, mais bon, faut ce qu'il faut...
drouvre 10/07/2006 22:18
Masquer
-0+
drouvre
J'ai tout lu et c'est vraiment bien ! Zeross t'es vraiment un chef :love:
darkboz 11/07/2006 07:17
Masquer
-0+
darkboz
Excellent article, très technique, bien rédigé, qui montre enfin au détracteur du P-M = un PIII survitaminé, ce qui dans le fond n'est pas faux mais la c'est plutot du niveau d'une refonte que d'un boost ce qui montre quand même l'expertise d'intel dans le domaine de l'architechture CPU, sublime quoi :love:. Sinon pour testé un proc dans les jeux c'est tout à fait pertinent de le faire à très basse résolution car la carte graphique n'entre quasiement pas en ligne de compte dans le calcul, on obtient vraiment la force brute du processeur. De toute maniere si on prend deux tests CPU et CG et qu'on tape dans les meilleurs de chaque on ne peut obtenir qu'une configuration très performante. Encore bravo pour cet excellent article !
christophe_d13 11/07/2006 10:49
Masquer
-0+
christophe_d13
Florian c> S'il y a des tests en socket 939, ce serait possible d'incorporer de la DDR-600 en plus de la DDR-400 ?
Oui je suis casse-pied... C'est bon, je retourne au bal !
manket 12/07/2006 11:29
Masquer
-0+
manket
Intérréssant on va bientôt pouvoir changer son ordinateur :pt1cable:
Mais pour acheter un conroe faut la carte mère qui va avec, et la malheureusement je n'en voit pas beaucoup de compatible à part la ASUS a 249 euros .... cher quand même surtout qu'elle est plein de gadget qui me servent à rien...
Y a t il un test de prévu? Et surtout quand les cartes sortiront elles? car sans elles mon E6600 sert à rien , enfin mon futur :sol:
Florian c 12/07/2006 11:37
Masquer
-0+
Florian c
Work In Progress... ;)
mixeur 12/07/2006 21:36
Masquer
-0+
mixeur
La NDA prend fin le 14/07. Le test sortira le 17/07 ?
Florian c 12/07/2006 21:46
Masquer
-0+
Florian c
Nous n'avons pas l'habitude d'être en retard par rapport au NDA non...
christophe_d13 13/07/2006 09:34
Masquer
-0+
christophe_d13
Florian c> J'imagine que l'article sera en ligne pour le 14/07 mais pas disponible : il n'y aura pas le lien.
Il ne restera qu'a déposer le lien le 15 ?
Mictateur 19/09/2006 14:10
Masquer
-0+
Mictateur
Commentaire du 19/09/06 avec la preview du Core 2 en homepage :
"Elle est fraîche ma news, toute fraîche !"


[:casimir59:5]
ThePike 20/09/2006 15:13
Masquer
-0+
ThePike
Intéressant l'article, de la technique ça fait plaisir :) Y'a même de l'assembleur, rhôôô, c'est bon ça! Tiens, au passage, le graphique 1 de la page 3, la commande en asm cmp (comparaison) devrait être avant jne (saut conditionnel), non? Bah je chipote, c'est vrai... :ange:
Gudule 21/09/2006 13:29
Masquer
-0+
Gudule
Il me semble qu'il est avant d'après le sens de la flêche.

A savoir Vous allez poster en tant qu'utilisateur anonyme.



Annonces Google