Téléchargez l'application
Tom's Hardware sur l'App Store
Toute l'actu informatique de référence sur votre iPhone
Oui Non

Le Penryn : une nouvelle architecture ?

par

Jusque là, le Penryn pourrait donc être qualifié de simple die-shrink. Ce n’est toutefois pas le cas puisque 3 évolutions font leur apparition.

SSE amélioré

Un nouveau jeu de 47 instructions fait son apparition, le SSE4, renommé SSE4.1 afin d’éviter la confusion avec les prochains jeux d’instructions AMD. Contrairement à ce que certains ont crus, les 16 nouvelles instructions introduites par le Core 2 Duo ne constituaient en effet pas une partie du SSE4, mais le SSSE3 (Digital Media Boost). Comme toujours, ces instructions ne montreront leur efficacité que dans les mois qui suivent et dans les applications multimédia optimisées pour ce jeu d’instruction, dont la base installée restera faible pour un moment. DivX 6.6.1 et TMPGenc sont en train de le supporter, et Sony Vegas, Mainconcept H.264 Encoder et Pinnacle Studio Plus devraient être optimisés pour ce jeu dès début 2008.

Autre amélioration, les instructions combinant les données entre des registres (shuffle) sont accélérées. On parle du passage d’une temps d’exécution de 2 cycles (Contact alignement, qword shifts, unpack integer notamment) voir 3-4 cycles pour certaines (Shuffle byte, insert, pack) à 1 cycle, pour un doublement des performances en moyenne. Les applications tirant parti des SSE précédents devraient donc être un peu plus rapides à fréquence égale sur le Penryn que sur l’actuel Conroe (Core 2), mais nous n’avons pas réussit à isoler avec certitude ce gain du suivant.

Divisions et virtualisation

Face au retournement de situation dont va faire preuve AMD avec le K10 sur les divisions (la latence devient variable en fonction de la taille des opérandes), Intel a également fait évoluer ses unités de calcul dédiées à la division : on passe du Radix-2,4 au Radix-16, ce qui signifie un doublement du nombre de bits traités par cycle, soit un doublement des performances en division. Ne cherchez pas plus loin le gain que nous allons observer dans les jeux…

Latence d’exécution d’opérations liées à la division

Vu les performances avancées par Intel, on constate cependant que le calcul de la racine carrée (square root) a également fait l’objet d’optimisations, inconnues mais visiblement efficaces puisque l’opération est 3 fois rapide à fréquence égale.

Par ailleurs des améliorations non précisées ont été apportées à la gestion matérielle de la virtualisation : la transition entre les différentes machines virtuelles est accélérée de 25 % à 75 % en moyenne (sans nécessiter de prise en charge logicielle spéciale).

Mise en veille et overclocking automatique

Les avancées dans la quête de la plus faible consommation au repos devrait constituer une force du choix d’Intel de décliner une même architecture commune pour les 3 marchés (serveur, PC, portables). Ce n’est malheureusement pas le cas : nous avons pu vérifier que les Penryn en version desktop ne supporteront aucune des 2 fonctionnalités suivantes, malgré le flou laissé par Intel. Dommage vu la pression de plus en plus forte sur la baisse de la consommation au repos des PC classiques.

Sur les Penryn mobiles donc, un nouveau mode, baptisé Deep Power Down fait son apparition. Il permet de désactiver complètement les caches L1 et L2. Par ailleurs, le Dynamic Acceleration introduit sur la plateforme Santa Rosa avec le Merom est de la partie sur le Penryn : dès qu’une application single-thread est lancée (n’utilisant qu’un seul core donc), la marge de dissipation liée à l’inactivité du second core est utilisée pour pratiquer un léger overclocking du seul core actif. Le gain est toujours de 200 MHz.

Partager:
Soyez le premier à laisser un commentaire !
X
Valider

Commentaires

Les offres du moment

Newsletters


OK