Publicité
Derniers dossiers Processeurs
Atom contre Athlon : duel à basse consommation

Atom contre Athlon : duel à basse consommation
Il paraissait difficile qu'AMD puisse concurrencer la nouvelle architecture spécifiquement mise au point par Intel (Atom) à la fois sur le plan des performances et de la consommation, en se contentant de recycler une nouvelle fois ses Athlon. Et pourtant. Lire la suite

Penryn et SSE4 : dialogue 8 fois plus rapide avec le GPU

Jeudi 24 mai 2007 à 18:39 par Matthieu Lamelot, 2007-11-08
Source: Presence PC – Catégorie : Processeurs
7 commentaires

Intel Penryn : toutes les nouveautésStephen Fischer, architecte en chef du PenrynNom de code d’une famille de processeurs Intel Core 2 et Xeon lancée en 2007-2008. Ces processeurs reposent sur l’architecture Core dont ils constitue... d’IntelIntel est le premier fabricant mondial de microprocesseurs pour ordinateurs. Le terme Intel est issu de la contraction de « Integrated Electronics »).... a révélé à nos confrères d’Extreme Tech, qu’une des 47 nouvelles instructions SSE4Jeu d’instructions ciblant principalement des opérations audio et vidéo introduites par Intel sur les processeurs Core au début 2008 (les processeurs ... embarquées sur la prochaine architectureL’architecture est le terme employé pour caractériser la manière dont sont agencés les composants d’un processeur informatique, mais peut également êt... Intel, pourra accélérer par un facteur 8 la communication entre le CPULe CPU, encore appelé processeur, est l’acronmye de « Central processing unit », en anglais. Ont pourrait traduire ce terme par unité centrale de trai... et un GPUProcesseur Graphique (Graphical Processing Unit). Unité de calcul spécialisée dans les taches graphiques et 3D qui constitue le cœur d’une carte graph....

Des tampons spéciaux pour des échanges plus rapides

Grâce à cette instruction, MOVNTDQA, Le CPU peut charger des données en provenance de la mémoire vive par paquets de 64 octets, au lieu de lots de 16 octets. De plus, ces lots ne sont pas stockés dans les classiques caches de niveau 1, 2 ou 3 du CPU, ils sont transférés dans tampons dédiés. Il y a donc économie de transactions, économie de bande passanteLa bande passante telle qu’utilisée lorsque l’on parle de réseau définit la quantité d’informations numériques que le réseau permet de faire transiter... du FSBFront Side Bus. Bus sur la carte mère qui assure les échanges entre le processeur et la mémoire vive. La vitesse du FSB est un des éléments déterminan... et donc augmentation de l’efficacité du transfert.

Lire l’avenir dans le SSE

Une instruction similaire avait déjà été introduite avec le SSE2 pour les échanges inverses, lorsque des données en provenance d’un périphérique doivent être écrites en mémoire centrale. Mais quel rapport avec une carte graphique vous demandez-vous ? Eh bien, ce genre d’écritures et de lectures de nombreuses données consécutives est couramment rencontré dans le cadre des échanges entre CPU et GPU, lorsque chacun traite le frame buffer(front buffer, backbuffer, Z buffer, stencil buffer) : Le frame buffer ou tampon d’image est un ensemble de tampons en mémoire stockant des informatio..., c’est-à-dire l’ensemble des données formant une image.

Ce genre d’optimisations n’apportera sans doute pas de résultats tangibles avant de nombreux mois, mais, compte tenu du contexte actuel (LarrabeeLarrabee est le nom d’un processeur regoupant plusieurs core mis en parallèle et capable de prendre en charge des calculs graphiques, mais pas seuleme..., AMDAMD est l’acronyme de « Advanced Micro Devices, Inc. ». Il s’agit d’un fabricant de semi-conducteurs basé à Sunnyvale en Californie. La réputation du... Fusion) on ne peut s’empêcher de noter chaque effort d’Intel pour fusionner les CPU et les GPU.


Réagissez ! Retour à la liste des news
Publicité
Commentaires
alkech 24/05/2007 19:25
Masquer
-0+
alkech
c'est une instruction SSE4 , donc normalement c'est pas specifique à intel non ?
Mangeur d'pommes 24/05/2007 22:21
Masquer
-0+
Mangeur d'pommes
Ok, mais est-ce qu'une communication "dédiée" entre processeur et CG permet un augmentation fulgurante des performances ?
En effet, la carte graphique communique plus vite avec le processeur, c'est ok, mais ça implique quoi ?

Mangeur d'pommes ©
KarLKoX 24/05/2007 23:04
Masquer
-0+
KarLKoX
Une telle optimisation est déjà implémenté dans le player Unix MPlayer : il utilise sa propre fonction memcpy qui utilise le fsb du bus AGP et le prefetcher pour accélérer la copie par des blocs de 64 octets contigus.
seblamb 24/05/2007 23:29
Masquer
-0+
seblamb
D'après le site d'http://softwarecommunity.intel.com [...] g/1248.htm, cette fonction permet uniquement de charger des données en provenance d'un périphérique ( ex: GPU ) via la mémoire vive en direction du CPU.

Ce que je ne comprends pas c'est l'intérêt de récupérer des données en provenance d'un GPU, à moins d'utiliser le GPU comme coprocesseur arithmétique, fonction il est vrai à la mode en ce moment.


alkech 25/05/2007 00:09
Masquer
-0+
alkech
Ou alors encore un coup marketing ....
christophe_d13 25/05/2007 11:46
Masquer
-0+
christophe_d13
sonund a écrit :

Une telle optimisation est déjà implémenté dans le player Unix MPlayer : il utilise sa propre fonction memcpy qui utilise le fsb du bus AGP et le prefetcher pour accélérer la copie par des blocs de 64 octets contigus.




On parle d'une instruction, d'un opcode, pas d'une optimisation logicielle, mais d'une implémentation hardware.
Batchy 26/05/2007 15:33
Masquer
-0+
Batchy
a écrit :

Ce que je ne comprends pas c'est l'intérêt de récupérer des données en provenance d'un GPU, à moins d'utiliser le GPU comme coprocesseur arithmétique, fonction il est vrai à la mode en ce moment.


cas classiques : savoir quel polygone est sous le pointeur, récuperer un rendu 3d, déterminer sur quoi on vient de tirer pour un fps ...

A savoir Vous allez poster en tant qu'utilisateur anonyme.



Publicité