Atom contre Athlon : duel à basse consommation
Il paraissait difficile qu'AMD puisse concurrencer la nouvelle architecture spécifiquement mise au point par Intel (Atom) à la fois sur le plan des performances et de la consommation, en se contentant de recycler une nouvelle fois ses Athlon. Et pourtant. Lire la suite
- Intel passe au sans plomb
- Intel propose du Core 2 Duo en embarqué
- Intel baisse les prix de ses processeurs Xeon
- Fujitsu : une puce de traitement H.264 Full HD
- Pentium E2140 : come-back d'une star déchue
- Ce n'est qu'un au revoir, Netburst
- IBM lance son Power 6 : 4,7 GHz
- Dossier : Core 2 Duo E6850, P35 et DDR3
- AMD Puma : contrer le Centrino ?
- Match Harpertown Vs. Barcelona au Computex
Penryn et SSE4 : dialogue 8 fois plus rapide avec le GPU
Source: Presence PC – Catégorie : Processeurs 7 commentaires
Stephen Fischer, architecte en chef du PenrynNom de code d’une famille de processeurs Intel Core 2 et Xeon lancée en 2007-2008. Ces processeurs reposent sur l’architecture Core dont ils constitue... d’IntelIntel est le premier fabricant mondial de microprocesseurs pour ordinateurs. Le terme Intel est issu de la contraction de « Integrated Electronics »).... a révélé à nos confrères d’Extreme Tech, qu’une des 47 nouvelles instructions SSE4Jeu d’instructions ciblant principalement des opérations audio et vidéo introduites par Intel sur les processeurs Core au début 2008 (les processeurs ... embarquées sur la prochaine architectureL’architecture est le terme employé pour caractériser la manière dont sont agencés les composants d’un processeur informatique, mais peut également êt... Intel, pourra accélérer par un facteur 8 la communication entre le CPULe CPU, encore appelé processeur, est l’acronmye de « Central processing unit », en anglais. Ont pourrait traduire ce terme par unité centrale de trai... et un GPUProcesseur Graphique (Graphical Processing Unit). Unité de calcul spécialisée dans les taches graphiques et 3D qui constitue le cœur d’une carte graph....
Des tampons spéciaux pour des échanges plus rapides
Grâce à cette instruction, MOVNTDQA, Le CPU peut charger des données en provenance de la mémoire vive par paquets de 64 octets, au lieu de lots de 16 octets. De plus, ces lots ne sont pas stockés dans les classiques caches de niveau 1, 2 ou 3 du CPU, ils sont transférés dans tampons dédiés. Il y a donc économie de transactions, économie de bande passanteLa bande passante telle qu’utilisée lorsque l’on parle de réseau définit la quantité d’informations numériques que le réseau permet de faire transiter... du FSBFront Side Bus. Bus sur la carte mère qui assure les échanges entre le processeur et la mémoire vive. La vitesse du FSB est un des éléments déterminan... et donc augmentation de l’efficacité du transfert.
Lire l’avenir dans le SSE
Une instruction similaire avait déjà été introduite avec le SSE2 pour les échanges inverses, lorsque des données en provenance d’un périphérique doivent être écrites en mémoire centrale. Mais quel rapport avec une carte graphique vous demandez-vous ? Eh bien, ce genre d’écritures et de lectures de nombreuses données consécutives est couramment rencontré dans le cadre des échanges entre CPU et GPU, lorsque chacun traite le frame buffer(front buffer, backbuffer, Z buffer, stencil buffer) : Le frame buffer ou tampon d’image est un ensemble de tampons en mémoire stockant des informatio..., c’est-à-dire l’ensemble des données formant une image.
Ce genre d’optimisations n’apportera sans doute pas de résultats tangibles avant de nombreux mois, mais, compte tenu du contexte actuel (LarrabeeLarrabee est le nom d’un processeur regoupant plusieurs core mis en parallèle et capable de prendre en charge des calculs graphiques, mais pas seuleme..., AMDAMD est l’acronyme de « Advanced Micro Devices, Inc. ». Il s’agit d’un fabricant de semi-conducteurs basé à Sunnyvale en Californie. La réputation du... Fusion) on ne peut s’empêcher de noter chaque effort d’Intel pour fusionner les CPU et les GPU.
Réagissez ! Retour à la liste des news
- Kodak ne fera plus dans l'entrée de gamme
- Partenaire : Derrière Google, les nouveaux moteurs de recherche
- Penryn et SSE4 : dialogue 8 fois plus rapide avec le GPU
- Test du vidéoprojecteur Optoma HD73
- Colin Mac Rae Dirt : la demo
- A8Sc : un nouveau portable 14 pouces chez Asus


En effet, la carte graphique communique plus vite avec le processeur, c'est ok, mais ça implique quoi ?
Mangeur d'pommes ©
Ce que je ne comprends pas c'est l'intérêt de récupérer des données en provenance d'un GPU, à moins d'utiliser le GPU comme coprocesseur arithmétique, fonction il est vrai à la mode en ce moment.
Une telle optimisation est déjà implémenté dans le player Unix MPlayer : il utilise sa propre fonction memcpy qui utilise le fsb du bus AGP et le prefetcher pour accélérer la copie par des blocs de 64 octets contigus.
On parle d'une instruction, d'un opcode, pas d'une optimisation logicielle, mais d'une implémentation hardware.
Ce que je ne comprends pas c'est l'intérêt de récupérer des données en provenance d'un GPU, à moins d'utiliser le GPU comme coprocesseur arithmétique, fonction il est vrai à la mode en ce moment.
cas classiques : savoir quel polygone est sous le pointeur, récuperer un rendu 3d, déterminer sur quoi on vient de tirer pour un fps ...