Le « Xeon Phi » d'Intel se montre un peu plus. Cette carte destinée au calcul est l'héritier de Larrabee, un projet de carte graphique basé sur le jeu d'instructions x86 et tué dans l'oeuf par Intel.
Chaque carte contiendrait 62 cores x86 (dérivé du Pentium original) avec des unités SIMD (notamment AVX) et proposerait 8 Go de mémoire interfacée sur un bus 512 bits. Au final, la puissance de calcul dépasserait 1 téraflop en double précision, ce que propose la récente FirePro W9000 d'AMD.
Actuellement, les Xeon Phi « B0 » ont 61 cores fonctionnels à plus de 1 GHz (sans plus de précisions) et Intel aimerait que tous les cores (62) fonctionnent au final, à une fréquence de 1,3 GHz. Bien évidemment, c'est le futur GK110 qu'Intel vise avec le Xeon Phi : la société est très attendue avec sa future puce haut de gamme, et si Intel n'a pas l'avantage de la puissance — on parle de 1,5 téraflop en double précision —, le Xeon Phi pourra tirer son épingle du jeu sur un point : la facilité de programmation. En effet, il faut passer par CUDA ou OpenCL pour profiter des cartes de NVIDIA ou AMD alors que la carte d'Intel est basée sur le jeu d'instructions x86. Concrètement, certains programmes fonctionneront directement sur le Xeon Phi, au pire avec une étape de recompilation pour tirer parti des spécificités des puces.
Notons enfin que des rumeurs indiquent aussi deux choses intéressantes : un portage de Linux directement sur la carte (c'est techniquement possible), ce qui évitera la nécessité d'utiliser un système hôte et éventuellement une version s'interfaçant directement avec le bus QPI des Xeon classiques pour proposer des systèmes hétérogènes utilisant le même espace mémoire.

Actuellement, Voici ce qu'on trouve sur le marché Nvidia:
GTX580 - 1,58 Tflops SP - 0,187 Tflops DP (DP/SP 1:8)
GTX680 - 3,09 Tflops SP - DP ? (il parait que c'est catastrophique en DP, très inférieur a l'architecture Fermi !)
Ces cartes grand public se trouve pour quelques centaines d'euro, ce qui donne un excellent rapport coût/Gflops (en SP).
A mon humble avis, Intel va plutôt concurrencer les carte de calcul pro qui ne sont pas bridé en DP comme les tesla, quadro, Firepro, et être agressifs sur les prix car a ce niveau, c'est un marché pris qu'il doit conquérir.
Je n'ose même pas imaginer le bon en avant pour un super calculateur, quand on sait qu'une carte mère peut avoir 4 slots PCI-E "double place", soit 4 Tflops DP / 8 Tflops SP par unité.
Le TOP 1 des supers calculateur (juin 2012) est le Sequoia - BlueGene/Q (16 Pflops)
Il est équipés de 98304 CPU PowerPC 16 cores.
En admettant qu'il en mettent 4 / carte mère, ça nous fait 24576 carte mères.
En admettant que ces cartes ont 4 port PCI-E, ca nous fait 24576 cartes mères * 4 cartes Xeon Phi, soit donc 98304 Xeon Phi, soit un apport de.......
98,3 Pflops en double précision
Ouch........
maintenant, je suis sur que tu avais compris ^^
En admettant que ces cartes ont 4 port PCI-E, ca nous fait 24576 cartes mères * 4 cartes Xeon Phi, soit donc 98304 Xeon Phi, soit un apport de.......
98,3 Pflops en double précision
Ouch........
Et si ma tante en avait je l'appellerais tonton...
je dis juste que ce scénario est physiquement et logiquement tout a fait réalisable ^^
Je part sur des suites de supposition car j'explique un cas de figure idéalement poussé à l’extrême, mais dans cette branche informatique tout a fait atypique, ou la puissance prime sur les financement, cet etat d'esprit d'aller au maximum des choses est fortement présente.
donc si cette carte venais réellement a sortir, clairement on la retrouverais dans des projets de cette mesure... ^^
c'est possible pour le X86, je ne sais pas. Mais je ne vois pas l'intéret de dériver un jeu d'instruction aussi éprouvé que le X86, il n'est pas lourd, et ne prend pas beaucoup de place sur une puce.
La preuve que cette carte vise bien le calcul massifs, il ont même ajouté des instruction SIMD, avec l'AVX qui peut traiter plusieurs donnée sur une instruction, et ce avec des facteurs de 256 bits, le tout sur un cycle d'horloge pour certaine opération facile, comme la multiplication , l'addition,...
Si en plus il ont tapé une largeur de bus de 512bits (en ring je suppose ?), ce qui va donner une bande passante de malade, je pense vraiment que cette carte donnera ce qu'elle promet de donner.
mais bon, tiront des leçons des expériences passé, larrabee promettait tout autant et n'est jamais sorti ^^