Power.org et leur processeur Kilocore
Il y a un monde après Intel et AMD. Un nouveau-né vient de faire son apparition dans ce monde parfois méconnu, mais non moins séduisant, le Kilocore. Ce processeur est le fruit de Rapport qui est un membre de Power.org fondé par IBM. Ce n’est donc pas un hasard si ce processeur dispose d’une architecture parallèle similaire à celle du Cell (que nous vous décrivions dans notre article intitulé: « Le processeur Cell ».
Son coeur
Comme son nom l’indique, son cheval de bataille est la consommation puisqu’il dispose plus de 1 024 unités de calculs tout en conservant un faible TDP. Pour cela, les ingénieurs ont travaillé à raccourcir le trajet parcouru par le signal entre les unités en les rapprochant.

Son application
Cette puce n’est absolument pas dédiée à rentrer dans nos PC, mais plutôt dans les appareils dits nomade tels que les PDA, Smartphone ou baladeur, puisque le Kilocore disposerait de capacités de décodage vidéo intéressantes. Comme l’explique un analyste, ce processeur se charge « de se concentrer sur une seule tache qu’il accomplira de façon excellente ».
- AMD investit 5,8 milliards dans ses usines
- Les premières retombées de Windows XP sur Mac
- Lucent poursuit Microsoft sur la Xbox 360
- Le prix de la PS3 en France
- Le P-Recording des nouveaux disques durs Seagate?
- Hardcore gamer: un profil ?
- Deux nouveaux écrans Dell
- Blu-ray au mois de juin
- Linux trop lourd pour le PC à 100$
- Test Lara Croft Tomb Raider Legend
- Microsoft se met au peer-to-peer ?
- Les caméscopes HD et disques durs de Sony
- Trois nouvelles souris Microsoft
- Google installera le Wi-Fi gratuit de San Francisco
- La webcam de surveillance
- Free et son offre WiMAX pour ses abonnés
- NVIDIA et sa carte double tuners TV
- Patch ATI pour Oblivion





A mon avis, il va être un peu plus compliqué à programmer que le CELL quand même.
EDIT: En fait c'est 1024 elements qui font des operations sur 8bits. Le CELL à 8 spe, mais qui font des operations sur 128bits(ou sous puisances de 2)
Ca ne fait que des operations sur 8086bits par cycle au lieu de 1024 (plus le ppe), et il devrait être plus lent (en nombre de cycles) que le CELL pour les operations sur les donnees de plus de 8bits, donc il faut relativiser les 1024 cores.
Par contre, 25go d'operations par secondes pour seulement 1W de consommation, chapeau!
1W de consommation, et c'est cense rentrer dans les appareils nomades ?
Sinon :
C'est quoi un TDP ?
Oui, tous les ingenieurs qui font de la timing closure (activite visant aa faire atteindre au circuit sa perf) dans n'importe quel circuit s'arrangent pour que les signaux arrivent quand il faut, c'est absolument pas specifique a ce circuit.
Son application
Cette puce n’est absolument pas dédiée à rentrer dans nos PC, mais plutôt dans les appareils dits nomade tels que les PDA, Smartphone ou baladeur, puisque le Kilocore disposerait de capacités de décodage vidéo intéressantes. Comme l’explique un analyste, ce processeur se charge « de se concentrer sur une seule tache qu’il accomplira de façon excellente ».
Mouais, comme dit plus haut, il consomme beaucoup. En plus, ce genre de processeurs utilise beaucoup de place pour des perfs souvent pas geniales comparees a un circuit integrant des accelerateurs dedies...
1W de conso c'est que dalle faut pas éxagerer ! TDP, c'est thermal definition package, cela définit la dissipation thermique maximum.
"les ingénieurs ont travaillé à raccourcir le trajet parcouru par le signal entre les unités en les rapprochant."
Je pense qu'il veulent dire cela "dés le début de la conception" et pas juste lors du placement routage.
"En plus, ce genre de processeurs utilise beaucoup de place pour des perfs souvent pas geniales comparees a un circuit integrant des accelerateurs dedies..."
Cela sera toujours vrai. Comme il est possible de réécrire n'importe quel logiciel en assembleur pour avoir des perfs de folie....
OK, 1 Watt, c'est paut etre un peu beaucoup ...
Par contre le 1024 "cores", ou unité de calculs peuvent etre assez devastatrices meme limités a 8 Bits
Pour des opretations simples type additions et soustractions, shifts ... ca doit depoter grave.
Du coup ce type de puce pour un decodage video simple (pas des 1080i et tout le toutim ...) ca doit valoir le coup.
Le fait d'utiliser en plus des "accelerateurs dediés" actuels n'ajouterons rien d'autre que de la conso ...
Comment arrives tu a cela o43 => 25go d'operations par secondes ???
Quelle belle invention que les langages : une fois le compilateur au point, un algorithme deja ecrit pour une autre processeur peut etre immediatement compilé pour ce processeur.
C'est sur Power.org
"les ingénieurs ont travaillé à raccourcir le trajet parcouru par le signal entre les unités en les rapprochant."
Je pense qu'il veulent dire cela "dés le début de la conception" et pas juste lors du placement routage.
"En plus, ce genre de processeurs utilise beaucoup de place pour des perfs souvent pas geniales comparees a un circuit integrant des accelerateurs dedies..."
Cela sera toujours vrai. Comme il est possible de réécrire n'importe quel logiciel en assembleur pour avoir des perfs de folie....
1W de conso c'est enorme, en application mobile. La puce sur laquelle je bosse (puce d'applications multimedia destine au haut de gamme des telephones japonais) consomme ~600 mW dans le pire des scenarios de consommation, c'est a dire en utilisant le moteur graphique. Donc j'imagine qu'en utilisant le moteur graphique + la decomp video + du MP3 (c'est faisable), on atteint a peine le watt. Mais la, tes batteries en prennent un sacre coup...
Oui, ils ont pense aux perfs des le debut de la conception, c'est pareil pout tout les circuits "performance-driven".
Je vois pas le rapport avec l'assembleur, la. Je dis que ce genre de processeur prends de la place (coute cher) pour pas beaucoup de perfs, alors qu'avec les accelerateurs dedies, on a moins de place et plus de cout...
Par contre le 1024 "cores", ou unité de calculs peuvent etre assez devastatrices meme limités a 8 Bits
Pour des opretations simples type additions et soustractions, shifts ... ca doit depoter grave.
Du coup ce type de puce pour un decodage video simple (pas des 1080i et tout le toutim ...) ca doit valoir le coup.
Le fait d'utiliser en plus des "accelerateurs dediés" actuels n'ajouterons rien d'autre que de la conso ...
Comment arrives tu a cela o43 => 25go d'operations par secondes ???
Et ca sert a quoi ? t'as vraiment besoin de 25Gflops/s pour afficher une video 640*480*30fps ? Bah non.
Quelle belle invention que les langages : une fois le compilateur au point, un algorithme deja ecrit pour une autre processeur peut etre immediatement compilé pour ce processeur.
Oui, mais ca ne fait que reporter la complexite de l'implementation de l'algo vers l'ecriture du compilateur... Et encore, si tu utilises un algo "classique" sur ce type de processeurs, tout va sous-utiliser le processeur car tu ne tireras pas partie de la parallelisation...