Téléchargez l'application
Tom's Hardware sur l'App Store
Toute l'actu informatique de référence sur votre iPhone
Oui Non

... pour la rendre ”intelligente”

par

Plutôt que de termes informatiques, le Web sémantique emprunte ses termes au domaine de la logique, c’est-à-dire aux logiciens. Un point évident car rappelons le, le Web sémantique vise à traduire informatiquement une représentation de la connaissance. L’exemple le plus probrant est le terme “Ontologie”, qui constitue une brique fondamentale de l’approche sémantique. L’ontologie, dans le cadre du Web sémantique, fournit les règles de logiques qui unissent et connectent les données, qui ont été au préalable définies. On parle également de règles d’inférence, autre terme également emprunté aux logiciens.

Un exemple ? Imaginons les technologies du web sémantique appliquées à un vaste catalogue d’un site de commerce électronique. En décrivant minutieusement chaque produit (en y ajoutant des méta-données), l’utilisateur dispose d’une vaste somme d’informations riches et logiques, auxquelles il a accès en fonction de sa recherche. Au produit est associé un nombre de données qui, elles-même, sont connectées à d’autres  grâce à des règles pré-définies. Je recherche une cafetière, l’application m’affichera pour résultat, sa nature, son matériau, un comparatif de prix, sa provenance, mais également des informations sur le café. A chaque information, une autre se déclenche, logiquement.

Dans un contexte de recherche d’information, là encore, l’avantage du web sémantique est évident. Grâce à une somme de données connectées entre elles par des liaisons structurantes, les résultats d’une requête livre, non plus de seuls documents HTML contenant les termes de la recherche, mais un ensemble d’informations pertinentes et logiques. Les résultats de la recherche ne reposent plus sur les termes que renferment une page Web (comme pourrait le faire Google), mais sur des informations fournies par des données entrelaçées.

Reste alors à définir très précisément les données et à y ajouter ces logiques qualifiantes qui permettent de créer ce vaste réseau de liaisons. C’est ce que nous allons aborder dans la deuxième partie, consacrée aux technologies qui soutiennent le mécanisme du Web sémantique.

Partager:
16
Commentaires
X
Valider

Commentaires
Lire les commentaires sur le forum
Misutsu 22/02/2010 10:20
Masquer
-1+

Ah oui oui, on a ça sur les blogs, ça s'appelle les nuages de tags et les liens relatifs ! Mais là je crois que je suis un peu réducteur :p

Ce que je retiens c'est qu'il va falloir être encore plus discipliné pour bien qualifier l'information que l'on diffuse. Qualifions, qualifions, qualifions !

omega2 22/02/2010 16:06
Masquer
-0+

Réducteur? si peu, si peu.
C'est juste comme si tu disais d'une voiture que "ça a 4 roues et un toit".

Au fait les nuages de tags n'ont aucun rapport avec ça. Dans un nuage de tags ont se fiche totalement de la valeur sémantique des mots. Par exemple avec un nuage de tag le mot "fleur" t'enverras aussi bien dans de la botanique que dans de la litérrature ("fleur du mal")
Le mot moule te fera saliver .. de deux manières différentes (super sémantique le mélange plat de noël en famille et soiré en solitaire devant la télé ;) )
Le mot "char" de son côté t'enverras aussi bien à l'armée que sur le dernier modèle de toyota en passant par la "2 chevaux" de César (Jule, empereur romain)

Personellement je ne vois rien de sémantique dans tout ce capharnaum.

Misutsu 22/02/2010 17:14
Masquer
-0+

Oui j'ai bien tout lu l'article ...

dreameddeath 22/02/2010 18:24
Masquer
-0+

Article interessant même si il parrait difficile de voir comment l'introduction du web sémantique peu se faire "concrètement" dans la vie réelle des sites... En effet, cela suppose une "normalisation" des classes forte et implémentée de la même manière par tous pour être efficace...

Sinon, pour moi il y a une petite coquille :

Citation :OWL pousse également le raisonnement plus loin, en proposant notamment des relations de symétrie. Si le tigre appartient à la famille des mammifères et qu’un mammifère est un vertébré, alors le tigre est un vertébré


==> Cette nature de "déduction" est la transitivité et non la symétrie (si a = b alors b = a)

jadu 23/02/2010 12:45
Masquer
-0+

En fait moi j'agis déjà dans ce sens depuis 1980, lorsque j'ai créé mon second site web, que je fais évoluer ( non sans mal ! ) vers le W3C !
C'est à dire que c'est plus le fond qui compte, la forme on ne s'y attache que pour plus de lisibilité ! et chaque visiteur du site voit les pages qu'il désire sans se demander si un autre a vu les mêmes ! car chacun étant différent la richesse doit circuler et non rester figée pour quelques uns !

sinon, dreameddeath, tu as raison, c'est bien de la transitivité et non de la symétrie !

Mictateur 23/02/2010 18:27
Masquer
-0+

Citation :Le stack est complet.

Vous n'avez pas honte ? :sarcastic:



Sinon moi je vois des gens qui ont plein d'idées, mais j'ai toujours pas compris ce que ça apporte au final... :sweat:

anonymous 02/03/2010 14:49
Masquer
-1+

Article trés intéressant, merci W3C.
Cependant pourquoi se priver d'une Architecture Web plus compléte : Une Archi-Web sémantique/sémiologique et sémitique. Aprés avoir découvert le "pot-aux-roses" du "Tria Vasa Lingarum" autant gagner du temps.
Un dictionnaire Hiérarchisé, mais dans quel but ? Sachant que toutes interprétations à partir d'une éthymologie d'un mot ou d'un groupe de mot : Le fameux "RDF Triplet" SPO Sub-Prédicat-objet est l'illustration parfaite de l'inégalité et de la légalité des chances des chemins vers la connaissance et le savoir de la chose (Web) des personnes physiques ou morales. Donner du sens aux mots et c'est déjà perdre le sens initial. Sachant que toutes personnes est unique, c'est déjà admettre que l'interprétation sera multiple et donc incohérente.
Nos "Ames" végétatives-sensible(animale)-intellective(rationnelle), ne sont "IMHO" que les reliquats occidentaux d'un tryptique double : Spiritus-Animus-Anima / Memoria-Intelligentia-Voluntas soit une solution de type : Ca-Moi-Surmoi. le Web Ontologique ne peut pas faire le grand écart avec l'aspect phylosophique à Géométrie variable.
Suivant les codifications actuelles : SYS/TRAD/DATA sans lesquelles les HTTP et HTML d'origine sont inexpoitables dans toutes bases de données, une lueure d'espoir est permit Le HTML5, il nous faudra bien admettre que nous nous éloignons de l'origine. A quoi nous servira une telle évolution du Systéme de base si les HTTP eux aussi sont exclus de l'évolution compléte de la structure de base.
Concernant la partie : Users interface and applications (unifying logic), il me semble que l'emsemble : Proof-SPARQL-RDFS-RIF-RDF-XML-URI/IRI, etc...Devra adopté de nouveaux critéres de CRYPTO liés essentiellement aux nouvelles Technologies Avancées du Web dans son intégralité et de leurs utilisations par les Internautes et les Entreprises fautes de quoi le Web dit "sémantique" deviendra obsolette aussi vite que les Hard-Wares et Soft-Wares que nous utilisons quotidiennement.
Différentes études personnelles (Deskwork and Fielwork) tendent à prouver que l'évolution et l'involution ne se sont pas un simple couple d'oppossé mais bel et bien une coincidencia oppositarum quatruple avec quoi il faudra composé un nouvel ordre des choses pour un Web-Sémantique efficace et s'inscrivant dans un avenir à trés court terme.
Malgré les incohérences des imbrications formalisées, les notions et les relations de transivité ou de symétrie, les microformats, la bataille du choix entre XFN et FOAF, un semblant d'intelligence du Web est une solution exploitable dans un contexte ou le Connaissant-le Connut-la Connaissance admet comme seul facteur Innovant : l' Inconnut.
Les Graphes de Connaissance sont pour le moins trés encourageants, les structurations des Données en Méta-Données l'avenir. Mais je m'emballe ! Mais attention tout de meme à ce que nous avions l'habitude de penser : Ce pilier Central indéboulonnable du Web-Sémantique, et si ce piler central comme nos systémes nerveux centraux venaient à fléchir, que resterait-il de ce Web-Sémantique si longtemps désiré.
Je suis ravit et je vous remerçie W3C pour votre travail, de mon coté je continu mes explorations Sémantiques et Sémitiques, vive le WEB-SEMANTIQUE, que nos super-calculateurs, processeurs,etc... Deviennent à leur tour Hyper-Intelligent. Bonne continuation au Consortium de dévellopement de la véritable Intelligence Artificielle.
Merci d'avoir pris le temps de lire mon article et merci de m'avoir permis de m'exprimer et d'apporter ma modeste contribution.
Que la Net-Etiquette soit avec vous.
Bien cordialement.
Signé : Oracle

penjab 03/03/2010 23:49
Masquer
-0+

Plus d'infos sur l'utilisation du Smart Desktop dans Mandriva 2010:
http://doc4.mandriva.org/bin/view/ [...] anguage=fr

anonymous 26/05/2010 00:03
Masquer
-0+

Pour ceux que cela intéressent, nous avons développer une approche sémantique autour d'une technologie basée sur la modélisation de l'Aire de Wernicke du cerveau.
La fonction qui permet de comprendre simplement l'intérêt de la technologie du web sémantique est le bouton "similar articles" disponible dans l'onglet "procedural mode".
En faisant des tests il faut prendre en compte que notre serveur tourne sur une ligne adsl classique et sur un seul PC. Les test sont réalisé sur 800 000 articles de wikipedia pour la base francaise, et 2,5 millions de la base anglaise. Les bases ne sont pas exhaustives. Une indexation du web demanderait environ 25 000 serveurs pour des performances équivalentes à Google ou Bing sur 5 milliards d'articles.

le lien: www.marvinbot.com

omega2 26/05/2010 15:28
Masquer
-0+

marvinbot > Article "Le Dernier Vol de Lancaster" : un roman
"similar article" : des villes, des comtés, etc toutes situé dans le wisconsin. (pas mal pour un roman qui se passe en europe et en afrique)

Où est le sémantique là dedans? Soit vous avez des erreurs dans votre base (mauvais référencement) soit vous ne faites pas de sémantique.

anonymous 27/05/2010 01:14
Masquer
-0+

Comme je le disais il n'y a que 800 000 articles dans notre base française de wiki et après vérification je ne vois pas celui concernant "Le Dernier Vol de Lancaster". La base n'est pas exhaustive...
En revanche, si je cherche dans notre base anglaise de wiki, il trouve The Last Flight (2009) et en cas le bouton "similar articles" trouve des articles en rapport avec le cinema. Marvin ne regarde pas encore la Tv et il ne peut pas apprendre un articles que nous n'avons pas indexé pour le moment. Je suis désolé nous n'avons pas vraiment les moyens de Bing ou Google.
Nous avons développé cela a deux avec un seul Xeon comme serveur.

Essayé par exemple avec l'article "Gratte-ciel"
http://www.marvinbot.com/index.php [...] wid=630832


Vous pouvez comparer les résultats obtenu avec les 200 millions d'euros dépensés par le projet européen Quaero dans http://www.exalead.com

Et également avec le projet www.powerset.com acheté 100 millions de dollars par Microsoft.

La techno de Marvin a gagner le prix de recherche Claude Allègre en 1999 et utilise une technologie différente des chaines de Markov et des probabilités statistique Bayésiennes.
Les résultats que nous proposons sur le site de démo comprennent l'intégralité du bruit de l'espace sémantique produit. Ce qui est un vrai problème quand on aborde la sémantique avec des mathématiques comme les deux projets précédent qui sont obligé de filtrer 95% de leurs résultats.

En IA rien n'est parfait, nous n'avons que des cerveaux d'être humain comme références et des ordinateurs qui sont des dinosaures en rapport au cerveau humain.

Nous somme en train de modifier le serveur pour qu'il apprenne le chinois. Je pense qu'avec des dessins cela sera plus facile à comprendre....


omega2 27/05/2010 21:15
Masquer
-0+

Pour arriver sur cet article là, j'avais simplement chercher le mot "vol" en procédural ( http://88.189.240.38/index.php?mod [...] search=Vol )
4éme article du résultat : "Le Dernier Vol de Lancaster"

Je vous laisse regarder ce qu'il en est. Peut être que comme vous dites il n'a juste pas encore été référencé dans la base sémantique. C'est juste qu'en le voyant dans une page où on voit le bouton "Similar Articles" pour chaque article, on s'attend à ce qu'il le soit.

anonymous 27/05/2010 22:28
Masquer
-0+

Oui effectivement, le problème c'est qu'il a crée la locution Dernier Vol et il avait beaucoup de connaissance concernant Lancaster quand il a lu l'article.

Il faudrait qu'il apprenne la locution "Le Dernier Vol de Lancaster". Le fait que Dernier et Vol ont une majuscule a du le tromper...
Il faudrait juste lui faire lire d'autres articles concernant ce roman pour corriger cela.

C'est un cas intéressant que je vais soumettre au physicien de permanence.
D'ailleurs pour la même raison, il y a un autre problème si je cherche Le Dernier Vol de Lancaster, il ne trouve pas l'article.

Le "Similar articles" fonctionne à 90% vous êtes tombé sur un des cas qui ne fonctionne pas. Dommage car le choix de l'article était excellent.

Marvin n'est pas encore intelligent pour cela il y a encore un an de boulot à temps plein...

Avez-vous fait d'autre tests plus concluants ?

Merci de votre coopération.

omega2 28/05/2010 21:15
Masquer
-0+

J'avais fait des tests classiques avant ça qui avaient retourné des articles similaires dans le même thème que le mot clé de la recherche mais comme le mot clé saisie correspondait au thème générique de l'article je n'arrivais pas à savoir si la recherche d'article similaire était par analyse thématique ou par simple mot clé et si les recherches successives tenaient compte de l'enchainement de "Similar Articles" ou si chaque recherche était parfaitement autonome.

C'est pour cette raison là que j'ai cherché un article où le thème principal ne correspondait pas au mot clé de la recherche initiale.

J'ai été ensuite trompé par une mauvaise recherche. Mais c'est peut être une bonne chose si ça vous permet de corriger ou améliorer votre produit.

anonymous 31/12/2010 13:26
Masquer
-0+

Pardon de ne répondre seulement maintenant. Vous pouvez recommencer le test du dernier de vol de lancaster.
http://www.marvinbot.com/index.php [...] genact=act

Marvinbot a la capacité d'apprendre en lisant les textes d'un article, voilà les résultats obtenue en le forçant à relire le texte de l'article sur le dernier vol de lancaster.
Les indications knowledge langage ( reconnaissance du langage) et Knowledge Meaning (signification de connaissance)ont leur rôle.
Lorsque Knowledge Meaning indique un nombre faible entre 0 et 40 l'articles à été soumis à l'indexation alors que la connaissance était insuffisante sur le sujet traité dans l'article pour une bonne indexation. En principe le système est fait pour fonctionner en indexation continue mais notre infrastructure matériel est très limitée et ne nous permet pas d'exploiter le système à 100%

anonymous 25/07/2011 15:00
Masquer
-0+

Juste pour revenir sur l'histoire transitivité / symétrie, pour moi il s'agit tout simplement de l'inclusion d'un ensemble dans un autre. Alors évidemment vous me direz que l'inclusion est une relation transitive entre objet :D mais pas la peine de sortir les termes techniques ^^

Les offres du moment

Newsletters


OK