Submitted by ErwanF on
Bonjour,
Quelques éléments de contexte, pour commencer :
- Mon profil est celui d'un webmestre éditorial, ou d'un communiquant multimédia si vous préférez (pour le dire autrement, je ne suis pas développeur, bien que je m'intéresse à la programmation) ;
-
Le projet de site internet sur lequel je travaille est centré sur les images, et accorde une place fondamentale aux métadonnées qui leur sont associées. Après avoir choisi comme CMS Drupal 6, que je suis en train de découvrir par la pratique, je cherche toujours la meilleure façon d'associer des métadonnées à mes fameuses images, de façon externe (les métadonnées en question ne sont pas embarquées dans les fichiers image, comme les données IPTC dans un document JPG par exemple, pour des raisons dont je vous épargne l'exposé ; ces métadonnées sont dans une base de données MySQL).
-
Je compte entamer la création puis l'alimentation de ma base de données (bilingue Français/Anglais) via D6. Celle-ci sera assez finement structurée en vue de permettre une recherche multi-critères aussi pointue que possible. Je compte notamment utiliser pour cela le module CKK (ou un module similaire, si cela existe).
Tout cela ne pose pas de problème particulier a priori. Seulement voilà : parallèlement, j'ai eu vent de ce qu'il est convenu d'appeler le "web sémantique" (W3C): le modèle de graphe RDF, les ontologies OWL et le protocole SPARQL. Et je n'ai que peu de doutes sur le fait que cette voie constitue la meilleure façon d'associer des métadonnées" destinées à un usage sur le web aujourd'hui. J'ai commencé à faire quelques essais de création d'ontologies, via le logiciel Protégé ; et je trouve que tout cela s'annonce prometteur.
Toutefois, comme vous le savez peut-être, ce terrain est à peine mûr, surtout dans le cadre d'une utilisation professionnelle au sein d'une TPI ; je souhaite donc simplement m'y préparer au mieux. Aussi j'aimerais savoir s'il est possible de concevoir et d'alimenter ma BDD en tenant compte de l'arrivée de ces outils, en vue d'une reprise sous RDF et d'une exploitation partielle de SPARQL (ou protocole similaire) à court ou moyen terme. Autrement dit, puis-je faire d'une pierre deux coups et utiliser RDF dès maintenant pour échafauder et alimenter ma BDD ? À défaut, puis-je dès à présent structurer ma BDD et les informations qui y sont stockées de façon à les rendre aussi compatible que possible avec RDF dans le cadre d'une utilisation ultérieure ?
Tout cela pourra paraître mal formulé, et peut-être aussi ambitieux voire passablement prétentieux, compte tenu à la fois de l'état de l'art et de mon humble profil, entre autres choses. Mais on ne sait jamais, je pose tout de même ici une petite sonde, pour savoir si d'autres personnes de la communauté francophone Drupal sont intéressées par le web sémantiques et auraient :
1- des débuts réponses ou des pistes à apporter à mes questionnements (quelqu'un a essayé l'API RDF ?) ;
2- ou plus globalement, des informations ou réflexions à échanger sur ces questions.
Merci de votre attention.
Salut, sur le sujet qui est
Permalien Soumis par tostinni le 12 Septembre, 2008 - 16:34
Salut, sur le sujet qui est plutot interessant je n'ai pas d'experience a partager, donc je vais faire court...
Cependant, Dries est fortement attache au web semantique et l'a defini comme un des objectifs a atteindre pour les prochaines versions de Drupal.
Donc c'est pas pour tout de suite et il y aura ptet pas de grand pas dans cette direction pour la v7 mais Dries y pense donc ca ne peut etre qu'encourageant.
http://www.lullabot.com/blog/drupalcon-state-dries-buytaert
http://buytaert.net/state-of-drupal-presentation-march-2008
Merci tostinni, je vais
Permalien Soumis par ErwanF le 12 Septembre, 2008 - 16:58
Merci tostinni, je vais regarder tout ça.
de mon côté je viens de
Permalien Soumis par jeunhommalunet@... le 16 Septembre, 2008 - 22:42
de mon côté je viens de découvrir Calais, < Semantic Metadata Tagging for your Nodes >
Drupal en parle ici.
Merci de ta contribution.
Permalien Soumis par ErwanF le 17 Septembre, 2008 - 10:01
Merci de ta contribution. Premières impressions : je suis un peu dérouté par la présentation de Calais sur sur son site. Je comprends qu'il suffit de soumettre un contenu et que Calais fera le reste (pour paraphraser un très vieux slogan de Kodak : "appuyez sur le bouton et nous ferons le reste"), en quelques fractions de seconde, en associant automatiquement des graphes à des portions de contenus non structurés partout où il sera en mesure de le faire.
Je ne doute pas que cette solution puisse intéresser des gens désireux de se lancer dans le web sémantique sans trop se compliquer la vie, toutefois:
- j'ai l'impression que cette simplicité se fait au détriment de la maîtrise de l'indexation (qu'est-ce qu'on tague, comment on le tague) ;
- je ne suis pas certain que cela simplifie la vie de l'utilisateur final.
L'objectif principal semble être l'accroissement du trafic entrant d'un site, à partir d'une recherche par mots-clés ; on serait dans l'ajout aveugle de "bruit" afin de donner davantage de prises sur un contenu. C'est pas mal mais j'attends un peu mieux du web sémantique pour mon site qu'un "simple" gain de perméabilité.
Ce ne sont que des a priori ; il faut que je regarde cela d'un peu plus près. Merci encore.
d'après ce que j'ai un peu
Permalien Soumis par jeunhommalunet@... le 17 Septembre, 2008 - 17:05
d'après ce que j'ai un peu vu :
à noter que :
- les méta-données sont transmises à Calais selon certians Terms of use.
- que les données appartiennent à Thomson Reuters Compagny qui a fait l'acquisition de Calais en février dernier.
- que plusieurs "outils sémantiques" (LinkedFacts, Gnosis ) utilisent les données de Calais.
< L'objectif principal semble être l'accroissement du trafic entrant d'un site >
ça doit être un argumentaire marketing. je verrais plutôt la chose comme une façon d'élargir les possibilités de contenu d'un site pour ses visiteurs. je vois le web sémantique comme de multiples ponts en instantané, plutôt que comme un aspirateur de liens.
pour chaque node, nous
Permalien Soumis par ErwanF le 17 Septembre, 2008 - 22:08
pour chaque node, nous pouvons choisir quels mots du node seront affiliés à ces vocabulaires, ou laisser Calais les chercher automatiquement.
Une fois de plus c'est pas mal, mais en ce qui me concerne - je veux dire dans le cadre du projet spécifique qui m'occupe - l'unité à privilégier est plutôt le champ dans le node que le node. Merci en tout cas pour ces précisions et celles qui suivent.
L'accroissement du trafic est effectivement un argumentaire marketing ; tout le monde ou presque se retrouve autour du besoin de capter un public ;-)
Bien cordialement,
EF