ShareThis

W3C : un pont lancé entre HTML-microformats et Web sémantique

"Une ligne de code peut parfois faire toute la différence", a déclaré Tim Berners-Lee en présentant le GRDDL (à prononcer "griddeul"), un nouveau lien important entre les communautés du Web sémantique et des microformats. "A l’instar des feuilles de style qui optimisent la lisibilité des pages Web, le GRDDL rend les pages Web, balises de microformat, documents XML et données plus lisibles pour les applications du Web sémantique, ouvrant ainsi un horizon de nouvelles possibilités d’utilisation des données et de réutilisation plus créative" a ajouté le directeur du W3C. Le "Gleaning Resource Descriptions from Dialects of Languages" (littéralement "glanage des descriptions de ressources à partir des dialectes de langages") établit en effet un pont entre le HTML et les microformats d'une part avec le Web sémantique d'autre part. Ce qui permet d’adopter de nouvelles approches pour le contenu Web quant à l'intégration des données et la réutilisation optimale.

 

Le partage des données dans la lignée du Web 2.0

 

Avec le GRDDL, les logiciels peuvent automatiquement extraire les informations des pages Web structurées pour les intégrer au Web sémantique. Les développeurs habitués à exprimer les données structurées à l’aide de microformats en XHTML peuvent ainsi accroître la valeur des données dont ils disposent en les portant vers le Web sémantique, à un coût très faible.

 

Comment se fait aujourd’hui l’intégration et l’extraction des données sur le Web? Un aspect des récents développements que certains appellent "Web 2.0" est relatif aux applications fondées sur la combinaison des différents types de données disséminées sur le Web. Nombre de communautés dynamiques innovant sur le Web ont pour objectif le partage des données telles que les informations d’agendas électroniques, de contact et de localisation géographique. Pour répondre à leurs besoins, ces dernières ont développé diverses technologies et pratiques sociales. Par exemple, les moteurs de recherche ont remporté un franc succès avec les méthodes statistiques, alors que pour le partage de photos, les utilisateurs trouvent utiles de marquer leurs photos manuellement par des libellés abrégés.

 

Microformats et Web sémantique

 

Ce développement s’est répandu en grande partie via les microformats, ensembles de formats de données ouverts et simples reposant sur des standards existants largement adoptés, dont HTML, CSS et XML. Cette vague d’activité est en relation directe avec l’essence même du Web sémantique. En effet, les communautés du Web sémantique cherchent des moyens d’améliorer la qualité et la disponibilité des données sur le Web, afin de rendre possible leur intégration et de permettre le développement d'applications qui s'adaptent à la taille du Web, tout en offrant des combinaisons plus performantes.

 

L’ensemble des standards Web qui sous-tend ce travail est connu sous le nom de pile du Web sémantique. Les bases de la pile du Web sémantique répondent aux besoins de formalité de certaines applications telles que la gestion des relevés bancaires ou la combinaison des volumes de données médicales. Chaque approche adoptée pour "tirer ses données de là" a sa place. Or, pourquoi se limiter à une seule approche si l’on peut bénéficier, à faible coût, de plusieurs ? Dans la mesure où les adeptes des microformats envisagent des utilisations nécessitant la modélisation ou la validation des données, comment peuvent-ils tirer parti de leurs données existantes dans des applications plus conformes ?

 

Un pont entre les applications Web flexibles et le Web sémantique

 

GRDDL est le lien qui convertit les données exprimées dans un format XML (tel que XHTML) en données pour le Web sémantique. Avec GRDDL, les auteurs transforment les données qu’ils souhaitent partager en un format pouvant être utilisé et transformé de nouveau pour des applications plus rigoureuses. Les cas d’utilisation GRDDL permettent de comprendre son utilité par le biais de différents scénarios concrets : planification d’une réunion, comparaison des informations des différents fournisseurs avant un achat, et extraction d’informations depuis des sites Web wiki (collaboratifs) pour faciliter l’apprentissage en ligne.

 

Une fois les données intégrées au Web sémantique, elles peuvent être fusionnées avec d’autres (par exemple, des données issues d’une base de données relationnelles, exposées de façon similaire au Web sémantique) pour les requêtes, inférences et conversions dans d’autres formats. Le Groupe de travail du W3C a présenté son expérience d’implémentation et ses membres se sont engagés à mettre en œuvre GRDDL. "Les cas d’utilisation GRDDL sont également publiés ce jour. Ils décrivent et incluent des cas d'utilisation d'agents logiciels supportant GRRDL. En outre, le Groupe de travail propose un service GRDDL qui permet aux utilisateurs d’entrer un fichier au format GRDDL et d’extraire les données importantes", note aussi le W3C.

 

+ d'infos

Voir le dossier de la recommendation du 11 septembre sur le Gleaning Resource Descriptions from Dialects of Languages (GRDDL) : http://www.w3.org/TR/2007/REC-grddl-20070911/

 

 


Crédits Indigen
- Copyrights WebTimeMedias 2011