ShareThis

La richesse de Wikipedia associée à la puissance du Web sémantique!

Aurélie Filippetti, ministre de la Culture et de la Communication, a lancé lundi le projet DBpédia et a signé une convention avec Inria et Wikimédia France pour la création de la plateforme Sémanticpédia, ouvrant sur des programmes de R&D en matière culturelle à partir des données extraites de Wikipédia francophone. Un challenge dans lequel l'équipe Wimmics d'Inria Sophia est fortement impliquée.

Associer la richesse de Wikipedia à la puissance du Web sémantique : c'est l'enjeu du projet DBpédia en français et de la création de la plateforme Sémanticpédia, opérations dans lesquelles Inria Sophia est fortement engagé à travers l'équipe Wimmics, et qui ont été lancées lundi à Paris par Aurélie Filippetti, ministre de la Culture et de la Communication.

"Repenser les modes de construction et d'usage des outils du savoir"

"Compte tenu de la place croissante que tiennent la consultation et les usages de la Toile dans nos vies, il est capital que le public puisse avoir accès à des données culturelles en ligne", a expliqué la ministre. "Or cet univers, en expansion continue, va connaître une véritable révolution, avec l’essor du web sémantique, ou "web de données", qui nous conduit à repenser les modes de construction et d’usage des outils du savoir. Après le Web 2.0 (les réseaux sociaux), il nous faut prévoir le passage au Web 3.0, qui permet aux ordinateurs de comprendre les requêtes qui leur sont adressées non plus par mot-clé, mais par champ sémantique, à partir du sens des mots".

Premier projet de la plateforme Sémanticpédia, DBpédia s'inscrit dans ce contexte. Il s'agit d'un dispositif d'extraction de données culturelles à partir des ressources offertes en libre accès par l'encyclopédie Wikipédia francophone (1,3 million d'entrées en français, dont 45 % à caractère culturel). Il offre ainsi aux musées, aux bibliothèques et plus généralement aux opérateurs culturels, des perspectives inédites de diffusion et de partage de leurs ressources en ligne.

Les possibilités de recherches (chronologiques, thématiques, géographiques, etc.) sont démultipliées, permettant au spécialiste, à l'étudiant comme au simple curieux, de trouver aisément l'information qui lui est utile. A travers la possibilité de procéder à des requêtes à partir de contenus en langue française, le projet place également notre langue au cœur de ce "Web de données", qui représente un enjeu culturel et technologique majeur.

"Sémanticpédia" pour exploiter les données de Wikipédia francophone

A l'occasion du lancement de ce projet, la ministre a signé une convention de partenariat avec Michel Cosnard, président d'Inria et Rémi Mathis, président de Wikimédia France, pour créer la plate-forme collaborative "Sémanticpédia". L'idée est d'aller bien au-delà de BDpédia, et d'ouvrir plus largement sur des programmes de recherche et de développement en matière culturelle à partir des données extraites de Wikipédia francophone.

"A travers la convention, l’idée est de lier un acteur majeur de la culture en France - le ministère de la Culture et de la Communication -, avec un grand acteur de la création de contenu sur le Web - Wikimedia - et un acteur de la recherche spécialiste des technologies du Web, notamment du Web de données et du Web sémantique", explique Fabien Gandon, responsable de l’équipe Wimmics à Inria Sophia et représentant d’Inria au World Wide Web Consortium (W3C).

L’objectif est de couvrir tout le cycle de vie pour créer, publier et maintenir des données culturelles en français sur lesquelles construire des applications innovantes. La convention entre les trois partenaires, membres fondateurs, définit pour ce faire le cadre de travail de la plateforme et fixe les conditions d’exploitation des projets collaboratifs qui en sont issus.

BDpédia, premier projet de la plateforme collaborative "Sémanticpédia"

S'inscrivant dans l'effort d'internationalisation de l’encyclopédie collaborative Wikipedia, DBpédia en français est le chapitre francophone de DBpédia, dont le but est de maintenir des données structurées extraites de différents chapitres de Wikipedia. "L’encyclopédie Wikipédia, qui fonctionne sur le principe du wiki, offre un contenu librement accessible et modifiable, mais uniquement utilisable par l’individu qui seul peut véritablement lire et comprendre le contenu des pages" souligne Fabien Gandon, pointant que de nombreuses données recelées par ces mêmes pages peuvent s’avérer utiles aux applications informatiques dès lors qu’elles leur deviennent accessibles.

C’est à ce manque, ou plus exactement à cette perte de données gigantesque que permet de parer DBpédia... en répondant automatiquement à des requêtes structurées complexes sur les données de Wikipédia et en les reliant à d'autres ensembles de données sur le Web. "Nous ouvrons ainsi ces données et collections à une multitude d’applications d’une richesse et d’une innovation réellement imprévisibles" se réjouit le chercheur.

Wimmics (Inria Sophia) en pointe

Commune avec l’Université de Nice Sophia Antipolis et le CNRS, l'équipe de recherche Wimmics est un acteur majeur du développement et de la diffusion des standards du Web sémantique, et assure aussi le rôle de correspondant français de DBpédia.org. Avec le lancement de ce premier projet qui repose sur les standards du Web sémantique, l’équipe Wimmics d'Inria attend une poussée dans la mise en ligne des données sur le Web. "Il s’agit là d’une preuve de concept grandeur nature des résultats de recherche et développement dans le domaine du Web de données et du Web sémantique" affirme Fabien Gandon.

"C’est tout un écosystème que l’on essaie de mettre en place au-dessus des données culturelles publiées" rappelle-t-il. Or toutes ces données afférentes à notre culture, qui se trouvent libérées des documents, permettent de générer d’innombrables applications (par ex. un GPS culturel). De la gestion de documents, on passe à la gestion de données rendues accessibles à tous, et utilisables pour créer de nouveaux usages, de nouveaux services, de nouveaux marchés..."


Crédits Indigen
- Copyrights WebTimeMedias 2011