Content-Aware Documents Repositories

CADOR gère la gestion distribuée de documents avec un langage de haut niveau intégrant principalement les fonctionnalités impliquées dans un environnement de type « Cloud » (ou nuage) : la réplication, la dérivation de nouveaux contenus, agrégation, recherche de documents (dans des entrepôts de documents distribués), l’annotation, une organisation flexible de collections de documents, et enfin des interactions conviviales avec l’entrepôt de documents. La composante de base de CADOR est donc un langage fondé sur des règles de manipulation de données, inspiré de projets récents, tels que Webdam.

Nous étudions l’application de ce langage à la synchronisation de documents dans plusieurs entrepôts, de recherche de documents, y compris la recherche par le contenu pour des données non conventionnelles (images, vidéos), dérivation de contenu (par exemple, produire des artefacts concrets à partir du contenu du document principal), la publication de documents par des vues adaptées aux contextes spécifiques de chaque utilisateur, ainsi que la qualité axée sur l’amélioration de collections de documents (c.-à-d., contrôle des attributs des documents, contrôle de la qualité de la dérivation à partir d’une collection de documents). En particulier, nous visons à utiliser le système comme un moyen de déployer un bureau basé sur la représentation des documents, permettant des interactions transparentes dans un environnement familier.

Nous développons un prototype de ce système au dessus de bases documentaires existantes telles que CouchDB ou MongoDB. CADOR apportera à un tel système de haut niveau des caractéristiques qui manquent actuellement. En ce qui concerne les résultats expérimentaux, CADOR est testé sur « NEUMA« , une bibliothèque de partitions musicales maintenue par notre équipe, puis sur « The Polymathic Machine« , un projet récent consacré à la gestion d’objets de jeux vidéos. Les deux applications constituent d’excellents exemples de la portée d’applications visées par CADOR.

Les principales contributions sont :

  1. Ajouter une spécification de haut niveau d’un langage de manipulation de données au dessus de l’état de l’art sur les entrepôts de type clé-valeur.
  2. Utiliser ce langage afin de permettre une navigation conviviale dans un entrepôt de documents sur une interface de type bureau utilisateur
  3. Mettre en oeuvre et expérimenter le système sur deux applications existantes

Laisser un commentaire