Métadonnée
Un article de Wikipédia, l'encyclopédie libre.
Une métadonnée (du grec meta "après" et du latin data "informations") est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).
[modifier] Historique
[modifier] À l'origine, une utilisation dans les bibliothèques numériques
Dans les bibliothèques numériques (médiathèques), on a pris l'habitude d'utiliser des notices bibliographiques pour décrire le contenu et les aspects normatifs d'un document. Elles facilitent la gestion interne des ressources documentaires et, côté usagers, permettent d'optimiser la recherche et la localisation des documents électroniques.
Dès 1988, la Bibliothèque du Congrès, aux États-Unis, proposait un protocole pour la recherche d'information (Z39.50), basé sur des éléments de données, qui fut revu en 1992.
[modifier] Généralisation
Les langages de balisage de type GML, puis SGML et HTML, permirent d'introduire des métadonnées dans les documents. Les Communautés européennes adoptèrent le langage SGML dès 1984.
La notion de métadonnées utilisables par les ordinateurs fut proposée assez tôt dans l'histoire du Web, dès 1994, par son inventeur Tim Berners-Lee, lors de la conférence WWW 94 où fut annoncée la création du W3C. Les métadonnées sont en effet au cœur de l'architecture Web.
Voir : Metadata architecture par Tim Berners-Lee.
En 1995, les métadonnées firent l'objet d'un atelier à Dublin (Ohio), pour les méthodes de recherche d'information. En parallèle, la bibliothèque du Congrès proposait une 3e version du protocole Z39.50.
En 1999, le W3C définit le cadre permettant de créer un réseau de métadonnées acceptant le langage XML : Resource Description Framework (RDF).
Le tronc commun de métadonnées Dublin Core a été adopté par l'Union européenne en 2002.
[modifier] Une notion qui concerne tous les organismes
[modifier] Description
Les notices contiennent des informations sur la source du document (titre, auteur, date, sujet, éditeur, etc.), la nature du document (monographie, périodique, etc.), son contenu informationnel (descripteurs, mots-clés, résumé) et sa localisation physique (la cote).
Pour un document numérique, ces notices s'appellent des métadonnées et sont contenues dans le document lui-même. Les métadonnées sont aussi utilisées pour d'autres types de ressources informatiques contenant des images ou du son (cédérom, dévédérom).
Les métadonnées sont, dans le cadre du Web sémantique, des données signifiantes qui permettent de faciliter l'accès au contenu informationnel d'une ressource informatique, une notice de contenu intégrée en quelque sorte (dans l'en-tête des documents HTML côté code source ou en tant que fichier XML autonome par exemple).
Au moins quinze éléments, répartis autour de trois domaines, permettent d'identifier et de décrire les ressources documentaires :
- Contenu : titre, sujet, description, source, langue, relation, couverture.
- Propriété intellectuelle : auteur, éditeur, contributeur, droits (droits d'auteur,...).
- Matérialisation : date, type, format, identifiant.
Les métadonnées sont un élément essentiel de l'architecture Web.
Toutefois, limiter les métadonnées aux ressources numériques de types documents, son et images, serait une erreur : dans les bases de données relationnelles, les métadonnées incluent le nom de chaque table et le type de chaque colonne dans la table.
[modifier] Une notion essentielle à l'interopérabilité
Les métadonnées sont des balises que l'on introduit dans les fichiers ou dans des langages de programmation appropriés, les langages de balisage XML (Extended Mark up Language : mark up signifie balise).
Les balises ont pour effet d'améliorer l'efficacité des recherches d'information par rapport aux recherches plein texte.
RDF (Resource Description Framework) crée les conditions d'interopérabilité, avec des réseaux de métadonnées, et l'utilisation du langage XML.
Il est très important de noter que les ressources numériques balisées transportent avec elles leurs propres métadonnées lorsqu'elles sont téléchargées, copiées, répliquées, transmises par des messageries électroniques.
Ceci s'applique à tous les types de ressources numériques (texte, son, image, multimédia).
Les métadonnées sont ainsi l'un des principaux éléments de l'étiquetage avec des balises (ou tags, en langage informatique), surtout dans le Web 2.0.
Mais les métadonnées sont beaucoup plus que cela, car lorsqu'elles sont correctement structurées dans des dictionnaires de données (ou registres de métadonnées), elles peuvent faire interopérer toutes les ressources informatiques, faisant notamment la correspondance entre les données structurées (bases de données classiques, utilisées dans les progiciels de gestion intégrés) et les données non structurées (documents, images, manipulés en gestion des connaissances...).
[modifier] Tous les secteurs de l'économie sont concernés : gestion de contenu
Pour un ensemble de raisons, tant historiques que juridiques, on n'a pas encore pris conscience, en Europe, de la sensibilité de la gestion des métadonnées pour les processus de décision dans les entreprises.
Même aux États-Unis, cette prise de conscience a été difficile, la technicité du sujet cachant son caractère hautement stratégique.
Voir http://www.tdan.com/i008fe01.htm SELECTING THE "RIGHT" META DATA TO MANAGE Robert S. Seiner - TDAN.com & KIK Consulting Services
L'expert américain Robert Steele a bien compris l'importance des métadonnées dans les sources ouvertes.
Les métadonnées concernent tous les secteurs de l'économie à travers la gestion de contenu, puisque tous les organismes gèrent des ressources documentaires sous forme électronique :
- Administrations centrales et territoriales,
- Entreprises,
- Universités et grandes écoles,
- Centres d'études et de recherches,
- Médiathèques.
Dans l'économie de l'immatériel, il est important de protéger le patrimoine informationnel constitué par les ressources documentaires, car les documents électroniques contiennent souvent des données confidentielles.
La circulation de documents sous forme électronique entre différents types d'organismes rend la protection du patrimoine informationnel complexe.
[modifier] Différence de perception entre l'Amérique et l'Europe
Selon Robert Steele, expert américain en sources ouvertes, qui intervient à Bruxelles, les métadonnées sont appelées à jouer un rôle de plus en plus important pour la représentation avancée de contexte dans les modèles de contrôle d'accès et les langages de ressources Web actives.
Voir : Économie de la connaissance
[modifier] En Amérique
La sensibilisation sur les métadonnées est très forte, en raison d'une législation plus stricte (voir le modèle employé dans la justice aux États-Unis), notamment sur les assurances, de sorte que l'ingénierie des connaissances y est plus développée.
Un certain nombre d'équipes impliquées dans la sémantique sur le web ont organisé un atelier à Dublin (Ohio) en 1995 sur les métadonnées. Les métadonnées peuvent décrire des règles et contraintes sur les données. Le Dublin Core a inspiré la conception du moteur de recherche Google.
Il faut noter aussi que, outre le gouvernement fédéral, la Bibliothèque du Congrès, située à Washington, joue un rôle moteur dans la définition des métadonnées aux États-Unis. Différents départements (DoD,...) se sont dotés de registres de métadonnées, qui permettent de définir un champ commun de partage de connaissances entre des organisations travaillant sur des sujets de souveraineté : défense, justice, environnement...
Les premiers serveurs racines du DNS ont été installés à proximité de Washington, en Virginie et au Maryland, ce qui a favorisé le développement de l'utilisation structurée des métadonnées dans les organisations fédérales américaines pour les recherches d'informations.
Le responsable du chantier DRM (data reference model) du projet FEA du gouvernement fédéral, Michael Daconta, est l'ancien responsable du centre d'excellence sur les métadonnées du Department of Homeland Security
Le gouvernement canadien doit se conformer au Dublin Core depuis octobre 2001. Norme des métadonnées du Gouvernement canadien en direct
Voir dans la Wikipedia anglophone :
- General IT metadata,
- Catégorie medata, sur l'importance accordée aux métadonnées aux États-Unis.
Voir : Économie de la connaissance en Amérique
[modifier] Dans l'Union européenne
Au Royaume-Uni, l'UKOLN (United Kingdom Office for Library and Information Networking) est l'organisme le plus avancé sur la gestion de l'information numérique (métadonnées et interopérabilité). Il développe des projets pour la recherche et développement financés par l'Union européenne. Il a une influence sur la réglementation, l'« awareness », la recherche et développement, les technologies Web.
En France, par manque de formation ou d'information à ce propos, peu d'utilisateurs et de webmestres intègrent des métadonnées aux contenus numériques qu'ils publient. La raison est probablement que les métadonnées n'avaient pas de valeur juridique normative au niveau européen et dans les États membres (en particulier la France), puisqu'il n'y avait pas d'obligation légale.
Voir : Article du 18 septembre 2006 : l'Europe très en retard dans le domaine du décisionnel
Des organismes comme le Commissariat à l'énergie atomique et le CNES (membres de l'association ARISTOTE emploient des métadonnées pour l'archivage à long terme, en utilisant les recommandations de l'OAIS.
La CORES Resolution (standards interoperability forum Resolution on Metadata Element Identifiers 12-12-2002) a adopté en 2002 les Identifiants de Ressource Uniformes (Uniform Resource Identifiers, URI) pour l'accès aux ressources Web, en s'appuyant sur des standards de métadonnées.
« Nos standards de métadonnées ont des éléments - unités signifiantes - qui peuvent être comparés et mis en correspondance avec des éléments d'autres standards ».
Ce groupe de projet a travaillé pour la Commission européenne. Il est composé de personnes appartenant à :
- GILS : Government Information Locater Service (USA)
- MARC21 : standards de la bibliothèque du Congrès américain (USA)
- IEEE/LOM : Learning Object Metadata (USA)
- DCMI : Dublin Core Metadata Initiative (USA)
- DOI Foundation : Digital Object Identifier
- ONIX : ONIX for books, diffusion de livres
- CERIF : Common European Research Information Format
Le Dublin Core pousse à une normalisation dans l'Union européenne, via les données employées dans les systèmes d'information. La Commission européenne emploie donc des métadonnées dans ses livres blancs, sur des sujets pouvant toucher à la souveraineté.
Le programme IDABC de la Commission européenne (3e phase du programme IDA), concernant les services d'e-Gouvernement, s'appuie largement sur les métadonnées du Dublin Core. Il a donné naissance au projet MIReG, qui vise à développer un framework de métadonnées, concernant les extensions du Dublin Core aux informations gouvernementales, qui soit basé sur les recommandations nationales sur les métadonnées des informations du secteur public.
La directive 2003/98/CE fournit un cadre pour la réutilisation des informations du secteur public. Par exemple, dans les pôles de compétitivité, des informations d'administrations territoriales, de centres d'études et de recherche publics, et d'universités sont partagées avec des entreprises privées. Les conditions d'application de la directive sont fonction des États membres et des organismes de secteur public.
Le projet de directive INSPIRE (2006) doit inciter les États membres et la Communauté européenne à mettre en place des organisations publiques (services de jeux de données), chargées de créer et de mettre à jour les métadonnées (registres de métadonnées), au moins pour ce qui concerne les informations géographiques. Elle devrait faire évoluer le cadre législatif.
Il existe un projet de traduction française de la norme internationale Dublin Core (voir site Web de Artist, 16 octobre 2006), mais aucun organisme ne semble prendre la responsabilité ou le leadership.
Les métadonnées sont appelées à être utilisées dans tous les réseaux d'innovation européens (pôles de compétitivité).
Voir : Économie de la connaissance en Europe
[modifier] Importance des métadonnées pour la prise de décision dans les grandes organisations
[modifier] Importance pour la gouvernance
Dans le domaine de la gouvernance en général (gouvernement, administrations, entreprises, les métadonnées stockées dans des métadictionnaires (ou repository ; référentiels) sont utilisées comme « données sur les données », ou données de référence.
Les métadonnées permettent de décrire les données utilisées dans les analyses et prises de décisions :
- la définition exacte des données (sémantique)
- la source des données (date, origine)
- la façon dont elles sont calculées, agrégées, ... (règles de calcul)
- les règles métier qui s'y rapportent
- le processus d'extraction, transformation et chargement qui a été mis en œuvre (voir ETL et Intégration d'applications d'entreprise).
Les différents types de gouvernance d'entreprise rencontrés sont :
- Les tableaux de bord de gestion et l'informatique décisionnelle (entrepôts de données et datawarehouse) : dans ce cas, les outils d'extraction et de gestion des métadonnées sont répertoriés dans la liste d'outils décisionnels.
- Les tableaux de bord prospectifs, encore peu employés en France.
[modifier] Importance dans la protection du patrimoine informationnel
Les métadonnées sont essentielles pour certifier et qualifier le contenu des bases de données, et donc conforter les analyses effectuées à partir des données.
Les métadonnées décrivant les critères principaux des ressources informatiques, (comme par exemple dans le titre et le sujet : client, produit / service, contrat, compte...). Elles peuvent être utilisées pour déterminer le profil de protection correspondant le mieux aux besoins de sécurisation de l'organisme.
Autant les métadonnées sont utiles pour partager un vocabulaire commun dans une communauté qui peut être très large, autant elles peuvent entraîner des pertes d'informations lors des transferts de fichiers si l'on ne se conforme pas strictement aux exigences de tenues de registres de métadonnées exprimées dans les normes officielles (ISO/CEI 11179).
Voir :
[modifier] Importance pour la gestion de la preuve
La gestion des documents d'archives doit pouvoir s'appuyer sur des données cohérentes le long du cycle de vie des données. Il existe donc des normes de gestion des documents d'archives (ISO 15489), et une norme particulière sur les métadonnées (ISO).
[modifier] Cadre de référence
Des travaux internationaux convergent pour utiliser « intelligemment » avec le Web les métadonnées avec des moteurs de recherche en décrivant les ressources numériques ou physiques et en établissant des relations avec d'autres ressources.
[modifier] Mise en œuvre d'un registre de métadonnées
Le pilotage d'organisations complexes (administrations centrales et locales, pôles de compétitivité,...) nécessite d'employer des informations d'autorité, qui sont contenues dans des référentiels de métadonnées appelés registres de métadonnées.
Un registre de métadonnées est un « Système de gestion des métadonnées, c'est-à-dire un système formel qui fournit l'information d'autorité sur la sémantique et la structure de chaque élément. Pour chaque élément, le registre en donne la définition, les qualificatifs qui lui sont associés, ainsi que les correspondances avec des équivalents dans d'autres langues ou d'autres schémas. »
La norme ISO/CEI 11179, dont l'application est fortement conseillée par le gouvernement américain, inclut les recommandations pour la mise en œuvre d'un registre de métadonnées. La partie 6 contient des recommandations organisationnelles. Par exemple, il faut mettre en place, au niveau adéquat, l'organisation qui convient (architectes de données, réseau de correspondants,...).
[modifier] Référentiels de métadonnées généraux : Dublin Core
Ce référentiel trouve son origine aux États-Unis (1995) et a été adopté par plus de huit gouvernements.
Le « Dublin Core » est la principale initiative visant à la convergence des éléments de métadonnées à utiliser.
C'est un schéma de métadonnées générique qui peut servir de base à des registres de métadonnées. Le « Dublin Core » comprend 15 éléments de description :
- formels (titre, auteur, éditeur),
- intellectuels (sujet, description, langue…)
- et relatifs à la propriété intellectuelle.
Chaque élément de description a plusieurs raffinements possibles (version qualifiée).
L'utilisation de ce référentiel doit impérativement être accompagnée d'une organisation en registre de métadonnées. Avant toute mise en œuvre de ce référentiel, il faut être conscient de son caractère sensible sur le plan de la protection du patrimoine informationnel et des contraintes organisationnelles qui y sont liées. C'est la raison pour laquelle le gouvernement américain conseille fortement de s'appuyer sur les recommandations de la norme ISO/CEI 11179 (partie 6 sur l'enregistrement).
Le moteur de recherche Google s'appuie sur le Dublin Core. La programmation network-centric utilise les métadonnées du Dublin Core.
Le système de publication d'OpenWeb (Présentation des métadonnées « Dublin Core ») est basé sur ce tronc commun.
La norme ISO 15836:2003 est la transposition normative de ce référentiel en version non qualifiée. Elle est utilisée par plus de huit gouvernements dans le monde. En France, on l'emploie dans la Gestion électronique des documents (GED) ou dans les Systèmes d'archivage électronique (SAE).
Il est important de noter qu'il n'existe pas de traduction officielle, complète, et unique du référentiel Dublin Core en français. Il existe plusieurs guides d'utilisation en français.
Voir : Projet de traduction française de la norme internationale de métadonnées Dublin Core.
[modifier] Autres référentiels de métadonnées
Bibliothèques
L'initiative la plus ancienne pour définir des troncs communs d'éléments standardisés de métadonnées remonte aux années 1960, avec le standard MARC développé par la bibliothèque du Congrès.
Le schéma MODS, développé par la Bibliothèque du Congrès, est un compromis entre la complexité de MARC et la simplicité du Dublin Core.
Archivage à long terme
L'archivage à long terme se fait selon le modèle OAIS, avec le schéma XML METS (Metadata Encoding and Transmission Standard). Il est utilisé par le Commissariat à l'énergie atomique et le CNES.
Presse
L'IPTC recommande l'utilisation d'un référentiel international de métadonnées spécifique à la presse, IPTC Core.
[modifier] Cadre général : Web sémantique, RDF
Les métadonnées trouvent leur pleine utilisation dans le Web sémantique. Celui-ci repose :
- sur des standards propres au Web sémantique :
- Resource Description Framework (RDF) : ce cadre de référence comporte des modèles de graphe destinés à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions. RDF a été défini en 1999 par le W3C, c'est le référentiel de base du Web sémantique.
- Les métadonnées peuvent également être utilisées dans des extensions de RDF : RDF Schema et OWL.
[modifier] Formats
- XMP : format de métadonnées basé sur XML, utilisé dans les applications PDF, de photographie et de graphisme, applicable au web. Il a été lancé par Adobe Systems en avril 2001.
[modifier] Risques
[modifier] Risques liés aux métadonnées
Les métadonnées sont utiles à l'interopérabilité, mais leur emploi sans précaution présente des risques.
- On a déjà souligné que la mise en œuvre d'un registre de métadonnées nécessite de s'appuyer sur la norme idoine (ISO/CEI 11179),
- Certains experts préconisent d'enlever les métadonnées des documents électroniques.
Voir : Content Security Risks sur le site metadatarisk.org
Le plus grand risque serait d'ignorer l'importance des métadonnées, et de ne pas percevoir qu'elles sont largement utilisées dans beaucoup de systèmes informatiques.
[modifier] Utilisation par les langages informatiques
Les métadonnées sont utilisées dans les langages de balisage : SGML, HTML, XHTML, XML.
Elles sont aussi utilisées dans le langage GML (Geography Markup Language).
Le langage Java accepte également les métadonnées.
Voir : Liste des JSR sur l'interopérabilité informatique
[modifier] Génération des métadonnées
Les métadonnées peuvent être introduites de façon manuelle, mais aussi semi-automatique, ou automatique.
Voir :
[modifier] Utilisations par types de ressources
[modifier] Bases de données relationnelles
Les bases de données relationnelles utilisent aussi des métadonnées dans les tables.
C'est dans la phase d'alignement stratégique des projets de système d'information, en particulier d'urbanisation, que l'on est amené à étudier comment les données de sécurité se positionnent dans l'architecture de données des systèmes d'information.
[modifier] Systèmes de fichiers Unix
Les systèmes de fichiers disposent de quelques informations de base sur les fichiers, qui sont à ce titre des métadonnées. Les principales sont le nom du fichier, sa taille, la date de création et de dernière modification.
Dans les systèmes UNIX, les droits d'accès (en lecture, écriture et exécution selon l'utilisateur, le groupe, ou les autres) sont des métadonnées sensibles. Ces droits d'accès sont décrits dans ce que l'on appelle les inodes (contraction d'index-node, nœud d'index).
Il semblerait que l'avenir de la localisation, de la lecture-repérage et de la collecte d'information dans les systèmes de fichiers passe par l'utilisation massive des métadonnées.
Certains systèmes de fichiers en cours de développement comme la version 4 de ReiserFS ou WinFS ont pour objectif de rendre la recherche des fichiers plus simple et plus intuitive, et les métadonnées permettent d'y arriver. Tous les fichiers seront donc pourvus de métadonnées permettant de savoir ce qu'ils contiennent.
Il faut noter que le principe n'est pas nouveau : le BeOS file system (BFS) était notamment réputé pour son support des métadonnées. Le ressource fork du système de fichiers utilisé par les anciennes version de Mac OS permettait également ce type de gestion.
[modifier] Fichiers bureautiques
Des formats de fichiers tels que PDF, Word, Excel, ou OpenOffice.org utilisent des métadonnées. Elles sont visibles et peuvent être complétées à partir du menu Fichier > propriétés du document dans l'interface des applications correspondantes.
Le format de document OpenDocument (ou ODF), ouvert, contient des métadonnées dans le fichier meta.xml. Ce format a été recommandé par Bernard Carayon [1] et a été adopté par l'Union européenne.
[modifier] Contenus multimédia
- MPEG-7 est une norme de description de contenu qui intègre des métadonnées
- MPEG-21 est un framework multimédia
- MXF
Voir aussi : framework multimédia
Chaque format d'image numérique implémente une façon spécifique de stocker les métadonnées, mais il existe certaines normes communes à plusieurs types, par exemple :
- le standard EXIF est utilisable à la fois dans les fichiers JPEG ou TIFF,
- le standard XMP est intégrable à une douzaine de types de fichier différents (JPEG, JPEG 2000, TIFF, GIF, PNG, etc.).
- DIG35, et JPX.
Les formats de son numérique intègrent des métadonnées :
- Dolby Digital EX
- Dolby E
etc.
Les technologies applicables sont PRISM, NewsML, et NITF.
Voir aussi : IPEG
Fichiers MP3
Les métadonnées sont utilisées par le format MP3 dans les tags ID3. On peut en effet y insérer des informations comme le nom de la chanson, de l'interprète, ou encore la date de sortie.
[modifier] Utilisations par types de systèmes
[modifier] Logiciels libres
Les logiciels libres utilisent comme tous les logiciels des métadonnées. Par exemple, le système de gestion intégrée des documents du gouvernement du Québec emploie des métadonnées avec des composants d'indexation et de stockage.
Voir : Services gouvernementaux du Québec, fonctions de base en gestion documentaire
En France, dans le Cadre Commun d'Interopérabilité du Référentiel Général d'Interopérabilité du programme d'e-Gouvernement ADELE, les technologies du logiciel libre sont représentées par l'intermédiaire de Zope, qui a des capacités à interopérer via le langage DTML (Dynamic Template Markup Language). Ce langage emploie lui-même des métadonnées.
Voir : Zope - Configuring the Metadata Tool
[modifier] Progiciels de gestion intégrés
Les grands progiciels de gestion intégrés (SAP, Oracle,...) ont des fonctions permettant de gérer les métadonnées. On les appelle quelquefois gestion des données de référence ou Master Data Management (MDM).
[modifier] Gestion de contenu
Les applications progicielles de gestion des connaissances ont, dans la gestion de contenu, des fonctions permettant de gérer les métadonnées.
À ce titre, elles sont essentielles pour la gestion de la preuve (voir supra).
[modifier] Interfaces de programmation (API)
Les métadonnées peuvent être employées dans les spécifications J2EE du langage de programmation Java, en particulier dans les interfaces de programmation (API).
Elles font l'objet de formats d'interface : JMI (Java Metadata Interface), spécifique au langage Java.
XMI (XML Metadata Interchange) est un standard d'échanges de métadonnées UML.
[modifier] Moteurs de recherche
Les moteurs de recherche peuvent s'appuyer sur des métadonnées pour améliorer les recherches d'information par rapport aux recherches plein texte.
[modifier] Services Web
Les services Web (architecture SOA) manipulent de grandes quantités de métadonnées. L'organisation WS-I (Web Services Interoperability) a développé une série de profils pour faire évoluer les futures normes impliquées dans l'interopérabilité des services Web.
Voir : Web Services Specifications : Registry And Metadata, 28/12/2006.
[modifier] Informatique décisionnelle
Les métadonnées permettent d'effectuer des analyses multidimensionnelles, dans les applications de gestion des ressources humaines, finances, gestion de la relation client.
À ce titre, elles sont un élément essentiel de la gouvernance d'entreprise (voir supra).
[modifier] Systèmes d'exploitation
Les métadonnées seront utilisées dans le prochain système d'exploitation Microsoft Windows Vista, dont les conditions de sécurité sont controversées.
Voir : Gartner s'inquiète des métadonnées dans Windows Vista
[modifier] Messageries électroniques
Les messageries électroniques peuvent véhiculer des métadonnées. Jason R. Baron a fait une étude dans le cadre de l'IEEE en 1999 sur l'archivage des courriels de l'administration américaine.
Voir la présentation qu'il fait pour l'US National Archives and Records Administration : ERPA Workshop Antwerp, 15 avril 2004
[modifier] Systèmes de gestion de règles métier
Les SGRM définissent des règles métier en employant des métadonnées.
[modifier] Syndication de contenu Web
Les balises de syndication RSS contiennent des métadonnées.
[modifier] Normalisation
[modifier] Importance de la normalisation
Les métadonnées ont une valeur ajoutée certaine et font déjà l'objet d'un ensemble de normes ISO.
Les moteurs de recherche dédiés à la lecture et au décryptage sémantique de ces données permettent une optimisation et une efficacité accrue des recherches d'information opérées par un internaute ou un ordinateur sur le Web.
La valeur ajoutée de cette solution technique repose sur un mode de requête qui écarte les informations parasites (le bruit documentaire) et réduit simultanément les silences documentaires (les informations pertinentes existantes mais non rapportées).
C'est de plus un moyen pour mettre en place un web sémantique par une optimisation des méthodes et moyens appliqués à la recherche d'information et de documentation dans un système d'information donné :
- ne rendre visibles et lisibles que les informations pertinentes pour l'utilisateur (avec indice de pertinence).
- diminuer les risques de désorientation liés à un déluge d'information (nombre de réponses non pertinentes rapportées à la question posée qui peuvent faire dériver l'internaute) comme c'est le cas aujourd'hui.
Par rapport au bruit généré par les recherches plein texte, les métadonnées insérées dans les ressources informatiques permettent d'améliorer les recherches d'information sur le Web, comme avec les logiciels utilisés par les bibliothèques.
Les métadonnées peuvent également être employées dans les moteurs de règles, pour automatiser les échanges de documents électroniques entre partenaires. Ces interfaces automatisées posent des questions juridiques, surtout lorsque les données échangées sont à caractère contractuel.
[modifier] Fondamentaux : éléments de métadonnées, registre de métadonnées
Les fondamentaux sur les métadonnées sont les éléments de métadonnées, et les recommandations sur la tenue de registres de métadonnées.
Le Dublin Core a acquis le statut de norme internationale en 2003, en raison de ses applications gouvernementales : ISO 15836. La mise en œuvre de cette norme très courte (6 pages) doit être accompagnée de mesures organisationnelles. Le Dublin Core n'est pas applicable à certains secteurs spécifiques (multimédia, presse, bibliothèques,...).
La norme ISO/CEI 11179 est une norme pour la représentation des métadonnées d'une organisation dans un registre de métadonnées, et la mise en place d'une autorité d'enregistrement.
Deux autres normes concernent la cohérence et l'interopérabilité des registres de métadonnées :
- ISO 20943 - Meta Data Registry content consistency,
- ISO 20944 - Meta Data Registry interoperability & binding.
On peut mentionner aussi la norme ISO 23950 sur les protocoles de recherche d'information, qui est étroitement associée au socle commun.
Le gouvernement fédéral semble accorder un peu moins d'importance à la norme ISO 11179 dans le projet Federal Enterprise Architecture (FEA) lancé en 2002. Le rôle stratégique des métadonnées est confirmé dans ce projet.
[modifier] Archivage informatique
La norme ISO 14721:2003 (Systèmes de transfert des informations et données spatiales - Système ouvert d’archivage de l’information - Modèle de référence), plus connue sous le nom de modèle OAIS (Open Archival Information System) est une norme conceptuelle, mise au point par les principaux centres d’études spatiales du monde dont le CNES (Centre National d’Etudes Spatiales).
Elle définit les objets d’information, les métadonnées nécessaires à leur préservation et l’organisation à mettre en place pour leur archivage, leur conservation et leur communication.
[modifier] Commerce électronique
Plusieurs normes sont relatives au commerce électronique :
- ISO/TS 15000, sur le registre de commerce électronique ebXML, qui a, au sein de l'ISO, le statut de spécification technique, disponible en anglais seulement.
- ISO/TS 17369 correspond à l'initiative SDMX visant à promouvoir l'échange de données et de métadonnées dans le domaine du commerce électronique.
[modifier] Informations géographiques
Deux normes sont relatives aux métadonnées des informations géographiques :
- ISO 19115
- ISO 19139
[modifier] Gestion des documents d'archives
Les normes sur la gestion des documents d'archives (ou records management) sont, avec d'autres types de normes, utiles afin d'assurer la cohérence du cycle de vie des documents, depuis l'élaboration des contrats jusqu'à la comptabilisation. Ces normes sont utiles pour la gestion de la preuve.
A côté de la norme de gestion des documents d'archive (ISO 15489), existe la norme relative aux métadonnées des enregistrements :
- ISO 23081-1:2006 Information et documentation -- Processus de gestion des enregistrements -- Métadonnées pour les enregistrements -- Partie 1 : Principes (en anglais seulement)
- Accès à la norme sur le site de l'ISO : [1]
Voir aussi, sur la conformité aux normes AFNOR Z42-013 ISO 15489 :
- Livre blanc sur l'infrastructure d'archivage Opensource conformité (2005)
La normalisation des comptabilités avec IAS/IFRS rend cette problématique stratégique.
[modifier] Domaines d'application
[modifier] Bibliothèque numérique
[modifier] Fonctions régaliennes
Gouvernement et finances :
- Normes des métadonnées du gouvernement canadien, sous la responsabilité du Conseil du Trésor
- En France, les métadonnées sont employées dans le programme ADELE, dans les règles relatives aux Composants Communs (voir site de la DGME, règle C73), et pour l'archivage électronique selon la norme OAIS (voir site de la DGME)
Défense :
- Fiches techniques « diffusion des données » du Ministère de l'écologie et du développement durable
- Metadata development in China, Department of Information Management, Peking University, Chine, décembre 2004
Justice :
- Aux États-Unis : Modèle de données du département de la justice
- En France : projet Solon de dématérialisation de la production normative juridique. Le périmètre défini en 2005 ne concerne que les décrets.
[modifier] Environnement, commerce électronique
- Environmental Protection Agency : Environmental metadata gateway
- Agence européenne de l'environnement : EIONET
- Commerce électronique : le registre ebXML, géré au niveau des Nations unies, utilise des métadonnées.
Sur l'environnement, voir aussi : Liste de registres du projet XMDR
[modifier] Données géospatiales
- États-Unis : Site du federal geographic data committee
- Union européenne : directive INSPIRE, sur les données spatiales et géographiques
[modifier] Autres domaines
etc.
[modifier] Organismes francophones ayant des compétences sur les métadonnées
Liste non exhaustive :
- INRIA
- Secrétariat du Conseil du Trésor du Canada
- Bibliothèque de l'Université Laval
- École nationale supérieure des mines de Saint-Étienne
- INIST
- Université Claude-Bernard Lyon 1
- CNRS, laboratoire Creatis
- Université Pierre et Marie-Curie, LIP6
- Bibliothèque nationale de France
[modifier] Note
[modifier] Bibliographie
Les Clés du Succès en Gestion des Métadonnées, Un Livre Blanc d'Alan Perkins de ASG
[modifier] Voir aussi
Architecture et interopérabilité
Référentiels
- Registre de métadonnées
- Dublin Core (initié aux États-Unis en 1995)
Recherches d'information
- Recherche d'information ; Z39.50 ; ISO 23950
- Exploration de données (fouille de données, data mining)
Autres applications
[modifier] Liens externes
- (en) Metadata standards ISO/CEI JTC1 SC32 WG2
- (en) Site du Dublin Core Metadata Initiative, organisme qui fait la promotion de l'utilisaton et de l'interopératibilité des métadonnées
- (en) David Marco
- (en) Site de l'UKOLN, United Kingdom Office for Library and Information Networking
- (fr) MDweb : Outil web pour la gestion et la consultation des métadonnées (norme ISO 19115)
- (fr) Métadonnées dans le progiciel de gestion intégrée SAP
- (fr) Dossier sur les métadonnées dans Bibliodoc.francophonie.org
- (fr) Métadonnées, normes et standards, dossier sur les métadonnées
- (fr) Formation sur la pérennisation et la communication de l'information numérique association ARISTOTE, avec le CNES, le Commissariat à l'énergie atomique, la BNF, 11 au 15 septembre 2006.
- (fr) Des métadonnées pour bien utiliser les ressources électroniques, sur le site de la BNF
- (fr) Dossier: Les métadonnées, élaboré par le SCÉRÉN
- (fr) Questions fréquentes sur les métadonnées
- (fr) Métadonnées et ressources électroniques, CNRS
Portail de l'informatique – Accédez aux articles de Wikipédia concernant l’informatique. |