Diapositive 1 - IRD

Document Sample
Diapositive 1 - IRD Powered By Docstoc
					Comment mettre en place un système de catalogage ?
L’interopérabilité avec d’autres outils est-elle possible ?



                         IRD : DSI – IS
                         Responsables : Régis HOCDE et Bruno GRANOUILLAC




   PRATLONG Léo – IRD Montpellier – 08/2007                                1
                                   PLAN

                            I-   Présentation de la mission


                            2- Présentation de MDweb


                            3- Les thésaurus


                            4- Architecture de MDweb


                            5- Installation de MDweb


                            6- Interopérabilité


                            7- Conclusion

PRATLONG Léo – IRD Montpellier – 08/2007                      2
                              LA MISSION




PRATLONG Léo – IRD Montpellier – 08/2007   3
                                       ENJEUX



     • Répondre à la directive européenne INSPIRE :
                        Publication des métadonnées
                        Echange et partage de données géographiques

     •   Recenser les données de l’IRD en répondant aux questions :
                        Où se trouve la donnée ?
                        Quand cette donnée a-t-elle été produite ?
                        Que décrit cette donnée ?
                        De quel type de donnée s’agit-il ?

     •   Faciliter le travail des chercheurs :
                            Savoir quelles données existent, et où la trouver




PRATLONG Léo – IRD Montpellier – 08/2007                                        4
                                  OBJECTIFS

     •   Evaluer les fonctionnalités de Mdweb

     • Créer un guide d’installation sur serveur virtuel Linux CentOs à
     l’attention des futurs utilisateurs de l’IRD
                          Installation
                          Correction
                          Documentation

     • Evaluer la possibilité d’une interopérabilité entre Mdweb et
     d’autres outils de catalogage
                          Recherche étendue
                          Jeux de données enrichis
                          Respect des normes (ISO19115 – ISO19139)

     •   Couvrir le besoin terminologique des chercheurs de l’IRD
                         Proposition de mot-clé : notion de Thesaurus
                         Evaluer ces thesaurus

     •   Mettre un portail public d’accès aux métadonnées de l’IRD

PRATLONG Léo – IRD Montpellier – 08/2007                                  5
                       Présentation de MDweb




PRATLONG Léo – IRD Montpellier – 08/2007       6
                                      MDWEB

        = Présentation

    •     Outil de catalogage de métadonnées sous forme de portail web

    •     Serveur cartographique de localisation de données

    •     Interopérabilité : Z3950, CSW

    •     Modification de la structure des métadonnées

    •     Indexation des métadonnées à l’aide d’un thesaurus

        = Droits d’utilisation

   •     License CeCILL : utilisation libre

   •     Projet soutenu par l’IRD (J-c Desconnets)

PRATLONG Léo – IRD Montpellier – 08/2007                                 7
                                  MDweb




PRATLONG Léo – IRD Montpellier – 08/2007   8
                             METADONNEES

       = Définition

   •    Permet d’obtenir des informations sur une donnée :
                       Où ?
                       Quoi ?
                       Quand ?

       = Exemple (morceau de métadonnée)




PRATLONG Léo – IRD Montpellier – 08/2007                     9
                     DEFINITIONS GENERALES



                     Mot-clé               Thesaurus

                           Décrit




                  Métadonnées


                          Décrit



                    Données

PRATLONG Léo – IRD Montpellier – 08/2007               10
                              THESAURUS




PRATLONG Léo – IRD Montpellier – 08/2007   11
                                    THESAURUS

        = Définitions

    •     Recueil terminologique hiérarchisé décrivant un domaine d’activité

    •     Référentiel : « processus énonciatif qui permet de différencier »

    • Descripteur : mot clé choisi parmi des synonymes pour les
    représenter

    •     Différent des annuaires de termes : FishBase, LarvalBase, etc…

    •     Chercheurs injoignables

        = Objectifs

   •     Décrire les domaines d’activité de l’IRD

   •     Faciliter la recherche
                           Offrir aux chercheurs les termes dont ils ont besoins
PRATLONG Léo – IRD Montpellier – 08/2007                                           12
                        THESAURUS : exemple


     = Thesaurus OECD (utilisé par l’IAM)




PRATLONG Léo – IRD Montpellier – 08/2007      13
               THESAURUS : problèmes rencontrés (1/2)

        = Recherche de thesauri difficile

    •     Confusion entre le terme « thesaurus » et l’objet « thesaurus »

    •     Peu de thesauri libres et accessibles en ligne

    • Abus de langage et fausses pistes

    •     Indisponibilité ou thesauri abandonnés

        = Droits d’utilisation


   • Thesauri soumis à des droits d’utilisation

   •     Thesauri payants et non consultables



PRATLONG Léo – IRD Montpellier – 08/2007                                    14
             THESAURUS : problèmes rencontrés (2/2)


       = Normalisation


   • Thesauri non normés

   •    Fichier de termes non hiérarchisés


       = Précision


   • Thesauri non maintenus (mise à jour inexistante)

   •    Manque de précision des thesauri : description souvent trop générale




PRATLONG Léo – IRD Montpellier – 08/2007                                       15
                                THESAURUS




        = Dans MDweb


    • AGROVOC : terminologie agronomique (multilingue)

    •    GEMET: terminologie environnementale (multilingue)

    • Toponymie : Terminologie géographique




PRATLONG Léo – IRD Montpellier – 08/2007                      16
                                THESAURUS


     = Quelques thesauri intéressants

   Nom            Propriétair    Langues            Domaines      Disponibilit
                  e                                               é
   EUROVOC        UE             21                 Multi (21)    Oui
   GeoEthno       CNRS           Multi              Géo / Ethno   Oui
   MeSH           INSERM         2 (Ang / franc)    Santé         Oui
   ASFA           FAO            3                  Science       Oui
                                                    halieutique
   Méditagri      IAM            Français           Multi         Oui
   Ecothek        Ministère      Français           Ecologie      Fin 2007
                  écologie
   Banane         INIBAP         3 (fr, ang, esp)   Banane        Oui
   Planète        Ministère      Français           Ecologie      Oui
                  écologie


PRATLONG Léo – IRD Montpellier – 08/2007                                         17
                              THESAURUS


     = Granularité

            Nom                            Précision
            EUROVOC                        Faible
            GeoEthno                       Haute
            MeSH                           Haute
            ASFA                           Haute
            Méditagri                      Moyenne
            Ecothek                        Inconnue
            Banane                         Extrême (spécialisé)
            Planète                        Moyenne




PRATLONG Léo – IRD Montpellier – 08/2007                          18
                 THESAURUS : utilisation sur le portail


        = Mise à jour

    •    Enrichir le recueil de termes

    • Actualiser le thesaurus

    •    Permettre aux utilisateurs de personnaliser leur outil


        = Importation

    •    Offrir un vaste choix de domaines

    •    Ne compromet pas la stabilité du système

    •    Possibilité d’évolution


PRATLONG Léo – IRD Montpellier – 08/2007                          19
                       Architecture de MDweb




PRATLONG Léo – IRD Montpellier – 08/2007       20
    ARCHITECTURE DU SERVEUR STOCKANT MDWEB




PRATLONG Léo – IRD Montpellier – 08/2007     21
                       NORMES ET PROTOCOLES

        = Normes

    • Normes de métadonnées
                    ISO19115
                    ISO19139

    •     Normes de thesaurus
                        RDF
                        SKOS
                        OWL


        = Protocoles


   •     Protocoles de communication
                        Z3950
                        CSW


PRATLONG Léo – IRD Montpellier – 08/2007      22
                                     NORMES

     = ISO19115

      <cntOnlineRes>
                <linkage>http://www.ird.fr/</linkage>
      </cntOnlineRes>




     = ISO19139

  <gmd:onlineResource>
  <gmd:CI_OnlineResource>
            <gmd:linkage><gmd:URL>http://www.ird.fr/</gmd:URL></gmd:linkage>
  </gmd:CI_OnlineResource>
  </gmd:onlineResource>




PRATLONG Léo – IRD Montpellier – 08/2007                                       23
                               PROTOCOLES

     = Z3950

    • Serveur Z3950
                       Installation côté données
                       Effectue la requête sur la base de données qu’il relie

    • Client Z3950
                       Inclus dans MDweb


    • Protocole Z3950
                     Communication entre le client et le serveur Z3950
                     Nécessité d’ouverture d’un port (2100, ici)


     = CSW

   • Version 1.6 de MDweb

PRATLONG Léo – IRD Montpellier – 08/2007                                        24
                ARCHITECTURE DE MDWEB : Besoins

        = Systèmes d’exploitation


    • Windows

    •    Unix
                         Solution choisie : Serveur virtuel Linux CentOS sur machine
                         distante


        = Besoin logiciel


    •    Serveur Apache et serveur cartographique
                        Serveur Apache MapServer

    •    Serveur de base de données
                        PostgreSQL avec extension PostGis


PRATLONG Léo – IRD Montpellier – 08/2007                                               25
                         Installation de MDweb




PRATLONG Léo – IRD Montpellier – 08/2007         26
               INTERFACES D’UTILISATION (1/3)



     = Webmin : portail web



     = Accès SSH : accès par un client (putty)



     = PhpPgAdmin : portail web


     = Netdrive : accès par client




PRATLONG Léo – IRD Montpellier – 08/2007         27
                    INTERFACES D’UTILISATION (2/3)

       = Webmin

       •   Interpréteur de commandes shell
                           Accès restreint (absence de « vi »)

       •   Interpréteur de commandes PostgreSQL

       •   Commandes personnalisés
                        Activation / redémarrage des serveurs

       •   Journal d’erreurs Apache / Php
                           Difficulté à repérer les erreurs instantanément

       = Accès SSH

   •       Interpréteur de commandes Shell
                           Accès non restreint
                           Indispensable pour travailler en mode console

PRATLONG Léo – IRD Montpellier – 08/2007                                     28
                  INTERFACES D’UTILISATION (3/3)

        = PhpPgAdmin


   •     Interface de gestion de base de données PostgreSQL

   •     Vue globale de la base



        = Netdrive

    •    Interface de gestion de fichiers distants
                          Logiciel très instable
                          Interprète les fichiers Php  inutilisable
                          Nécessité de renommer les fichiers *.php pour transférer
                          Met en péril la stabilité du reste du système




PRATLONG Léo – IRD Montpellier – 08/2007                                             29
                  INSTALLATION DE MDWEB 1.5

       = Inconvénients

   •    Peu de docs

   •    Documentation pour Windows mal adaptée à Linux

   •    Bugs importants

       = Problèmes techniques

   •    Réseau

   •    Outils
                  Accès limité
                  Peu ergonomique




PRATLONG Léo – IRD Montpellier – 08/2007                 30
            INSTALLATION DE MDWEB 1.5 : problèmes

        = Serveur Cartographique

    •    Nombreuses erreurs (mapscript.so, fichiers introuvables, …)

    •    Bug persistant : impossibilité de modification du style des shapes

    •    Conséquences : installation très longue

    •    Aucune documentation spécifique pour Linux

        = Serveur Z3950

    •    Documentation inexistante

    •    Impossibilité d’exécuter la GUI d’installation  installation impossible

    •    Impossibilité de correction du code

    • Messages d’erreur peu explicites et illogiques
PRATLONG Léo – IRD Montpellier – 08/2007                                            31
                          INTEROPERABILITE




PRATLONG Léo – IRD Montpellier – 08/2007     32
                                 INTEROPERABILITE

       = Z3950 : résultats

       •    Z3950 entre Mdweb et Géonetwork et entre Mdweb et Mdweb

       •    Communication active entre un serveur et un client

       •    Reçoit la réponse

       •     Ne parvient pas à interpréter et afficher la fiche

       • NB : fonctionne de manière opérationnelle sur d’autres serveurs Unix
       (MTD)

       = Conclusion

   •       Presque opérationnel

   •       Installation peu facile

PRATLONG Léo – IRD Montpellier – 08/2007                                        33
                               INTEROPERABILITE

       = CSW

       • Testé : CSW entre MDweb et Géonetwork

       • Implémentation du CSW nécessaire (version 1.6 encore instable,
       donc ici, Mdweb 1.5 enrichi du CSW)

       •    Reçoit les métadonnées

       •    Géonetwork renvoie du DublinCore : Mdweb ne l’interprète pas

       •    Pas d’ouverture de port

       = Conclusion

   •       Opérationnel

   •       Technologie actuelle encore non adaptée (donc incompatibilité)

PRATLONG Léo – IRD Montpellier – 08/2007                                    34
                               LIVRABLES


     = Documentation pour l’installation de Mdweb 1.5 sur serveur
    Linux CentOS


     = Installation de Mdweb1.5 sur serveur Linux CentOs


     = Documentation sur l’utilisation de MDweb


     = Documentation sur les thesauri


     = Thesauri




PRATLONG Léo – IRD Montpellier – 08/2007                            35
                            CONCLUSION



     = Mdweb : beaucoup de fonctionnalités, mais peu opérationnel



     = Interopérabilité possible : mieux vaut préférer le CSW



     = Installation de Mdweb sur serveur Linux peu pratique


     = Outil peu concurrentiel face à Geonetwork




PRATLONG Léo – IRD Montpellier – 08/2007                            36
                             PERSPECTIVES




     = Mdweb 2.0 : version Java avec installation facilitée et CSW




     = Standardisation du CSW aux autres outils




PRATLONG Léo – IRD Montpellier – 08/2007                             37

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:6
posted:2/25/2012
language:
pages:37