Tableau comparatif des principales solutions logicielles d by Gpk21O

VIEWS: 0 PAGES: 6

									          Tableau comparatif des principales plate-formes logicielles d’Archives Ouvertes utilisées en France

Nom                CASTORE                    Eprints                      Dspace                         HAL
Développé par      Ecole des Mines de         Université de                Hewlett-Packard et le MIT      CCSD (Centre pour la
                   Nantes,                    Southampton, UK.                                            Communication
                   IRISA (INRIA Rennes),      (School of Electronics and                                  Scientifique directe) -
                   XEROX                      Computer Science)                                           CNRS

Licence            Version 1.1.4 (mars 06)    Open-source : licence        Open-source : licence          Pas encore Open source
                   Open source licence        GNU/GPL                      Berkeley standard              (prévu pour 2007)
                   CeCILL compatible GPL                                   distribution (BSD)

Configuration         Unix, Solaris, Mac        GNU/Linux, Unix,            Unix/Windows/ Mac          Navigateur Web (tout est
requise                OSX. Windows.              Solaris, Mac OSX.            OSX                        hébergé au CCSD)
                      Architecture à             (Aucune prévision de        Langage java
                       composants J2EE            le faire fonctionner        BDD Oracle,
                       (Servlet Java /JSP)        sous Microsoft               PostgreSQL
                      Langages Java et           Windows.)                   Serveur Web
                       AspectJ                   Apache (avec                 indifférent
                      Base de données : la       mod_perl)                   Tous clients supportés
                       plupart : MySQL,          BDD MySQL3
                       Oracle, PostGreSQL,       Langage Perl


Dépôt :
Types              Possibilité de définir     3 niveaux :                     Administrateur             Auteur (autoarchivage)
d’utilisateurs     différents types d’accès    administrateur (editor)       Public                     Laboratoires
                   aux documents par           utilisateurs (author)         Utilisateurs               Public
                   groupe d’utilisateurs.      public (researcher)            enregistrés sur
                                                                               l’archive qui selon leur
                   Rôle                                                        appartenance à un
                   utilisateurs                                                groupe pourront être
                   superviseurs ou tuteurs                                     associés à une étape
                   documentalistes,                                            de validation ou non à
                   administrateurs                                             l’intérieur d’une
                                                                               collection donnée

Authentification   Basé sur LDAP                 LDAP                     E-mail x509                    LDAP
                   Login + password              login + password         Plusieurs méthodes             Login + Password
                                                                           d'authentification :
                                                                            reconnaissance par
                                                                                adresse IP et/ou
                                                                            login + mot de passe
                                                                           en fonction des
                                                                           droits octroyés aux
                                                                           utilisateurs
Formats des        Html, htm, doc, txt, sxw   html, pdf, ASCII, ps,        DSpace accepte les             .rtf, .tex etc. Le dépôt des
documents                                     image de couverture, .zip,   principaux formats des         fichiers sources est
                                              .tar.gz, autre               éditeurs de documents          encouragé en plus des
                                                                           mais dans un but de            principaux formats des
                                                                           conservation des               éditeurs.
                                                                           documents établit une
                                                                           distinction entre les
                                                                           formats « supported »,
                                                                           « known » et
                                                                           « unsupported » qui
                                                                           dépendent de la capacité
                                                                           de l’institution dépositaire
                                                                           à connaître et maîtriser
                                                                           un format en vue de la
                                                                           conservation des
                                                                           documents.
Feuille de style   OUI 2 modèles élève et     Non                          Non                            Non
requise            séminaires ACM




3d076d8d-f908-4fa8-b42e-c0e110e4e1aa.doc                                                                                         1/6
Nom                  CASTORE                        Eprints                          Dspace                        HAL
Validation           Workflow : plusieurs           Workflow : chaque                workflow en trois étapes      Workflow possible
                     étapes de validation           document déposé passe            maximum :                     Tampon administratif
                     paramétrables par un           dans la zone de                      o Acceptation du          (pour valider le document)
                     utilisateur ou un groupe,      soumission où il peut être               fichier soumis
                     pour valider le contenu,       lu, édité, accepté ou                o Edition des
                     les métadonnées, la            rejeté par l’administrateur.             métadonnées
                                                                                                         1
                     classification ou les droits                                        o Validation.
                     de diffusion

Versions                  Possibilité de                possibilité en             Oui. Pas de possibilité de    Oui, Pas de possibilité de
successives                supprimer un                   consultation de passer     supprimer un document         supprimer un document,
                           document                       d'une version à une        mais de le déplacer et        mais possibilité de
                          Possibilité de passer          autre d'un pre-print ou    cacher pour la recherche      déposer une nouvelle
                           d’une version à une            post-print facilement.                                   version.
                           autre                         possibilité de
                                                          supprimer un
                                                          document et de copier
                                                          un eprint pour faciliter
                                                          l'archivage d'une
                                                          nouvelle version
                                                          (utiliser un eprint
                                                          comme modèle pour
                                                          autres eprints (use as
                                                          template)).

Métadonnées               DublinCore                    DublinCore                 Dublin Core qualifié          Dublin Core qualifié
                          Transformation des            ajouts d'autres            + métadonnées sur             Métadonnées variables
                           documents en XML               métadonnées possible       communities et                au-delà de la DTD
                           sur toute la chaîne                                       collections                   minimale.
                          ajouts d'autres                                           + métadonnées
                           métadonnées possible                                      administratives
                                                                                     + possibilité d’ajout de
                                                                                                    2
                                                                                     métadonnées
Interopérabilité /   OAI – PMH                      OAI-PMH                          OAI – PMH                     OAI (à 95%)
export des           Z 3950                                                          export au format METS         Interconnecté avec des
métadonnées                                                                          en cours de                   systèmes de référence :
                                                                                     développement.                ArXiv en physique, maths,
                                                                                                                   biologie etc.
                                                                                                                   Pubmed Central en
                                                                                                                   médecine et biologie
Interface            Oui (XML + CSS)                Oui (programmation Perl)         Oui (programmation            Oui
                                                                                           3
personnalisable                                                                      java)
Multilinguisme       Oui                            Oui                              Non (quelques                 Version anglaise
                                                                                     traductions au niveau de
                                                                                     l’interface de recherche
                                                                                                4
                                                                                     avancée)
Ajout de             Déposer un avis                oui : information                non                           Possibilité de déposer
commentaires         Consulter les avis             additionnelle pour la                                          des documents annexes
                     déposés sur le document        consultation et                                                (pour faciliter la lecture,
                                                    commentaire pour le                                            ex. soutenance de thèse)
                                                    modérateur

Droits de            L’auteur a le choix :          L’utilisateur qui soumet un      Pas de définition des         La date de dépôt a une
diffusion             - céder ses droits à          document accepte la              droits associés au dépôt :    valeur légale.
                        l’EMN l’Ecole des           politique et les                 chaque institution doit       L'envoi d'un document sur ce
                                                                                                                   serveur est assimilable à la
                        mines de Nantes             responsabilités définies         définir sa politique et ses
                                                                                                                   présentation de résultats
                      - Licence libre (libre        par l’institution.               responsabilités dans          scientifiques dans une
                        accès à ses                                                  l’archivage des               conférence : les travaux sont
                        documents)                                                   documents                     divulgués publiquement ce
                      - Aucun droit pour                                                                           qui peut, compte tenu des
                        limiter la diffusion                                                                       réglementations
                                                                                                                   européennes, empêcher
                                                                                                                   dans certains cas le dépôt
                                                                                                                   d'un brevet.5




3d076d8d-f908-4fa8-b42e-c0e110e4e1aa.doc                                                                                                   2/6
Consultation
Nom                 CASTORE                      Eprints                       Dspace                           HAL
Indexation par      Oui (Google)                 Oui (Google)                  Oui (Google)                     Oui (Google)
moteurs de
recherche
Recherche              Plein texte et sur          Recherche simple ou          utilise le moteur de         Recherche simple, ou
                        index (titre, auteur,        avancée. Champs de            recherche lucène             avancée.
                        mots clés)                   recherche modifiables         (fondation Apache)           Recherche dans
                       Recherche Simple et          par l’administrateur          basé sur XML.                l’ensemble des
                        Avancée                     recherche dans             3 types de                     métadonnées
                       Moteur de recherche :        métadonnées et plein          recherches : simple,         Extraction par croisement
                        Lucène sur document          texte                         avancée, par index.          de plusieurs champs.
                        XML                                                        Recherche plein texte        Pas de recherche plein
                                                                                             6
                                                                                   possible                     texte.
Tri des résultats   Oui par défaut, le nombre    Oui, par titre, auteur ou     Le tri est basique ordre         Tri paramétrable
                    d’occurrences des mots       année (ordre croissant ou     décroissant ou croissant
                    composant la requête         décroissant).                 pour les dates.
                    (Métadonnées et plein
                    texte)
Format de           Pdf, html                    pdf, html                     pdf                              Pdf
consultation
Services               Workflow élaboré            possibilité d'ajout de         Workflow : Chaque               Nouveaux articles du
                       Outil de travail             fonctionnalités en              étape de validation fait         jour par flux RSS
                        collaboratif (mes            programmant.                    l’objet d’une                   Workflow (basique)
                        documents, mes              Possibilité de gérer et         information auprès de           Extraction
                        collections, mes             modifier les sujets             celui qui soumet le              automatique de listes
                        groupes)                     organisés en                    document.                        de documents en
                       Modèle utilisateur           arborescence à partir          système d’alerte sur             texte intégral (listes de
                        auteur ; gestion de sa       de l’interface web              toutes les nouveautés            publication avec liens
                        propre production et        système d’alerte sur            pour une ou plusieurs            vers le texte intégral)
                        de ses groupes               les nouveautés selon            collections données             Extraction
                                                     critères spécifiés                                               automatique de listes
                                                                                                                      de publication au
                                                                                                                      format souhaité selon
                                                                                                                      les métadonnées
                                                                                                                      choisies.
                                                                                                                     Import automatique de
                                                                                                                      listes de publications
                                                                                                                     Alertes automatiques
                                                                                                                     Zone cachée pour les
                                                                                                                      documents
                                                                                                                      confidentiels.
                                                                                                                     Compilation
                                                                                                                      Tex/LaTeX
                                                                                                                     Transfert automatique
                                                                                                                      des documents sur
                                                                                                                      ArXiV pour certaines
                                                                                                                      disciplines
                                                                                                                     Possibilité de créer un
                                                                                                                      environnement
                                                                                                                      « colloque »




3d076d8d-f908-4fa8-b42e-c0e110e4e1aa.doc                                                                                                  3/6
Maintenance
Nom              CASTORE                        Eprints                        Dspace                         HAL
Support           Pas de maintenance,           Eprints Services              Pas de maintenance           ManuHal
technique          ni de service attribué          propose des services           ni de service attribué.     2 contacts (méls) en cas
                  Modèle contribution             payants de conseils,         La liste de diffusion et     de problème de dépôt.
                   de l’Open source avec           aide, installation,            le club des utilisateurs
                   possibilité d’aide des          formation.                     français semblent
                                                 Listes de discussions
                                                                                                    7
                   porteurs du projet                                             assez peu actifs .
                   (Ecole des Mines de             d'utilisateurs pour          3 listes en anglais
                   Nantes)                         questions techniques           (general, technology
                                                                                  et developper)
                                                                                  beaucoup plus actives
                                                                                            8
                                                                                  et un wiki .
Sauvegarde       Robot de sauvegarde ?          Robot de sauvegarde à          Robot de sauvegarde à          Sauvegarde gérée par le
                                                mettre en place                mettre en place                CCSD

Pérennité        Oui, Chaîne de traitement      Problème de pérennité          Problème de pérennité si       Oui, le dépôt du code
                 en XML, format pérenne         car le format source n'est     le source n'est pas exigé      source du document est
                                                pas exigé                      MAIS permet de réfléchir       fortement encouragé.
                                                                               à une stratégie                Lorsqu’une version est
                                                                               d'archivage sur le long        obsolète, le CCSD peut
                                                                               terme : classement des         générer une nouvelle
                                                                               documents en 3                 version pdf à partir du
                                                                               catégories.                    code par exemple.
                                                                               L'identification des           Le CCSD s’engage à
                                                                               formats de fichiers aide       assurer la pérennité des
                                                                               les administrateurs dans       documents (mission
                                                                               leur stratégie de              première)
                                                                               préservation numérique
                                                                               (opération de migration
                                                                               quand un format devient
                                                                               obsolète)


Mise en oeuvre
Moyens humains      1/2 documentalistes           documentaliste                documentaliste                Documentaliste
                    1 administrateur J2EE         1 administrateur Unix /       1 administrateur Unix /       1 juriste
                    programmeur JAVA              programmeur Perl              programmeur Java              1 informaticien
                    groupes de travail            groupes de travail            groupes de travail            Groupes de travail
                     pour le début du projet        pour le début du projet        pour le début du projet        pour le début du projet
                     : plusieurs                    : plusieurs                    : plusieurs
                     documentalistes, 1             documentalistes, 1             documentalistes, 1
                     juriste, 1 informaticien       juriste, 1 informaticien       juriste, 1 informaticien


Moyens              1 serveur Unix ou             1 serveur Unix ou             1 serveur Unix ou          Aucun (tout est hébergé
techniques           Windows ou Mac OSX             Windows ou Mac OSX             Windows ou Mac OSX         au CCSD)
                    1 version Linux               1 version Linux               1 version Linux
                     Entreprise                     Entreprise                     Entreprise
                    1 disque dur                  1 disque dur                  1 disque dur
                    1 serveur pour                1 serveur pour                1 serveur pour
                     l'archivage des                l'archivage des                l'archivage des
                     documents                      documents                      documents
                    RAM > 1 Go, espace
                     disque

Coût             Exemple devis : ? pas à        Exemple devis :                Exemple devis :                Aucun coût
d’installation   jour                            1 serveur Xeon avec           1 serveur Xeon avec
                  1 serveur Xeon avec             onduleur 980 W :               onduleur 980 W :
                     onduleur 980 W :              7000 euros                     7000 euros
                     7000 euros                  1 disque dur : 420            1 disque dur : 420
                  1 disque dur : 420              euros                          euros
                     euros                       facultatif : 1 version        facultatif : 1 version
                 facultatif : 1 version Linux      Linux avec 3 ans de            Linux avec 3 ans de
                 avec 3 ans de mise à jour         mise à jour : 700+ 500         mise à jour : 700+ 500
                 : 700+ 500 euros                  euros                          euros



3d076d8d-f908-4fa8-b42e-c0e110e4e1aa.doc                                                                                            4/6
Bilan
Nom             CASTORE                  E-Prints                   DSpace                       HAL
Avantages        Interface et            Plate-forme               offre des solutions         Outil recommandé par le Ministère
                  fonctionnalités           logicielle standard       d'archivage à long          Hébergement et maintenance pris en
                  évoluées                  la plus utilisée en       terme assez                    charge par le CCSD
                 Worflow evolué            France pour la            intéressantes, avec         Politique de pérennité du document
                 Pérennité des             création                  une perspective très           grâce au dépôt du source.
                  documents                 d'Archives                intéressante                Extraction automatique de listes de
                  archivés                  institutionnelles         d'exporter les                 publications au format souhaité
                 OAI – PMH, Z            Nombreux                   métadonnées sous            Système d’alerte automatique
                  3950                      services possibles        le format METS (en          Instance institutionnelle entièrement
                 Gestion des               (si                       cours de                       personnalisable (charte graphique,
                  accès aux                 programmation)            développement).                paramétrage des métadonnées,
                  documents en            a servi de base           Plusieurs méthodes             onglets…)
                  fonction des              pour le                   d'authentification          Pas de coûts techniques
                  groupes                   développement             des utilisateurs            Gestion des documents relatifs à un
                  d’utilisateurs            de HAL                    possibles                      congrès
                 Outils collaboratifs                                                            Transfert automatique dans ArXiV
                  élaborés                                                                           pour certaines disciplines
                 Produit Open                                                                    Zone cachée accessible par mot de
                  Source Portable                                                                    passe pour certains documents
                  sur des                                                                            confidentiels : visibilité totale pour le
                  plateformes                                                                        Directeur de laboratoire
                  variées, avec un                                                                Concilie les avantages d’une archive
                  socle de                                                                           thématique et d’une archive
                  technologie,                                                                       institutionnelle pour une meilleure
                  intégration dans                                                                   visibilité
                  ENT                                                                             Mise en place d’un tampon
                                                                                                     administratif : workflow basique et
                                                                                                     labellisation.
Inconvénients      Produit en cours        Problème lié à         semble offrir moins de       Produit estampillé CNRS (en cours de
                    d’évolution (qq          l'archivage à long     fonctionnalités et de        modification car accord avec les EPST
                    bugs encore)             terme (pérennité)      services que HAL.            et les universités le 6 sept. 2005)
                   Contraintes liées       Version par défaut
                    à la feuille de          basique donc
                    style                    nombreux
                   Formats de               développements à
                    dépôts restreints        effectuer en PERL
                   Développement            pour élargir les
                    en J2EE / Java           services offerts.

Exemples        EM Nantes                   Ens LSH :                 Maison des
                                             http://eprints.ens-        Sciences de
                SCD Nantes                   lsh.fr/                    l’Homme – Alpes :
                http://www.bu.univ-         Université Lyon2 :         https://dspace.msh-
                nantes.fr                    http://eprints.univ-       alpes.prd.fr/index.js
                                             lyon2.fr/                  p
                UVPL                        Université Louis          l’édition électronique
                http://www.uvpl.org/         Pasteur                    de l’INIST :
                                             Strasbourg :               http://documents.ire
                                             http://eprints-scd-        vues.inist.fr/
                                             ulp.u-
                                             strasbg.fr:8080/




3d076d8d-f908-4fa8-b42e-c0e110e4e1aa.doc                                                                                                 5/6
1
  Le workflow est lié à la collection (un item fait partie d’une collection). Chaque collection est associée à
un groupe (e-person) pour effectuer chaque étape. Le workflow correspond aux étapes de validation en
vigueur au MIT et à l’architecture la plus simple possible.
2
  Ajout de plusieurs qualificatifs au niveau des DC contributor, date, identifier, description, format, relation
(vraisemblablement pour mieux gérer les différentes versions d’un même document) et right.
Les « communities » et « collections » sur lesquelles est organisé l’archivage des items comprennent des
métadonnées très simples (nom, ID, description, introduction, logo, copyright…
En plus de ces métadonnées descriptives, un contenu archivé dans une application Dspace comprend des
métadonnées administratives (métadonnées d’archivage, de provenance et des droits de consultation). En
plus d’être incluses dans le système de gestion de la BDD (DBMS) ces métadonnées sont également
présentes ou copiées dans les métadonnées Dublin Core de façon à pouvoir être récupérées en dehors de
l’application. Enfin, les items comprennent des métadonnées structurelles pour leur mise en forme et les
relations existant entre leurs différentes composantes.
3
 les affichages simples comme l’intitulé des métadonnées des items ou des collections passent par des
modifications plus simples.
4
 Le logiciel est disponible uniquement en anglais en attendant la traduction de l’INIST. Toutefois
« erudit » a pu intégrer des traductions au niveau de l’interface de recherche avancée.
5
 La mise à disposition gratuite en ligne des documents est destinée à la meilleure diffusion des travaux de
recherche, mais leur propriété intellectuelle reste entièrement celle du ou des auteurs. Les utilisateurs
sont donc soumis aux règles du bon usage habituelles, comme pour les publications sur papier : respect
des travaux originaux, citation dans des travaux antérieurs, interdiction du pillage intellectuel, etc.
6
 Il est possible d’ajouter des index.
Au niveau du moteur de recherche, on peut préciser :
    o la possibilité de limiter la recherche par communauté/collection
    o liste de mots vides (en anglais par défaut)
    o troncature *
    o utilisation des booléens and, or, not
    o la recherche d’une phrase précise (utilisation des guillemets)
    o système de troncature automatique pour les formes plurielles, féminisées ou conjuguées
    o attention un problème de recherche sur les caractères accentués (la saisie des accents est
        obligatoire).
7
  la liste de diffusion française compte 35 personnes et le dernier message posté date de décembre 2005
(http://www.services.cnrs.fr/wws/info/dspace-fr dernière consultation le 1er mars 2006).
8
    http://wiki.dspace.org/ dernière consultation le 1er mars 2006




3d076d8d-f908-4fa8-b42e-c0e110e4e1aa.doc                                                                    6/6

								
To top