Docstoc

ged

Document Sample
ged Powered By Docstoc
					Gestion Electronique de Documents

                ou

              GED




            Luc Quoniam             1
                                    Un constat
• Quand il s'agit de gérer des données numériques et quelques lignes de texte: les
  Systèmes de Gestion de Bases de Données (SGBD) sont satisfaisants.
• Ils ne suffisent plus quand il s'agit de mettre en œuvre une gestion dynamique des
  documents contenant du texte, des illustrations, voire du son et de l'image.




• Pour répondre à ces exigences, ont été conçues des bases de données documentaires
  sur lesquelles de puissants outils sont greffés.
• Ces outils permettent une augmentation de la productivité et une rationalisation des
  tâches au sein de l'entreprise. La GED s'inscrit dans cette voie.

                                      Luc Quoniam                                        2
                                     Documents:
• Renseignement écrit ou objet servant de preuve, d'information ou de témoignage.
  Document statistique, photographique.
  Ensemble d’objets à usage social de communication professionnelle ou non…
• Objets qui jouent un rôle de médiateur, entre les hommes, dans le temps et l’espace.
• Moyens de communication de la pensée, connaissance, information et savoir
• Se présentent sous la forme de textes, tableaux, dessins, photos…
• Ce sont des objets très riches avec forme (structure) et fond (contenu) très codifiés:
    – Règles de rédaction, de mise en page, de typographie …




                                       Luc Quoniam                                         3
                              Documents électroniques
• Ensemble cohérents d’objets (textes, graphisme, vidéo, son) numériques
  (informatiques) stockés sur des machines informatiques connectées, transportables
  et de grandes capacités. Ces objets incorporent de nouvelles fonctionnalités:
    –   nouvelles expressions (sonores, visuelles) et nouvelles façons de les manipuler ou lire.
    –   Hypertexte:              contenu homogène seulement textuel
    –   Hyperdocument:           contenu hétérogène
    –   Multi- ou hypermedia: supports différents et multiples média
• Les documents sont des réceptacles où l ’information est présentée de façon
  granulaire: Nœuds reliés par des liens ou passerelles sémantiques. Ces liens
  permettent de passer d’un nœud à un autre pour accéder à de nouvelles informations.
    –   Lecture                 non-linéaire         /      lecture traditionnelle
    –   Accès à l ’information par la navigation     /      requête de SGBD
    –   Documents sans fin ni début
    –   Problème de désorientation
• Devenir: l ’Expertexte: Le documents devient comparable à un programme:
    – assure la cohérence de ses contenus, prend des décisions, suggère au lecteur.
    – Ex: Doc. Technique qui guiderait un technicien dans sa tâche de maintenance

                                           Luc Quoniam                                             4
             Le document électronique = pivot de la GED
• Le document électronique est
    – un lieu de composition et d ’assemblage de fragments documentaires divers
    – une plate-forme à partir de laquelle peuvent être dérivés de nombreux supports matériels.


         Texte                                                             CD-ROM

         Données
                                                                           Papier
         Son

         Images                                                            Ecran

         Expertise

      Composants                   Document électronique                   Support
                                         Luc Quoniam                                          5
                        Document = Contenu + Structure
• Les Techniques de la GED ont rendu possible la séparation
    – du message (contenu)
    – de sa présentation matérielle (structure)
• Cette séparation permet à la GED de:
    – Faciliter accès et diffusion:
         • Quasi instantanés via les réseaux de télécommunication
         • D ’un coût très faible avec les CD-ROM
    – Transformer un document d ’un format à un autre
    – Définir des documents normalisés
    – Diffuser puis produire:
         • Plus rentable parfois de diffuser (réseau) un document et de le produire localement (Journaux)
    – Produire à partir d ’un format initial des documents multi-supports
    – De créer des documents multimédia interactifs




                                             Luc Quoniam                                                    6
                  Document = Contenus et leurs codages
• Objets documentaires de base: texte, graphisme son image fixe et animée.
    – Chacun de ces objets est codé selon une technique particulière.
    – La technique de codage des caractères est différente de celle des images ou du son.
    – Ces techniques de codages rendent compréhensibles ces données par l ’ordinateur.
    – La forme du codage permet de déterminer la nature de l ’objet.

• Ces codages sont appelés techniques de représentation de contenus
• Il est par contre très difficile de déterminer la sémantique (sens) d ’un contenu
• Pour chaque objet, il existe de très nombreuses normes et standards.




                                         Luc Quoniam                                        7
                                           Définitions
• Gestion de Documents Electroniques / Gestion Electronique de Documents
    – 1er: gère les documents si ils sont électroniques: restrictif
    – 2nd: gère des documents de toute nature (le papier aussi) par des moyens électroniques
• La GED est l ’ensemble des techniques permettant d ’organiser, gérer et distribuer
  des informations documentaires sous forme électronique. (APROGED)
• La production d’un document s’effectue par étapes successives mettant en jeu des
  processus pour travailler:
    – soit sur le message véhiculé par le document
        • Processus rédactionnel qui concerne le recueil et la validation de l ’information.
        • Il dépend de la nature de l ’information traitée: recherche, sélection et vérification de
          l ’information, indexation, veille...
    – soit sur le document lui-même.
        • Processus éditorial de mise en forme du message et de production industrielle des
          documents.
        • Acquisition des documents, structuration, indexation et archivage, production et diffusion de
          l ’information.
• Les techniques de la GED s’intéressent plus au deuxième processus

                                              Luc Quoniam                                                 8
              GED et systèmes documentaires
• Fonctions de documentation par archivage et diffusion de l ’information:
     – bibliothèques, banques de données, serveurs Web…

• Trois grandes classes:
     – Banques de données textuelles (ou de données primaires) : texte intégral

     – Banques de données bibliographiques (ou secondaires) : références des
        documents

     – Banques d ’images : images électroniques de documents de toutes sortes



     – INIST, QUESTEL




                                Luc Quoniam                                       9
GED et Systèmes d ’Informations Géographiques (SIG)
 • S ’intéressent à des documents de type cartes géographiques ou plans où se
    mélangent un fond de carte et des informations de type socio-économiques.
      – Par exemple couplage d ’un fond de cartes de la France avec données sur le
         tracé des lignes haute tension de l ’EDF.

      – Intéressent Administrations, Collectivités locales (recensement, POS,
         urbanisme) ou entreprises (Géo-marketing)

 • Les deux aspects essentiels des SIG:
      – réalisation et mise à jour des cartes et représentations des données

      – Exploitation par l ’utilisateur: analyse, représentation des cartes sur le papier...




                                    Luc Quoniam                                                10
             GED et Documentation Technique
• La documentation technique comprend l ’ensemble des documents nécessaires
  à la vie d ’un produit industriel (pas seulement sa commercialisation.)
    – Les documents fixant les relations fournisseurs / clients peuvent être inclus.
    – La M.A.J. de cette Doc technique est essentielle à la vie de l ’entreprise.
         • La masse de la Doc. Technique d ’un avion est > masse de l ’avion
           représente 1/15 du prix!!!
         • Machine à laver = 1/100 du prix de la machine
         • A.M.M. des médicaments: 600.000 pages !!!
• Deux sous ensembles de la Doc. Technique:
    – Documentation interne qui supporte et accompagne la conception et la
      fabrication du produit (spécifications, plans, nomenclatures…)
    – Documentation externe destinée au client du produit
         • description, procédures de dépannage ou d ’entretien, formation (tutoriels), manuel de
           référence
         • doit répondre à des critères de lisibilité, synthèse, mise à jour. Doit être traduite et
           comporte des clauses contractuelles




                                    Luc Quoniam                                                  11
                   Doc. Technique et ISO 9000
• L ’ISO (International Standard Organization) a établi en 1987 des normes de
  gestion et d ’assurance qualité: la norme ISO 9000.
    – Sert à fournir les éléments pour bâtir des relations précises entre clients et
      fournisseurs.
    – Est le standard de qualité pour tous les appels d ’offres publics et privés.
• Les documents jouent un rôle très important dans
    – le processus de production et de maintenance (Doc. Technique)
    – la commercialisation (documents publicitaires).

    – 80% des informations nécessaires à une entreprise sont contenues dans des
      documents
    – Echecs, surcoûts, délais non respectés… sont souvent imputés
      à de la documentation mal conçue, mal gérée, non mise à jour.


• ISO 9000 met en avant la Doc des Processus et des produits industriels
• Importance stratégique de la GED qui apporte ses méthodes, outils,
  automatismes

                                   Luc Quoniam                                         12
                              Normes versus Standards
• La Norme est édictée par un organisme de normalisation avec les professionnels
    – définie clairement dans des documents publics
    – Des fois lourde et difficile à mettre en œuvre car résultat de discussions et de compromis
• Standard ou format propriétaire est défini par un industriel.
    – Définition non publique pour garder une avance technologique
    – L ’industriel est libre de faire évoluer sans garantie de compatibilité.
    – Un standard peut devenir une norme (Java)



• Un projet de GED est un travail très important et coûteux or les techniques évoluent
                       rapidement et des produits disparaissent
    – Il est donc important de se servir de normes édictées par des organismes indépendants
    – ISO (International Standard Organization) dépend de l ’ONU
         • A défini l ’OSI (Open System Interconnection)
    – ANSI (American National Standards Institute)
    – CCITT (Comité consultatif International Téléphonique et télégraphique)
         • Absorbé par l ’ITU (International Telecommunication Union) depuis 1992
    – AFNOR (Association Française de NORmalisation) www.afnor.fr
                                           Luc Quoniam                                         13
                     Normes de codages des caractères
     Correspondance bi-univoque Caractère ↔ information textuelle
                              n bits ¥ 2n informations

• 7 bits
    – ASCII                  128 caractères (sans accentués) ISO Recommandé par le CCITT
      étendu par la suite à 8 bits.
    – CMC7 (Caractères Magnétiques Codés à 7 éléments) Norme Européenne.
      7 barres donc 6 intervalles donnant 64 caractères différents
• 8 bits
    – Iso Latin-1 256 caractères (alphabets européens) ISO
• 16 bits
    – UNICODE 65536 caractères (cyrilliques, asiatiques, africains…) 1989
      (http://www.unicode.org)
• ASN.1 (Abstract Syntax Notation One)
  encodage des structures de données au niveau de la couche présentation de l ’ISO
                                        Luc Quoniam                                        14
                     Standards de codages des caractères
• EBCDIC                         IBM                   Code à 8 bits
  Extended Binary Coded Decimal Interchange
  MainFrames. Première distinction minuscule, majuscule.

• DIF                            US Navy               1983
  Documents Interchange Format


• RTF                            Microsoft             Format pivot Windows. Utilise ASN.1
  Rich Text Format
  aussi un format d ’image, d ’enrichissement et de structuration de textes




                                         Luc Quoniam                                    15
                        Normes de graphisme Vectoriel
 • Notation dans un repère Orthonormé à 2 ou 3 D
      –   les extrémités de chaque vecteur
      –   leurs caractéristiques (épaisseur,pointillés, couleurs…)
      –   Permet la construction de figures géométriques (Pt, lignes, polygones…)
      –   Des fonctions d ’interpolation entre les points permettent la construction de courbes

•CGM                      ISO 1989                + méthodes de compression
Computer Graphics Metafile
   Indépendant du matériel et de l ’OS. Retenu par US DOD
•PHIGS            ISO. 1990          Struct. Hiérar. des formes géom.
Programmer Hierarchical Interactive Graphics System
   Indépendant du matériel et de l ’OS
   Créer, visualiser et interagir avec des objets graphiques en 3D
•GKS               ISO 1985           API utilisable à partir de C, Fortran
Graphical Kernel System
    Image vectorielle 2D. Indépendant du matériel et de l ’OS
                                           Luc Quoniam                                            16
                          Standards de Graphisme vectoriel
•CDR                Corel Draw              Vectoriel 2D
Corel Draw Format

•DXF              AutoCad                   CAO dessin technique
Drawing Exchange Format

•GEM              Digital Research

•HPGL                                       format pour tables traçantes
Hewlet Packard Graphic Language

•EPS              Adobe, Aldus, Altsys      Vectoriel 2D-image Manipulation d ’objets
Encapsulated PostScript




                                         Luc Quoniam                                    17
          Normes de codages d ’images N&B ou Couleurs

         Une image est formée de millions de points élémentaires
                 formant des matrices de bits ou rasters
                          Noir et Blancs (0 ou 1)
                                    ou
                dégradés de gris, couleurs (8, 16, 24 bits)

• JPEG                                   CCITT & ISO
   Joint Photographic Expert Group

    – Consultation rapide pour les catalogues d ’images et les images haute définition
• TIFF                                   ANSI et ISO
   Tag Image File Format pensé par Aldus et Microsoft

    – Standard des scanners et des systèmes d ’archivage. X méthodes de compression: LZW…
• Télécopie Groupes 3 & 4 . CCITT. Codage de Huffman


                                           Luc Quoniam                                   18
        Standards de codages d ’images N&B ou Couleurs
• GIF                           Compuserve            Image 8 Bits RVB
  Graphics Interchange Format

• PNG                                                 Successeur du GIF
  Portable Network Graphics

• BMP                           Microsoft             Non compressé

• Photo-CD                      Kodak                 Format de stockage sur CD-ROM

• PICT                          Apple                 mixte vectoriel-image

• TCA                           Targa, Vista          trop propriétaire
  Targa File Format




                                        Luc Quoniam                               19
                                Normes Audio, Vidéos
• MIDI
  Musical Instrument Digital Interface

• MPEG              CCITT et ISO                Compression d ’images animées
  Motion Picture Expert Group

                    CD-ROM, CDI, HDTV, RTC…
• CCITT H320                                    Vidéo Conférence 64 Kb/s (Numéris)
• Codages Analogiques:
   – SECAM Séquentiel à mémoire
   – NTSC National Television Standard Commitee
   – PAL Phase Alternation Line extension de NTSC




                                         Luc Quoniam                                 20
                               Standards Audits, Vidéos
• Quick Time                  Apple

• Wav                         IBM & Microsoft, 1991      Audio File Format
  Waveform

• DVI                         Intel (1988) IBM
  Digital Video Interactive

• RTV
  Real Time Video

• DVI, AVK                    Windows                    API Fournie
  Audio Video Kernel




                                           Luc Quoniam                       21
                 Structuration de documents




 CALS: 1980 action pour une standardisation des formats
   d ’Acquisition, Stockage et échange de documents

     Computer aided Acquisition and Logistic Support

Military Handbook 1959 Package de base de l ’US DOD:
    IGES (PAO), SGML (Texte), Raster (Télécopie), CGM (images vectorielles)

        Computer Acquisition and Life Cycle Support




                              Luc Quoniam                                     22
                 Normes de structuration de documents
• Réponse de l ’ISO: Document Description and Processing Language
   http://www.ornl.gov/sgml/sc34/sc34home.htm                  SC34
    – SGML : Modèle générique de document à l ’aide d ’un langage déclaratif de balisage
       Standard Generalized Markup Language

    – ODA : pour échanger des documents formatés et retraitables
       Office Document Architecture

    – SPDL : pour échanger des documents en format final (imprimables)
       Standard Page Description Language

    – DSSSL : définir la forme et l ’aspect physique des feuilles de style
       Document Style Semantics and Specification Language

    – HYTIME et HYPERODA : Définition de liens et synchronisation des contenus hyper et
       multimédias



                                            Luc Quoniam                                    23
                                SGML (1986)
• Langage déclaratif de description de documents sous forme de balises
• Un Cours
  http://itrc.uwaterloo.ca/~engl210e/BookShelf/Tutorials/SGML/sgmlint.htm
• Un exemple de fichier       SGML

• Comment ça marche ?




                                   Luc Quoniam                              24
                                 SGML: Des outils
• Pour créer des document SGML

   – http://www.sgmltools.org/     Linux

   – http://www.jclark.com/sp/index.htm      MS-DOS

   – http://www.oasis-open.org/cover/publicSW.html#spFrontEnds   Windows




                                     Luc Quoniam                           25
                                    SGML critiques
• SGML est faible pour
• Liens
    – SGML a une infinité de moyens de lier des concepts. Aussi beaucoup de DTD sont
      spécifiques au niveau des liens. Le SGML a donc besoin de négociations complexes pour
      des connexions hasardeuses.
• Simplicité
• Portabilité
    – SGML a besoin avant tout d ’un DTD sinon il ne marche pas. SGML devient donc
      impraticable en réseau. Il n ’est donc bon que local.




                                         Luc Quoniam                                     26
                                            Hytime
• Hypermedia Time Based Document Structuring Language

• http://www.hytime.org/             Le site

• Extension du SGML
    – méta DTD reliant des DTD élémentaires
    – Prise en compte du facteur temps
        • durée de chaque événement et synchronisation en temps relatif.




                                           Luc Quoniam                     27
               Standards de structuration de documents
• HTML (1992) CERN, IBM, Microsoft, Netscape, Novell, SoftQuad, Spyglass, Sun
   – Hyper Text Markup Language
• XML Sun, Netscape, Microsoft, W3C, HP, NCSA, Fuji, Xerox, Adobe, SoftQuad
   – eXtensible Markup Language
• VRML http://www.vrml.org/about/members.html                 Les membres
   – Virtual Reality Modeling Language pour décrire des objets et mondes 3D interactifs
   – destiné à être utilisé sur Internet, il est un format universel d ’échange de graphiques 3D
     et multimedia intégré.
• PostScript Adobe
   – Description de pages indépendamment des équipements nécessaires
• PDF Adobe
   – Portable Document Format
   – Echange électronique de documents indépendant de la plate forme, des applicatifs.




                                         Luc Quoniam                                           28
                          HTML: un standard du SGML
• La syntaxe des documents HTML est définie par la combinaison de déclarations
  SGML et du « document type definition » (DTD).


• http://www.w3.org/MarkUp/                        Spécifications




• HTML a été le premier moyen de lier autant de ressources aussi facilement.
    – L ’intégration de la Radio et TV a permis de présenter pleins de ressources.
    – L ’ordinateur permet une forte intégration de ressources
        • mais était limité par la place et la compatibilité des plate formes.
    – HTML a permis aux ressources de dépasser la tyrannie de la place et de la distance.




                                              Luc Quoniam                                   29
                              HTML: Pour et contre
• Pour
   – Liens - les ressources sont liées, consultation par navigation
   – Simple - HTML est simple, rendant son apprentissage facile
   – Portable - HTML est dépouillé, le rendant portable, surtout sur les réseaux.
• Contre
   – Intelligence - l ’intelligence indique à quel point une ressource se connaît elle même.
   – Adaptation - Bien penser les changements.
   – Maintenance - faire attention aux ressources c ’est s ’occuper de leur maintenance.




                                         Luc Quoniam                                           30
                    XML: un standard du SGML 1996
• XML autorise la création de balises spécifiques pour des ressources spécifiques et
  les partager sur le réseau. Il a les vertus du SGML et du HTML sans les défauts.

• Intelligence, Adaptation, Maintenance, Liens, Simplicité, Portabilité

• Spécifications
     – http://www.oasis-open.org/cover/xml.html            Oasis



     – http://www.geocities.com/SiliconValley/Peaks/5957/xml.html   Géocities



     – http://www.w3.org/XML/           CERN




                                      Luc Quoniam                                      31
                    XML: Intelligence, Adaptation, Maintenance, Liens,
• XML est intelligent à n ’importe quel niveau de complexité.

• Langage intégrateur pour d ’autres langages, DickML ou JaneML sont possibles.
    – Les adaptations sont infinies. Plus de balises fixes.

• XML est facile à maintenir.
    – Seulement des balises et des ressources.
    – L ’apparence vient de feuilles de styles séparées et les liens sont séparés du document.
    – Chacun de ces aspects peut être maintenu séparément au grès des besoins.

• XML englobe toutes les façons de lier et lie comme HTML ne le peut pas.
         • HTML lie de façon unidirectionnelle dans ou à l ’extérieur d ’une ressources.
    – XML fait cela mais peut aussi:
         •   liens bidirectionnels et N à N (fenêtres et/ou sources multiples)
         •   Nomage dynamique, indépendant du lieu physique.
         •   Liens spécifiables et gérables indépendamment des documents sur lesquels ils s ’appliquent
         •   liens intra (transclusion): le document cible est un sous ensemble du document source
         •   attributs attachés aux liens


                                              Luc Quoniam                                                 32
                                   XML: Simplicité, Portabilité
• XML est simple
    – Les spécifications SGML font 300 pages, celles du XML 33.


•   XML est portable facilement.
    – Sa raison d existence est puissance et portabilité.
         •   SGML a la puissance
         •   HTML a la portabilité
         •   XML a les deux
         •   XML peut être vu avec ou sans son DTD, le rendant télédéchargeable plus vite .
         •   Tout ce dont un « browser » a besoin pour voir du XML c ’est la ressource et la feuille de style
             contrôlant sa présentation. Si une validation plus stricte est nécessaire, son DTD est là pour
             fournir les détails de toutes les balises




                                               Luc Quoniam                                                 33
                       XML: ressources sur le Net


• http://www.oasis-open.org/cover/publicSW.html#xmlTools       Oasis




• http://www.geocities.com/SiliconValley/Peaks/5957/xml.html      Geocities


• Microsoft Notepad pour XML            Notepad




• Télédécharger
• http://www.microsoft.com/xml/notepad/intro.asp           Microsoft




                                   Luc Quoniam                                34
                          XML vu par ses créateurs
• 1. XML shall be straightforwardly usable over the Internet. XML should be easy for
 current Web users to use. It's designed to use proven methods and require little
 retooling to make it a vital part of the Web. Adoption is intended to be as painless as
 possible.
• 2. XML shall support a wide variety of applications. HTML's reach is widespread. It's
 independent of any hardware or software. People with different platforms can access
 the same HTML without much trouble. Hundreds of programs access HTML easily
 for viewing or editing. XML must support a similar or greater range of uses and
 programs to be successful.
• 3. XML shall be compatible with SGML. Vast libraries of SGML exist. They must
 have their road to the future open. XML must also reach back to embrace them. Users
 of XML and SGML shouldn't have to spend a lot of time making the two work
 together.
                                      Luc Quoniam                                          35
                            XML vu par ses créateurs
• 4. It should be easy to write programs which process XML
   documents. If you don't build it, they won't come. Why some some platforms win
   and others don't is the amount of software written for them. The test of a computer's
   usefulness is how much you can do with it. This applies to XML too. If nothing uses
   it, it dies. Making it as painless as possible for programs to use it is in the best
   interests of those who want XML to fly.


• 5. The number of optional features in XML is to be kept to the absolute minimum,
   ideally zero. SGML is choking with optional features, most of which the public
   won't need or want. XML's job is to compose and deliver thought in as efficient
   manner as possible. Optional overhead is only needed by a very few. They can still
   get their jollies off that while the rest of us use thought in a useful way.



                                         Luc Quoniam                                      36
                          XML vu par ses créateurs
• 6. XML documents should be human-legible and reasonably clear. Interesting idea.
  You should be able to read over a raw XML document and understand it. It may
  even be easier than normal English. "Jack and Jill went up the hill.", marked up as
  <NAME> Jack </NAME> and <NAME> Jill </NAME> went <DIRECTION> up
  </DIRECTION> the <GEOLOGIC_FORMATION> hill.
  </GEOLOGIC_FORMATION> may be even more self-explanatory than its
  unmarked form.


• 7. The XML design should be prepared quickly. The makers of XML want it out of
  the kitchen and into the fire. The first specification is already out.


• 8. The design of XML shall be formal and concise. Instead of often obscure markup
  like <P>, <VLINK=00ff>, or <TR>, XML is spelled out. <P> would be
  <PARAGRAPH>. <VLINK=00ff> would be <VISITEDLINK=00ff>. <TR> would
  be <TABLEROW>. This makes XML easier to understand and compose.
                                     Luc Quoniam                                    37
                        XML vu par ses créateurs
• 9. XML documents shall be easy to create. XML documents are easy. If you can
  type <, >, and /, and remember that for every opening <MARKUP> there needs to
  be a closing </MARKUP> you can write "well-formed" XML. Complex or "valid"
  XML is more difficult but not overwhelmingly so.


• 10. Terseness in XML markup is of minimal importance. HTML has a lot of
  shortened markup. The meaning of <IMG SRC> may be recognizable but if it's
  spelled out as <IMAGE SOURCE> it's even clearer. XML seeks to make its markup
  clear, as opposed to short, across the board.


• This is the vision of XML. XML won't just supplement the Web. It
  will be the Web. This vision will happen. Visions often die when they
  try to be all things to all people. XML won't. Its job is allowing
  visions to be all things to all people.
                                   Luc Quoniam                                    38
                        PDF: un standard d ’ADOBE
• Portable Document Format
   – développé pour faciliter le transfert des documents d’une plate- forme vers l’autre.

   – PDF est un format de fichier utilisé pour représenter un document indépendamment de
      l’environnement (logiciel d’application, matériel et système d’exploitation) dans lequel il
      a été créé.

• Manuel Portable Document Format Reference Manual (ISBN 0- 201- 62628- 4)




                                         Luc Quoniam                                           39
                               PDF: Caractéristiques
• • Le format PDF représente le texte et les images en utilisant le mode de
   numérisation du langage PostScript.
    – Tout comme dans le cas d’un programme PostScript, la description d’une page PDF
       dessine une page en plaçant une “couleur” sur une zone déterminée de sorte que sa
       représentation est indépendante du périphérique et de la résolution.

• • La portabilité des fichiers PDF s’étend à de nombreux environnements matériels
   et systèmes d’exploitation.
    – Les systèmes de codage des données binaire et ASCII sont tous deux utilisés.

• • Pour réduire la taille des fichiers, le format PDF prend en charge les filtres de
   compression standard suivants :
    – JPEG, CCITT Group 3, CCITT Group 4, ZIP et LZW.


                                          Luc Quoniam                                      40
                                 PDF: Caractéristiques
• • Les fichiers PDF comportent des informations nécessaires soit à l’affichage des
   polices incorporées, soit à la substitution des polices.
    – Un descripteur de police est inclus dans un fichier PDF pour chaque police utilisée.
    – Celui- ci indique le nom de la police, la taille des caractères et le style utilisé.
    – Lorsque la police employée dans le document est disponible sur l’ordinateur qui doit
       l’afficher ou lorsqu’elle est incluse dans le fichier PDF, celle- ci est visualisée.
    – Si elle n’est pas disponible, une police Serif ou Sans serif Multiple Master spéciale est
       utilisée afin de la simuler. Les polices Symbol et Expert sont automatiquement
       incorporées ou converties en images.

• • La substitution des polices n’entraîne pas le reformatage des documents PDF.
    – Les polices de substitution créées à partir des polices Serif et Sans serifMultiple Master
       spéciales respectent la largeur et la hauteur des caractères d’origine.



                                            Luc Quoniam                                            41
                               PDF: Caractéristiques
• • Un fichier PDF comporte un tableau de références croisées

    – qui permet de retrouver et d’accéder directement à d’autres pages et objets du fichier.

    – Grâce à cette table (appelée xref ), le délai d’affichage d’une page donnée est quasiment

       indépendant du nombre total de pages du document.

• • Le format PDF est conçu de sorte qu’il puisse être complété facilement par de

   nouvelles fonctions grâce à son architecture modulaire.

    – Les modules externes correspondent à des programmes logiciels fournissant des

       fonctionnalités supplémentaires à un programme de base tel qu’Adobe Acrobat Exchange

       ou Reader.




                                         Luc Quoniam                                            42
PDF: plate-formes supportées




         Luc Quoniam           43
               Comparaison des formats de structuration
• 1 = insuffisant ou faible
• 3 = Moyen
• 5 = Excellent ou élevé




                              Luc Quoniam                 44
                             VRML: Un Standard

• VRML est capable de représenter de objet 3D statiques et animés ainsi que des
  objets multimedia avec des liens vers d ’autres media comme le texte, des sons, des
  films et des images.

• Les « browsers » VRML, comme les outils pour la création de fichiers VRML, sont
  largement disponibles pour de nombreuses plate formes.

• VRML supporte un modèle d ’extension qui autorise la définition de nouveaux
  objets 3D offrant à la communauté des utilisateurs de développer des extensions
  compatibles sur la base du standard.

• Il y a des recouvrements entre les objets VRML et les interfaces d ’application 3D
  courantes (API).




                                     Luc Quoniam                                       45
                                       Le VRML
• Authorability
    – Enable the development of computer programs capable of creating, editing, and
      maintaining VRML files, as well as automatic translation programs for converting other
      commonly used 3D file formats into VRML files.
• Composability
    – Provide the ability to use and combine dynamic 3D objects within a VRML world and
      thus allow re-usability.
• Extensibility
    – Provide the ability to add new object types not explicitly defined in VRML.
• Be capable of implementation
    – Capable of implementation on a wide range of systems.
• Performance
    – Emphasize scalable, interactive performance on a wide variety of computing platforms.
• Scalability
    – Enable arbitrarily large dynamic 3D worlds.
                                        Luc Quoniam                                           46
                              Les étapes de la GED
• Acquisition
    – Saisie ou numérisation (Scanners + Reconnaissance de formes) Presto OCR, Acrobat
• Composition et Présentation
    – Enrichissement, formattage, liens hypertextuels, régles typographiques en automatique
    – synchronisation de séquences vidéos et audio… (Infotrans, VRML, Acrobat)
• Mémorisation
    – Indexation, archivage: Base de données (Idéalist, Wais, Acrobat)
• Consultation
    – requête, protocoles clients serveurs, écrans (VRML, Wais, Acrobat)
• Production
    – Sur papier ou électronique
• Diffusion
    – Réseau Internet, RTC (VRML, Wais, Acrobat)

                                        Luc Quoniam                                           47
                 ANSI/NISO Z39.50 plus qu'une norme...
• Un protocole client/serveur
    – fonctionnant sur le mode d'un dialogue requête-réponses entre deux ordinateurs
    – qui permet avant tout à un ordinateur de récupérer de l'information contenue dans un
      autre ordinateur.
                                                  Jusque-là, rien de nouveau...

• Mais devient intéressant quand:
    – il permet à l'ordinateur client de sélectionner cette information sur l'ordinateur serveur en
      utilisant son propre langage d'interrogation, quel que soit le type d'ordinateur supportant
      le serveur, et quelle que soit, sur ledit serveur, la structure des données parmi lesquelles
      se trouvent celles qui l'intéressent.


• Et ce n'est pas tout ! Ce protocole, implémenté au-dessus du protocole TCP/IP
    – permet l'interrogation simultanée de banques de données par l'envoi d'une requête unique
      à plusieurs serveurs distants sans se préoccuper de l'interface propre au module de
      recherche utilisé par les usagers directs de ces banques de données.



                                          Luc Quoniam                                            48
                                            Z39.50
• Permet de sélectionner, le ou les serveur(s), et à l'intérieur de ces serveurs la ou les
  base(s) de données à qui adresser votre requête, sans vous limiter aux seuls
  documents numériques accessibles directement à travers l'Internet, mais au contraire
  en étendant votre recherche aux bases de données de références bibliographiques.

• Prévoit
    – la navigation dans les bases de données selon le mode hypertexte,
    – le parcours de listes  d'index sur un serveur,
    –   la pratique du relevance feedback, procédé qui réutilise un paquet de références
        reçues en réponse à une requête, ou un sous-ensemble préalablement sélectionné, ou
        même une seule référence, pour relancer une recherche des documents s'en rapprochant
        le plus, surmontant ainsi le problème que posent, dès lors qu'on interroge plus d'une base,
        les différences de vocabulaire d'indexation.




                                           Luc Quoniam                                           49
                              Exemples d ’utilisation
• Plusieurs bases simultanées

  http://melpomene.grenet.fr/POLE/REDOC/catalogues_CD.html             Grenoble


  http://www.univ-lyon1.fr/bases_de_donnees/entree.html           Lyon 1


• Catalogues
  http://lcweb.loc.gov/z3950/gateway.html          Z39.50 Maintenance Agency


• Une base
  http://copac.ac.uk/copac/         Copac




                                     Luc Quoniam                                  50
                                        1981: Z39.50
• ANSI-NISO
         American National Standards Institute, National Information Standards Organization,
• documentée par la Z39.50 Maintenance Agency de la LC (Bibliothèque du
  Congrès), grâce aux travaux du ZIG (Z39.50 Implementors Group), existent trois
  versions :


• 1988, a été utilisée par les moteurs d'indexation et de recherche de type WAIS.

• 1992, l ’ ISO 10162-10163, Search and Retrieve (SR) est incorporée à Z39.50

    – ce qui rend la version 1 plus ou moins incompatible avec les suivantes.

• 1995, enrichit les fonctionnalités et les services de Z39.50
    – en ménageant la compatibilité avec la précédente.
    – principe de compatibilité restant décisif pour l'adoption de toute nouvelle version.


                                            Luc Quoniam                                        51
                           L'intégration Java/Z39.50
• Elle suscite de nombreux débats dans les news spécialisées,
    – l'encapsulation des diverses fonctionnalités
    – l'automatisation de liens constitués d'URLs Z39.50
        ouvrant des perspectives d'intégration rapide de Z39.50 au Web.


• L'oclc a rendu publique une version test de son applet Java pour Z39.50 :

   http://tikal.dev.oclc.org:3000/html/zapplet.html        Applet Java pour Z39.50


• Le problème reste cependant l'incapacité de Java à faire communiquer plus de deux
  ordinateurs à un instant T.




                                        Luc Quoniam                                  52
                 L'aide à la localisation des bases Z39.50

• Un des objectifs du projet GILS (Global Information Locator Service) du G7
    – il s'agit de la mise au point d'un outil qui permette automatiquement, lors d'une recherche,
       le repérage et la localisation de la ou des bases de données Z39.50 susceptibles de fournir
       l'information recherchée avant de lancer la recherche proprement dite
    – il s'agit donc d'une base dont les données sont les adresses, ainsi que tous les autres
       renseignements, dont ceux de contenu, entre autres, fournis par le service explain, des
       bases de données Z39.50
    – Cette base de donnée étant consultable par tout client Z39.50, elle pourrait même
       constituer en quelque sorte l'annuaire interactif Z39.50

    – étape indispensable à terme de toute recherche d'information sur le
       Web si le couple WWW/Z39.50 se révèle efficace,
    – voire "obligée " si aucune autre alternative de répertoire n'est
       proposée.
                                          Luc Quoniam                                            53
                        GILS, Z39.50, AltaVista
• Dans le cadre du projet GILS,
  l'équipe de Digital qui développe Altavista
  a conclu un accord avec Blue Angel Technologies
  pour l'intégration de leurs deux produits respectifs
   – le Kit Intranet SKD (Search eXtension Developer's Kit)
   – le serveur MDS (Meta Data Server)
  Ce serveur d'adresses de sites Z39.50 s'offre ainsi la puissance
  d'indexation et de recherche des moteurs d'Altavista

  http://www.bluangel.com/PressRels/Press5.htm         Alta Vista & Z39.50




                                   Luc Quoniam                               54
                               Les serveurs gratuits
• Peu d'outils serveurs Z39.50 sur ses bases de données à partir d'API toutes faites

• Isite (Clearinghouse for Networked Information Discovery and Retrieval) mérite
  d'être cité car le plus utilisé, et comporte une gateway WWW/Z39.50 qui a été
  adoptée par la Library of Congress : http://vinca.cnidr.org/software/Isite/

                                                                            Isite

• La BN du Canada met également les sources de son serveur en accès libre :

   http://ds.internic.net/z3950/nlc.txt            BN du Canada

• D ’autres adresses de listes de softwares
                                                         Z39.50 Maintenance Agency

   http://lcweb.loc.gov/z3950/agency/projects/software.html

   http://www.niso.org/z39.50/z3950.html National Information Standards Organization

                                          Luc Quoniam                                  55
                           Solution pour SERECOM
• WAIS
    – Bien que s ’appuyant sur la version 1 de la norme non compatible avec plus récent


• Freeware
• Bien connu et utilisé
• Relativement Facile de mettre en œuvre pour la création de bases pour des débutants

• Maintenu par l ’université de dortmund en 2 parties:

• FreeWais SF serveur Wais
• SFGate gateway vers le serveur WWW




                                        Luc Quoniam                                       56

				
DOCUMENT INFO
Shared By:
Categories:
Tags: document
Stats:
views:17
posted:9/20/2012
language:French
pages:56
Description: my documents