RECHERCHE DOCUMENTAIRE DANS LE DOMAINE BIOMÉDICAL
URFIST PACA-C - MARSEILLE 16 novembre 2006
Organisation de la formation
Coordonnées du formateur : Michaël Hug –
Université de Nice – Faculté de Médecine - SCD michael.hug@unice.fr - Tél. 04 93 37 77 71 Support de cours : http://www.unice.fr/BU/medecine/formations/ Cliquez sur : Recherche documentaire dans le domaine bio-médical - Urfist Marseille
Objectifs de la formation
Principes de base de la méthodologie de la
recherche documentaire dans le domaine biomédical Principaux outils : bases de données, moteurs, annuaires, recherches particulières Base de données de référence, Medline sous PubMed
Recherche documentaire
Publication
Experiences et Récupération des données
Recherche et analyse
Plan de la formation
I. MÉTHODOLOGIE DE LA
RECHERCHE II. PRINCIPAUX OUTILS III. PUBMED
I. MÉTHODOLOGIE DE LA RECHERCHE DOCUMENTAIRE
1. 2.
Processus de la recherche documentaire Principes de base d’une recherche documentaire efficiente
I.I. Processus de la recherche
1. 2. 3.
Identification du sujet Sélection de l'information Évaluation
I.I.I. Identification du sujet
Importance de «faire parler» le demandeur Cadre : mémoire, thèse, prise de décision Choix des supports Dégager les concepts Choix des mots-clés Détermination des limites
Exemple
Concept 1 = Établissements de santé Concept 2 = Traitement des déchets Limite 1 = France Limite 2 = Langue = français / anglais Limite 3 = Années = 2000 -
Un mot-clé est terme représentatif d'un concept qu'on
soumet aux différents outils de recherche informatisés. Penser aux différents synonymes (le terme ou l’expression à laquelle on pense n’est pas forcément celui de l’indexeur, de l’auteur du livre ou de l’article). Nécessité ou non de penser aux mots-clés en anglais (dans certaines bases c’est même nécessaire y compris pour trouver des documents en français).
I.I.II. Sélection de l'information
Tri des documents obtenus en fonction du but (il faut
localiser l’information dans les documents) Évaluation critique des articles
Exemple : qualité des sites Internet (Netscoring http://www.chu-rouen.fr/netscoring/ 8 critères : Crédibilité Contenu Liens Design Interactivité Aspects quantitatifs Aspects déontologiques Accessibilité
Médecine basée sur les niveaux de preuves
Définition : Constat : progrès rapide des connaissances médicales et croissance du nombre des publications Besoin de synthétiser de manière critique les informations disponibles Méthodes : Les conférences de consensus Les recommandations pour la pratique clinique (RPC) et références médicales opposables (RMO)
Pyramide des preuves (Par ordre décroissant)
Littérature de synthèse
Méta-analyses Revues systématiques Études individuelles Essais contrôlés randomisés Études de cohorte Études de cas-témoins Études transversales Séries de cas
Sources
Sites institutionnels
Ex, Haute Autorité de la Santé Recension de sites : Cismef Bases bibliographiques Ex, Cochrane Databases PubMed – Clinical Queries
I.I.III. Évaluation
Évaluation de la stratégie de recherche Évaluation de la production elle-même Évaluation de l’information et vérification des sources Les résultats obtenus ont-ils abouti à une
reformulation de la problématique ?
I.II.I. Quels sont les risques d'une mauvaise interrogation ?
Le bruit Nombre excessif de résultats. Parmi les résultats figurent des documents non pertinents. Le silence Absence ou insuffisance de résultats. les documents pertinents ne figurent pas parmi les résultats.
Explications :
Choix non approprié de la base Mauvaise interrogation
I.II.II. Formulation de la requête
Synonymes Traduction (termes de recherche / interface) Expression ou mots isolés
I.II.III. Thésaurus – vocabulaire contrôlé
Son emploi permet d'augmenter l'efficacité de la
recherche Définition = répertoire de termes normalisés employés pour l 'analyse du contenu But : Il pallie l'ambiguïté du langage naturel car chaque terme (appelé descripteur) représente un concept et un seul
Thésaurus
Hiérarchie du thésaurus Chaque descripteur a un descripteur placé
hiérarchiquement au dessus de lui, possédant donc un sens plus large, c’est le « terme générique ». Cas du MeSH (Medical Subject Headings) pour la base médicale Medline
Hiérarchie d’un thésaurus
Terme générique n°1
Terme spécifique n°1
Terme spécifique n°2
Terme spécifique n°3
I.II.IV. Opérateurs et troncature
Liste des opérateurs booléens : AND OR NOT But : association des concepts Attention ! Contrairement au langage courant AND ou
ET, est restrictif dans le langage documentaire. Il s’applique aux termes trouvés et non aux résultats. Priorité dans l’ordre des opérateurs : OR AND NOT de gauche à droite (PubMed, usage des parenthèses pour les hiérarchiser) Opérateurs de proximité : Nombre de mots entre deux termes ou présence dans un même champ. Troncature, masque de 0, 1 ou plusieurs caractères.
AND, ET, all Intersection The terms Union Exclusion OR, OU, any of the terms NOT, AND NOT, SAUF
«Établissements de santé» ET «Traitement des
déchets» ET pays = France ET (langue=français OU langue=anglais) ET années > 2000
I.II.V. Bonne connaissance de la base
Structuration de la base en champs indexés
(notamment pour appliquer les limites) Pour le web, structures relatives des documents Notions de ranking, relevance
I.II.VI. Aide à la formulation : Méthodologie PICO
Pour mieux formuler la question clinique, on peut la
décomposer à l’aide de PICO P (Patient, Population ou le Problème qu’il pose) I (Intervention) C (Comparaison) O (Résultat, Outcome)
Exemple d ’un cas clinique :
1) Femme, 55 ans, avec antécédents d’asthme
allergique (acariens), plusieurs épisodes d’arrêts respiratoire. Traitement aux anti-leukotrienes qui permettrait de réduire les doses de corticoïdes avec de meilleurs résultats thérapeutiques ? 2) Dans le cadre de la construction d’une nouvelle unité de soins, que faut-il prévoir en terme d’équipement, locaux pour prévenir les risques de chute pour les personnes âgées ?
P : caractéristiques du patient ou de la population Maladie ou état de santé Âge, ethnie, sexe, conditions antérieures,médications passées et actuelles 1) Femme, 55 ans, asthme sévère traité par corticoïdes. 2) Sujets âgés de plus de 65 ans, unités de réadaptation.
I : Déterminer l’intervention Il peut s’agir, par exemple, d’un test diagnostic particulier, d’un traitement, d’un traitement d’appoint, d’une médication ou de la recommandation d’un produit ou d’une démarche. 1) Corticoïdes inhalés + antagonistes des leukotrienes. 2) Risques de chutes.
C : comparaison, c’est-à-dire la (une seule) solution de rechange Seul élément facultatif 1) Corticoïdes + placebo. 2) Comparer l’existant avec les aménagements envisagés.
O, outcome [résultat], issue clinique recherchée combinaison de moyens prévus et mesurables en vue d’accomplir, d’améliorer ou de modifier quelque chose 1) Diminution des crises et diminution des doses de corticoïdes. 2) Diminution du nombre de chutes dans la population envisagée.
II. OUTILS POUR LA RECHERCHE DOCUMENTAIRE
II. OUTILS POUR LA RECHERCHE DOCUMENTAIRE
1. 2. 3.
Documents de référence Bases de données Information sur le Web
II.I. Documents de référence
Dictionnaires Encyclopédies Manuels de base
Avantages des documents de référence
Indispensables pour une nouvelle recherche Permettent d’ orienter rapidement une nouvelle
recherche Ils permettent l'établissement d'une bibliographie de base Ces ouvrages de référence peuvent être sous forme papier et maintenant sous forme électronique, cas des Encyclopédies Médico-Chirurgicales, EMC. http://www.emc-consulte.com
II.II. Bases de données
Il s'agit du point d'accès privilégié pour l'accès à
l'information scientifique et technique Choix des bases Bases de données en médecine
Éléments utiles lors du choix de la base de données
Producteur de la base, gage du sérieux de
l'indexation Mode d'accès à la base de données, Internet, cédérom, serveur de base de données Modalité de cet accès, gratuit, payant (forfait ou à l'interrogation), gratuit avec des restrictions… Nombre de références Disciplines couvertes (la présence des périodiques analysés peut être un élément déterminant)
Éléments utiles lors du choix de la base de données - suite
Année de couverture Types des références (références bibliographiques,
données factuelles, structures en 3D, etc) Quel type d'éléments bibliographiques sont présents (ex, résumé ou non) Langue des documents (différent de la langue de l'interface et de la langue du résumé du document, par exemple, dans PubMed, il existe des résumés en anglais d'articles de périodiques français). Présence d'un thésaurus Fréquence de la mise à jour
Bases de données médicales
Prépondérance de la base Medline Nécessité de compléter par d'autres pour viser
l'exhaustivité
Autres bases de données
Bases : Pascal, Web of Science Bases gratuites. Comment les identifier ? Ex, dans le domaine de la santé publique, la Banque
de Données Santé Publique (BDSP) http://www.bdsp.tm.fr/ Existence d’un thésaurus. Depuis 2006, l’accès est possible gratuitement pour tout le monde : possibilité pour exploiter les résultats, bibliographiques, consultation des textes intégraux. Bases de données payantes et sans abonnement de l’institution (ex, Embase, Biosis : accès via un serveur commercial).
II.III. Particularités de l'information présente sur le web
Absence quasi totale de structuration Extrême diversité des sources Absence de pérennité des pages web Problème de la responsabilité juridique
Outils pour rechercher sur Internet
Annuaires Moteurs de recherche Métamoteurs Outils intelligents
II.III.I. Les moteurs de recherche
Un robot logiciel parcourt les pages du Web, capture
les données et les envoie au serveur d’ index Le serveur d’ index indexe en texte intégral Le serveur Web reçoit les requêtes des usagers, les transmet au serveur d’ index qui renvoie les résultats. Le serveur Web renvoie ensuite les résultats à l’ utilisateur
Avantages des moteurs de recherche
Quantité des documents référencés Objectivité des critères de sélection
INCONVÉNIENTS DES MOTEURS
Les moteurs les plus vastes (Alltheweb, Exalead,
Google…) n’indexent qu’une partie des pages. Seule une partie du web est indexée. Existe le web invisible (pages générées dynamiquement par bases de données…) Retard dans l’indexation Absence de structuration des documents HTML Un moteur de recherche est incapable de gérer la polysémie : les mots clés ne sont pas analysés en fonction de leur sens ou de leur contexte. Le moteur propose donc toutes les pages dans lesquelles cette suite de caractères apparaît, quelque soit son sens.
Exemple d’ un moteur de recherche : Google
Façon de saisir les termes de recherche (lettres
accentuées, majuscules/minuscules, recherche des expressions, troncature) Construction de la requête (opérateurs booléens, les mots exclus) Recherche avancée (recherche par langue, recherche sur le nom du site, recherche sur l’adresse du site, format de fichier, par date, par l’emplacement, rebond vers pages similaires).
Moteurs de recherche
Diversification des moteurs classiques :
Ex., Google Scholar pour la documentation universitaire http://scholar.google.com/ Autres moteurs : Exemple d’un moteur spécialisé dans le domaine scientifique, Scirus : http://www.scirus.com
II.III.II. Mode de fonctionnement des annuaires
Base de données de liens classés de façon
hiérarchique vers des sites et non des pages. Travail humain Il existe une possibilité de recherche par mot clés. Il ne s’ agit pas de moteurs de recherche du type de Google qui recherchent dans le texte intégral. Les recherches portent sur les indications portées par le référenceur : le titre du document, l’ URL, le commentaire et les catégories Les annuaires doivent être privilégiés pour rechercher de l’information de type générale
Utilisation des annuaires et répertoires
Cet outil est à privilégier : au début de la recherche pour avoir une idée d'ensemble d'une question pour trouver des ressources déjà évaluées pour rechercher des faits pour identifier une base de données spécialisée pour telle question
Avantages des annuaires et répertoires
Ils contiennent beaucoup moins d'informations que
les moteurs de recherche (se limitent au niveau des sites et non des pages) Les liens sont commentés, rangés dans des catégories afin de permettre l'accès de la catégorie la plus large à la catégorie la plus spécialisée Ils sont plus susceptibles de sortir des informations pertinentes
Inconvénients des annuaires et répertoires
Faible nombre des références Mise à jour peu satisfaisante Subjectivité des commentaires Subjectivité de la distribution des sites Internet dans
les catégories hiérarchisées
Exemple d ’annuaire médical : Le CISMEF
Catalogue des sites médicaux francophones Réalisé par le CHU de Rouen Utilisation du thésaurus du MeSH pour les sites web
sélectionnés
Lien : http://www.chu-rouen.fr/cismef/
II.III.III. Recherches de documents particuliers
Actualités Images Congrès Logiciels Brevets
Information sur le web - RSS
Deux façons d’accéder à l’information :
1) Pull : l’utilisateur va chercher l’information sur les serveurs 2) Push : les serveurs envoient l’information à l’utilisateur Les flux ou fils RSS (Really Simple Syndication) sont un format de syndication de contenu web qui se développent depuis plusieurs années : blogs/blogues, services documentaires comme des bases de données (PubMed), catalogues ou revues.
Information sur le web - RSS
Signalement : Icônes représentant XML ou RSS Utilisation pratique :
1) Intégration sous forme de favoris dans des navigateurs (Firefox, Opera, IE 7, Safari,…) 2) Intégration dans des outils de messagerie comme Thunderbird 3) Intégration dans des pages web. Ex, Netvibes, http://www.netvibes.com ou My Yahoo http://my.yahoo.com/ 4) Agrégateurs de flux locaux
Images
Il est toujours possible de rechercher des images sur
Internet (ex, Google), mais : recherche difficile et souvent infructueuse problèmes de copyright, droits d’utilisation Il existe des bases de données spécialisées, exemple, Images.MD (UNSA). http://www.images.md/
Les sites ne constituent qu’une partie de l’information
présente sur le web. Une grande partie de l’information, souvent pertinente est constituée sous la forme de messages des listes de diffusion spécialisées. Il existe des outils spécialisés pour les rechercher, par exemple onglet Groupes dans Google. Recherche dans des blogues Par exemple Blogsearch dans Google.
III. MEDLINE SOUS PUBMED
III.I. Présentation de la base Medline
MEDLINE est la base de données de référence dans
les domaines de la médecine. Medline couvre tous les domaines biomédicaux : biochimie, biologie, médecine clinique, économie, éthique, odontologie, pharmacologie, psychiatrie, santé publique, toxicologie, médecine vétérinaire MEDLINE contient des références bibliographiques de plus de 4800 revues (EU et 70 autres pays). D’autres sources ne sont pas couvertes (comptesrendus de congrès, livres…)
Medline
Plus de 13 millions de références depuis 1966
(16 millions au total avec OLD-Medline) Les sources sont majoritairement (86%) en anglais (les articles d’autres sources aussi ont des résumés, des termes anglais et les titres sont traduits en anglais) Près de 76% des références contiennent un résumé Références ajoutées quotidiennement. Interfaces disponibles (payantes, PDA…)
III.II. Présentation de PubMed
Produit par le National Center for Biotechnology
Information (NCBI) et la National Library of Medicine (NLM) Interface gratuite PubMed inclut – MEDLINE (depuis 1966) – Références en traitement (In-process) et fournies par l’éditeur (Publisher supplied citations) – OLDMEDLINE (début des années 1950 à 1965) – Autres bases de données (livres, génétique…)
III.III.I. Recherche simple
Opérateur booléen par défaut : AND Recherche par troncature Spell Checker Recherche par expression Recherche par champ Le mapping automatique (table de correspondance
des termes MeSH, puis celle des revues, puis celle des phrases et en dernier celle des auteurs) Visualiser la question avec l’onglet Details
III.III.II. Recherche avec équation
Recherche nécessitant une excellente connaissance
de la structuration de la base en champs (et ses intitulés) Maîtrise parfaite de l’interprétation de la requête par le serveur Exemple
III.III.III. Limites
Possibilité de plusieurs options alternatives pour
chaque champ Choix du champ à interroger Attention au maintien des limites par défaut
III.III.IV. Preview / Index
Utilité et utilisation de la fonctionnalité Preview (ex.
requêtes avec des termes très fréquents) Utilité et utilisation de la fonctionnalité Index (doute sur l’orthographe, recherche avec plusieurs occurrences…)
III.III.V. Historique
Conditions d’utilisation (Cookies, limite, durée) Relance de recherches précédentes Opérateurs booléens entre les étapes Pourquoi décomposer la requête en étapes
successives facilite la recherche bibliographique ?
III.IV. Affichage des résultats
Existence par défaut de l’onglet Review Indications basiques (langue, indexation…) Signification des icônes indiquant suivant les cas la
présence de résumés, de lien vers le texte intégral librement accessible… Fonctions de détermination du nombre de références, du tri Articles en relation, liens contextuels
III.IV.I. Principaux formats d’affichage
Summary Brief Abstract Abstract Plus Citation Medline Autres formats non bibliographiques
III.IV.II. Exploitation des résultats
Génération de fichier texte Enregistrement dans un fichier Enregistrement pour une exploitation dans un logiciel
de gestion de références bibliographiques (ex., EndNote) Impression Sauvegarde dans le panier (cookies, limite, durée) ; possibilité d’enregistrements par étapes Commande d’articles, Loansome Doc
III.V. MeSH
Définition d’un thésaurus (avantages : vocabulaire
contrôlé où chaque terme est strictement défini, où chaque concept est représenté par un seul descripteur) Procédure d’indexation des notices PubMed à la NLM et les différents types de notices. Il est nécessaire de compléter par une recherche en langage naturel Arborescence du MeSH Notions de qualificatifs (subheadings), d’explosion et de sujet majeur
Traduction d’un terme MeSH
Utilisation du thésaurus de l’Inserm
– http://ist.inserm.fr/basismesh/mesh.html Utilisation alternative de HON – http://www.hon.ch/HONselect/ Utilisation d’une notice PubMed de référence au format MEDLINE
Analyse d’une notice PubMed - MeSH
Qualificatif (Subheading) MH - Acute Disease MH - Anti-Bacterial Agents/administration & dosage/therapeutic use MH - Bacteriological Techniques MH - Child MH - Child, Preschool MH - Comparative Study MH - Diagnosis, Differential Sujet majeur (Major Topic) MH - English Abstract MH - Hospitalization MH - Humans MH - Infant, Newborn MH - Osteomyelitis/*diagnosis/*drug therapy/pathology MH - Retrospective Studies
MeSH Database
Comment interroger sans connaître le descripteur ?
– Visualisation des trois possibilités
Utilisation des possibilités de recherche avancée
dans la MeSH Database : qualificatifs, explosion, sujet majeur
III.VI. Recherches particulières
Recherche par nom de revue - Journals Database Accès à une référence précise - PMID ou Single
Citation Matcher Recherches cliniques - Clinical Queries Recherches thématiques prédéterminées - Special Queries
III.VII. Veille et personnalisation : MyNCBI
Fonctionnement de MyNCBI, ex. Cubby Utilisation a priori et a posteriori Sauvegarde d’une recherche Comment ré-exécuter une requête ? Utilisation des filtres de recherche (différents modes
de recherche, changements) Exemple appliqué à l'envoi des sommaires de revues dans une discipline Génération de flux RSS
C’est fini, merci pour votre attention !
Contacts :
Michaël Hug - Université de Nice – Faculté de
Médecine - SCD Michael.Hug@unice.fr - Tél. 04 93 37 77 71 Sans oublier bien sûr en premier lieu tous vos contacts locaux !