Indexation sociale & Bibliothéconomie de masse
Session 5 : Les usages à distance Quelle distance ? Quels usagers ? Quels usages ?
. Olivier Ertzscheid. Maître de Conférences . . IUT La Roche sur Yon. Dept Infocom. Université de Nantes . http://www.affordance.info
. 53ème Congrès ABF . . Nantes : 8-11 Juin 2007 .
? QUI est à distance ?
Une question d’âge « Digital natives »
• Internet aux Etats-Unis :
– 200 millions d’usagers. – 87 % ont entre 12 et 17 ans
• MySpace :
– 110 millions d'utilisateurs. Echangent photos, sons, messages … – 110 millions de préadolescents.
• Wikipedia :
– moyenne d'âge des wikipédiens est majoritairement celle de jeunes adultes.
Les cultures & les besoins : ou comment comprendre ce que veut le « public »
• • Culture du fragment
– Homogénéisation des savoirs
• •
Besoin de discrimination Besoin de recommandation
– Réhabilitation de l’expertise collective et non plus simplement « es qualité » – Besoin d’inventer des modèles hybrides, mixtes d’expertise sinon, on entretient la confusion dramatique entre autorité et popularité.
• • •
•
Culture de l’agrégation, de l’appropriation Culture de l’accès Culture du service Culture de « l’économie » 1. d’expertise 2. de temps 3. d’argent (culture du gratuit) 4. d’échelle dans le repérage et l’accès (catalogue Amazon) 5. Economie cognitive de l’indexation (folksonomies) Culture de la synchronicité
– Accès, repérage, recherche, certification, indexation, navigation, partage
•
Besoin de centralisme & de proximité
– Librairie, bibliothèque, pizzéria « près de chez vous » : « caRtalogue »
•
•
Besoin d’interopérabilité (sans DRM) Besoin de clarification des pratiques
– chercher n’est pas communiquer n’est pas partager n’est pas Réflexion sur « l’offre » documentaire indexer n’est pas s’orienter n’est pas organiser… Doit intégrer cette économie de la demande
? Que fait-on à distance ?
Confusion des pratiques ?
Web/documenet Web/document` Web personnel public privé (Desktop) Web intime (Mail) Web extime (blogs)
chercher communiquer
talk
google
s’orienter
organiser
print
orkut
partager
Tagger / indexer
earth API’s
? A distance de quoi ?
Dérive des continents documentaires : le monde comme Pan-catalogue
? Pourquoi ? Web public Web personnel (Desktop) Web privé Web intime (Mail)
index é non-indexé
Web extime (blogs)
2015 ?
Web public Web personnel (Desktop) Web privé Web intime (Mail)
Qui ? Web extime (blogs)
2005
Web public Quoi ? Web personnel (Desktop) Web intime (Mail)
Web privé
1995
ET ALORS ???
Alors …
• Hier : monde de la culture, de la connaissance, • Aujourd’hui : « Industries culturelles »
– Phénomène de longue traîne / – Massification des accès / – "les dimensions collectives de la production, circulation, consommation des savoirs sont en voie de différenciation accélérée."
• Hier : CatalogueS. • Aujourd’hui : Le monde comme Pan-Catalogue
– ouvert & interopérable
• Hier : Sages, savants, experts. • Aujourd’hui : Babélisation des expertises :
– Expertise ascendante, partagée (modèle wikipédien)
• Hier : peu « en ligne ». Aujourd’hui, « tout en ligne »
– Bureautique, Communication (IM, Chat, Forum), Catalogue
• Hier : environnement fermé ou semi-ouvert. • Aujourd’hui « tout ouvert »
– Bureautique, données, archives, accès, suites logicielles, textes de savoir
1er cas d’usage : l’indexation sociale ou « Folksonomie »
Définition
• « Folksonomies désignent
– un processus de classification collaborative – par des mots-clés librement choisis – Ou le résultat de cette classification. » (Wikipédia)
≠ thesaurus
• « vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine »
≠ ontologie
• • • « ensemble structuré de concepts. (…) organisés dans un graphe (…) relations sémantiques et de composition ou d'héritage. »
Folksonomie ≠ thesaurus ≠ ontologie
• « Folksonomies désignent
– un processus de classification collaborative – par des mots-clés librement choisis – Ou le résultat de cette classification. »
• • • •
Vocabulaire non-normalisé, non-structuré, non-spécifique à un domaine, sans relations sémantiques ou hiérarchiques.
Dél.icie.uses folksonomies
Qui indexe ?
Usagers, Consommateurs, Producteurs, Auteurs, Novices, Experts.
Quoi ?
Textes Docs de travail Articles scientifiques Billets de blogs Photos Vidéos A moi Aux autres
A la volée En surface En profondeur (deep tagging) En connaissance de cause Au hasard Pour moi (tags privés) Pour les autres (tags publics)
Organiser, Partager, Chercher, Retrouver Associer, « Participer »
Comment ?
Pourquoi ?
? Avantages = Inconvénients ?
• •
•
•
Indexation humaine, à la volée, instantanée, cumulative, simple, rapide, gratuite Intérêt d’un filtrage collaboratif
gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs) … Couverture documentaire totale (documents, livres, photos, couriels, cartes géographiques …)
•
Conforme aux usages (onebox, oneword)
• Trop simple, trop peu d’expertise, trop d’hétérogénéité • Confusion entretenue entre pertinence (autorité) et popularité (photos les plus vues les plus tagguées et réciproquement) • polysémie, synonymie, lemmatisation, orthographe, langue, redondance, univers de référence (« peinture » et/ou « louvre », etc.) • = Méta-bruit
? Avantages = Inconvénients ?
• « Folksonomist are confusing cataloging structure with personal opinions (…). These are not the same thing and they need to be separated. » • Non. Ils se servent (à dessein) de leurs opinions personnels comme d’une structure d’indexation. • Sur le processus de classification : oui, sont plus floues, plus polysémiques, plus imprécises. • Mais sur les objets ? – Qui va se lancer dans une entreprise de classification aristotélicienne des photos de vacances de 100 000 personnes sur FlickR ? – Doit-on décider qu’elles sont inclassables ??
Nécessité fait loi
• Metropolitan Museum of Art indique que :
– "sur 30 oeuvres d'art indexées par les usagers, plus de 80% des tags ne figuraient pas dans le vocabulaire documentaire utilisé par le musée."
• Outil collaboratif de tagging à destination des musées
– http://www.steve.museum/
2nd cas d’usage : Librarything. www.librarything.com
Site communautaire à vocation bibliothéconomique
Le meilleur des deux mondes ?
• Indexation « standard » :
– notice au format MARC, – indexation DEWEY, – LC « subjects headings »,
• Indexation sociale :
– des tags associés, – des fiches de lecture et revues de la communauté, – système de recommandation
• Quelques chiffres :
– – – – Février 2006 : 1.5 millions de références Juin 2006 : 3.2 millions Novembre 2006 : 6.2 millions Juin 2007 : 14 millions
• Modèle collaboratif, auto-régulé, ouvert en lecture et en écriture, « Amazon-ifié » & « OPAC-ifié »
Les bases de données scientifiques … aussi !!
Le catalogue … aussi !!
http://orlabs.oclc.org/Identities
Et ce n’est qu’un début …
• Côté bibliothèques (publiques et universitaires)
– Intégration de plus en plus fréquente d’un espace "MySpace" ou "Facebook« – Hébergement de blogs, – Utilisation des tags, – Mise en œuvre de wikis, de systèmes de recommandation, etc.
• Pour :
– Du catalogage, du service, de l’accès
• Côté SIGB (open source ou propriétaires)
– Intégration des mêmes fonctionnalités
• Côté moteurs de recherche
– Accès de plus en plus fréquent par Folksonomies – Le mot plutôt que l’absence du mot
• Vers une Bibliothéconomie « de masse » ?
Une question de services
« Amazon est notre cahier des charges pour les années à venir. » • Le catalogue (et les usages) de demain :
– Aura du RSS – Sera ouvert aux utilisateurs, et pas seulement « en lecture » mais aussi « en écriture » : catalogablogs, catalogues commentés) – donnera des extraits et non simplement des notices – Fera communauté autour des services mis en place réseaux sociaux, partage de documents, d’applications … – Systématisera les logiques d’accès : • Par proximité (le livre dans la bibliothèque, la librairie près de chez vous = géolocalisation amont et non aval comme dans le sudoc par exemple) • Par affinité (logiques de recommandation) • Par remontée d’expertise (Folksonomies et indexation sociale)
• Bref … ira à la rencontre non plus simplement des usagers mais des USAGES
Problématiques ouvertes
• « indexabilité » de l’actuelle masse documentaire (dans laquelle tout est document, y compris … nous) • Bibliothéconomie de masse • Horizon de l’indexation :
– Question n’est plus celle de l’autorité (qui a autorité pour indexer) – ni même de l’expertise (qui a compétence pour indexer) – mais celle de l’usage (qui a besoin d’indexer)
Il y a urgence. ? Sinon ?
Autarcithécaires Modèle marchand de la bib.