Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Le Docablock Blog!
8 décembre 2007

Langages documentaires: le retour.

Une petite communication pratique pour commencer: il est vrai que mes cartes conceptuelles, que je mets en 2 formats (image-PNG et PDF), n'arrivent pas après publication sur le blog avec la résolution graphique désirée... C'est le cas pour le format image-PNG. Pour plus de netteté visuelle, je vous conseille donc de privilégier le format PDF, en utilisant le zoom jusqu'à obtenir l'angle désiré!


Retour aux choses sérieuses: les langages documentaires, 2. Dans l'épisode précédent, nous avions vu comment Bruno Menon, enseignant en sciences de l'information, avait eu l'audace d'écrire un article dans le dossier sur "L'évolution des langages documentaires" paru dans les DIE de décembre 2004. Son texte, intitulé "L'héritage classique", voulait montrer la continuité entre les langages documentaires classiques (classifications encyclopédiques, thésaurus....) et les langages documentaires qui sont développés à l'heure de la société de l'information, du document numérique et de l'Internet (classifications originales proposées par les annuaires Web, taxonomies d'entreprise sur mesure...).

Le 3ème texte du dossier est susceptible de nous intéresser fortement. Intitulé "Des fonds éditoriaux structurés pour améliorer la lisibilité du Web éducatif", l'auteur en est Nicole Rodriguez, du Scérén- CNDP (le Scérén est un réseau national justement dédié à la publication et  à  la diffusion de ressources pédagogiques...).

Petit résumé-analyse, donc...

Le document électronique sur Internet a une caractéristique double:
il peut contenir en lui-même sa description documentaire (indexation) et sa structure éditoriale (dans les métadonnées), mais paradoxalement la force des moteurs de recherche leur vient, non de cette spécificité mais de l'actualisation permanente du contenu même des pages  que permet une indexation plein texte... En effet, la recherche sur Internet met  l'usager de l'information au centre du dispositif de recherche, car c'est lui qui construit sa requête: le moteur de recherche explore alors "un fonds chaotique formé de milliards de pages et fournit d'immenses listes de résultats qu'il faut explorer un par un". On est dans une situation de bruit documentaire, toute différente du contexte de recherche dans des fonds éditoriaux locaux ou physiques: dans un CDI, dans une bibliothèque, par exemple, l'usager s'adresse à  un professionnel de la documentation qui agit comme médiateur, élabore une stratégie de recherche et explore un fonds documentaire "construit et organisé en fonction  de besoins pédagogiques" (politique d'acquisition). Cela donne une sélection limitée de documents, mais pertinente. Comment faire pour permettre à la recherche d'information sur Internet  de se rapprocher de cette pertinence de résultats?

Jusqu'à présent, en effet, les professionnels de l'information s'occupaient de constituer et d'organiser des fonds documentaires. Cette démarche, appliquée à Internet, a donné les listes de signets (comme de la BNF ou de la BPI), les portails thématiques ou  disciplinaires, ... , mais reste d'une efficacité limitée, l'expérience des sites Educasource et Educlic, du CNDP, l'a montré: en effet, voulait-on construire un annuaire   répertoriant les unités documentaires, ou un moteur permettant l'accès au document lui-même? Aujourd'hui ces deux sites se sont fondus dans la base Educasources, qui décrit un nombre restreint de ressources pédagogiques à  l'aide de métadonnées. Ce n'est pas la direction prise par les moteurs de recherche généralistes, qui donne accès à un contenu riche et constamment mis à jour, mais avec une "intelligence" limitée: en effet l'indexation automatisée "ne peut porter que sur des éléments présents dans le texte": elle constitue des index inversés à partir de chaînes de caractères repérées par le robot ("spider"), ne traitant ni du contenu (par exemple les points du système scolaire) ni du niveau (la classe) ni de la discipline.

Pourtant des travaux visent à transformer ce Web en un Web sémantique: le moteur agirait au niveau du document lui-même (unité documentaire et non page Web), l'indexation permettrait une hiérarchisation de l'information et l'utilisation  de descriptions documentaires (thésaurus, mots-clés etc...). Chaque document pourrait devenir ainsi un "objet pédagogique" accompagné de sa description documentaire dans ses métadonnées ; d'où l'importance d'initiative visant  à en standardiser la forme, comme les "schémas de métadonnées" du Dublin Core Educative et du LOM (Learning Objects Metadata, métadonnées des objets d'apprentissage).

L'éditeur de  ressources électroniques pourrait ainsi se voir confier 2 nouvelles tâches primordiales:

  1. une fonction d'indexation, traditionnellement effectuée a posteriori par le documentaliste, qui s'intègrerait a priori, dans l'acte d'édition.
  2. en vue d'intégrer la ressource dans un "fonds éditorial partagé".

Bien entendu, des fonds à vocation éducative existent déjà: sites ministériels, CNDP, CRDP, grands sites institutionnels comme celui de la BNF etc... . Mais l'absence de règle de mutualisation des ressources empêche la constitution d'un fonds éditorial éducatif global, qui permettrait l'adéquation entre des  besoins éducatifs et une offre éditoriale. Prendre en compte l'utilisateur obligera donc l'éditeur "à inscrire ses publications dans des chartes éditoriales".

Evitons toutefois une double illusion:

  • l'idée que l'on pourrait construire un paysage éditorial convenant à la totalité du monde éducatif. Il va falloir en effet segmenter les publics, évaluer les besoins, "définir des scénarios d'accès adaptés", par exemple à partir des programmes scolaires existants et des documents d'accompagnement.
  • l'idée que l'ensemble des éditeurs de ressources éducatives électroniques va adhérer d'emblée à la mutualisation de leur fonds dans un pôle public. Toutefois on avance sur cette voie, avec notamment des bouquets éditoriaux comme le CNS (canal numérique des savoirs) et le KNE (kiosque numérique de l'éducation), que l'on peut d'ailleurs tester grâce au point d'accès Wizwiz jusqu'au début 2008.

L'Education nationale, qui est l'institution prescriptrice, a donc son rôle à jouer pour homogénéiser l'offre et la rendre adéquate aux besoins; elle le fait autour d'un projet comme le SCHENE (schéma de l'édition numérique pour l'enseignement). Elle peut également jouer un grand rôle dans la centralisation et la diffusion des ressources, dans des bases comme MURENE (mutualisation des ressources pour l'éducation, pour plus de détails voir ici).

Mais l'essentiel sera de toujours viser la simplicité d'accès (dans la recherche documentaire notamment), d'usage (nécessité de formation des usagers) et d'édition (notamment en utilisant l'intelligence artificielle pour "alléger les tâches d'indexation des producteurs de contenus")....library_research

Publicité
Commentaires
R
très bon billet, merci bien
Publicité