vendredi 20 novembre 2009

Après les systèmes Dewey et Congress II

Les grands sites commerciaux, ceux qui gèrent des millions de documents, d'informations et de documents, comme Ebay, Amazon, Facebook, Youtube, etc, ont développé d'autres systèmes de classement, non-standardisés, plus intuitifs, où les usagers jouent un rôle central dans l'indexation des dizaines de millions documents multimédias qu'ils décrivent. En ce domaine, c'est sans doute l'expérience de Ebay qui est la plus riche et originale. Le site regroupe des millions d'acheteurs et de vendeurs qui font des millions de transaction par jour pour vendre-acheter de tout: livres, bébelles, voitures, maisons (!), billets de spectacle, vêtements, "weird stuff", etc. La variété des choses décrites est absolument phénoménale: elle recoupe tous les produits et choses possibles. Et pourtant, les acheteurs trouvent rapidement ce que des milliers de vendeurs sans aucune formation en bibliothéconomie ou en indexation décrivent spontanément, sans trop rigueur, d'une manières souvent incomplète et même souvent (involontairement) fausse. Et ça marche! Moins rigoureux que ceux des bibliothèque mais plus souple, ce système est très performant parce qu'il évolue tout le temps selon les ressources nouvelles des NTIC. Celui des bibliothèques ne bouge pas, n'évolue pas. Si de nombreuses discussions portent sur la manière d'introduire la folksonomie dans les bibliothèques web 2.0, faut noter que les exemples sont encore rares et plutôt prudents et craintifs.

Mais comment le sytème d'Ebay réussit-il? Il y a deux systèmes d'identification complémentaire: un thésaurus de catégories structuré, hiérarchique et la recherche plein texte dans le titre (par défaut) et/ou dans le texte de la description rédigée par les vendeurs. Ça peut ressembler à un système Dewey, moins détaillé à l'intérieur de chaque grande classe d'objets (par exemple, le classement des livres y est infiniment moins développé quand dans le Dewey bien sûr), mais avec un spectre, un champ d'application plus large, du dé à coudre pour collectionneur aux photos anciennes, du calendrier aux souliers de contrefaçons.

Autre idée: Youtube permet de découvrir et tous les moteurs de recherche commerciaux sont axés sur la découverte: offrir aux clients plus qu'ils en demandent, leur proposer ce qu'ils ne cherchent pas, les faire cliquer plus et plus, ne jamais les mettre devant "pas de résultats": ces sites nous inondent d'informations qu'on ne cherche pas, et ça marche: souvent, on oublie un peu ce qu'on est venu chercher et on clique sur ce qu'on nous propose. D'ailleurs, les gens utilisent très souvent l'expression "T'as pas vu ce que j'ai découvert..." ou "Tu sais pas ce que j'ai trouvé...", mais employée dans le sens de "découvrir", verbe qui exprime l'étonnement, la surprise... En un certain sens, les moteurs de recherche de ces sites sont plutôt des moteurs de découverte plus que de recherche.

Dans les sites des institutions publiques, c'est comme si à l'entrée d'une musée il y avait un portier qui demandait l'air un peu bête: que cherchez-vous? Si vous ne le savez pas, attendez de le trouver avant d'entrer. On sait tous que souvent la première motivation, comme dans une librairie, est la curiosité même l'ignorance: "Je ne sais pas trop, je m'en viens voir ce que vous avez..." Et c'est au musée et à la librairie de concevoir un aménagement qui m'en mette plein la vue. C'est ce que font les sites commerciaux qui, autre paradoxe, ne produisent aucun contenu! Ils ne doivent pas classer ce qu'ils produisent, mais ce que les usagers et les abonnés ajoutent à leur base de données. Ce sont des sites qui investissent rien dans le contenu, ou presque, et tout dans des applications pour rendre facile l'ajout du contenu, sa consultation, son échange, etc.
À l'inverse, les bibliothèques et les institutions nationales investissent tout dans le contenu numérisé et rien ou presque dans les applications pour le consulter, le commenter, l'échanger. La popularité des premiers est-elle que tout le monde les connaît - même ceux les non-branchés ont entendu parler de Ebay, Amazon, Facebook - alors que le contenu des seconds est à peine connu et consulté par le public branché.