À la rencontre des « bots » qui veillent eux aussi sur Wikipédia

Classé dans : Services en ligne, Wikipédia | 8

Temps de lecture 7 min

image_pdfimage_print

Connaissiez-vous les «  bots  » de Wikipédia  ?

Le mieux est de commencer tout d’abord par demander à Wikipédia  :

«  Les bots sont des agents automatiques ou semi-automatiques qui interagissent avec Wikipédia comme le fait un utilisateur, mais pour des tâches répétitives et fastidieuses pour un humain. Les bots peuvent être utilisés pour créer des articles. D’autres peuvent être utilisés pour éditer ou même détruire des articles. Certains bots sont spécialisés dans la gestion des liens d’interlangue, la résolution des homonymies, les annulations de certains vandalismes ou encore les opérations sur les catégories. Des bots bien conçus peuvent apporter un bénéfice concret à Wikipédia. Cependant, parce que le système n’a pas été conçu pour supporter des bots, même un bon bot peut avoir des effets secondaires non souhaitables.  »

C’est donc de ces satanés bots dont il est question dans la traduction ci-dessous. Bien moins pour glorifier l’intelligence artificielle que pour rendre hommage à ceux bien humains qui les programment dans les coulisses.

Remarque  : Les wikipédiens francophones ont quant à eux souvent à faire avec le bot Salebot (Attention, bot méchant  ! nous prévient-on sur sa page «  Utilisateur  »), un article spécialement dédié lui avait été consacré par Camille Gévaudan sur le site Écrans en août 2008.

Kristina Alexanderson - CC by-sa

Meet the ‘bots’ that edit Wikipedia

Daniel Nasaw – 25 juillet 2012 – BBC News
(Traduction  : elfabixx, Pwetosaurus, Gatitac, Jose, ProgVal, Kaya, fck)

Rencontrez les «  bots  » qui éditent Wikipédia

Wikipedia est écrit et maintenu par des dizaines de milliers de volontaires bénévoles dans le monde, qui sont eux-mêmes assistés par des centaines de «  bots  » — des programmes informatiques autonomes — qui aident à garder l’encyclopédie fonctionnelle.

«  Le pénis est l’organe mâle de copulation et de miction chez les mammifères.  » dit la page Wikipédia en question.

Cette affirmation est indéniablement vraie, et donc mérite d’être dans Wikipédia, mais elle n’a assurément rien à faire dans l’article du site consacré à la Cour suprême  !

C’est un facétieux lecteur anonyme de Wikipédia vivant en Caroline du Sud a proposé cette contribution à l’encyclopédie mondiale en ligne la semaine dernière, et il a suffi de quelques secondes pour que cette erreur soit détectée et supprimée.

Ce vandalisme n’a pas été trouvé par un autre contributeur, mais simplement par un programme d’intelligence artificielle appelé «  bot  », qui est une aphérèse de «  robot  ».

Virtuellement invisible

ClueBot NG, car tel est son nom, réside dans un ordinateur à partir duquel il intervient sur la vaste encyclopédie pour détecter et nettoyer le vandalisme, quasiment dès que celui-ci apparaît.

Il fait partie des quelques centaines de bots qui patrouillent sur Wikipedia à tout moment. Son rôle dans la restauration immédiate de l’article sur la Cour suprême illustre comment les bots sont devenus une partie indispensable — même si virtuellement invisible — du projet Wikipédia.

«  Wikipedia serait une belle pagaille sans les bots  », écrivait dans un courriel un administrateur de Wikipédia, connu sur le site sous le nom de Herfold.

À elle seule, la version anglaise de Wikipedia dépasse les quatre millions d’articles ce mois-ci. Elle contient autour de 2.5 milliards de mots, équivalent à des millions de pages, et est 50 fois plus grosse que l’Encyclopædia Britannica.

Wikipedia est maintenue dans toutes les langues par des dizaines de milliers de contributeurs — dont environ 77 000 font plus de cinq éditions par mois.

Le projet est devenu avec le temps tellement vaste et sa maintenance un tel travail intensif que cela défie les capacités de ses administrateurs et simples contributeurs humains de le maintenir en ordre.

Intervenir contre les vandales

C’est là que les (ro)bots interviennent.

«  On s’amuse à penser au jour où les robots se mettront en grève juste pour que tout monde se rende compte de la quantité de travail qu’ils abattent  », dit Chris Grant un étudiant de 19 ans à Perth en Australie, qui fait partie du comité de Wikipédia qui supervise les robots.

«  Le site demanderait beaucoup plus de travail de notre part et épuiserait davantage les contributeurs  ».

Les bots effectuent ainsi de nombreuses tâches éditoriales et administratives qui sont fastidieuses, répétitives et chronophages mais néanmoins vitales.

Ils suppriment le vandalisme et les grossièretés, organisent et cataloguent les entrées, et gèrent les coulisses de l’encyclopédie, ce qui lui permet de fonctionner efficacement et de garder son apparence soignée et uniforme dans le style.

En des termes plus concrets, les bots sont comme des étudiants qui veillent sur les livres, déplacent des piles d’un étage à un autre, corrigent les codes-barres au dos des livres, et effectuent d’autres tâches ingrates, qui permettent aux bibliothécaires qualifiés de se concentrer sur les acquisitions et la politique du lieu.

Les bots peuvent-ils écrire  ?

«  Wikipédia s’est tellement développée que je ne sais pas comment les gens pourraient bien la gérer si tous les bots s’en allaient  » nous dit Brad Jorsch, un programmeur informatique en Caroline du Nord qui gère un bot qui traque les bandeaux rappelant aux rédacteurs d’ajouter des sources aux articles.

Les bots sont présents depuis presque aussi longtemps que Wikipédia elle-même.

Le site a été fondé en 2001 et l’année suivante, un bot appelé Rambot a créé environ 30 000 articles — à un rythme du millier par jour — sur les villes individuelles des États-Unis. Le bot a puisé ses données directement à partir de tabeaux de recensement américain. Et les articles se lisaient bien comme s’ils avaient été écrit par un robot. Ils étaient courts et convenus, et contenaient à peine plus que des séries de statistiques démographiques.

Mais, une fois qu’ils avaient été créés, des rédacteurs humains prenaient le relais et remplissaient les entrées avec des détails historiques, des informations sur la politique locale et les sites touristiques.

En 2008, un autre bot a créé des milliers de courts articles sur des astéroïdes, renseignants quelques lignes de données pour chacun à partir des bases de données de la NASA.

Aujourd’hui, la communauté Wikipédia demeure divisée quant à l’apport des bots aux articles. Certains administrateurs trouvent que de petits articles composés de quelques données n’ont que peu de valeur, d’autres trouvent que tout nouveau contenu est bon à prendre.

La peur des bots malicieux

Le résultat du débat a été que les bots ne sont désormais plus autorisés à écrire des articles entiers. Cependant, leur capacité à effectuer le plus gros de la maintenance libère les vrais contributeurs humains qui disposent alors de plus de temps pour effectuer une recherche, créer ou modifier un article et vérifier l’exactitude du travail des autres.

«  Je ne pense pas que les gens réalisent quelle quantité de maintenance et de travail annexe sont nécessaires sur Wikipédia  » dit Grant.

Certains administrateurs craignent les dégâts qu’un bot renégat pourrait un jour occasionner à l’encyclopédie. Pensez à Skynet dans les films Terminator.


Ces peurs sont infondées, d’après Grant.

Déjà, un robot n’est pas comme une automobile  : si une partie d’une opération échoue, il s’arrêtera plutôt que de se fracasser quelque part.

«  Il faudrait déjà que quelqu’un demande à un programmeur de rendre le bot fou et qu’il efface tout  », dit Grant.

«  Les bots avec les droits de supprimer des pages, bloquer des éditeurs, et prendre d’autres décisions drastiques ne peuvent être utilisés que par des contributeurs de confiance disposant de hauts privilèges administratifs  », dit Grant.

Cependant, les bots aussi font des erreurs lorsqu’ils font face à des situations pour lesquelles ils n’ont pas été conçus. ClueBot NG, le bot anti-vandlisme, a cependant un très faible taux de faux positifs (lorsqu’il confond des articles légitimes avec du vandalisme). Étant donné que Wikipédia garde une trace des éditions, les erreurs peuvent être réparées presque aussi vite qu’elles surgissent, disent les administrateurs.

Les contributeurs humains ne craignent pas d’être un jour remplacés par les bots, disent les maîtres de bots. «  Ecrire un article, citer ses sources, ou encore améliorer sa grammaire et son orthographe nécessiteront toujours le concours d’une personne  », conclut Jorsch.

Crédit photo  : Kristina Alexanderson (Creative Commons By-Sa)

8 Responses

  1. Zil

    C’est amusant mais il aurait été intéressant de parler de Salebot et de fr.

  2. aucuneimportance

    Techniquement c’est très impressionnant. Sauf que : la dernière fois que j’ai voulu commencer une contribution (en fait une traduction), par deux fois, ma contribution a été supprimée en une fraction de seconde par un bot sous prétexte que ça ne respectait pas les « canons » wikipédiens. Forcément, faut bien commencer quelque part…

    Moralité : désormais, pour initier quelqu’un à (contribuer à) wikipédia, je ne vais surtout pas sur wikipédia. Autre chose à faire que de me/se battre contre des bots « intelligents ».

    … C’est peut-être l’objectif visé?

  3. aKa

    @Zil : Oui, du coup j’ai ajouté un vieux lien sur Salebot dans mon intro :
    http://www.ecrans.fr/Inside-Wikiped

    @aucuneimportance : Cela m’est arrivé moi aussi. Il vaut mieux commencer par modifier un article existant que de vouloir de go en créer un, ce qui éveille la suspicion d’un bot parce que c’est la première fois qu’il voit votre IP 😉

  4. aucuneimportance

    @aka ben oui, mais si je veux précisément créer une nouvelle page … ?
    Je dois en abimer une pour en créer une autre ? 😛

    Ne serait-il pas plus judicieux que le bot (se|nous) laisse un peu plus de 0,5s avant d’agir ? (genre 15 / 30 minutes / 1h ?)

    Enfin bref, de toute manière, je ne peux pas prendre le risque de faire un atelier « initiation wikipédia » et de voir la séance saccagée en plein milieu par un bot…

  5. Aa

    @aucuneimportance je fais très régulièrement des ateliers d’initiation à Wikipédia, et il arrive que les articles créés à l’occasion, pour une raison X ou Y, soient supprimés par un administrateur ou par un bot. Ok ça n’est pas très agréable, mais ça fait partie du fonctionnement de Wikipédia et, bien expliqué, c’est souvent au contraire l’occasion pour les néophytes de mieux comprendre comment fonctionne la contribution et la « modération » sur Wikipédia.

    Après, on peut aussi suivre d’assez près les nouveaux pour leur éviter cela lors d’un atelier. Mais les bots sont indispensables pour que les contributeurs puissent se concentrer sur des tâches qui nécessitent une vraie intelligence…

  6. Benoît

    Bonjour,
    Savez-vous comment agissent les robots ?
    – utilisent-ils la même interface (formulaire web) que les humains ?
    – ont-ils une interface simplifiée mais toujours web ?
    – travaillent-ils directement dans les données (ce qui serait bien plus économique en ressources serveurs par rapport à l’interface pour humains et certainement plus rapide) ?

    Merci d’avance

    Benoît

  7. ironie

    @Benoit :

    La majorité des bots wikipédiens (type pywikipedia) sont contrôlés par l’intermédiaire d’une interface textuelle de type « ligne de commande » ou « shell unix », c’est à dire une fenêtre qui affiche du texte déroulant (parfois en couleur) dans laquelle l’utilisateur tape des instructions.
    Une fois le bot lancé, le programmeur peut suivre/contrôler les actions du bots dans cette fenêtre. Ou bien fermer la fenêtre et laisser le bot fonctionner tout seul pendant des jours.
    Voir par exemple http://commons.wikimedia.org/wiki/F

    Certains bots dont les fonctions obligent à un contrôle humain pour chaque édition (corrections syntaxe, orthographe) ont des interfaces évolués, avec des boutons, des fenêtres, etc. On les assimile à des bots, mais il s’agit plutôt de programmes/script d’assistance rédactionnelle que de programmes autonomes.

    Les bots « lisent et écrivent » Wikipédia par l’intermédiaire d’une transmission de texte brut (API web), et n’utilisent donc pas les pages HTML vues par les humains. Voir http://fr.wikipedia.org/w/api.php Quelques bots (anti-vandalisme notamment) utilisent le protocole IRC pour suivre le flux continu des dernières modifications. Pour certaines tâches spécifiques (recherche d’information), les bots interrogent une réplique de la base de donnée.


    @ all

    Sinon merci l’équipe Framablog pour la traduction. Selon moi, c’est quand même très journalistique, c’est à dire que ça mélange plein de trucs : l’ambition est d’intéresser le lecteur, lui donner une idée sensationnelle ou énervante… Pas vraiment expliquer et vulgariser.

    Pour le risque de bots malicieux, Grant n’y connait rien. Pas besoin d’agiter l’épouvantail Skynet, sur Internet existent déjà les botnets, et sur Wikipédia des faux-humains.

    Quant à ClueBot NG, son intérêt dépasse celui de la simple tâche d’anti-vandalisme (cf Salebot). ClueBot est l’un des premiers bots « intelligence artificielle », par l’usage d’algo d’apprentissage automatique. Ça signifie que le bot s’éduque « tout seul » au fil des jours. Il perfectionne petit à petit ses règles, et devient ainsi capable de discerner des principes/facteurs d’action qui échappent au discernement des humains (ou son programmeur). C’est ça, la magie.

    D’après les études sur Wikipédia et les recherches en cours, c’est là l’avenir des bots wikipédiens : plus seulement des scripts idiots (regex) qui remplacent un bout de texte sur des milliers d’articles, mais des « compagnons » qui aideront et conseillerons les rédacteurs humains : recherche d’information, suggestions, complètement et corrections. Pour illustrer, des universitaires japonais ont déjà testé avec succès un bot qui découvre les sujets/informations manquants dans un article wikipédia (après recherche Google et analyse de pages web) et qui propose ensuite au lecteur wikipédien d’insérer l’information manquante… avec un simple clic.

    VOIR AUSSI 😉
    * la page des bots wikipédiens sur wikipédia : http://fr.wikipedia.org/wiki/Wikip%

    * mon blog à propos des bots wikipédiens : http://wikironie.wordpress.com