Lokas : l’app pour enregistrer et transcrire vos réunions en toute confidentialité

Framasoft vous propose d’essayer le prototype de Lokas, une nouvelle application de transcription « speech to text » qui respecte votre vie privée. Cette démo fonctionnelle est aussi une expérimentation de Framasoft dans le domaine de l’IA, accompagnée du site Framamia, que l’on présente ici.

🎈 Framasoft a 20 ans🎈 : Contribuez pour financer une 21e année !

Grâce à vos dons (défiscalisables à 66 %), l’association Framasoft agit depuis 20 ans pour faire avancer le Web éthique et convivial. Retrouvez un focus sur certaines de nos actions en 2024 sur le site Soutenir Framasoft.

➡️ Lire la série d’articles de cette campagne (nov. – déc. 2024)

 

Veuillez noter que cet article est aussi disponible en anglais.

Facilitez vos prises de notes avec Lokas

Lokas est une application (sur smartphone Android ou iOS) qui permet de transcrire le son de voix en fichier texte.

En gros, pour une réunion : vous mettez le téléphone au centre de la table, vous appuyez sur le bouton « Enregistrer » en début de réunion, sur « Arrêter » en fin de réunion, et l’application vous renvoie quelques minutes après un fichier texte reprenant les phrases prononcées par chacun et chacune.

Lokas permet et surtout permettra pas mal d’autres choses, mais nous y reviendrons en fin d’annonce.

captures d'écran de l'application Lokas avec les trois étapes : enregistrement, édition du transcript, détail du temps de parole

Lokas, c’est pour qui ?

Lokas s’adresse à toute personne qui participe à des réunions. Autant dire un paquet de personnes sur la planète 🙂

Nous pouvons cependant partager quelques cas d’usages.

Premier exemple : une AG associative

Imaginons une Assemblée Générale associative. Il y a 15 personnes dans la pièce, 2 animateur⋅ices, 1 personne à la prise de notes. Et une réunion de 2H.

Les soucis :

  • La prise de notes est épuisante
  • La personne qui prend les notes voit sa participation limitée
  • Les notes peuvent être incomplètes (un « trou » dû à une pause pipi)

Ce qu’apporte Lokas ?

Lokas permet d’assister la personne qui prend les notes, et lui permettra de participer plus facilement (tout en autorisant la pause pipi !).

Exemple de transcription d'un échange vocal avec l'application Lokas
Exemple de transcription d’un échange vocal avec l’application Lokas

Second exemple : un atelier avec des ados

Un atelier de l’association « Les petits débrouillards ». 3 groupes de 5 adolescent⋅es. Une majorité de filles dans les groupes.

Les soucis :

  • La prise de notes peut être très compliquée
  • Les garçons monopolisent la parole

Ce qu’apporte Lokas ?

Lokas permet de garder trace (sonore et écrite) de ce qu’il s’est dit. Et permet d’établir des statistiques de temps de paroles, notamment par genre, afin d’objectiver le fait que les garçons ne laissent que peu de temps de paroles aux filles.

Troisième exemple : une réunion de travail en visio, en langue étrangère

Votre collectif militant est proche d’une association espagnole. C’est Camille, une bénévole de votre collectif, qui parle à peu près l’espagnol, qui fera la visio avec son interlocutrice madrilène. La visio a donc lieu dans une langue étrangère.

Les soucis :

  • Vous avez besoin de pouvoir réécouter à tête reposée
  • Vous avez besoin d’une transcription en français et de la partager aux membres du C.A.

Ce qu’apporte Lokas ?

Avec Lokas, Camille pourra réécouter la visio, la transcrire automatiquement en français, et la partager depuis votre smartphone (par mail, via Signal, Matrix, WhatsApp, Telegram, etc).

Soutenir Lokas (et Framasoft)

L’IA n’est pas magique . Lokas non plus 🤷.

Lokas n’est qu’un outil. Il peut vous assister dans la prise de notes. Cependant, comme tout outil, il ne doit pas vous dispenser d’utiliser votre cerveau !

L’invention de l’écriture (une autre technologie, très perfectionnée) date d’au moins 3 000 ans. Cela fait donc au moins aussi longtemps que l’humanité est capable de se réunir et de garder des traces écrites. Sans IA. Sans smartphone. Ne jetez pas plusieurs millénaires de techniques avec l’eau de l’IA. Un outil comme Lokas pourra être utile dans certains cas, et complètement gadget, voire improductif, dans d’autres cas. Cela n’est pas sans rappeler le concept de Pharmakon, cher au philosophe Bernard Stiegler : Lokas, comme tout objet technique, est à la fois poison, remède, et bouc-émissaire.

Par exemple le web est « à la fois un dispositif technologique associé permettant la participation et un système industriel dépossédant les internautes de leurs données pour les soumettre à un marketing omniprésent et individuellement tracé et ciblé par les technologies du user profiling. ». Remède et poison.

De la même façon, Lokas pourra être émancipateur (en facilitant la participation plutôt que la prise de notes), ou au contraire contraignant (les réunions un peu foutraques dans un bar bruyant ont aussi leur intérêt, il ne faudrait pas s’en passer parce que l’outil fonctionne mieux dans un environnement calme), ou frustrant (« l’application a planté, je n’ai aucune note de secours ! La technologie, c’est de la mârde ! »).

Lokas, comme une voiture, un marteau, un stylo, n’est pas un outil « neutre ». À vous de voir, collectivement, si vous souhaitez l’utiliser, et comment.

Illustration de Gee, montrant de mauvaises conditions pour utiliser Lokas, à savoir une réunion bruyante dans un bar
Forcément, ça va moins bien marcher – CC-By SA Gee

« C’est l’histoire d’une app… »

Il nous semble intéressant de pouvoir vous raconter comment est née l’application Lokas. C’est lever un coin de rideau sur les coulisses de Framasoft, comprendre comment nous pouvons prendre la décision de faire (ou de ne pas faire) tel ou tel projet. C’est aussi montrer que parfois, avec un peu de chance et d’huile de coude clavier, on peut faire des choses qui pourraient paraître impossibles. Cependant, comme cette partie n’est pas indispensable, on vous laisse le choix d’en prendre connaissance ou pas.

Cliquez ici pour lire (l’improbable et fabuleuse) histoire de Lokas

 

Cela fait bien trois ou quatre ans que l’idée de Lokas traîne dans la tête de pyg, membre de Framasoft.

L’idée de départ (nom de code : « Brewawa »), c’était surtout d’imaginer une application qui serait capable de calculer le temps de parole de locuteur⋅ices dans une réunion. Le but (pas du tout caché) était de démontrer facilement que lors d’une discussion avec des personnes de genres différents, ce sont de façon très très majoritairement les hommes qui monopolisent la conversation.

Différents essais ont été réalisés ces dernières années (coucou Gee, coucou bjnbvr !) pour étudier la faisabilité d’une telle application. Mais le fait est qu’en 2020, même si les possibilités techniques étaient présentes, elles n’étaient pas vraiment accessibles pour notre toute petite association, surtout sur un projet parallèle à tous ceux que Framasoft menait déjà.

« C’est l’histoire d’améliorations techniques… »

Cependant, avec le développement de logiciels tels que Vosk ou Whisper, les capacités de transcription audio (c’est-à-dire la capacité à transformer le son de phrases en texte) se sont largement améliorées.

À tel point qu’aujourd’hui, ces technologies sont utilisées par énormément de logiciels (de YouTube à PeerTube, en passant par BigBlueButton ou WhatsApp), et souvent même directement intégrée dans des appareils (Samsung en fait clairement un argument de vente).

Par ailleurs cette dernière décennie a aussi vu s’améliorer les processus de « diarisation ». Ce terme un peu barbare est en fait la technique qui permet d’identifier différent⋅es locuteur⋅ices dans une discussion. Par exemple, si Alex, Camille et Fred font une réunion, la diarisation saura attribuer à chacun⋅e les phrases qu’il ou elle aura prononcées (non, le logiciel ne va pas deviner le prénom de la personne, mais il saura – à peu près – identifier qu’il y avait trois participant⋅es, et dire « Cette phrase a été prononcée par la personne #1. Cette phrase a été prononcée par la personne #2. », etc.

C’est évidemment une phase essentielle pour pouvoir comprendre « qui a dit quoi » dans une réunion.

Ce processus est encore imparfait, mais s’améliore de mois en mois. Il faut donc se projeter en 2026 ou 2027 pour imaginer une diarisation vraiment fiable, mais elle est aujourd’hui « suffisante » dans 60 à 80% des usages en « bonnes conditions ».

« C’est l’histoire d’un alignement de planètes… »

Il se trouve qu’au sein de Framasoft, les compétences nécessaires pour le développement d’une telle application étaient réunies.

Chocobozzz, le développeur de PeerTube, avait déjà beaucoup travaillé sur le processus d’intégration de Whisper à PeerTube, afin de pouvoir générer automatiquement les sous-titres d’une vidéo. Il connait donc bien Whisper, ses options de configuration, ses performances, etc.

Wicklow, le développeur de l’application PeerTube, travaille depuis plusieurs mois avec le langage Dart et le SDK Flutter qui permet de développer en une seule base de code une application pour différents terminaux (Android, iPhone, ordinateur/tablette, web, etc).

Luc, notre administrateur système préféré (c’est pas compliqué, remarquez, nous n’en avons qu’un 😅) gère l’intégralité de l’infrastructure technique de Framasoft (une soixantaine de serveurs informatiques physiques). Donc, mettre en place la machine qui gère les transcriptions, l’installer, la sécuriser, etc, était pour lui un jeu d’enfant.

pyg, anciennement directeur de Framasoft, aujourd’hui coordinateur des services numériques de l’association, a géré d’innombrables projets pour Framasoft ces 20 dernières années. Alors, un de plus, même en pleine campagne, ça n’allait pas l’arrêter.

Entre cet ensemble de compétences, et les capacités techniques des logiciels de transcriptions et diarisation, les planètes étaient donc alignées pour lancer un tel projet.

« C’est une histoire de chance… »

Cependant, comme souvent, il faut un peu compter aussi sur le hasard ou la chance.

En effet, pyg avait un peu laissé tomber l’idée de cette application, tout simplement par ignorance des avancées techniques en termes de diarisation.

C’est en évoquant l’idée de cette application lors du dernier Framacamp, en juillet 2024, que Wicklow a lâché une info au détour de la conversation : « Ah, mais tu sais, Whisper fait maintenant une diarisation correcte. »

BIM 💣

 

« Ah, super intéressant ! Mais j’imagine qu’il faudrait longtemps pour développer une telle application de transcription libre ? » lui demanda pyg.

« Oh, je dirais qu’en 3 jours, je peux avoir un prototype fonctionnel si Chocobozzz se charge de la partie serveur. »

BOUM 💥

Autant vous dire qu’au lieu de profiter de sa soirée à jouer au poker, pyg a filé dans sa chambre, préparé une présentation d’une douzaine de diapositives sur un potentiel projet d’application, qu’il a présenté à l’association le lendemain matin.

Diapo extraite de la présentation "Brewawa"
Une des diapos produites pendant la nuit…

 

Certain⋅es membres étaient enthousiastes, d’autres moins. Et on les comprend : d’une part, c’était encore ajouter du travail à une association déjà particulièrement chargée et épuisée ; d’autre part, c’était un projet utilisant un logiciel issu de l’intelligence artificielle, une technologie sur laquelle nous sommes (unanimement) très critiques.

Cependant, cette application, qui allait devenir Lokas, nous semblait un bon moyen « d’incarner » l’objet social de Framasoft : faire de l’éducation populaire aux enjeux du numérique et des communs culturels.

Cela nous permettait en effet de sortir de l’aspect discours pédagogique, à la fois indispensable, mais insuffisant en termes d’appropriation et d’autodétermination. En créant un « objet numérique manipulable », nous pouvions faire de Lokas une occasion complémentaire de faire comprendre ce qu’est l’IA, ses possibilités, mais aussi ses faiblesses. Et revenir, donc, à notre « Pharmakon » évoqué plus haut.

Par ailleurs, en plus de pouvoir assister tout collectif faisant des réunions, cela nous permettait de mettre en œuvre, concrètement, une application portant nos valeurs : un outil convivial, n’exploitant pas les données des utilisateur⋅ices, sous licence libre, s’adressant avant tout aux personnes qui changent le monde pour plus de progrès social et de justice sociale.

Au final, la majorité des membres présent⋅es s’est exprimée : « Banco la caravane ! On se lance ! ».

« C’est (aussi) une histoire de contraintes »

Comme évoqué plus haut, les contraintes étaient fortes.

Un projet, ça coûte forcément en temps et en argent. Du temps et de l’argent qui ne pourront pas être utilisés ailleurs.

Or, il ne vous a pas échappé que Framasoft vit des dons. Il faut donc faire des campagnes de dons. Et la fin de l’année était déjà particulièrement chargée par la finalisation de différents projets et leurs annonces

En discutant avec Thomas et Pouhiou, codirecteurs de l’association, il a donc été décidé que Lokas devrait rester un projet sous contraintes fortes : coûter moins de 10 000€ tout compris ; ne pas impacter fortement les missions de Chocobozzz, pyg, ou Wicklow ; être réalisé (à « temps perdu », donc) entre mi-septembre et mi-novembre (notamment à cause des délais de validation des stores Android et iOS, que nous ne maîtrisons pas).

Avec de telles contraintes, impossible pour nous de réaliser un produit bien finalisé. Nous avons donc décidé de viser plutôt la mise à disposition d’un prototype. Voyez ce prototype comme un appartement témoin. Nous avons produit cette version non pas en nous focalisant sur un projet de long terme, avec des fondations solides, mais plutôt comme une « preuve de concept », développée rapidement, pour voir si le concept est suffisamment attirant et intéressant pour qu’en 2025 nous priorisions le développement de cette application (si les dons sont suffisants, donc !).

Afin de vous donner suffisamment « envie » de voir un jour une version 1.0 de Lokas arriver, nous avons fait appel aux compétences de l’Atelier Domino pour la création d’un logotype et d’une charte graphique. Ce qui nous a guidés pour réalisé en interne le site web du projet : lokas.app

En parallèle, Wicklow et Chocobozzz se sont attaqués au développement du prototype, ainsi qu’à la partie serveur de transcription.

« C’est une histoire qui ne demande qu’à être écrite… »

Une quinzaine de jours de travail plus tard (et un coût estimé à 7 500€ tout compris, avec en gros moitié de temps de travail Framasoft, et moitié prestations : Atelier Domino, location du serveur, des noms de domaines, validation des stores), nous pouvons présenter, avec fierté et un peu d’anxiété, notre prototype !

Soutenir Lokas (et Framasoft)

Lokas, comment ça marche ?

1. Se mettre dans les bonnes conditions

Lokas, comme tous les outils de transcription, d’ailleurs, est imparfait. Des bruits extérieurs, une mauvaise articulation, une voix fluette en fond de salle, des personnes qui se coupent la parole… Autant de raisons qui peuvent nuire à la transcription.

En conséquence, prévoyez de vous mettre au calme, de placer le téléphone au centre de la table (meilleure est la qualité sonore, meilleure est la transcription), n’ayez pas plusieurs discussions en même temps, et… prenez des notes « à l’ancienne » à côté (papier+crayon, ordinateur+pad, etc) en cas de souci.

Une fois cela fait, le fonctionnement est très simple.

Illustration de Gee montrant les bonnes conditions pour Lokas, à savoir une réunion au calme.
L’IA c’est pas magique : Lokas nécessite de bonnes conditions – CC-By SA Gee

2. Lancer l’enregistrement

Cliquez simplement sur le bouton « Enregistrement ». Placez le téléphone de façon à ce qu’il puisse capter au mieux les échanges. Et commencez votre réunion.

Capture (non contractuelle ;) ) de l'application Lokas, permettant l'enregistrement et la mise en pause de cet enregistrement audio
Enregistrement d’une réunion

 

Afin de limiter les abus, les enregistrements sont limités à 5 par jour et par appareil.

Notez que le modèle de langue géré par Lokas permet de l’utiliser d’ores et déjà dans une cinquantaine de langues, notamment : Néerlandais, espagnol, coréen, italien, allemand, thaïlandais, russe, portugais, polonais, indonésien, mandarin, suédois, tchèque, anglais, japonais et bien entendu français ! D’autres langues sont supportées, mais la reconnaissance sera moins performante.

À la fin de la réunion, cliquez sur « Finaliser ».

3. Envoyez votre fichier pour transcription (et patientez)

Vous pourrez éventuellement réécouter votre fichier avant de cliquer sur « Envoyer ».

Votre fichier est alors envoyé sur notre serveur où il sera placé dans la file d’attente pour sa transcription.

Cette étape pourra prendre de quelques minutes à quelques heures, suivant le nombre de fichiers en attente.

Vous pourrez vérifier manuellement si votre fichier a bien été transcrit, ou attendre tranquillement la notification (dont la tâche de vérification est exécutée toutes les 15mn)

 

Capture (non contractuelle ;) ) de l'application Lokas, montrant l'écran signifiant l'envoi du fichier audio aux serveurs de Framasoft
L’écran signifiant l’envoi du fichier audio aux serveurs de Framasoft

Une fois la transcription reçue

Une fois la transcription reçue, vous pourrez l’afficher dans Lokas.

 

Vous pourrez évidemment la partager (avec l’application de votre choix : mail, Signal, WhatsApp, etc) pour la corriger.

Affichage du menu de partage (audio ou texte) dans Lokas. En fond d'écran, la transcription.
Affichage du menu de partage (audio ou texte) dans Lokas. En fond d’écran, la transcription.

 

Vous pourrez aussi voir les statistiques de temps de parole (NB : cette fonctionnalité est relativement expérimentale). Si vous le souhaitez, pour une meilleure lecture des notes, vous pouvez attribuer un prénom (ou pseudo) aux participant⋅es. Pour obtenir des temps de parole par genre, vous pouvez aussi les attribuer manuellement, en vous assurant évidemment du consentement des personnes concernées à communiquer cette information. Notez que ces informations sont volontairement manuelles, et ne quittent pas votre téléphone, et ne sont donc pas transmises à Framasoft ou qui que ce soit.

 

Capture (non contractuelle ;) ) des stats de l'application Lokas. Temps de parole par participant⋅es et genres (attribués manuellement) des participant⋅es
Aperçu des temps de parole, ainsi que des noms et genres des participant⋅es (aucune de ces informations n’est transmise à Framasoft)

 

Point confidentialité : l’une des particularités de Lokas est que nous respectons votre vie privée : le fichier audio est enregistré sur votre téléphone. Il est envoyé, à votre demande, sur nos serveurs, qui se chargeront alors de sa transcription. Une fois la transcription terminée, une notification est envoyée sur votre téléphone ; lorsque vous ouvrez (dans « Mes fichiers ») la réunion en question, la transcription est alors téléchargée sur votre téléphone. Une fois cette étape réalisée, et après un léger délai pour s’assurer que tout s’est bien passé techniquement, tout est supprimé de notre serveur : le fichier audio ainsi que la transcription. Par ailleurs, si vous attribuez des noms, pseudos ou genres, pour les statistiques, sachez que ces informations ne font l’objet d’aucun traitement de notre côté.

Soutenir Lokas (et Framasoft)

Et l’IA dans tout ça ?

À Framasoft, nous ne sommes pas fans du tout de l’IA. Nous pensons que cette technologie (ou plutôt cet ensemble de technologies), pose plus de problèmes qu’elle n’apporte de solutions. Nous avons d’ailleurs essayé de présenter une synthèse de notre position sur l’I.A. au sein du site Framamia, que nous présentons ici sur le Framablog.

Alors, n’est-ce pas contradictoire d’utiliser l’IA au sein d’applications Framasoft, comme Lokas ou PeerTube ?

À notre sens, non. Et ce pour plusieurs raisons.

D’abord, comme nous l’écrivions dans le site Framamia, tous les modèles d’intelligence artificielle ne se valent pas. Whisper, le logiciel qui sert à la transcription, est une IA « spécialisée », et non une IA « généraliste » comme ChatGPT par exemple.

« Les modèles spécialisés, quant à eux sont optimisés pour résoudre efficacement une tâche précise. Leur impact est souvent maîtrisé, et peut correspondre à celui d’un autre logiciel. ».
Framasoft, sur le site Framamia.org

Whisper est certes une IA, mais qui tourne « en vase clos » sur nos serveurs.

Les algorithmes utilisés sont plus complexes qu’un filtre « Enlève les yeux rouges de cette photo » avec GIMP ou Photoshop, mais cela reste un modèle relativement simple (avec un processus d’entrées/sorties) infiniment moins énergivore qu’un modèle d’entraînement. En effet, l’inférence (le processus d’utiliser le modèle pour effectuer une tâche) consomme bien moins d’énergie que l’entraînement. Par exemple, exécuter Whisper pour transcrire un fichier audio de quelques minutes nécessite une puissance de calcul relativement modeste.

Ensuite, un projet comme Lokas ne nécessite pas d’acheter 350 000 puces GPU pour 9 milliards de dollars, comme l’a fait récemment Meta/Facebook, ce qui représente en gros le PIB du Togo en 2023. Nous ne pensons pas participer à la croissance de la bulle financière autour de l’IA, ou à faire faire s’emballer le capitalisme algorithmique.

Enfin (et surtout), avec Lokas ou PeerTube, nous demeurons cohérent⋅es avec une des valeurs au cœur de Framasoft, à savoir le respect de la confidentialité de vos données. En effet, nous ne faisons aucune exploitation de vos fichiers, en dehors de la tâche explicitement demandée, par exemple la transcription. Elles ne servent pas à enrichir un modèle d’IA à partir de vos discussions, de votre identité, etc. Nous ne conservons pas les fichiers audio ou texte, nous n’avons pas accès aux noms/prénoms/genres que vous attribuez manuellement aux participant⋅es d’une discussion (ça reste sur votre téléphone), etc. Et, évidemment, vos données ne sont JAMAIS monétisées.

Bref, Framasoft se fiche du contenu de vos données, elles vous appartiennent et ne regardent que vous.

Malgré cela, nous respectons le point de vue des personnes qui souhaitent boycotter l’IA, et nous entendons la contradiction qu’iels pourraient trouver à ce qu’une asso technocritique comme Framasoft propose des projets utilisant l’I.A.

Notre objectif est justement de proposer un outil qui permette d’avoir une réflexion concrète, afin de se forger un avis autonome, permettant à chacun et chacune de se construire sa propre position.

Illustration. Autour d'une table, des pinguoin chantent. Au centre, un petit perroquet mécanique prend des notes à la manière d'un sténographe.
Un perroquet mécanique prend des notes : tout un symbole.Illustration de David Revoy – Licence : CC-By 4.0

Lokas c’est pour quand ?

Vous pouvez d’ores et déjà télécharger l’application Lokas sur le Play Store, iOS (toujours en testflight chez Apple, parce qu’ils sont 🤬… disons tatillons), f-droid (en cours), ou avoir l’apk Android en téléchargement direct ici. Notez cependant que Lokas est un prototype (si ce n’est pas déjà fait, prenez deux minutes pour lire « L’histoire de Lokas » et comprendre pourquoi), et il est donc normal que plein plein plein de choses ne fonctionnent pas !

Nous avons déjà pris du temps, de l’énergie, et un peu d’argent sur des ressources pourtant limitées (on vous a déjà dit qu’on ne vivait que de vos dons ? 😉 ). De plus, comme toujours, le code est libre, nous l’avons publié ici sur notre forge logicielle.

Avant d’aller plus loin, nous avons donc besoin de confirmer que ce projet vous intéresse. Si les dons ne sont pas assez importants, ou si les contradictions sont trop fortes : nous nous arrêterons là. (le code est libre, donc ça ne sera pas « perdu »).

Si, par contre, vous trouvez ça pertinent, les possibilités de développements futurs sont innombrables. Citons par exemple :

  • Reprendre complètement le design et l’accessibilité (en mode prototypage, nous sommes allé⋅es très vite, et Lokas est donc très perfectible) ;
  • Possibilité de (re)transcrire le fichier de son choix (par exemple issu d’une vidéo ou d’une autre application) ;
  • Ajouter un mode « web » à l’application. C’est à dire la possibilité d’utiliser Lokas depuis son ordinateur (sur le modèle de ce que fait le serveur Scribe de nos ami⋅es des Céméa) ;
  • Ajouter la possibilité de synthèses automatiques des transcriptions, pour retrouver rapidement les points clés ;
  • Traduire l’application (et le site web) dans d’autres langues que le français et l’anglais ;
  • Possibilité d’éditer et corriger la transcription directement depuis votre téléphone ;
  • Donner la possibilité d’obtenir la transcription dans la langue de son choix (par exemple une réunion en anglais, transcrite en français, ou l’inverse) ;
  • etc

Mais pour cela, il va nous falloir du temps salarié, et donc de l’argent. Donc, au risque de paraître insistant, nous vous invitons, si vous le pouvez, à nous faire un don.

Faire une don pour soutenir Lokas

Le défi : 20 000 fois 20 € de dons pour les 20 ans de Framasoft !

Framasoft est financée par vos dons ! Chaque tranche de 20 euros de dons sera un nouveau ballon pour célébrer 20 d’aventures et nous aider à continuer et décoller une 21e année.

Framasoft, c’est un modèle solidaire :

  • 8000 donatrices en 2023 ;
  • plus de 2 millions de bénéficiaires chaque mois ;
  • votre don (défiscalisable à 66 %) peut bénéficier à 249 autres personnes.

jauge de dons au 3 décembre 2024 à 58 625 €

À ce jour, nous avons collecté 58 625 € sur notre objectif de campagne. Il nous reste 29 jours pour convaincre les copaines et récolter de quoi faire décoller Framasoft.

Alors : défi relevé ?

Obtenir Lokas Soutenir Framasoft




Lokas : Record and transcribe your meetings in complete confidentiality !

Framasoft invites you to try out the prototype of Lokas, a new speech-to-text transcription application that respects your privacy. This functional demo is also an experiment by Framasoft in the field of AI, accompanied by the Framamia website, which we present here (in French).

🎈Framasoft is 20 years old🎈 : Contribute to finance a 21st year!

Thanks to your donations (66% tax-free), the Framasoft association has been working for 20 years to advance the ethical and user-friendly Web. Find out more about some of our actions in 2024 on the Support Framasoftwebsite .

➡️ Read the series of articles from this campaign (Nov. – Dec. 2024)

 

Please note that this article is also available in French here.

Make note-taking easier with Lokas

Lokas is an application (for Android or iOS smartphones) that allows you to transcribe the sound of your voice into a text file.

Basically, during a meeting: you put the phone in the middle of the table, press the ‘Record’ button at the start of the meeting and the ‘Stop’ button at the end. A few minutes later, the application sends you a text file containing the sentences spoken by everyone.

Lokas can and will do many more things, but we’ll come back to that at the end of this announcement.

screenshots of the Lokas application with the three stages: recording, editing the transcript, details of speaking time

Who is Lokas for?

Lokas is aimed at anyone who takes part in meetings. That’s a lot of people on the planet 🙂

However, we can share a few usecases.

First example: a nonprofit’s Annual General Meeting

Let’s imagine a nonprofit AGM. There are 15 people in the room, 2 moderators and 1 note taker. And a 2-hour meeting.

Concerns:

  • Note-taking is exhausting
  • The person taking the notes has limited participation
  • The notes may be incomplete (a ‘blank’ due to a bathroom break).

What does Lokas offer?

Lokas assists the note-taker, making it easier for him or her to participate (while still allowing for a pee break!).

Example of a transcription of a voice exchange using the Lokas application.

Second example: a workshop with teenagers

A workshop run by the ‘ Les petits débrouillards ’ association. 3 groups of 5 teenagers. A majority of girls in the groups.

Concerns:

  • Note-taking can be very complicated.
  • Boys monopolise the floor

What does Lokas offer?

Lokas makes it possible to keep a record (audio and written) of what was said. It also makes it possible to compile statistics on speaking time, particularly by gender, so that we can see for ourselves that boys leave very little speaking time for girls.

Example of transcription of a voice exchange using the Lokas application
Example of transcription of a voice exchange using the Lokas application

Third example: a video meeting in a foreign language

Your activist collective is close to a Spanish association. Camille, a volunteer from your group, who speaks a little Spanish, will be doing the video with her contact in Madrid. The video will therefore take place in a foreign language.

Concerns :

  • You need to be able to listen again with your head down
  • You need a French transcript to share with board members.

What does Lokas offer?

With Lokas, Camille will be able to listen to the video again, automatically transcribe it into French, and share it from your smartphone (by email, via Signal, Matrix, WhatsApp, Telegram, etc).

Support Lokas (and Framasoft)

AI isn’t magic . Neither is Lokas 🤷.

Lokas is just a tool. It can assist you in taking notes. However, like any tool, it shouldn’t exempt you from using your brain!

Writing (another highly sophisticated technology) was invented at least 3,000 years ago. So humanity has been able to get together and keep written records for at least that long. Without AI. Without smartphones. Don’t throw away several millennia of technology with the water of AI. A tool like Lokas could be useful in some cases, and completely gimmicky, even unproductive, in others. This is reminiscent of the concept of Pharmakon, a concept dear to the French philosopher Bernard Stiegler: Lokas, like any technical object, is simultaneously poison, remedy and scapegoat.

The web, for example, is both a technological device enabling participation, and an industrial system dispossessing Internet users of their data in order to subject them to omnipresent marketing that is individually traced and targeted by user profiling technologies.

In the same way, Lokas can be emancipating (by facilitating participation rather than note-taking), or on the contrary restrictive (meetings in a noisy bar can be interesting, but we shouldn’t do without them because the tool works better in a quiet environment), or frustrating (« The application has crashed, I don’t have any backup notes! Technology is shite! »)

Lokas, like a car, a hammer or a pen, is not a ‘neutral’ tool. It’s up to you, collectively, to decide whether and how you want to use it.

Illustration by Gee, showing poor conditions for using Lokas, i.e. a noisy meeting in a bar.
Inevitably, it won’t work as well – CC-By SA Gee

 

‘This is the story of an app…’

We thought it would be interesting to tell you how the Lokas app came about. It means lifting the curtain on what goes on behind the scenes at Framasoft, and understanding how we can decide to do (or not to do) such and such a project. It’s also about showing that sometimes, with a bit of luck and a bit of elbow keyboard, you can do things that might seem impossible. However, as this part is not essential, we’ll leave it up to you to decide whether or not you want to read it.

Click here to read the (improbable and fabulous) origin story of Lokas

The idea for Lokas has been in the head of pyg, a member of Framasoft, for three or four years now.

The original idea (code name: ‘ Brewawa ’) was mainly to come up with an application that would be able to calculate the speaking time of participants in a meeting. The (not at all hidden) aim was to easily demonstrate that during a discussion with people of different genders, it is overwhelmingly men who monopolise the conversation.

Various tests have been carried out in recent years (hi Gee, hi bnjbvr !) to study the feasibility of such an application. But the fact is that in 2020, even if the technical possibilities were there, they weren’t really available to our tiny association, especially on a project piling on all those that Framasoft was already carrying out.

‘It’s all about technical improvements…’.

However, with the evolution of softwares such as Vosk and Whisper, audio transcription capabilities (i.e. the ability to transform the sound of sentences into text) have considerably improved.

So much so that today, these technologies are used by a huge number of software applications (from YouTube and PeerTube to BigBlueButton and WhatsApp), and are often even integrated directly into devices (Samsung has clearly made this a selling point).

The last decade has also seen improvements in ‘diarization’ processes. This rather barbaric term is in fact the technique used to identify different⋅es speakers in a discussion. For example, if Alex, Camille and Fred are having a meeting, the diarization will know how to attribute to each their sentences (no, the software won’t guess the person’s first name, but it will know – more or less – identify that there were three participants, and say ‘This sentence was uttered by person #1. This sentence was said by person #2.’, etc.

This is obviously an essential phase in being able to understand ‘who said what’ in a meeting.

This process is still imperfect, but it is improving month by month. We therefore need to look ahead to 2026 or 2027 to imagine truly reliable diarization, but today it is ‘sufficient’ in 60 to 80% of uses under ‘good conditions’.

‘It’s the story of an alignment of planets…’.

It just so happened that Framasoft had the skills needed to develop such an application.

Chocobozzz, developer of PeerTube, had already worked hard on the process of integrating Whisper into PeerTube, in order to be able to automatically generate subtitles for a video. So he’s very familiar with Whisper, its configuration options, its performance and so on.

Wicklow, developer of the PeerTube application, has been working for several months with the Dart language and Flutter SDK, which enables an application to be developed for different terminals (Android, iPhone, computer/tablet, web, etc.) in a single code base.

Luc, our favourite system administrator (it’s not complicated, mind you, we only have the one 😅 ) manages Framasoft’s entire technical infrastructure (around sixty physical computer servers). So setting up the machine that manages the transcriptions, installing it, securing it, etc, was child’s play for him.

pyg, former director of Framasoft, now the association’s digital services coordinator, has managed countless projects for Framasoft over the last 20 years. So one more, even in the middle of a campaign, wasn’t going to stop him.

With this range of skills, and the technical capabilities of the transcription and diarization software, the planets were aligned to launch such a project.

‘It’s all about luck…’

However, as is often the case, you also have to rely a little on chance or luck.

Indeed, pyg had somewhat dropped the idea of this application, simply out of ignorance of the technical advances in terms of diarisation.

It was while discussing the idea of this application at the last Framacamp, in July 2024, that Wicklow dropped a piece of information in the nick of time: ‘Ah, but you know, Whisper now does proper diarization.’

BIM 💣

‘Ah, very interesting! But I imagine it would take a long time to develop such a free transcription application?’ asked pyg.

‘Oh, I’d say in 3 days I can have a working prototype if Chocobozzz takes care of the server part.’

BANG 💥

So instead of enjoying his evening playing poker, pyg went off to his room and prepared a presentation of a dozen slides on a potential application project, which he presented to the association the following morning.

One of the slides produced during the night...
One of the slides produced overnight…

 

Some members were enthusiastic, others less so. And we can understand them: first, because it was adding yet more work to an already particularly busy and exhausted association. More, this project would use software derived from artificial intelligence, a technology about which we are (unanimously) very critical.

However, this application, which was to become Lokas, seemed to us to be a good way of ‘embodying’ the social purpose of Framasoft: to educate the public about the challenges of digital technology and the cultural commons.

This enabled us to move away from the pedagogical aspect, which is both essential and insufficient in terms of appropriation and self-determination. By creating a ‘manipulable digital object’, we could use Lokas as an additional opportunity to explain what AI is, its possibilities, but also its weaknesses. And so return to our ‘Pharmakon’ mentioned above.

What’s more, as well as being able to assist any collective holding meetings, this enabled us to put into practice, in concrete terms, an application bearing our values: a user-friendly tool, not exploiting users data, under an open licence, aimed above all at people who are changing the world for more social progress and social justice.

In the end, the majority of members present said: ‘Let’s go for it!’.

‘It’s (also) a story of limits’.

As mentioned above, the constraints were considerable.

A project inevitably costs time and money. Time and money that can’t be used elsewhere.

As you know, Framasoft lives off donations. So we have to run donation campaigns. And the end of the year was already particularly busy with the finalisation of various projects and their announcements.

In discussions with Thomas and Pouhiou, co-directors of the association, it was decided that Lokas should remain a project subject to strict limitations: it should cost less than €10,000 all-included; it should not have a major impact on the missions of Chocobozzz, pyg or Wicklow; and it should be completed (in ‘wasted time’) between mid-September and mid-November (in particular because of the validation deadlines for the Android and iOS stores, which we don’t control).

With such constraints, it was impossible for us to produce a well-finished product. So we’ve decided to focus instead on making a prototype available. Think of this prototype as a showroom house. We’ve produced this version not by focusing on a long-term project, with solid foundations, but rather as a ‘proof of concept’, developed rapidly, to see if the concept is sufficiently attractive and interesting for us to priorise the development of this application in 2025 (if donations are sufficient, that is!).

To give you enough ‘desire’ to see a version 1.0 of Lokas arrive one day, we called on the skills of Atelier Domino to create a logotype and a graphic charter. This led us to create the project website in-house : lokas.app

At the same time, Wicklow and Chocobozzz set about developing the prototype and the transcription server.

‘It’s a story just waiting to be written…’.

A fortnight’s work later (and an estimated cost of €7,500 all-in, with roughly half the time spent by Framasoft and half on services: Domino workshop, server hire, domain names, validation of Google & Apple app stores), we can proudly and somewhat anxiously present our prototype!

Support Lokas (and Framasoft)

How does Lokas work?

1. Get in the right conditions

Lokas, like all transcription tools, is imperfect. Outside noise, poor articulation, a faint voice in the background, people cutting each other off… These are just some of the reasons why transcription can be difficult.

As a result, plan to be in a quiet room, place the telephone in the centre of the table (the better the sound quality, the better the transcription), don’t hold several discussions at the same time, and… take ‘old-fashioned’ notes (paper+pencil, computer+pad, etc.) in case of problems.

Once you’ve done that, it’s very simple.

Illustration by Gee showing the right conditions for Lokas, i.e. a quiet meeting.
AI isn’t magic: Lokas needs the right conditions – CC-By SA Gee

 

2. Start recording

Simply click on the ‘Record’ button. Position the phone so that it can best pick up the exchanges. And start your meeting.

Record your meetings with Lokas
Record your meetings with Lokas

 

To limit abuse, recordings are limited to 5 per day and per device.

Note that the language model managed by Lokas means that it can already be used in around fifty languages, including: Dutch, Spanish, Korean, Italian, German, Thai, Russian, Portuguese, Polish, Indonesian, Mandarin, Swedish, Czech, French, Japanese and, of course, English! Other languages are supported, but recognition will be less effective.

At the end of the meeting, click ‘Finish’.

3. Send your file for transcription (and be patient)

You may wish to listen to your file again before clicking on ‘Send’.

Your file will then be sent to our server where it will be queued for transcription.

This stage can take from a few minutes to a few hours, depending on the number of files in the queue.

You can check manually whether your file has been transcribed, or wait quietly for the notification (the verification task is carried out every 15 minutes).

The screen showing that the audio file has been sent to the Framasoft servers.
The screen showing that the audio file has been sent to the Framasoft servers.

 

Once the transcript has been received

Once you have received the transcript, you can display it in Lokas.

You can of course share it (with the application of your choice: email, Signal, WhatsApp, etc.) to correct it.

Display of the sharing menu (audio or text) in Lokas. The transcript in the background.
Display of the sharing menu (audio or text) in Lokas. The transcript in the background.

 

You can also see the speaking time statistics (NB: this feature is relatively experimental). If you wish, you can assign a first name (or pseudonym) to each participants to make it easier to read the notes. To obtain speaking times by gender, you can also allocate them manually, obviously ensuring that you have the consent of the people concerned to communicate this information. Note that this information is voluntarily manual, and does not leave your phone, and is therefore not transmitted to Framasoft nor anyone else.

Overview of speaking times, as well as names and genders of participants (none of this information is transmitted to Framasoft)
Overview of speaking times, as well as names and genders of participants (none of this information is transmitted to Framasoft)

 

Confidentiality point: one of the special features of Lokas is that we respect your privacy: the audio file is recorded on your phone. At your request, it is sent to our servers, which will then transcribe it. Once the transcription is complete, a notification is sent to your phone; when you open (in ‘My files’) the meeting in question, the transcription is then downloaded to your phone. Once this stage has been completed, and after a slight delay to ensure that everything has gone well technically, everything is deleted from our server: the audio file as well as the transcript. And if you give us names, pseudonyms or genres for statistical purposes, please note that we do not process this information in any way.

Support Lokas (and Framasoft)

What about AI?

At Framasoft, we are not at all fans of AI. We think that this technology (or rather this set of technologies) poses more problems than it solves. In fact, we tried to summarise our position on AI on the Framamia website, which we present here on the Framablog (in French).

So, isn’t it contradictory to use AI in Framasoft applications such as Lokas or PeerTube?

In our opinion, no. For several reasons.

Firstly, as we wrote on the Framamia website, not all artificial intelligence models are created equal. Whisper, the software used for transcription, is a ‘specialised’ AI, not a ‘generalist’ AI like ChatGPT, for example.

‘Specialised models are optimised to solve a specific task efficiently. Their impact is often controlled, and may correspond to that of other software’.

Framasoft, on the Framamia.org website

Whisper is certainly an AI, but it runs ‘in isolation’ on our servers.

The algorithms used are more complex than a ‘Remove the red eyes from this photo’ filter with GIMP or Photoshop, but it remains a relatively simple model (with an input/output process) that uses infinitely less energy than a training model. In fact, inference (the process of using the model to perform a task) consumes much less energy than training. For example, running Whisper to transcribe an audio file lasting a few minutes requires relatively modest computing power.

Secondly, a project like Lokas does not require the purchase of 350,000 GPU chips for $9 billion, as Meta/Facebook recently did, which is roughly equivalent to Togo’s GDP in 2023. We don’t think we’ll be taking part in the growth of the AI financial bubble, or in the runaway growth of algorithmic capitalism.

Finally (and most importantly), with Lokas or PeerTube, we remain consistent with one of the values at the heart of Framasoft, namely respect for the confidentiality of your data. Indeed, we do not make any use of your files, apart from the task explicitly requested, for example transcription. They are not used to enrich an AI model based on your discussions, your identity, etc. We don’t keep audio or text files, we don’t have access to the names/first names/genders that you manually assign to participants⋅es in a discussion (that stays on your phone), etc. And, of course, your data is NEVER monetised.

In short, Framasoft doesn’t care about the content of your data, it belongs to you and is nobody’s business but yours.

Despite this, we respect the point of view of people who wish to boycott AI, and we understand the contradiction they might find in a technocritical association like Framasoft proposing projects using AI.

Our aim is to offer a tool that will enable people to think about the issues in a concrete way, so that they can form their own opinions and come to their own conclusions.

Illustration. Around a table, penguins are singing. In the centre, a small mechanical parrot takes notes like a stenographer.
A mechanical parrot takes notes: quite a symbolic Illustration by David Revoy – Licence: CC-By 4.0

 

When is Lokas coming?

You can Download the Lokas app on the Play Store, iOS (still in testflight on iOS, because they are 🤬… let’s say picky), (and soon on f-droid), or get the android apk directly from us here. But keep in mind it is a prototype (if you haven’t already, take two minutes to read ‘The Lokas Story ’ and understand why), so it’s normal that lots and lots of things don’t work!

We’ve already taken time, energy and a bit of money out of limited resources (did anyone ever tell you that we only live off your donations? 😉 ). And, obviously, this POC is open source, the code is publish here on our forge.

So before going any further, we need to confirm that you are interested in this project. If the donations aren’t big enough, or if the contradictions are too strong: we’ll stop there (the code is free, so it won’t be ‘lost’).

If, on the other hand, you find it relevant, there are countless possibilities for future developments. For example:

  • Complete redesign and accessibility (in prototyping mode, we went very fast, and Lokas is therefore very perfectible);
  • Ability to (re)transcribe the file of your choice (from Lokas, a video or another application, for example);
  • Add a ‘web’ mode to the application. This means you can use Lokas from your computer (similar to the Scribe server used by our friends at the Céméa);
  • Add the possibility of automatic summaries of the transcripts, to quickly find the key points;
  • Translate the application (and the website) into languages other than French and English;
  • Ability to edit and correct the transcript directly from your phone;
  • Provide the option of obtaining the transcript in the language of your choice (e.g. a meeting in English transcribed into French, or vice versa);
  • etc

But to do this, we’re going to need some staff time, and therefore money. So, at the risk of sounding insistent, we invite you, if you can, to make a donation.

Make a donation to support Lokas

 

The challenge: 20,000 times €20 donations for Framasoft’s 20th anniversary!

Framasoft is funded by your donations! Every €20 you donate will be a new balloon to celebrate 20 years of adventures and help us continue and take off for a21st year.

Framasoft is a model of solidarity:

  • 8,000 donors in 2023 ;
  • over 2 million beneficiaries every month;
  • your donation (66% tax deductible) can benefit 249 other people.

To date, we have raised €58,625 of our campaign target. We still have 29 days to convince our friends and raise enough money to get Framasoft off the ground.

So, challenge accepted?

Get Lokas Support Framasoft




Framamia : partageons des clés de compréhension de l’IA

Afin d’aider à démystifier le sujet de l’intelligence artificielle, Framasoft publie une première version du site Framamia. Définitions, enjeux, risques et questionnements : en partageant le savoir, nous espérons contribuer à reprendre le pouvoir sur ces technologies qui impactent nos sociétés. Et pour la mise en pratique, Framasoft publie en même temps l’application Lokas, que l’on présente ici.

🎈 Framasoft a 20 ans🎈 : Contribuez pour financer une 21e année !

Grâce à vos dons (défiscalisables à 66 %), l’association Framasoft agit depuis 20 ans pour faire avancer le Web éthique et convivial. Retrouvez un focus sur certaines de nos actions en 2024 sur le site Soutenir Framasoft.

➡️ Lire la série d’articles de cette campagne (nov. – déc. 2024)

Furby est presque en âge de voter : toute une Histoire

Depuis deux-trois ans, « ✨ L’IA™✨© » semble être le nouveau fourre-tout-tech à la mode qui fait vibrer la silicon valley, se répand dans les appels à projets publics, et sera oublié tout aussi rapidement (qui se souvient des NFT…? Du web3…? Y’a quelqu’un…?).

Sauf que c’est plus compliqué que ça. À l’inverse des NFT et autres techno-lubies, l’intelligence artificielle est un domaine du numérique composé de nombreuses branches et disciplines (d’où l’impression de fourre tout).

Frise Chronologique de l'IA

Avec une histoire de plus de 70 ans, les expérimentations dans l’Intelligence artificielles sont déjà présentes dans nos quotidiens numériques. On peut imaginer Clippy (le trombone assistant numérique de Microsoft Office 97) comme l’ancêtre de Siri ou Alexa. Ou encore que les comportements de plus en plus réalistes des personnages de jeux vidéos sont l’héritage de DeepBlue (ordinateur qui bat le champion mondial Gary Kasparov aux échecs en 1997) ou des Furby (peluches parlantes créées en 1998)…

Photo d'un Furby
Cette peluche animatronique disposait de son propre langage et pouvait « apprendre » celui qu’on lui parlait.

Bref, notre histoire ne manque pas d’exemples pour montrer que les domaines de l’IA ont existé bien avant la popularisation des IA génératives comme Chat GPT et Dall-E (à explorer : ce poster, en anglais malheureusement, de la professeure de philosophie Danielle J. Williams).

 

Ni ✨magique✨, ni 😱apocalyptique😱… L’IA, c’est technique

Au delà de cette histoire, notre culture est remplie de mythes et clichés narratifs où la machine devient plus humaine que les humains. Du Golem à Wall-E, de HAL (2001, l’Odyssée de l’espace) à Skynet (Terminator), notre propension à vouloir humaniser des bouts de minéraux et impulsions électriques a inspiré bien des œuvres.

Présentes dans nos cultures et nos esprits, ces histoires jouent souvent sur la magie de la compassion, l’émerveillement de voir une création se doter d’empathie… ou sur le pêché de démiurgie, se prendre pour l’égal de Dieu en créant la vie, et déclencher ainsi une apocalypse vengeresse.

Gif tiré d'Edward aux mains d'argent, où un vieil homme place un biscuit en forme de cœur sur une machine de patisserie.
À l’origine, « Edward aux mains d’argents » est un robot à pâtisserie. – © 20th Century Fox / Tim Burton

Or les chantres des entreprises de l’IA générative jouent justement sur ces mythes de « l’IA Miraculeuse » (qui va résoudre le problème de l’urgence écologique, selon Éric Schmidt, ancien directeur de Google) ou de l’IA apocalyptique (qui risque de détruire l’humanité sans que l’on sache vraiment comment, à en croire Sam Altman, directeur d’OpenAI).

Présenter l’IA comme un unique personnage légendaire tour à tour salvateur et destructeur permet d’appuyer l’argument de laisser leurs entreprises faire le bien© sans entraves, et de réguler les autres (la concurrence) qui pourraient faire advenir le mal©.

L’IA c’est technique, donc politique

Or l’IA, c’est avant tout des technologies numériques. On parle de code développé par des humains, dirigés par d’autres humains, qui ont prit des décisions en fonction de leurs motivations et leurs idéologies.

Par exemple : vous ne créerez pas la même plateforme vidéo, vous n’y développerez pas les mêmes fonctionnalités si votre objectif est de faire croître le chiffre d’affaire de votre entreprise en exploitant les vidéastes et leur audience ; ou si votre but est de favoriser le partage du savoir et de la culture entre pairs. Les motivations sont différentes car les modèles idéologiques (le capitalisme de surveillance pour YouTube/Twitch, les communs numériques pour PeerTube) sont différents.

Un outil n’est pas neutre. Les outils numériques, complexes et organisant nos partages entre humains, sont donc éminemment politiques.

À Framasoft, nous fêtons les 10 ans de Dégooglisons Internet, dix années riches d’expériences et de leçons. Nous avons vu la généralisation des services en ligne. Cet internet de plateformes a sécurisé les monopoles des géants du web, qui sont devenus les hérauts et garants du capitalisme de surveillance.

Illustration « Quittons la planète GAFAM NATU BATX », CC BY David Revoy
Illustration de David Revoy – Licence : CC-By 4.0

Une des forces de ce système a été d’arriver à nous faire croire que l’outil numérique est neutre, qu’il est magique, que c’est très très très compliqué de nous l’expliquer, à nous pauvres consommateurs. Et puis de toutes façons, c’est de notre faute aussi : il a bien lu les conditions générales, elle a cliqué sur « tout accepter », iel reste libre de ne pas utiliser ces outils.

En individualisant la responsabilité sur des outils qu’il ne faut pas chercher à comprendre (de toutes façons ils sont neutres, qu’on vous dit !), il n’est plus possible de faire des choix collectifs sur la société que l’on désire.

Framamia, here we go again !

Voilà quelques années qu’à Framasoft, on se penche, on discute, on se trompe et on apprend sur le boom des intelligences artificielles. Les échanges sont nombreux, et nous partageons même une veille sur le sujet.

Aujourd’hui, Framasoft publie Framamia : un site où nous partageons des clés de compréhension sur l’intelligence artificielle, ainsi que des extraits de notre veille.

Vous y trouverez des définitions, des informations, des enjeux identifiés pour nos sociétés et notre environnement, et enfin des questionnements… Autant de bouts de savoirs que nous proposons pour que chacune et chacun puisse se construire un avis éclairé et le partager avec ses proches.

Partager la connaissance sur un sujet, c’est partager le pouvoir de l’appréhender individuellement et de l’influencer collectivement.

capture d'écran de l'entête du site framamia.org
Cliquer pour visiter le site Framamia.

Notez bien qu’il s’agit là d’un premier jet, d’une première tentative de partage autour des intelligences artificielles, et plus précisément des intelligences artificielles génératives qui se multiplient aujourd’hui.

Nous ne prétendons pas que Framamia est parfait, que les informations sont compréhensibles par une personne qui ne s’y connaît pas, ou que le site soit gravé dans le marbre. Nous espérons pouvoir améliorer cet outil informatif avec le temps.

Visiter Framamia Soutenir FramamIA et Framasoft

Jeter le Clippy avec l’eau (…K Google) du bain ?

Si l’histoire du numérique semble se répéter, nous avons envie de partager quelques leçons que nous en avons tirées. Nous espérons contribuer à sortir des clichés tels que « Le cloud L’IA c’est magique », « Google OpenAI est ton ami », « roh là là regarde c’est meugnon Siri CharacterAI a halluciné », « si tu utilises Amazon Dall-E c’est ta faute et je te juge… »

Pour le capitalisme de surveillance comme pour le capitalisme algorithmique, l’enjeu ne se situe pas sur tel ou tel outil, ni sur le choix de Camille Dupuis-Morizeau de l’utiliser ou le boycotter. L’enjeu est systémique : c’est celui du monde dans lequel nous voulons collectivement vivre, et comment les citoyennes peuvent collectivement reprendre le pouvoir de le choisir.

S’il semble impossible de poser, a posteriori, un moratoire sur les larges modèles de langage et les IA génératives, peut-on sortir ces outils du capitalisme algorithmique et les utiliser pour le bien commun ?

Mème Clippy « avez-vous besoin d'aide pour déclencher l'apocalypse ? »
« avez-vous besoin d’aide pour déclencher l’apocalypse ? »… merci Clippy.

On le sait : transcrire des voix en texte permet de rendre vidéos et podcasts accessibles aux personnes sourdes, ajouter une description textuelle des images que nous partageons sert aux personnes aveugles qui utilisent un lecteur d’écran.

Au delà de l’accessibilité, tout le monde ne maîtrise pas l’outil numérique : savoir formuler efficacement sa demande sur un moteur de recherche, écrire un objet d’email plus informatif et facile à retrouver que « Quelques nouvelles………… » Tout le monde n’est pas en capacité de s’adapter aux outils numériques. Pouvoir adapter les interfaces aux humains et à leurs langages naturels pourrait réduire la fracture numérique.

Encore faut-il peser les coûts (humains, techniques, écologiques) de tels projets, choisir collectivement si c’est ce que l’on désire et enfin s’en donner les moyens.

Expérimenter une IA des communs…? Voici Lokas !

La question « Pour ou contre l’IA ? » ressemble à un piège, un faux débat qui nous isole les unes des autres. À Framasoft, nous n’avons pas (souvent) de réponses, mais beaucoup de questions qui nous semblent bien plus enthousiasmantes.

Une IA des Communs est-elle possible ? A quoi ressemblerait-elle ? Est-ce seulement souhaitable ? Quels en seraient les compromis et les conséquences ? Pour travailler de telles questions, nous avons eu envie d’expérimenter.

En parallèle de FramamIA, Framasoft publie dès aujourd’hui Lokas. Lokas est une application mobile (Android et iOS) qui permet d’enregistrer une réunion, afin d’obtenir une transcription.

captures d'écran de l'application Lokas avec les trois étapes : enregistrement, édition du transcript, détail du temps de parole
Cliquez pour découvrir et obtenir Lokas

Attention, Lokas est un prototype : c’est une démo limitée, mais fonctionnelle.  Nous avions envie de voir quelle forme prendrait un outil fait par une association sans but lucratif, aux moyens limités, souhaitant être utile au bien commun, en transparence et en limitant l’impact.

Nous avons hâte d’avoir vos retours sur une telle démarche, afin de voir s’il faut s’avancer dans cette voie, ou conclure l’expérimentation.

Lire une présentation complète de Lokas sur le Framablog

Obtenir Lokas Soutenir Framasoft

 

Le défi : 20 000 fois 20 € de dons pour les 20 ans de Framasoft !

Framasoft est financée par vos dons ! Chaque tranche de 20 euros de dons sera un nouveau ballon pour célébrer 20 d’aventures et nous aider à continuer et décoller une 21e année.

Framasoft, c’est un modèle solidaire :

  • 8000 donatrices en 2023 ;
  • plus de 2 millions de bénéficiaires chaque mois ;
  • votre don (défiscalisable à 66 %) peut bénéficier à 249 autres personnes.

jauge de dons au 3 décembre 2024 à 58 625 €

À ce jour, nous avons collecté 58 625 € sur notre objectif de campagne. Il nous reste 29 jours pour convaincre les copaines et récolter de quoi faire décoller Framasoft.

Alors : défi relevé ?

Visiter Framamia 🎈 Je soutiens la 21e année de Framasoft 🎈




20 ans de Framasoft… et un de plus grâce à vos dons ?

Grâce à vos dons, Framasoft accompagne plus de 2 millions de personnes dans leur émancipation numérique. Après une vingtième année difficile, notre association vous demande les moyens de poursuivre ses actions… et de relever les défis du futur.

🎈 Framasoft a 20 ans🎈 : Contribuez pour financer une 21e année !

Grâce à vos dons (défiscalisables à 66 %), l’association Framasoft agit depuis 20 ans pour faire avancer le Web éthique et convivial. Retrouvez un focus sur certaines de nos actions en 2024 sur le site Soutenir Framasoft.

➡️ Lire la série d’articles de cette campagne (nov. – déc. 2024)

 

Malgré une année difficile…

Sans rentrer dans les détails ni l’auto-apitoiement (car l’heure est à la célébration), cette année a été doublement difficile pour Framasoft.

Humainement d’abord, car des conflits significatifs (qui peuvent advenir dans toutes les associations… et toute aventure humaine) ont accaparé beaucoup d’énergies et affaibli le niveau de motivation.

Ainsi Framasoft conclut 2024 avec une fatigue cumulée, une équipe amoindrie, et une furieuse envie de se recentrer en 2025 sur nos actions au service de celles et ceux qui ont besoin d’outils numériques éthiques et populaires.

Or financièrement aussi, c’est pas la joie. Entre le fait d’avoir moins de forces humaines dans l’association, et une année morose pour tout le monde : inflation, fascisme aux portes du pouvoir, besoins de solidarités qui se multiplient…

Framasoft a vu (comme bien d’autres) ses dons baisser drastiquement. Ainsi, au 1er octobre 2024, Framasoft a reçu près de 50 000 € de dons en moins qu’à la même date, en 2023.

🎈 Soutenir Framasoft 🎈

…Framasoft est fière de son bilan 2024 !

D’ici la fin de l’année, nous vous présenterons en détail sur ce blog quelques actions marquantes réalisées en 2024. Bien entendu, Framasoft c’est beaucoup plus que cette sélection (on pense par exemple à l’ensemble des services Dégooglisons Internet)… Mais il faut bien choisir parmi les 100 pages de nos rapports d’activités.

🦄 Framaspace, le cloud associatif s’enrichit d’outils importants

Comptabilité, gestion des membres, formulaires, gestion simplifiée de données… toutes ces fonctionnalités viennent rejoindre les intros interactives, partage de propriété, agendas, contacts, chat et synchronisation de dossiers déjà proposés dans Framaspace.

Illustration - Dans l'espace, une licorne fait apparaitre des bulles de sa baguette magique. Dans les bulles, on trouve des symboles : un boulier, des fichiers, etc.
Illustration de David Revoy – Licence : CC-By 4.0

Si vous souhaitez que votre asso ou petit collectif obtienne un Framaspace et profite de ces nouveautés dès que possible, n’hésitez pas : les inscriptions sont toujours ouvertes !

🦄 Soutenir Framaspace 🦄

🤖 Framamia & Lokas : démystifier l’IA par l’explication (et l’exemple !)

Du miracle à l’apocalypse, l’IA est le lieu des fantasmes prophétiques. Framasoft s’est lancé le défi de nuancer le débat, et de revenir au concret en partageant des clés de compréhension.

Illustration. Autour d'une table, des pingouin chantent. Au centre, un petit perroquet mécanique prend des notes à la manière d'un sténographe.
Illustration de David Revoy – Licence : CC-By 4.0

Avec le site Framamia nous voulons exposer, de manière claire, ce que nous percevons aujourd’hui de ce nouvel enjeu du numérique…

Quant à Lokas, c’est une expérimentation, une démonstration du type d’outils qu’on peut créer lorsque l’on s’empare de l’outil IA sans chercher le profit, la croissance ou l’exploitation… mais juste à être foncièrement utile.

🤖 Soutenir Framamia 🤖

📱 L’application PeerTube : un univers de vidéos au creux de votre main

PeerTube n’est pas une plateforme de vidéos et de live : c’est un réseau de plateformes, autonomes, auto-gérées et interconnectables.

Cependant, il reste difficile de découvrir des contenus sur ce réseau, d’autant plus quand la majorité des vidéos en ligne sont désormais regardées depuis un téléphone.

Illustration - Sepia, læ poulpe mascotte de PeerTube, sort de l'écran d'un téléphone mobile.
Illustration de David Revoy – Licence : CC-By 4.0

Nous avons donc développé une application mobile PeerTube, qui sera disponible sur F-Droid, le PlayStore et l’appstore d’iOS (si tout va bien).

📱 Soutenir l’application PeerTube 📱

🐙 PeerTube v7 : un redesign pour une expérience encore plus fluide

Ce fut une année riche en nouveautés pour le logiciel qui permet de créer sa plateforme de vidéos et de lives : export et import des comptes, modération des commentaires, transcription automatique d’une vidéo, séparation des flux audio et vidéo, navigation dans les sous-titres…

Illustration - Dans la mer Sepia, læ poulpe mascotte de PeerTube, dessine un grand chiffre sept avec son encre.
Illustration de David Revoy – Licence : CC-By 4.0

En décembre nous comptons publier la version 7 de PeerTube, avec des changements majeurs dans l’expérience et l’interface du logiciel.

Plus de clarté, de simplicité, d’accessibilité : nous avons hâte de vous partager ce nouveau look !

🐙 Soutenir PeerTube v7 🐙

🦆 Cancanons : bilan des actions pour collectiviser et convivialiser internet

Annoncée fin 2022, la feuille de route Collectivisons Internet / Convivialisons Internet (ou « coin-coin », pour les rapides) peut se résumer en une ambition : dégoogliser les associations.

Illustration - Une maman canard regarde le nid dans lequel quelques uns des œufs ont éclot.
Illustration de David Revoy – Licence : CC-By 4.0

Avec ECHO Network qui arrive à sa (brillante) conclusion, Émancip’Asso qui a été lancé et fait son petit bonhomme de chemin, Framaspace qui évolue… le moment nous semble propice pour faire le point sur ces actions et le futur que nous leur réservons.

Désormais, Framasoft propose plusieurs outils aux collectifs qui désirent des outils numériques à la hauteur de leurs valeurs : c’est l’heure de les présenter correctement !

🦆 Soutenir Coin-Coin 🦆

Célébrons 20 ans de partages associatifs

2024, c’est aussi pour nous la 20e année de l’association Framasoft, dont la déclaration fut officialisée par la publication au Journal Officiel du 03 janvier 2004.

Annonce de déclaration de l’association Framasoft au journal officiel du 3 janvier 2004.

… dans le podcast Projets Libres !

On ne va pas raconter 20 ans d’aventures associatives dans un article de blog (on ignore si un seul livre suffirait !) Nous avons donc demandé à Walid, auteur du podcast Projets Libres !, d’aider des membres historiques à partager quelques souvenirs autour de ces deux décennies.

Le premier épisode de ce podcast est déjà disponible : Framasoft, les premières années (2004-2014) racontées par Alexis Kauffmann et Pierre-Yves Gosset.

capture d'écran de la page du podcast projets libres dédié à Framasoft
Cliquez pour aller écouter le premier épisode du podcast racontant les 20 ans de Framasoft

Pensez à vous abonner à Projets Libres! pour ne pas rater (très prochainement) l’épisode suivant, autour des années Dégooglisons (2014-2024), racontées par Christophe Masutti, Pierre-Yves Gosset et Pouhiou.

… sur le site 20ans.framasoft.org !

De plus, les membres bénévoles de l’association vous ont préparé un site web qui détaille 20 ans d’actions et de projets autour du logiciel libre, des communs culturels, et de l’éducation populaire aux enjeux du numérique.

L’histoire de Framasoft démontre qu’avec beaucoup de contributions, de talents, de travail, de chance (aussi) et de détermination… une petite association de moins de 40 membres peut proposer des services et des outils qui améliorent la vie numérique de plus de deux millions de personnes chaque mois.

capture d'écran du bandeau d'accueil du site des 20 ans de Framasoft
Cliquez pour découvrir le site des 20 ans de Framasoft

Cette histoire est peut-être une anomalie statistique (quoique… nous en profitons pour souhaiter un joyeux 20 ans aux copaines du CLISS XXI, de Thunderbird et de Wikimédia France !). Et oui : Framasoft présente un modèle assurément difficile à reproduire… mais c’est surtout pour nous une grande fierté et une grande responsabilité, qui a été rendue possible par le soutien de celles et ceux qui, chaque année, ont donné à Framasoft.

🎈 Soutenir 20 ans de Framasoft 🎈

Deux futurs possibles, qui ne dépendent que de vous

Les dons à Framasoft sont une démonstration de solidarité : en 2023, nous estimons avoir eu environ 8 000 donateurices pour 2 millions de bénéficiaires mensuels.

Une personne qui fait un don à Framasoft permet à 249 autres de bénéficier gratuitement de nos outils.

D’ailleurs, Framasoft étant une association d’intérêt général, on rappelle que les dons ouvrent droit à 66 % de déduction fiscale pour les contribuables français. Un don de 200 € cette année reviendra finalement à 67 €, après déduction.

Car oui, c’est le moment de l’année où nous faisons appel à votre soutien pour poursuivre et financer les actions de Framasoft. Et après une 20e année difficile, notre association a encore plus besoin de vous, que ce soit pour redémarrer ou pour décoller.

illustration où des animaux mascottes de projets framasoft rassemblent des ballons sur deux piquets au sol. Les ballons prennent la forme d'un 20 géant.
Illustration de David Revoy – Licence : CC-By 4.0

Avec 200 000 €, Framasoft continue une 21ième année

C’est la somme qu’il nous faut pour boucler le budget 2025, et poursuivre nos projets avec l’équipe réduite. Cela nous permettra, par exemple, de pérenniser enfin l’emploi de Wicklow (qui, entre autres, développe l’application PeerTube) dont nous avons prolongé le CDD fin août dernier.

Cependant, ne nous leurrons pas : si cette (déjà très belle) somme permettra à Framasoft de se désembourber, nous aurons juste les moyens de maintenir les actions actuelles, les services en ligne, etc. sans pouvoir vraiment s’attaquer à de nouveaux chantiers.

🎈 Aider Framasoft à continuer ses actions 🎈

Avec 400 000 €, Framasoft décolle pour innover !

D’où le fait qu’on affiche un deuxième pallier, bonus, dans notre collecte de dons cette année. Tout ce que vous nous confierez au-delà des 200 000 € nous donnera les moyens de faire plus, de faire mieux, et de s’attaquer à de nouveaux sujets.

Bien entendu, nous avons d’ores et déjà de nombreux plans pour améliorer drastiquement les services actuels les plus utilisés. Or cela demande du temps, des talents… bref : de l’argent.

Nous avons aussi envie de démontrer qu’un numérique émancipateur, compris, maîtrisé… c’est un enjeu d’actualité et d’importance face aux urgences climatiques et sociales.

Qu’il s’agisse des usages mobiles, de l’IA, des Communs, des outils résilients (low-technicisation, réemploi, etc.), de la place du numérique à l’heure de l’urgence climatique… nous avons de grandes ambitions pour entamer cette nouvelle décennie de la vie de Framasoft. Il ne nous manque plus que les moyens de les réaliser !

🎈🎈 Aider Framasoft à décoller en 2025 🎈🎈

Illustration - des mascottes ont planté une flopée de ballons qui prennent la forme du logo Framasoft. Le lopin de terre s'est détaché, et ils flottent dans le ciel nocture en faisant la fête.
Illustration de David Revoy – Licence : CC-By 4.0

Le défi : 20 000 fois 20 € de dons pour les 20 ans de Framasoft !

Certes, le slogan « 20 balles pour les 20 ans de Frama » avait de l’allure… mais si les plus généreuxses d’entre vous se limitent à 20 € de dons, il faudrait trouver 20 000 donateurices ! (alors qu’il y en avait un peu plus de 8000 en 2023)

Et puis on ne veut pas vous dire combien contribuer, juste que (si vous le souhaitez et le pouvez), votre soutien sera plus que bienvenu. Chaque tranche de 20 euros de dons sera un nouveau ballon pour célébrer 20 ans d’aventures et nous aider à décoller.

Vos partages et vos encouragements nous seront tout aussi précieux : nous avons, ensemble, 42 jours pour convaincre les copaines et récolter de quoi faire décoller Framasoft.

Alors : défi relevé ?

🎈 Je soutiens la 21e année de Framasoft 🎈




L’IA Open Source existe-t-elle vraiment ?

À l’heure où tous les mastodontes du numérique, GAFAM comme instituts de recherche comme nouveaux entrants financés par le capital risque se mettent à publier des modèles en masse (la plateforme Hugging Face a ainsi dépassé le million de modèles déposés le mois dernier), la question du caractère « open-source » de l’IA se pose de plus en plus.

Ainsi, l’Open Source Initiative (OSI) vient de publier une première définition de l’IA Open-Source, et la Linux Foundation (dont le nom peut prêter à confusion, mais qui ne représente surtout qu’une oligarchie d’entreprises du secteur) s’interroge également sur le terme.

Au milieu de tout cela, OpenAI devient de manière assez prévisible de moins en moins « open », et si Zuckerberg et Meta s’efforcent de jouer la carte de la transparence en devenant des hérauts de l’« IA Open-Source », c’est justement l’OSI qui leur met des bâtons dans les roues en ayant une vision différente de ce que devrait être une IA Open-Source, avec en particulier un pré-requis plus élevé sur la transparence des données d’entraînement.

Néanmoins, la définition de l’OSI, si elle embête un peu certaines entreprises, manque selon la personne ayant écrit ce billet (dont le pseudo est « tante ») d’un élément assez essentiel, au point qu’elle se demande si « l’IA open source existe-t-elle vraiment ? ».

Note : L’article originel a été publié avant la sortie du texte final de l’OSI, mais celui-ci n’a semble t-il pas changé entre la version RC1 et la version finale.

L’IA Open Source existe-t-elle vraiment ?

Par tante, sous licence CC BY-SA (article originel).
Une traduction Framalang par tcit et deux contributeur·ices anonymes.
Photo de la bannière par Robert Couse-Baker.

 

 

L’Open Source Initiative (OSI) a publié la RC1 (« Release Candidate 1 » signifiant : cet écrit est pratiquement terminé et sera publié en tant que tel à moins que quelque chose de catastrophique ne se produise) de la « Définition de l’IA Open Source ».

D’aucuns pourraient se demander en quoi cela est important. Plein de personnes écrivent sur l’IA, qu’est-ce que cela apporte de plus ? C’est la principale activité sur LinkedIn à l’heure actuelle. Mais l’OSI joue un rôle très particulier dans l’écosystème des logiciels libres. En effet, l’open source n’est pas seulement basé sur le fait que l’on peut voir le code, mais aussi sur la licence sous laquelle le code est distribué : Vous pouvez obtenir du code que vous pouvez voir mais que vous n’êtes pas autorisé à modifier (pensez au débat sur la publication récente de celui de WinAMP). L’OSI s’est essentiellement chargée de définir parmi les différentes licences utilisées partout lesquelles sont réellement « open source » et lesquelles sont assorties de restrictions qui sapent cette idée.

C’est très important : le choix d’une licence est un acte politique lourd de conséquences. Elle peut autoriser ou interdire différents modes d’interaction avec un objet ou imposer certaines conditions d’utilisation. La célèbre GPL, par exemple, vous permet de prendre le code mais vous oblige à publier vos propres modifications. D’autres licences n’imposent pas cette exigence. Le choix d’une licence a des effets tangibles.

Petit aparté : « open source » est déjà un terme un peu problématique, c’est (à mon avis) une façon de dépolitiser l’idée de « Logiciel libre ». Les deux partagent certaines idées, mais là où « open source » encadre les choses d’une manière plus pragmatique « les entreprises veulent savoir quel code elles peuvent utiliser », le logiciel libre a toujours été un mouvement plus politique qui défend les droits et la liberté de l’utilisateur. C’est une idée qui a probablement été le plus abimée par les figures les plus visibles de cet espace et qui devraient aujourd’hui s’effacer.

Qu’est-ce qui fait qu’une chose est « open source » ? L’OSI en dresse une courte liste. Vous pouvez la lire rapidement, mais concentrons-nous sur le point 2 : le code source :

Le programme doit inclure le code source et doit permettre la distribution du code source et de la version compilée. Lorsqu’une quelconque forme d’un produit n’est pas distribuée avec le code source, il doit exister un moyen bien connu d’obtenir le code source pour un coût de reproduction raisonnable, de préférence en le téléchargeant gratuitement sur Internet. Le code source doit être la forme préférée sous laquelle un programmeur modifierait le programme. Le code source délibérément obscurci n’est pas autorisé. Les formes intermédiaires telles que la sortie d’un préprocesseur ou d’un traducteur ne sont pas autorisées.
Open Source Initiative

Pour être open source, un logiciel doit donc être accompagné de ses sources. D’accord, ce n’est pas surprenant. Mais les rédacteurs ont vu pas mal de conneries et ont donc ajouté que le code obfusqué (c’est-à-dire le code qui a été manipulé pour être illisible) ou les formes intermédiaires (c’est-à-dire que vous n’obtenez pas les sources réelles mais quelque chose qui a déjà été traité) ne sont pas autorisés. Très bien. C’est logique. Mais pourquoi les gens s’intéressent-ils aux sources ?

Les sources de la vérité

L’open source est un phénomène de masse relativement récent. Nous avions déjà des logiciels, et même certains pour lesquels nous ne devions pas payer. À l’époque, on les appelait des « Freeware », des « logiciels gratuits ». Les freewares sont des logiciels que vous pouvez utiliser gratuitement mais dont vous n’obtenez pas le code source. Vous ne pouvez pas modifier le programme (légalement), vous ne pouvez pas l’auditer, vous ne pouvez pas le compléter. Mais il est gratuit. Et il y avait beaucoup de cela dans ma jeunesse. WinAMP, le lecteur audio dont j’ai parlé plus haut, était un freeware et tout le monde l’utilisait. Alors pourquoi se préoccuper des sources ?

Pour certains, il s’agissait de pouvoir modifier les outils plus facilement, surtout si le responsable du logiciel ne travaillait plus vraiment dessus ou commençait à ajouter toutes sortes de choses avec lesquelles ils n’étaient pas d’accord (pensez à tous ces logiciels propriétaires que vous devez utiliser aujourd’hui pour le travail et qui contiennent de l’IA derrière tous les autres boutons). Mais il n’y a pas que les demandes de fonctionnalités. Il y a aussi la confiance.

Lorsque j’utilise un logiciel, je dois faire confiance aux personnes qui l’ont écrit. Leur faire confiance pour qu’ils fassent du bon travail, pour qu’ils créent des logiciels fiables et robustes. Qu’ils n’ajoutent que les fonctionnalités décrites dans la documentation et rien de caché, de potentiellement nuisible.

Les questions de confiance sont de plus en plus importantes, d’autant plus qu’une grande partie de notre vie réelle repose sur des infrastructures numériques. Nous savons tous que nos infrastructures doivent comporter des algorithmes de chiffrement entièrement ouverts, évalués par des pairs et testés sur le terrain, afin que nos communications soient à l’abri de tout danger.

L’open source est – en particulier pour les systèmes et infrastructures critiques – un élément clé de l’établissement de cette confiance : Parce que vous voulez que (quelqu’un) soit en mesure de vérifier ce qui se passe. On assiste depuis longtemps à une poussée en faveur d’une plus grande reproductibilité des processus de construction. Ces processus de compilation garantissent essentiellement qu’avec le même code d’entrée, on obtient le même résultat compilé. Cela signifie que si vous voulez savoir si quelqu’un vous a vraiment livré exactement ce qu’il a dit, vous pouvez le vérifier. Parce que votre processus de construction créerait un artefact identique.

Logo du projet Reproducible builds
Le projet Reproducible builds cherche à promouvoir la reproductibilité des systèmes libres, pour plus de transparence.
Le projet est notamment financé par le Sovereign Tech Fund.

 

Bien entendu, tout le monde n’effectue pas ce niveau d’analyse. Et encore moins de personnes n’utilisent que des logiciels issus de processus de construction reproductibles – surtout si l’on considère que de nombreux logiciels ne sont pas compilés aujourd’hui. Mais les relations sont plus nuancées que le code et la confiance est une relation : si vous me parlez ouvertement de votre code et de la manière dont la version binaire a été construite, il me sera beaucoup plus facile de vous faire confiance. Savoir ce que contient le logiciel que j’exécute sur la machine qui contient également mes relevés bancaires ou mes clés de chiffrement.

Mais quel est le rapport avec l’IA ?

Les systèmes d’IA et les 4 libertés

Les systèmes d’IA sont un peu particuliers. En effet, les systèmes d’IA – en particulier les grands systèmes qui fascinent tout le monde – ne contiennent pas beaucoup de code par rapport à leur taille. La mise en œuvre d’un réseau neuronal se résume à quelques centaines de lignes de Python, par exemple. Un « système d’IA » ne consiste pas seulement en du code, mais en un grand nombre de paramètres et de données.

Un LLM moderne (ou un générateur d’images) se compose d’un peu de code. Vous avez également besoin d’une architecture de réseau, c’est-à-dire de la configuration des neurones numériques utilisés et de la manière dont ils sont connectés. Cette architecture est ensuite paramétrée avec ce que l’on appelle les « poids » (weights), qui sont les milliards de chiffres dont vous avez besoin pour que le système fasse quelque chose. Mais ce n’est pas tout.

Pour traduire des syllabes ou des mots en nombres qu’une « IA » peut consommer, vous avez besoin d’une intégration, une sorte de table de recherche qui vous indique à quel « jeton » (token) correspond le nombre « 227 ». Si vous prenez le même réseau neuronal mais que vous lui appliquez une intégration différente de celle avec laquelle il a été formé, tout tomberait à l’eau. Les structures ne correspondraient pas.

Représentation d'une puce informatique sous la forme d'un cerveau.
Image sous CC BY par Mike MacKenzie & Liam Huang

Ensuite, il y a le processus de formation, c’est-à-dire le processus qui a créé tous les « poids ». Pour entraîner une « IA », vous lui fournissez toutes les données que vous pouvez trouver et, après des millions et des milliards d’itérations, les poids commencent à émerger et à se cristalliser. Le processus de formation, les données utilisées et la manière dont elles le sont sont essentiels pour comprendre les capacités et les problèmes d’un système d’apprentissage automatique : si vous voulez réduire les dommages dans un réseau, vous devez savoir s’il a été formé sur Valeurs Actuelles ou non, pour donner un exemple.

Et c’est là qu’est le problème.

L’OSI « The Open Source AI Definition – 1.0-RC1 » exige d’une IA open source qu’elle offre quatre libertés à ses utilisateurs :

  1. Utiliser le système à n’importe quelle fin et sans avoir à demander la permission.
  2. Étudier le fonctionnement du système et inspecter ses composants.
  3. Modifier le système dans n’importe quel but, y compris pour changer ses résultats.
  4. Partager le système pour que d’autres puissent l’utiliser, avec ou sans modifications, dans n’importe quel but.

Jusqu’ici tout va bien. Cela semble raisonnable, n’est-ce pas ? Vous pouvez inspecter, modifier, utiliser et tout ça. Génial. Tout est couvert dans les moindre détails, n’est-ce pas ? Voyons rapidement ce qu’un système d’IA doit offrir. Le code : Check. Les paramètres du modèle (poids, configurations) : Check ! Nous sommes sur la bonne voie. Qu’en est-il des données ?

Informations sur les données : Informations suffisamment détaillées sur les données utilisées pour entraîner le système, de manière à ce qu’une personne compétente puisse construire un système substantiellement équivalent. Les informations sur les données sont mises à disposition dans des conditions approuvées par l’OSI.

En particulier, cela doit inclure (1) une description détaillée de toutes les données utilisées pour la formation, y compris (le cas échéant) des données non partageables, indiquant la provenance des données, leur portée et leurs caractéristiques, la manière dont les données ont été obtenues et sélectionnées, les procédures d’étiquetage et les méthodes de nettoyage des données ; (2) une liste de toutes les données de formation accessibles au public et l’endroit où les obtenir ; et (3) une liste de toutes les données de formation pouvant être obtenues auprès de tiers et l’endroit où les obtenir, y compris à titre onéreux.
Open Source Initiative

Que signifie « informations suffisamment détaillées » ? La définition de l’open source ne parle jamais de « code source suffisamment détaillé ». Vous devez obtenir le code source. Tout le code source. Et pas sous une forme obscurcie ou déformée. Le vrai code. Sinon, cela ne veut pas dire grand-chose et ne permet pas d’instaurer la confiance.

La définition de l’« IA Open Source » donnée par l’OSI porte un grand coup à l’idée d’open source : en rendant une partie essentielle du modèle (les données d’entraînement) particulière de cette manière étrange et bancale, ils qualifient d’« open source » toutes sortes de choses qui ne le sont pas vraiment, sur la base de leur propre définition de ce qu’est l’open source et de ce à quoi elle sert.

Les données d’apprentissage d’un système d’IA font à toutes fins utiles partie de son « code ». Elles sont aussi pertinentes pour le fonctionnement du modèle que le code littéral. Pour les systèmes d’IA, elles le sont probablement encore plus, car le code n’est qu’une opération matricielle générique avec des illusions de grandeur.

L’OSI met une autre cerise sur le gâteau : les utilisateurs méritent une description des « données non partageables » qui ont été utilisées pour entraîner un modèle. Qu’est-ce que c’est ? Appliquons cela au code à nouveau : si un produit logiciel nous donne une partie essentielle de ses fonctionnalités simplement sous la forme d’un artefact compilé et nous jure ensuite que tout est totalement franc et honnête, mais que le code n’est pas « partageable », nous n’appellerions pas ce logiciel « open source ». Parce qu’il n’ouvre pas toutes les sources.

Une « description » de données partiellement « non partageables » vous aide-t-elle à reproduire le modèle ? Non. Vous pouvez essayer de reconstruire le modèle et il peut sembler un peu similaire, mais il est significativement différent. Cela vous aide-t-il d’« étudier le système et d’inspecter ses composants » ? Seulement à un niveau superficiel. Mais si vous voulez vraiment analyser ce qu’il y a dans la boîte de statistiques magiques, vous devez savoir ce qu’il y a dedans. Qu’est-ce qui a été filtré exactement, qu’est-ce qui est entré ?

Cette définition semble très étrange venant de l’OSI, n’est-ce pas ? De toute évidence, cela va à l’encontre des idées fondamentales de ce que les gens pensent que l’open source est et devrait être. Alors pourquoi le faire ?

L’IA (non) open source

Voici le truc. À l’échelle où nous parlons aujourd’hui de ces systèmes statistiques en tant qu’« IA », l’IA open source ne peut pas exister.

De nombreux modèles plus petits ont été entraînés sur des ensembles de données publics explicitement sélectionnés et organisés. Ceux-ci peuvent fournir toutes les données, tout le code, tous les processus et peuvent être appelés IA open-source. Mais ce ne sont pas ces systèmes qui font s’envoler l’action de NVIDIA.

Ces grands systèmes que l’on appelle « IA » – qu’ils soient destinés à la génération d’images, de texte ou multimodaux – sont tous basés sur du matériel acquis et utilisé illégalement. Parce que les ensembles de données sont trop volumineux pour effectuer un filtrage réel et garantir leur légalité. C’est tout simplement trop.

Maintenant, les plus naïfs d’entre vous pourraient se demander : « D’accord, mais si vous ne pouvez pas le faire légalement, comment pouvez-vous prétendre qu’il s’agit d’une entreprise légitime ? » et vous auriez raison, mais nous vivons aussi dans un monde étrange où l’espoir qu’une innovation magique et / ou de l’argent viendront de la reproduction de messages Reddit, sauvant notre économie et notre progrès.

L’« IA open source » est une tentative de « blanchir » les systèmes propriétaires. Dans leur article « Repenser l’IA générative open source : l’openwashing et le règlement sur l’IA de l’UE », Andreas Liesenfeld et Mark Dingemanse ont montré que de nombreux modèles d’IA « Open-Source » n’offrent guère plus que des poids de modèles ouverts. Signification : Vous pouvez faire fonctionner la chose mais vous ne savez pas vraiment ce que c’est.

Cela ressemble à quelque chose que nous avons déjà eu : c’est un freeware. Les modèles open source que nous voyons aujourd’hui sont des blobs freeware propriétaires. Ce qui est potentiellement un peu mieux que l’approche totalement fermée d’OpenAI, mais seulement un peu.

Certains modèles proposent des fiches de présentation du modèle ou d’autres documents, mais la plupart vous laissent dans l’ignorance. Cela s’explique par le fait que la plupart de ces modèles sont développés par des entreprises financées par le capital-risque qui ont besoin d’une voie théorique vers la monétisation.

L’« open source » est devenu un autocollant comme le « Commerce équitable », quelque chose qui donne l’impression que votre produit est bon et digne de confiance. Pour le positionner en dehors du diabolique espace commercial, en lui donnant un sentiment de proximité. « Nous sommes dans le même bateau » et tout le reste. Mais ce n’est pas le cas. Nous ne sommes pas dans le même bateau que Mark fucking Zuckerberg, même s’il distribue gratuitement des poids de LLM parce que cela nuit à ses concurrents. Nous, en tant que personnes normales vivant sur cette planète qui ne cesse de se réchauffer, ne sommes avec aucune de ces personnes.

Photo d'un sticker où il est marqué « Open-Source Fuck Yeah ».
Les libristes adorent pourtant les stickers. Image sous CC BY-SA par Kirsten Comandich.

Mais il y a un autre aspect à cette question, en dehors de redorer l’image des grands noms de la technologie et de leurs entreprises. Il s’agit de la légalité. Au moins en Allemagne, il existe des exceptions à certaines lois qui concernent normalement les auteurs de LLM : si vous le faites à des fins de recherche, vous êtes autorisé à récupérer pratiquement n’importe quoi. Vous pouvez ensuite entraîner des modèles et publier ces poids, et même s’il y a des contenus de Disney là-dedans, vous n’avez rien à craindre. C’est là que l’idée de l’IA open source joue un rôle important : il s’agit d’un moyen de légitimer un comportement probablement illégal par le biais de l’openwashing : en tant qu’entreprise, vous prenez de l’« IA open source » qui est basée sur tous les éléments que vous ne seriez pas légalement autorisé à toucher et vous l’utilisez pour construire votre produit. Faites de l’entraînement supplémentaire avec des données sous licence, par exemple.

L’Open Source Initiative a attrapé le syndrome FOMO (N.d.T : Fear of Missing Out) – tout comme le jury du prix Nobel. Elle souhaite également participer à l’engouement pour l’« IA ».

Mais pour les systèmes que nous appelons aujourd’hui « IA », l’IA open source n’est pas possible dans la pratique. En effet, nous ne pourrons jamais télécharger toutes les données d’entraînement réelles.

« Mais tante, nous n’aurons jamais d’IA open source ». C’est tout à fait exact. C’est ainsi que fonctionne la réalité. Si vous ne pouvez pas remplir les critères d’une catégorie, vous n’appartenez pas à cette catégorie. La solution n’est pas de changer les critères. C’est comme jouer aux échecs avec les pigeons.

 




ChatGPT, Bard et cie : nouvelle course à l’IA, et pourquoi faire déjà ?

Google va ajouter de l’IA générative dans Gmail et Docs. Énième actualité d’un feuilleton permanent depuis « l’irruption » de ChatGPT. Et chez moi, un sentiment de malaise, d’incompréhension, et même de colère.

Qu’est-ce que ChatGPT ? Qu’est-ce que l’IA1 ? Ce sont d’abord d’immenses infrastructures : les câbles sous-marins, les serveurs des datacenters, mais aussi nos ordinateurs et nos smartphones. Donc ce sont des terres rares et des minerais, dégueulasses à excaver et à purifier (heureusement un jour il n’y en aura plus2). Ensuite, c’est du traitement MASSIF de données. Du vrai gavage de programmes d’apprentissages par des quantités phénoménales de données. C’est donc des infrastructures (encore) et de l’énergie. Une quantité phénoménale d’énergie, très largement carbonée. Enfin, c’est beaucoup de main-d’œuvre sous-payée pour entraîner, tester, et entretenir les systèmes d’IA. ChatGPT, il ne faut pas l’oublier, ce n’est que la face émergée d’un très très gros iceberg. Très gros et très sale.

vue d'une vallée étroite et du cheminement de mineurs vers une mine de cobalt

Ce n’est pas un film. ÇA, c’est l’ambiance dans une mine de cobalt.

Image issue du documentaire d’Arte : Cobalt, l’envers du rêve électrique

Bref, développer une IA a un coût environnemental et humain énorme (et largement opaque), ce n’est pas que du code informatique tout propre. À la rigueur, si le rapport coût/bénéfice était largement positif… Par exemple, si l’IA développée permettait des économies d’énergie de 30 % dans le monde, ou qu’elle permettait de mieux gérer les flux alimentaires et donc d’endiguer la faim, alors on pourrait sérieusement discuter de moralité (est-ce acceptable de détruire la planète et d’exploiter des humains pour sauver la planète et d’autres humains ?).

Mais à quoi servent ces IA génératives ? Pour le moment, à faire joujou, principalement. À chanter les louanges de l’innovation, évidemment. À se faire peur sur l’éternelle question du dépassement de l’humain par la machine, bien sûr. Et ensuite ? Supprimer des postes dans des domaines plutôt créatifs et valorisés ? Défoncer les droits d’auteur en pillant leur travail via des données amassées sans régulation ? Gagner un peu de temps en rédigeant ses mails et ses documents ? Transformer encore un peu plus les moteurs de recherche en moteurs de réponses (avec tous les risques que ça comporte) ? Est-ce bien sérieux ? Est-ce bien acceptable ?

copie d'écran d'un site "cadremploi", avec ce texte "comment s'aider de chatgpt pour rédiger sa lettre de motivation - ChatGPT est une intelligence artificielle capable de rédiger des contenus à votre place.
C’est ça, le principal défi du siècle que les technologies doivent nous aider à relever ???

Tout ça me laisse interrogateur, et même, en pleine urgence environnementale et sociale, ça me révolte. À un moment, on ne peut pas continuer d’alerter sur l’impact environnemental réel et croissant du numérique, et s’enthousiasmer pour des produits comme ChatGPT et consorts. Or souvent, ce sont les mêmes qui le font ! Ce qui me révolte, c’est que toute cette exploitation humaine et naturelle3, inhérente à la construction des Intelligences Artificielles, est tellement loin de ChatGPT que nous ne la voyons pas, ou plus, et nous ne voulons pas la voir. Cela se traduit par tous les messages, enthousiastes et même volubiles, postés quotidiennement, sans mauvaise intention de la plupart de leurs auteur⋅ice⋅s.

Symboliquement, je propose de boycotter ces technologies d’IA génératives. Je ne suis heureusement pas utilisateur de Google et Microsoft, qui veulent en mettre à toutes les sauces (pour quoi faire ?). J’espère que mes éditeurs de services numériques (a priori plus éthiques) ne céderont pas un pouce de leurs valeurs à cette hype mortifère…

schéma mettant en relation par des flèches bi-directionnelles : Le numérique acceptable :Emancipateur et non aliénant /Choisi et non subi / Soutenable humainement et environnementalement
Au vu de ce qu’elles apportent, les IA génératives sont-elles vraiment soutenables humainement et environnementalement ? Je ne le crois pas.

Pour poursuivre sa lecture et ses réflexions




Démystifier les conneries sur l’IA – Une interview

Cet article a été publié à l’origine par THE MARKUP, il a été traduit et republié selon les termes de la licence Creative Commons Attribution-NonCommercial-NoDerivatives
Publication originale sur le site themarkup.org

Démystifier le buzz autour de l’IA

Un entretien avec Arvind Narayanan

par JULIA ANGWIN
Si vous avez parcouru tout le battage médiatique sur ChatGPT le dernier robot conversationnel qui repose sur l’intelligence artificielle, vous pouvez avoir quelque raison de croire que la fin du monde est proche.

Le chat « intelligent » de l’IA a enflammé l’imagination du public pour sa capacité à générer instantanément des poèmes, des essais, sa capacité à imiter divers styles d’écrits, et à réussir à des examens d’écoles de droit et de commerce.

Les enseignants s’inquiètent de la tricherie possible de leurs étudiants (des écoles publiques de New York City l’ont déjà interdit). Les rédacteurs se demandent si cela ne va pas faire disparaître leur travail (BuzzFeed et CNET ont déjà utilisé l’IA pour créer des contenus). Le journal The Atlantic a déclaré que cela pourrait « déstabiliser les professions de cadres supérieurs ». L’investisseur en capital-risque Paul Kedrosky l’a qualifié de « bombe nucléaire de poche » et blâmé ses concepteurs pour l’avoir lancé dans une société qui n’y est pas prête.

Même le PDG de l’entreprise qui a lancé ChatGPT, Sam Altman, a déclaré aux médias que le pire scénario pour l’IA pourrait signifier « notre extinction finale ».

Cependant pour d’autres ce buzz est démesuré. Le principal scientifique chargé de l’IA chez Meta’s AI, Yann LeCun, a déclaré à des journalistes que ChatGPT n’a « rien de révolutionnaire ». Le professeur de langage informatique de l’université de Washington Emily Bender précise que « la croyance en un programme informatique omniscient vient de la science-fiction et devrait y rester ».

Alors, jusqu’à quel point devrions-nous nous inquiéter ? Pour recueillir un avis autorisé, je me suis adressée au professeur d’informatique de Princeton Arvind Narayanan, qui est en train de co-rédiger un livre sur « Le charlatanisme de l’IA ». En 2019, Narayanan a fait une conférence au MIT intitulée « Comment identifier le charlatanisme del’IA » qui exposait une classification des IA en fonction de leur validité ou non. À sa grande surprise, son obscure conférence universitaire est devenue virale, et ses diapos ont été téléchargées plusieurs dizaines de milliers de fois ; ses messages sur twitter qui ont suivi ont reçu plus de deux millions de vues.

Narayanan s’est alors associé à l’un de ses étudiants, Sayash Kapoor, pour développer dans un livre la classification des IA. L’année dernière, leur duo a publié une liste de 18 pièges courants dans lesquels tombent régulièrement les journalistes qui couvrent le sujet des IA. Presque en haut de la liste : « illustrer des articles sur l’IA avec de chouettes images de robots ». La raison : donner une image anthropomorphique des IA implique de façon fallacieuse qu’elles ont le potentiel d’agir dans le monde réel.

Narayanan est également le co-auteur d’un manuel sur l’équité et l’apprentissage machine et dirige le projet Web Transparency and Accountability de l’université de Princeton pour contrôler comment les entreprises collectent et utilisent les informations personnelles. Il a reçu de la Maison-Blanche le Presidential Early Career Award for Scientists and Engineers [N. de T. : une distinction honorifique pour les scientifiques et ingénieurs qui entament brillamment leur carrière].

Voici notre échange, édité par souci de clarté et brièveté.

Angwin : vous avez qualifié ChatGPT de « générateur de conneries ». Pouvez-vous expliquer ce que vous voulez dire ?

Narayanan : Sayash Kapoor et moi-même l’appelons générateur de conneries et nous ne sommes pas les seuls à le qualifier ainsi. Pas au sens strict mais dans un sens précis. Ce que nous voulons dire, c’est qu’il est entraîné pour produire du texte vraisemblable. Il est très bon pour être persuasif, mais n’est pas entraîné pour produire des énoncés vrais ; s’il génère souvent des énoncés vrais, c’est un effet collatéral du fait qu’il doit être plausible et persuasif, mais ce n’est pas son but.

Cela rejoint vraiment ce que le philosophe Harry Frankfurt a appelé du bullshit, c’est-à-dire du langage qui a pour objet de persuader sans égards pour le critère de vérité. Ceux qui débitent du bullshit se moquent de savoir si ce qu’ils disent est vrai ; ils ont en tête certains objectifs. Tant qu’ils persuadent, ces objectifs sont atteints. Et en effet, c’est ce que fait ChatGPT. Il tente de persuader, et n’a aucun moyen de savoir à coup sûr si ses énoncés sont vrais ou non.

Angwin : Qu’est-ce qui vous inquiète le plus avec ChatGPT ?

Narayanan : il existe des cas très clairs et dangereux de mésinformation dont nous devons nous inquiéter. Par exemple si des personnes l’utilisent comme outil d’apprentissage et accidentellement apprennent des informations erronées, ou si des étudiants rédigent des essais en utilisant ChatGPT quand ils ont un devoir maison à faire. J’ai appris récemment que le CNET a depuis plusieurs mois maintenant utilisé des outils d’IA générative pour écrire des articles. Même s’ils prétendent que des éditeurs humains ont vérifié rigoureusement les affirmations de ces textes, il est apparu que ce n’était pas le cas. Le CNET a publié des articles écrits par une IA sans en informer correctement, c’est le cas pour 75 articles, et plusieurs d’entre eux se sont avérés contenir des erreurs qu’un rédacteur humain n’aurait très probablement jamais commises. Ce n’était pas dans une mauvaise intention, mais c’est le genre de danger dont nous devons nous préoccuper davantage quand des personnes se tournent vers l’IA en raison des contraintes pratiques qu’elles affrontent. Ajoutez à cela le fait que l’outil ne dispose pas d’une notion claire de la vérité, et vous avez la recette du désastre.

Angwin : Vous avez développé une classification des l’IA dans laquelle vous décrivez différents types de technologies qui répondent au terme générique de « IA ». Pouvez-vous nous dire où se situe ChatGPT dans cette taxonomie ?

Narayanan : ChatGPT appartient à la catégorie des IA génératives. Au plan technologique, elle est assez comparable aux modèles de conversion de texte en image, comme DALL-E [qui crée des images en fonction des instructions textuelles d’un utilisateur]. Ils sont liés aux IA utilisées pour les tâches de perception. Ce type d’IA utilise ce que l’on appelle des modèles d’apprentissage profond. Il y a environ dix ans, les technologies d’identification par ordinateur ont commencé à devenir performantes pour distinguer un chat d’un chien, ce que les humains peuvent faire très facilement.

Ce qui a changé au cours des cinq dernières années, c’est que, grâce à une nouvelle technologie qu’on appelle des transformateurs et à d’autres technologies associées, les ordinateurs sont devenus capables d’inverser la tâche de perception qui consiste à distinguer un chat ou un chien. Cela signifie qu’à partir d’un texte, ils peuvent générer une image crédible d’un chat ou d’un chien, ou même des choses fantaisistes comme un astronaute à cheval. La même chose se produit avec le texte : non seulement ces modèles prennent un fragment de texte et le classent, mais, en fonction d’une demande, ces modèles peuvent essentiellement effectuer une classification à l’envers et produire le texte plausible qui pourrait correspondre à la catégorie donnée.

Angwin : une autre catégorie d’IA dont vous parlez est celle qui prétend établir des jugements automatiques. Pouvez-vous nous dire ce que ça implique ?

Narayanan : je pense que le meilleur exemple d’automatisation du jugement est celui de la modération des contenus sur les médias sociaux. Elle est nettement imparfaite ; il y a eu énormément d’échecs notables de la modération des contenus, dont beaucoup ont eu des conséquences mortelles. Les médias sociaux ont été utilisés pour inciter à la violence, voire à la violence génocidaire dans de nombreuses régions du monde, notamment au Myanmar, au Sri Lanka et en Éthiopie. Il s’agissait dans tous les cas d’échecs de la modération des contenus, y compris de la modération du contenu par l’IA.

Toutefois les choses s’améliorent. Il est possible, du moins jusqu’à un certain point, de s’emparer du travail des modérateurs de contenus humains et d’entraîner des modèles à repérer dans une image de la nudité ou du discours de haine. Il existera toujours des limitations intrinsèques, mais la modération de contenu est un boulot horrible. C’est un travail traumatisant où l’on doit regarder en continu des images atroces, de décapitations ou autres horreurs. Si l’IA peut réduire la part du travail humain, c’est une bonne chose.

Je pense que certains aspects du processus de modération des contenus ne devraient pas être automatisés. Définir où passe la frontière entre ce qui est acceptable et ce qui est inacceptable est chronophage. C’est très compliqué. Ça demande d’impliquer la société civile. C’est constamment mouvant et propre à chaque culture. Et il faut le faire pour tous les types possibles de discours. C’est à cause de tout cela que l’IA n’a pas de rôle à y jouer.

Angwin : vous décrivez une autre catégorie d’IA qui vise à prédire les événements sociaux. Vous êtes sceptique sur les capacités de ce genre d’IA. Pourquoi ?

Narayanan : c’est le genre d’IA avec laquelle les décisionnaires prédisent ce que pourraient faire certaines personnes à l’avenir, et qu’ils utilisent pour prendre des décisions les concernant, le plus souvent pour exclure certaines possibilités. On l’utilise pour la sélection à l’embauche, c’est aussi célèbre pour le pronostic de risque de délinquance. C’est aussi utilisé dans des contextes où l’intention est d’aider des personnes. Par exemple, quelqu’un risque de décrocher de ses études ; intervenons pour suggérer un changement de filière.

Ce que toutes ces pratiques ont en commun, ce sont des prédictions statistiques basées sur des schémas et des corrélations grossières entre les données concernant ce que des personnes pourraient faire. Ces prédictions sont ensuite utilisées dans une certaine mesure pour prendre des décisions à leur sujet et, dans de nombreux cas, leur interdire certaines possibilités, limiter leur autonomie et leur ôter la possibilité de faire leurs preuves et de montrer qu’elles ne sont pas définies par des modèles statistiques. Il existe de nombreuses raisons fondamentales pour lesquelles nous pourrions considérer la plupart de ces applications de l’IA comme illégitimes et moralement inadmissibles.

Lorsqu’on intervient sur la base d’une prédiction, on doit se demander : « Est-ce la meilleure décision que nous puissions prendre ? Ou bien la meilleure décision ne serait-elle pas celle qui ne correspond pas du tout à une prédiction ? » Par exemple, dans le scénario de prédiction du risque de délinquance, la décision que nous prenons sur la base des prédictions est de refuser la mise en liberté sous caution ou la libération conditionnelle, mais si nous sortons du cadre prédictif, nous pourrions nous demander : « Quelle est la meilleure façon de réhabiliter cette personne au sein de la société et de diminuer les risques qu’elle ne commette un autre délit ? » Ce qui ouvre la possibilité d’un ensemble beaucoup plus large d’interventions.

Angwin : certains s’alarment en prétendant que ChatGPT conduit à “l’apocalypse,” pourrait supprimer des emplois et entraîner une dévalorisation des connaissances. Qu’en pensez-vous ?

Narayanan : Admettons que certaines des prédictions les plus folles concernant ChatGPT se réalisent et qu’il permette d’automatiser des secteurs entiers de l’emploi. Par analogie, pensez aux développements informatiques les plus importants de ces dernières décennies, comme l’internet et les smartphones. Ils ont remodelé des industries entières, mais nous avons appris à vivre avec. Certains emplois sont devenus plus efficaces. Certains emplois ont été automatisés, ce qui a permis aux gens de se recycler ou de changer de carrière. Il y a des effets douloureux de ces technologies, mais nous apprenons à les réguler.

Même pour quelque chose d’aussi impactant que l’internet, les moteurs de recherche ou les smartphones, on a pu trouver une adaptation, en maximisant les bénéfices et minimisant les risques, plutôt qu’une révolution. Je ne pense pas que les grands modèles de langage soient même à la hauteur. Il peut y avoir de soudains changements massifs, des avantages et des risques dans de nombreux secteurs industriels, mais je ne vois pas de scénario catastrophe dans lequel le ciel nous tomberait sur la tête.

Comme toujours, merci de votre attention.

À bientôt,
Julia Angwin
The Markup

On peut s’abonner ici à la lettre hebdomadaire (en anglais) du magazine The Markup, envoyée le samedi.