IA génératives : la fin des exercices rédactionnels à l’université ?

Stéphane Crozat est membre de Framasoft, auteur de « Traces » et de « Les libres », et surtout, enseignant à l’Université de Technologie de Compiègne (UTC). Il nous livre ci-dessous une réflexion personnelle – initialement publiée sur son blog – au sujet de l’usage des LLM (ChatGPT ou autre) dans les travaux des étudiant⋅es.

IA génératives : la fin des exercices rédactionnels à l’université ?

visage de Stéphane CrozatEn décembre 2022 le magazine États-unien The Atlantic titre : « The College Essay Is Dead » ( Marche, 2022 [1] ). L’auteur de l’article, écrivain, attribue un B+ à une rédaction produite avec le LLM [2] GPT-3 dans le cadre du cours de Mike Sharples, enseignant en sciences humaines. J’ai moi même attribué la note de 14/15 à un exercice rédactionnel réalisé avec ChatpGPT en février 2023 à l’UTC ( Turcs mécaniques ou magie noire ? ). Une enseignante de philosophie lui a attribué une note de 11/20 au baccalauréat ( Lellouche, 2023 [3] ).

J’ai depuis observé plusieurs cas de « triche » avec des LLM à l’UTC en 2023.

Se pose donc la question de la réaction à court terme pour les enseignants concernant les exercices rédactionnels qui sont réalisés par les étudiants à distance.

Je parlerai de LLM

Je parlerai de LLM [2] dans cet article plutôt que de ChatGPT.

ChatGPT est un outil de l’entreprise OpenIA basé sur un LLM [2] à vocation de conversation généraliste (capable d’aborder n’importe quel sujet) et le premier à avoir introduit une rupture d’usage dans ce domaine. Le problème abordé ici concerne bien cette classe d’outils, mais pas seulement ceux d’OpenIA : des outils concurrents existent à présent (certains pourront devenir plus puissants), des outils plus spécialisés existent (pour la traduction par exemple), d’autres sont probablement amenés à voir le jour (orientés vers la production de textes universitaires, pourquoi pas ?).

On pourra lire, par exemple, Bortzmeyer, 2023 [4] ou Tiernan, 2020 [5] pour plus d’informations.

Je ne parlerai pas de…

Les LLM [2] ne génèrent pas que des textes à la demande, ils génèrent aussi de nombreuses opinions parmi les spécialistes et les usagers ; j’essaierai de me borner aux faits présents, à ce que l’on peut raisonnablement anticiper à court terme (sans faire de science-fiction) et à la seule question de l’évaluation en contexte pédagogique (mais je n’y arriverai pas totalement…).

Je ne parlerai donc pas :

  • des autres enjeux pédagogiques : quel est le rôle de l’université face au développement des LLM ? doit-on former à leurs usages ? les enseignants doivent-il utiliser des LLM eux-mêmes ? est-ce que ça a du sens d’apprendre à rédiger à l’ère des LLM ?
  • des enjeux technico-fonctionnels : qu’est-ce que les LLM ne savent pas faire aujourd’hui ? qu’est-ce qu’on pense qu’ils ne seront jamais capables de faire ?
  • des enjeux politiques et éthiques : est-ce un progrès ? est-ce qu’on peut arrêter le progrès ? que penser de la dépendance croissante aux entreprises de la tech États-uniennes ? du déploiement du capitalisme de surveillance ?
  • des enjeux socio-écologiques : à quoi ça sert ? quels humains ça remplace ? quel est l’impact environnemental des LLM ?
  • des enjeux philosophiques : les LLM sont-ils neutres ? est-ce que ça dépend comment on s’en sert ? ou bien l’automatisation introduite change-t-elle radicalement notre rapport au langage et à la raison ? compléter des textes en utilisant des fonctions statistiques, est-ce penser ? qu’est-ce que l’intelligence ?
  • des enjeux juridiques : est-ce que les LLM respectent le droit d’auteur ? un texte produit avec un LLM est-il une création originale ?

TL;DR

Cet article étant un peu long, cette page en propose un résumé (TL;DR signifiant : « Too Long; Didn’t Read ») : Résumé du présent article.

Problématique et hypothèse

Problématique

Peut-on continuer à faire faire des exercices rédactionnels « à la maison » comme avant ?

Sans statuer sur la dimension de rupture des LLM — est-ce une nouvelle évolution liée au numérique qui percute le monde de la pédagogie, comme les moteurs de recherche ou Wikipédia avant elle, ou bien une révolution qui va changer radicalement les règles du jeu — il parait nécessaire de réinterroger nos pratiques : « sans sombrer dans le catastrophisme, il serait tout aussi idiot de ne pas envisager que nous sommes une nouvelle fois devant un changement absolument majeur de notre manière d’enseigner, de transmettre, et d’interagir dans un cadre éducatif, a fortiori lorsque celui-ci est asynchrone et/ou à distance. ( Ertzscheid, 2023 [6]) »

Hypothèse

L’automatisation permise par les LLM rend raisonnable une triche automatisée dont le rapport coût/bénéfice est beaucoup plus avantageux qu’une triche manuelle.

De nombreux modules universitaires comportent des exercices rédactionnels à réaliser chez soi. Ces travaux sont généralement évalués et cette évaluation compte pour la validation du module et donc in fine, pour l’attribution d’un diplôme.

  • Dans certains contextes, il n’y a pas d’évaluation en présentiel sans ordinateur et donc la totalité de la note peut bénéficier d’une « aide extérieure ».
  • Souvent à l’université la présence et/ou la participation effective des étudiants lors des cours et TD n’est pas elle-même évaluée, et parfois il n’y a pas d’examen classique, en conséquence un étudiant a la possibilité de valider un cours sans y assister en produisant des rendus écrits qualitatifs à domicile.

Cette situation pré-existe à l’arrivée des LLM, mais nous faisons l’hypothèse suivante :

  • sans LLM il reste un travail significatif pour se faire aider par un humain ou copier des contenus glanés sur le Web ;
  • sans LLM il reste un risque important d’une production de qualité insuffisante (l’humain qui a aidé ou fait à la place n’est pas assez compétent, les contenus Web copiés ont été mal sélectionnés, ou mal reformulés, etc.) ;
  • avec un LMM il est possible de produire un écrit standard sans aucun effort, pour exemple la copie de philo évaluée à 11 a été produite en 1,5 minute ( Lellouche, 2023 [3]).

Triche ?

J’utilise le terme de triche car si la consigne est de produire un texte original soi-même alors le faire produire par un tiers est de la triche. L’existence d’un moyen simple pour réaliser un exercice n’est pas en soi une autorisation à l’utiliser dans un contexte d’apprentissage. C’est similaire à ce qu’on peut trouver dans un contexte sportif par exemple, si vous faites une course à vélo, vous ne devez pas être aidé d’un moteur électrique.

LLM et moteurs de recherche : différence de degré ou de nature ?

J’écrivais en 2015 à propos de l’usage des moteurs de recherche ( Le syndrome de la Bibliothèque de Babel) : « La question intéressante qui se pose aux pédagogues n’est tant de savoir si l’élève va copier ou pas, s’il va « tricher ». La question est de savoir comment maintenir un travail d’élaboration d’une démarche et de production sensément originale et personnelle qui repose explicitement sur une recherche – donc une recherche sur le web – alors que la réponse à la question posée s’invite sur l’écran, formulée très exactement telle qu’attendue. C’est à peine une simplification en l’espèce de dire que la réponse a été jointe à la question, par celui même qui a posé cette question. »

Les LLM font sauter cette barrière : là où les moteurs de recherche permettaient une réponse facile à une question récurrente, les LLM permettent une réponse immédiate à une question originale.

L’évaluation de tout travail avec un ordinateur

Notons que le problème se pose pour tous les travaux rédactionnels avec ordinateur, même en présentiel ou en synchrone. En effet dès lors que l’on veut que nos exercices s’appuient sur un accès à un traitement de texte, des recherches Web ou d’autres outils numériques, alors ils ouvrent l’accès aux LLM.

Il existe des solutions humaines ou techniques de surveillance des examens pour ouvrir l’accès à certains outils seulement, mais d’une part elles posent des problèmes pratiques, éthiques et juridiques, et d’autre part les LLM s’introduisent progressivement au sein des autres outils, ainsi par exemple le moteur de recherche.

Les LLM et les étudiants

Les LLM sont utilisés par les étudiants

Lors de mes cours du semestre dernier (mars à juillet 2023), j’ai rencontré plusieurs cas d’usage de LLM.

  • Ces cas s’apparentent à de la triche.
  • Les étudiants n’ont pas facilement admis leur usage (allant dans certains cas jusqu’à nier des évidences).
  • Ce sont des cas d’usages stupides de la part des étudiants, car non nécessaires pour la validation du cours, sans intérêt du point de vue pédagogique, et facilement détectables.

On peut retenir les arguments principaux revendiqués par les étudiants :

  • Le gain de temps (même si je sais faire, « flemme » ou « retard »).
  • La nécessité de ne pas échouer et la peur d’être pénalisé sur le niveau d’expression écrite.
  • Le fait de ne pas être « sûr » de tricher (ce n’est pas explicitement interdit).

Des étudiants qui n’utilisent pas encore les LLM pour les exercices rédactionnels les utilisent plus facilement pour la traduction automatique.

UTC : Un premier étudiant utilise ChatGPT (IS03)

Au sein du cours de l’UTC IS03 («  Low-technicisation et numérique »), les étudiants doivent réaliser des notes de lecture sur la base d’articles scientifiques. Un étudiant étranger non-francophone utilise grossièrement un LLM (probablement ChatGPT) pour produire en une semaine le résumé de plusieurs dizaines de pages de lectures d’articles scientifiques difficiles et de rapports longs. J’avais donné une liste de plusieurs lectures possibles, mais n’attendais évidemment des notes que concernant un ou deux documents.

Il faut plusieurs minutes de discussion pour qu’il reconnaisse ne pas être l’auteur des notes. Mon premier argument étant sur le niveau de langue obtenue (aucune faute, très bonne expression…) l’étudiant commencera par reconnaître qu’il utilise des LLM pour corriger son français (on verra que cette « excuse » sera souvent mobilisée). Sur le volume de travail fournit, il reconnaît alors utiliser des LLM pour « résumer ».

In fine, il se justifiera en affirmant qu’il n’a pas utilisé ChatGPT mais d’autres outils (ce qui est très probablement faux, mais en l’espèce n’a pas beaucoup d’importance).

C’était un cas tout à fait « stupide », l’étudiant avait produit des notes sur près d’une dizaine de rapports et articles, sous-tendant plusieurs heures de lectures scientifiques et autant de résumés, et avait produit des énoncés sans aucune faute, tout cela en maîtrisant mal le français.

UTC : 6 cas identifiés lors de l’Api Libre Culture

Une Activité Pédagogique d’Intersemestre (Api) est un cours que les étudiants choisissent au lieu de partir en vacances, en général par intérêt, dont les conditions d’obtention sont faciles : les étudiants sont en mode stage pendant une semaine (ils ne suivent que l’Api) et leur présence régulière suffit en général pour valider le cours et obtenir les 2 crédits ECTS associés. Un devoir individuel était à réaliser sur machine pour clôturer l’Api Libre Culture de juillet 2023. Il consistait essentiellement en un retour personnel sur la semaine de formation.

Lors de ce devoir de fin d’Api, 6 étudiantes et étudiants (parmi 20 participants en tout) ont mobilisé de façon facilement visible un LLM (ChatGPT ou un autre). Pour 4 d’entre eux c’était un usage partiel (groupe 1), pour 2 d’entre eux un usage massif pour répondre à certaines questions (groupe 2). J’ai communiqué avec ces 6 personnes par mail.

3 des étudiants du groupe 1 ont avoué spontanément, en s’excusant, conscients donc d’avoir certainement transgressé les règles de l’examen. La 4e personne a reconnu les faits après que j’ai insisté (envoi d’un second mail en réponse à un premier mail de déni).

Pour les 2 étudiants du groupe 2 :

  • le premier n’a reconnu les faits qu’après plusieurs mails et que je lui aie montré l’historique d’un pad (traitement de texte en ligne) qui comportait un copie/coller évident de ChatGPT.
  • le second, étudiant étranger parlant très bien français, n’a jamais vraiment reconnu les faits, s’en tenant à un usage partiel « pour s’aider en français » (loin de ce que j’ai constaté).

À noter qu’aucun étudiant ne niait avoir utilisé un LLM, leur défense était un usage non déterminant pour s’aider à formuler des choses qu’ils avaient produites eux-mêmes.

Pour les deux étudiants du groupe 2, j’ai décidé de ne pas valider l’Api, ils n’ont donc pas eu les crédits qu’ils auraient eu facilement en me rendant un travail de leur fait, même de faible niveau. Ils n’ont pas contesté ma décision, l’un des deux précisera même : « d’autant plus que j’ai déjà les compétences du fait du cours suivi dans un semestre précédent ».

Un étudiant en Nouvelle-Zélande reconnaît utiliser ChatGPT

« In May, a student in New Zealand confessed to using AI to write their papers, justifying it as a tool like Grammarly or spell-check: “I have the knowledge, I have the lived experience, I’m a good student, I go to all the tutorials and I go to all the lectures and I read everything we have to read but I kind of felt I was being penalised because I don’t write eloquently and I didn’t feel that was right,” they told a student paper in Christchurch. They don’t feel like they’re cheating, because the student guidelines at their university state only that you’re not allowed to get somebody else to do your work for you. GPT-3 isn’t “somebody else”—it’s a program. » ( Marche, 2022 [1] )

On note les deux arguments principaux produits :

  • je l’utilise car je ne suis pas très fort à l’écrit et je ne trouve pas normal que cela ma pénalise ;
  • ce n’est pas clairement interdit à l’université.

J’ai interviewé des collégiens et lycéens

  • ChatGPT est déjà utilisé au collège et au lycée : surtout par les « mauvais » élèves (selon les bons élèves)…
  • …et par les bons élèves occasionnellement, mais pour une « bonne raison » : manque de temps, difficultés rencontrées, etc.
  • Des outils d’IA dédiés à la traduction sont plus largement utilisés, y compris par les bons élèves.
  • À l’école « l’échec c’est mal » donc le plus important est de rendre un bon devoir (voire un devoir parfait).

Interviews de 6 collégiens et lycéens à propos des LLM

Les LLM sont capables d’avoir de bonnes notes

A à un exercice rédactionnel à l’UTC

Cet article fait suite à «  Turcs mécaniques ou magie noire ? » un autre article écrit en janvier sur la base d’un test de ChatGPT à qui j’avais fait passer un de mes examens. Pour mémoire ChatGPT obtenait selon ma correction 14/15 à cet examen second, égalité donc avec les meilleurs étudiants du cours.

B+ à un exercice rédactionnel en Grande-Bretagne

En mai 2022, Mike Sharples utilise le LLM [2] GPT-3 pour produire une rédaction dans le cadre de son cours de pédagogie ( Sharples, 2022 [7] ). Il estime qu’un étudiant qui aurait produit ce résultat aurait validé son cours. Il en conclut que les LLM sont capables de produire des travaux rédactionnels du niveau attendu des étudiants et qu’il faut revoir nos façons d’évaluer (et même, selon lui, nos façons d’enseigner).

Le journaliste et écrivain qui rapport l’expérience dans The Antlantic attribue un B+ à la rédaction mise à disposition par Mike Sharples ( Marche, 2022 [1] ).

11 au bac de philo

ChatGPT s’est vu attribué la note de 11/20 par une correctrice (qui savait qu’elle corrigeait le produit d’une IA) au bac de philosophie 2023. Le protocole n’est pas rigoureux, mais le plus important, comme le note l’article de Numerama ( Lellouche, 2023 [3] ) c’est que le texte produit est loin d’être nul, alors même que le LLM n’est pas spécifiquement programmé pour cet exercice. Un « GPTphilo » aurait indubitablement obtenu une meilleure note, et la version 2024 aura progressé. Probablement pas assez pour être capable de réaliser de vraie productions de philosophe, mais certainement assez pour être capable de rendre caduque un tel exercice d’évaluation (s’il était réalisé à distance avec un ordinateur).

66% de réussite dans le cadre d’une étude comparative

Farazouli et al. ( 2023 [8] ) ont mené un travail plus rigoureux pour évaluer dans quelle mesure ChatGPT est capable de réussir dans le cadre de travaux réalisés à la maison, et quelles conséquences cela a sur les pratiques d’évaluation. 22 enseignants ont eu à corriger 6 copies dont 3 étaient des copies ChatGPT et 3 des copies d’étudiants ayant préalablement obtenu les notes A, C et E (pour 4 de ces enseignants, ils n’avaient que 5 copies dont 2 écrites avec ChatGPT).

« ChatGPT achieved a high passing grade rate of more than 66% in home examination questions in the fields of humanities, social sciences and law. »

Dont :

  • 1 travail noté A sans suspicion que c’était une copie ChatGPT ;
  • 4 rendus notés B, dont 1 seul était suspecté d’avoir été réalisé avec ChatGPT.

On observe des disparités assez importantes en fonction des domaines :

Les notes obtenues par ChatGPT ont été meilleures en philosophie et en sociologie et moins bonnes en droits et en éducation
F E D C B A
Philosophie 3 2 7 6 3 0
Droit 9 4 0 2 0 0
Sociologie 6 6 1 1 3 1
Éducation 5 2 0 1 0 0

Remarque

On observe une grande disparité dans les évaluations d’un même travail (humain ou ChatGPT) par des évaluateurs différents (de F à A), ce qui interroge sur le protocole suivi et/ou sur la nature même de l’évaluation.

Corriger c’était déjà chiant…

La plupart des enseignants s’accordent sur le fait que le plus ennuyeux dans leur métier est la correction des travaux étudiants. Savoir que l’on corrige potentiellement des travaux qui n’ont même pas été produits par les étudiants est tout à fait démobilisant…

« La question c’est celle d’une dilution exponentielle des heuristiques de preuve. Celle d’une loi de Brandolini dans laquelle toute production sémiotique, par ses conditions de production même (ces dernières étant par ailleurs souvent dissimulées ou indiscernables), poserait la question de l’énergie nécessaire à sa réfutation ou à l’établissement de ses propres heuristiques de preuve. » ( Ertzscheid, 2023 [6] ).

Il est coûteux pour un évaluateur de détecter du ChatGPT

Prenons un exemple, Devereaux ( 2023 [9] ) nous dit qu’il devrait être facile pour un évaluateur de savoir si une source existe ou non. Il prend cet exemple car ChatGPT produit des références bibliographiques imaginaires.

  1. C’est en effet possible, mais ce n’est pas « facile », au sens où si vous avez beaucoup de rédactions avec beaucoup de références à lire, cela demande un travail important et a priori inutile ; lors de la correction de l’exercice de ChatGPT ( Turcs mécaniques ou magie noire ?), je me suis moi-même « fait avoir » y compris avec un auteur que je connaissais très bien : je ne connaissais pas les ouvrages mentionnés, mais les titres et co-auteurs était crédibles (et l’auteur prolifique !).
  2. C’est aussi un bon exemple de limite conjoncturelle de l’outil, il paraît informatiquement assez facile de coupler un LLM avec des bases de données bibliographiques pour produire des références à des sources qui soient existantes. La détection ne supposera pas seulement de vérifier que la référence existe mais qu’on soit capable de dire à quel point elle est utilisée à propos. Le correcteur se retrouve alors plus proche d’une posture de révision d’article scientifique, ce qui suppose un travail beaucoup plus important, de plusieurs heures contre plusieurs minutes pour la correction d’un travail d’étudiant.

À quoi sert la rédaction à l’école ?

À quoi sert la rédaction à l’école ?

L’exercice rédactionnel est un moyen pour faire travailler un contenu, mais c’est surtout un moyen pour les étudiants d’apprendre à travailler leur raisonnement.

On peut penser que la généralisation de l’usage de LLM conduise à la perte de compétences à l’écrit, mais surtout à la perte de capacités de raisonnement, pour lesquelles l’écrit est un mode d’entraînement

Pourquoi faire écrire ?

Bret Devereaux ( 2023 [9] ) s’est posé la même question — à quoi sert un exercice rédactionnel ( « teaching essay ») — dans le même contexte de l’arrivée de ChatGPT ? Il propose trois fonctions pour cet exercice.

  1. L’exercice est un moyen pour travailler (chercher, lire, explorer, étudier…) un contenu tiers (histoire, idée…) : l’usage de ChatGPT rend l’exercice totalement inutile, mais on peut assez facilement imaginer d’autres façon de faire travailler le contenu.
  2. L’exercice est un moyen d’apprendre à faire des rédactions : l’usage de ChatGPT rend aussi l’exercice inutile, mais une part importante des étudiants n’aura plus à produire de rédaction en dehors de l’école.
  3. L’exercice est un moyen d’apprendre à mettre en forme des idées par écrit. Ici encore l’usage de ChatGPT rend l’exercice inutile, puisque bien entendu, le résultat final obtenu n’a aucune importance (le contenu sera détruit après usage), et que seul compte le processus suivi (analyse des idées, organisation…). On peut considérer que l’usage d’un LLM est ici plus dommageable en ce sens qu’apprendre à penser via l’exercice rédactionnel est un processus d’apprentissage assez fondamental.

Exemple

Un étudiant qui a utilisé ChatGPT pour un exercice rédactionnel à l’UTC m’a transmis un de ses exemples d’usage, pour me montrer qu’il n’avait pas « triché » puisque le contenu venait de lui.

Il a ainsi donné en entrée à ChatGPT le texte suivant : « Le droit d’auteur, est une licence qui protège les œuvres artistiques et intellectuelles, genre les bouquins, les musiques, les films ou les tableaux. Ça donne aux créateurs le pouvoir de décider comment on peut utiliser, copier ou diffuser leur travail, et ça leur assure d’être reconnus comme ceux qui l’ont créé. »

Si l’on demande une reformulation à ChatGPT on obtient : « Le droit d’auteur est une forme de protection légale qui s’applique aux œuvres artistiques et intellectuelles, telles que les livres, la musique, les films et les œuvres d’art. Il accorde aux créateurs le pouvoir de contrôler l’utilisation, la reproduction et la diffusion de leur travail, tout en garantissant qu’ils soient reconnus en tant que créateurs de ces œuvres. »

On observe une correction de style, mais aussi une correction de fond. Le droit d’auteur n’est pas une « licence » (cette phrase n’a pas de sens) comme l’écrit l’étudiant, mais bien « une forme de protection légale » . En outre le même texte écrit avec beaucoup de fautes ressortira parfaitement écrit en français (l’étudiant qui m’écrivait avait certainement déjà corrigé préalablement son texte car le mail qui l’accompagnait comportait beaucoup de fautes d’orthographe et de formulation).

Si ChatGPT peut l’écrire, ça ne sert à rien ?

Un argument que produit Bret Devereaux et pas mal d’autres commentateurs devant les résultats obtenus par ChatGPT est le suivant : si une machine y arrive c’est que l’exercice est sans intérêt. « If your essay prompt can be successfully answered using nothing but vague ChatGPT generated platitudes, it is a bad prompt » ( Devereaux, 2023 [9] ).

C’est discutable :

  • Cette assertion suppose que l’exercice n’avait pas de sens en soi, même s’il était pratiqué avec intérêt avant, et la preuve qui est donnée est qu’une machine peut le faire. On peut faire l’analogie avec le fait de s’entraîner à faire de la course à pied à l’ère de la voiture (des arts martiaux à l’ère du fusil, du jardinage à l’ère de l’agriculture industrielle, etc.), ce n’est pas parce qu’une machine peut réaliser une tâche qu’il est inutile pour un humain de s’entraîner à la réaliser.
  • Farazouli et al. ( 2023 [8]) relèvent que les qualités mise en avant par les évaluateurs après correction de copies produites par ChatGPT étaient notamment : la qualité du langage, la cohérence, et la créativité. Dans certains contextes les productions de ChatGPT ne sont donc pas évaluées comme médiocres.

Ce que ChatGPT ne fait pas bien

À l’inverse Farazouli et al. ( 2023 [8] ) ont identifié des lacunes dans l’argumentation, le manque de références au cours et au contraire la présence de contenus extérieurs au cours.

La faiblesse argumentative est peut-être un défaut intrinsèque au sens où la mécanique statistique des LLM ne serait pas capable de simuler certains raisonnements. En revanche on note que le manque de références au cours et la présence de références extérieures est discutable (ça peut rester un moyen de détecter, mais c’est un assez mauvais objectif en soi).

  • En premier cycle universitaire on ne souhaite pas en général cette relation étroite au cours (il existe plusieurs approches, et un étudiant qui ferait le travail par lui-même serait tout à fait dans son rôle).
  • En second cycle, cela peut être le cas lorsque le cours porte sur un domaine en lien avec la recherche de l’enseignant typiquement. Mais la recherche est en général publiée et le LLM peut tout à fait être entraîné sur ces données et donc « connaître » ce domaine.

À quoi servent les évaluations à l’école ?

L’évaluation joue un double rôle : l’évaluation formative sert à guider l’apprenant (elle a vocation à lui rendre service), tandis que l’évaluation sommative joue un rôle de certification (elle a vocation à rendre service à un tiers).

Or on est souvent en situation de confusion de ces deux fonctions et cela conduit l’apprenant à se comporter comme s’il était en situation d’évaluation sommative et à chercher à maximiser ses résultats.

On note en particulier :

  • la fonction de classement entre les élèves des notes ;
  • la confusion entre l’exercice rédactionnel comme moyen (c’est le processus qui compte) ou comme fin (c’est le résultat qui compte).

Certifier ou réguler ? (confusion des temps)

L’évaluation peut poursuivre trois fonctions ( Hadji, 1989 [10]) :

  • Certifier (évaluation sommative) afin de statuer sur les acquis, valider un module de cours, délivrer un diplôme ; cette évaluation se situe après la formation.
  • Réguler (évaluation formative) afin de guider l’apprenant dans son processus d’apprentissage ; cette évaluation se situe pendant la formation.
  • Orienter (évaluation diagnostique) afin d’aider à choisir les modalités d’étude les plus appropriées en fonction des intérêts, des aptitudes et de l’acquisition des pré-requis ; cette évaluation se situe avant la formation (et en cela l’évaluation diagnostique se distingue bien de l’évaluation sommative en ce qu’elle se place avant la formation du point de vue de l’évaluateur).

« L’évaluation survient souvent à un moment trop précoce par rapport au processus d’apprentissage en cours ( Astofi, 1992 [11]) ».

C’est un défaut du contrôle continu, arrivant tôt, dès le début du cours même, il nous place d’emblée en posture sommative. Celui qui ne sait pas encore faire est donc potentiellement stressé par l’évaluation dont il refuse ou minore la dimension formative.

Entraîner ou arbitrer ? (confusion des rôles)

« Les fonctions d’entraîneur et d’arbitre sont trop souvent confondues. C’est toujours celle d’entraîneur dont le poids est minoré. ( Astofi, 1992 [11]) »

« Il reste à articuler les deux logiques de l’évaluation, dont l’une exige la confiance alors que l’autre oppose évaluateur et évalué ( Perrenoud, 1997 [12]) ».

Cette confusion des temps entraîne une confusion des rôles : l’enseignant est toujours de fait un certificateur, celui qui permet la validation du cours, la poursuite des études, l’orientation…

Se faire confiance

La question de la confiance au sein de la relation apprenant-enseignant était également relevée par Farazouli et al. ( 2023 [8] ) qui insistait sur la dégradation potentielle introduite par les LLM :

« The presence of AI chatbots may prompt teachers to ask “who has written the text?” and thereby question students’ authorship, potentially reinforcing mistrust at the core of teacher–student relationship »

Évaluation des compétences

Philippe Perrenoud ( 1997 [12]) défend une approche par compétences qui s’écarte d’une « comparaison entre les élèves » pour se diriger vers une comparaison entre « ce que l’élève a fait, et qu’il ferait s’il était plus compétent ». L’auteur souligne que ce système est moins simple et moins économique : « l’évaluation par les compétences ne peut qu’être complexe, personnalisée, imbriquée au travail de formation proprement dit ». Il faut, nous dit-il, renoncer à organiser un « examen de compétence en plaçant tous les concurrents sur la même ligne ».
Cet éloignement à la fonction de classement est intéressante à interroger. La fonction de classement des évaluations n’est pas, en général, revendiquée comme telle, mais elle persiste à travers les notes (A, B, C, D, E), la courbe de Gauss attendue de la répartition de ces notes, le taux de réussite, d’échec, de A. Ces notes ont également une fonction de classement pour l’accès à des semestres d’étude à l’étranger par exemple, ou pour des stages.

Il ne s’agit donc pas seulement de la fonction formative et de l’apprenant face à sa note.

La tâche n’est qu’un prétexte

« La tâche n’est qu’un prétexte », nous rappelle Philippe Meirieu ( Meirieu, 2004 [13]), pour s’exercer en situation d’apprentissage ou pour vérifier qu’on a acquis certaines habiletés.

Il est déterminant de différencier les deux situations :

  • dans le premier cas on peut travailler à apprendre avec l’apprenant sans se focaliser sur ce qu’on produit ;
  • dans le second, en revanche, cas l’énergie de l’apprenant est concentrée sur le résultat, il cherche à se conformer aux attentes de l’évaluation.

On oublie que la tâche n’est qu’un prétexte, le « livrable » qu’on demande est un outil et non un objectif, dans l’immense majorité des cas la dissertation ne sera pas lue pour ce qu’elle raconte, mais uniquement pour produire une évaluation. La résolution du problème de mathématique ou le compte-rendu d’expérience de chimie ne revêt aucun intérêt en soi, puisque, par construction, le lecteur connaît déjà la réponse. C’est à la fois une évidence et quelque chose que le processus évaluatif fait oublier, et in fine, c’est bien au résultat qui est produit que l’étudiant, comme souvent l’enseignant, prête attention, plutôt qu’au processus d’apprentissage.

Évaluation des moyens mis en œuvre et non d’un niveau atteint

À travers l’étude des travaux de Joseph Jacotot, Jacques Rancière ( 1987 [14]) propose que ce qui compte n’est pas ce qu’on apprend mais le fait qu’on apprenne et qu’on sache que l’on peut apprendre, avec sa propre intelligence. Le « maître ignorant » n’est pas celui qui transmet le savoir, il est celui qui provoque l’engagement de l’apprenant, qui s’assure qu’il y a engagement. Selon ce dispositif, la notion même d’évaluation sommative n’est pas possible, puisque le maître est ignorant de ce que l’élève apprend (Jacotot enseigne ainsi les mathématiques ou la musique dont il n’a pas la connaissance).

Cette approche pourrait inspirer à l’évaluation un rôle de suivi de l’engagement (présence, travail…) décorrélé de toute évaluation de résultat : présence et participation en cours et en TD. Notons que le système ECTS [15] est déjà basé sur une charge de travail requise (25 à 30 heures pour 1 crédit).

Remise en question de l’évaluation sommative

L’évaluation via des examens et des notes est un processus peu fiable, en témoignent les variations que l’on observe entre différents évaluateurs, et les variations dans le temps observées auprès d’un même évaluateur ( Hadji, 1989 [10]). On peut donc minorer l’importance de la fonction certifiante de certaines notes. Or les notes coûtent cher à produire par le temps et l’attention qu’elles exigent des enseignants et des apprenants.

On peut donc se poser la question du supprimer, ou diminuer, l’évaluation sommative. Cela pour une partie des enseignements au moins, quitte à garder des espaces sommatifs pour répondre à des nécessités de classement ou certification.

Qu’est-ce qu’on peut faire maintenant ?

  • Interdire l’usage des LLM par défaut dans le règlement des études (en sachant que ça va devenir difficile d’identifier quand ils sont mobilisés) ?
  • Utiliser des moyens techniques de détection de fraude (et entrer dans une « course à l’armement ») ?
  • Améliorer nos exercices rédactionnel pour « échapper aux LLM » tout en restant en veille sur ce qu’ils savent adresser de nouveau ?
  • Renoncer aux travaux rédactionnels évalués à la maison ?
  • Évaluer uniquement en fin de module, voire en dehors des modules et/ou procéder à des évaluations de compétence individuelles ?
  • Organiser des évaluations certifiantes en dehors des cours (évaluation de compétences, examens transversaux…) ?
  • Diminuer la pression sur les étudiants et modifier le contrat pédagogique passé avec eux ?
  • Simplifier la notation, ne conserver que les résultats admis ou non admis, pour évacuer toute idée de classement ?
  • Passer d’une obligation de résultat à une obligation de moyen, c’est à dire valider les cours sur la base de la présence ?
  • Ne plus du tout évaluer certains cours (en réfléchissant contextuellement à la fonction de l’évaluation sommative) ?

Interdire ChatGPT ?

« And that’s the thing: in a free market, a competitor cannot simply exclude a disruptive new technology. But in a classroom, we can absolutely do this thing ( Devereaux, 2023 [9]) »

C’est vrai, et le règlement des études peut intégrer cette interdiction a priori. Mais les LLM vont s’immiscer au sein de tous les outils numériques, a commencer par les moteurs de recherche, et cela va être difficile de maintenir l’usage d’outils numériques sans LLM.

mème classique : Bernie Sanders, un vieil homme face caméra sous le titre "les profs" dit : "je vous demande une fois encore de ne pas utiliser chatGPT"

Utiliser des moyens techniques de détection de fraude ?

Des systèmes de contrôle dans le contexte de l’évaluation à distance ou des logiciels anti-plagiat existent, mais :

  • cela pose des problèmes de surveillance et d’intrusion dans les machines des apprenants ;
  • cela suppose une « course à l’armement » entre les systèmes de détection et les systèmes de triche.

Il faut des résultats fiables pour être en mesure d’accuser un étudiant de fraude.

Adapter nos exercices et rester en veille ?

« Likewise, poorly designed assignments will be easier for students to cheat on, but that simply calls on all of us to be more careful and intentional with our assignment design ( Devereaux, 2023 [9]). »

Certains exercices pourront être en effet aménagés pour rendre plus difficile l’usage de LLM. On peut avoir une exigence argumentative plus élevée et/ou poser des questions plus complexes (en réfléchissant à pourquoi on ne le faisait pas avant, ce qui doit être modifié pour atteindre ce nouvel objectif, etc.). On peut augmenter le niveau d’exigence demandé (en réfléchissant au fait que cela puisse exclure des étudiants, au fait qu’il faille relâcher d’autres exercices par ailleurs…).

Mais pour certains exercices ce ne sera pas possible (thème et version en langue par exemple). Et de plus cela implique une logique de veille active entre la conception de ces exercices et l’évolution rapide des capacités des outils qui intégreront des LLM.

Renoncer aux travaux à la maison (ou à leur évaluation)

On peut décider de ne plus évaluer les travaux réalisés à la maison.

On peut alors imaginer plusieurs formes de substitution : retour aux devoirs sur table et sans ordinateur, passage à l’oral…

Évaluer en dehors des cours ?

On peut imaginer :

  • des évaluations certifiantes totalement en dehors des cours (sur le modèle du TOEIC ou du baccalauréat, par exemple pour les langues donc, pour l’expression française, pour des connaissances dans certains domaines, des compétences rédactionnelles…) ;
  • des évaluations certifiantes calées uniquement en fin d’UV (examen final de sortie de cours, avec éventuellement rattrapage, sans plus aucune note intermédiaire) ;
  • des évaluations de compétences individuelles (intéressantes pédagogiquement, mais coûteuses à organiser et demandant des compétences avancées de la part des évaluateurs).

Diminuer la pression sur les étudiants ?

Le contrat ECTS est très exigeant. 30 crédits par semestre c’est 750 à 900 heures attendues de travail en 16 semaines, vacances comprises, soit 45h à 55h par semaine. Plus la pression sur le temps est importante plus la tentation de tricher est grande.

On peut imaginer de renouer un contrat pédagogique d’un autre ordre avec les étudiants, fondé sur la confiance réciproque et la recherche de leur intérêt.

Simplifier la notation (pass or fail) ?

L’UTC a connu un système à 3 notes : « admis », « non admis » et « mention » (équivalent à A). Dans ce système, on prête moins d’attention à la fonction sommative des évaluations. Si un apprenant obtient une note suffisante à un premier examen par exemple, il sait qu’il validera le module et il n’a pas d’intérêt particulier à optimiser ses autres évaluations sommatives.

Sauf à viser un A, mais on peut aussi se passer du A : c’est le cas des Activité Pédagogiques d’Inter-semestre à l’UTC qui sont évaluées juste avec « reçu » ou « non reçu ».

Mème classique avec personnage dégoûté par "corriger des copies d'étudiant⋅es rédigées par des IA", le même ravi par "Demander à des IA de corriger des copies d'étudiant⋅es rédigées par des IA"

Passer d’une obligation de résultat à une obligation de moyen ?

De fait certains cours sont mobilisés pour la validation du diplôme, voire la sélection et le classement des étudiants, et d’autres comptent très peu pour cet objectif en pratique.

Certains cours pourraient donc être exclus du processus d’évaluation sommative (comme en formation professionnelle). On économiserait le temps de travail d’évaluation sommative qui pourrait être réinvesti ailleurs. Quelques étudiants en profiteraient certainement pour « passer au travers » de certains contenus, il faudrait pouvoir évaluer dans quelle mesure cela serait pire qu’aujourd’hui.

Renoncer à noter ? (pourquoi note-t-on ?)

Certains cours, sinon tous, pourraient donc échapper totalement à la notation.

À quelle fin évalue-t-on les étudiants dans une école qui a sélectionné à l’entrée comme l’UTC ?

  • Pour valider que les étudiants ont été « bien » sélectionnés ?
  • Pour les « forcer » à travailler ?
  • Pour faire « sérieux » ?
  • Pour répondre aux demandes d’organismes de certification du diplôme ?

 

réunion de conseil d'administration d'université — nous avons un grave problème : comment allons-nous évaluer les étudiants s'ils fraudent avec un LLM ? — on interdit tout sauf le stylo ? — on les punit ? — on arrête de noter ? Le jeune homme décontracté qui faisait cette dernière suggestion déclenche la fureur de l'animateur de la réunion, qui le passe par la fenêtre de l'immeuble.

Notes et références

[1] – Marche Stephen. 2022. The College Essay Is Dead. in The Atlantic. https://www.theatlantic.com/technology/archive/2022/12/chatgpt-ai-writing-college-student-essays/672371/

[2] – LLM (Large Language Model) : Les grands modèles de langage (ou LLM, pour « Large Language Model ») sont des mécanismes d’Intelligence Artificielle. Une de leurs applications les plus connues est la génération de textes ou d’images. L’ouverture au public de ChatGPT, en novembre 2022, a popularisé cette application. Chaque grande entreprise de l’informatique sort désormais son propre modèle, son propre LLM.

https://framablog.org/2023/07/31/que-veut-dire-libre-ou-open-source-pour-un-grand-modele-de-langage/

[3] – Lellouche Nicolas. 2023. Oubliez Enthoven : ChatGPT a eu la moyenne au bac de philo et c’est ce qui compte, Oubliez Enthoven. in Numerama. https://www.numerama.com/tech/1415146-vous-navez-pas-besoin-de-neurone-pour-avoir-votre-bac-de-philo.html.

[4] – Bortzmeyer Stéphane. 2023. Que veut dire « libre » (ou « open source ») pour un grand modèle de langage ?. https://framablog.org/2023/07/31/que-veut-dire-libre-ou-open-source-pour-un-grand-modele-de-langage/.

[5] – Tiernan Ray. 2020. Qu’est-ce que GPT-3 ? Tout ce que votre entreprise doit savoir sur le programme de langage d’IA d’OpenAIQu’est-ce que GPT-3 ?. https://www.zdnet.fr/pratique/qu-est-ce-que-gpt-3-tout-ce-que-votre-entreprise-doit-savoir-sur-le-programme-de-langage-d-ia-d-openai-39908563.htm.

[6] – Ertzscheid Olivier. 2023. GPT-3 : c’est toi le Chat.GPT-3. https://affordance.framasoft.org/2023/01/gpt-3-cest-toi-le-chat/.

[7] – Sharples Mike. 2022. New AI tools that can write student essays require educators to rethink teaching and assessment. https://blogs.lse.ac.uk/impactofsocialsciences/2022/05/17/new-ai-tools-that-can-write-student-essays-require-educators-to-rethink-teaching-and-assessment/.

[8] – Farazouli Alexandra, Cerratto-Pargman Teresa, Bolander-Laksov Klara, McGrath Cormac. 2023. Hello GPT! Goodbye home examination? An exploratory study of AI chatbots impact on university teachers’ assessment practicesHello GPT! Goodbye home examination?. in Assessment & Evaluation in Higher Education. vol.0 n°0 pp1-13.https://doi.org/10.1080/02602938.2023.2241676.

[9] – Devereaux Bret. 2023. Collections: On ChatGPTCollections. in A Collection of Unmitigated Pedantry. https://acoup.blog/2023/02/17/collections-on-chatgpt/.

[10] – Hadji C.. 1989. L’évaluation, règles du jeu: des intentions aux outils. ESF.

[11] – Astolfi Jean-Pierre. 1992. L’école pour apprendre: l’élève face aux savoirsL’école pour apprendre. ESF.

[12] – Perrenoud Philippe. 1997. Construire des compétences dès l’école. ESF.

[13] – Meirieu Philippe. 2004. Faire l’école, faire la classe: démocratie et pédagogieFaire l’école, faire la classe. ESF.

[14] – Rancière Jacques. 1987. Le maître ignorant: cinq leçons sur l’émancipation intellectuelleLe maître ignorant. Fayard.

[15] – ECTS (European Credit Transfer and accumulation System). Le système européen de transfert et d’accumulation de crédits a pour objectif de faciliter la comparaison des programmes d’études au sein des différents pays européens. Le système ECTS s’applique principalement à la formation universitaire. Il a remplacé le système des unités de valeur (UV) jusque-là utilisé en France. wikipedia.org




Bifurquer avec le
Collège européen de Cluny

Changer de voie professionnelle pour être plus en phase avec ses valeurs, ça se prépare : le Master of Advanced Studies « Innovation territoriale », organisé conjointement par le Collège européen de Cluny et la prestigieuse Université de Bologne, recrute sa promo 2023-2024 jusqu’au 29 septembre.

Framasoft y anime le module « Se connecter sans exclure » ­dans le cadre de l’UPLOAD1

On y parle culture libre et re-décentralisation d’Internet, bien sûr, mais aussi impact social et environnemental du numérique.

Nous profitons de cette rentrée pour donner un coup de projecteur sur ce post-master riche en promesses qui s’inscrit dans la perspective de bifurcation sociale et environnementale que Framasoft s’efforce d’accompagner.
Il vous reste 3 semaines pour embarquer dans ce chouette train.

logo de établissement : un C jaune comme Cluny au centre de la représentation stylisée de l'abbaye. Texte : Collège européen de Cluny, démocraties locales & innovation

Bonjour Jean-Luc, pourrais-tu d’abord te présenter et nous dire par quelle trajectoire tu en es venu à proposer une formation aussi originale.

photo de Jean-Luc Puech, bras croisés, souriantProfessionnellement, ma formation d’ingénieur m’a conduit vers les domaines de l’énergie et de l’environnement, puis de l’enseignement supérieur. En parallèle, je me suis engagé en citoyen dans l’action publique locale, avec un mandat de maire et trois mandats de président de communauté de communes en milieu rural à Cluny, dans le sud de la Bourgogne.
De cette double expérience, j’ai acquis la conviction que les modes de vie ne changeront que si l’action publique locale invente de nouvelles solidarités, de nouveaux services aux habitants. Et pour cela, la formation des acteurs est indispensable et urgente. Il faut sortir de l’hyper-spécialisation et du prêt-à-penser.

Ah oui en somme, tu as toi-même parcouru plusieurs voies… et c’est ainsi que le Collège européen de Cluny a ouvert sous ta direction un post-master que tu définis comme une formation « pour les bifurqueuses et bifurqueurs ».

Oui, cette formation qui est portée par un établissement à statut associatif, ce qui lui donne une large liberté d’inventer, est ouverte à toutes les personnes titulaires d’un diplôme de niveau master (ou disposant d’une expérience professionnelle équivalente), qui veulent donner un autre sens à leur parcours professionnel : sortir du carcan du monde d’avant, regarder en face les défis du changement climatique, de l’effondrement de la biodiversité, du creusement des inégalités territoriales et sociales, pour contribuer à tracer des chemins d’avenir par l’intelligence collective.

Voilà des perspectives et de nobles objectifs mais qui pourraient sembler un peu idéalistes… Pour donner des exemples concrets, peux-tu parler de personnes qui ont bénéficié de la formation l’année dernière, et dire dans quoi elles se sont engagées ensuite ?

Dans la première promotion, nous avons eu à la fois des profils de personnes qui venaient d’obtenir leur master et souhaitaient ouvrir leurs horizons, et d’autres qui après quelques années d’activité professionnelle décevante, souhaitaient se réorienter vers l’action publique à l’échelle des territoires.
Ainsi par exemple, Arnaud n’en pouvait plus de servir une société de services informatiques, le Master of advanced studies lui a permis de devenir développeur de projets d’énergie renouvelable en collectivité locale, Mathilde, juriste de l’environnement se consacre désormais à un pôle territorial d’économie circulaire. Clément, kiné, préfère travailler à l’issue de sa nouvelle formation sur la mobilité douce en milieu rural plutôt que de réparer les dégâts de modes de vie déséquilibrés.

Ça pourrait bien donner des idées aux lectrices et lecteurs du Framablog… Mais pour le contenu de la formation, quels sont les cours et ateliers qui sont proposés ?
La formation est structurée en deux types de modules, organisés chacun sur deux jours et demi par semaine :

  • Des modules qui portent sur des enjeux sectoriels :
    • se nourrir local,
    • se déplacer bas-carbone,
    • gérer l’énergie et le climat,
    • habiter l’existant, vivre avec le vivant,
    • se connecter sans exclure, etc.
  • Des modules méthodologiques :
    • mobiliser l’intelligence collective,
    • mobiliser le design pour l’innovation publique,
    • agir en citoyen local, régional, national, européen et global face à l’anthropocène, etc.

Dans ces modules, on alterne analyse théorique, expérimentation sur le terrain et rencontre avec des acteurs locaux.

groupe d'étudiants et étudiantes autour d'une table blanche ovale, photo prise au Collège européen de Cluny

Ah donc les participants et participantes font aussi l’expérience du terrain avec des projets ou stages ?

Oui, la formation comporte une période de conduite de projet territorial innovant, en collectivité, en association ou en entreprise, comme travailler avec les ados d’un territoire à l’évolution de leurs pratiques de mobilité, animer un collectif d’artisans et d’artistes dans la revitalisation d’une friche hospitalière pour en faire un lieu de partage de compétences, accompagner une intercommunalité dans la valorisation de ses ressources en bois local, etc.

Par ailleurs, la formation est en partenariat avec l’Université de Bologne, qu’est-ce que ça signifie au juste ?

Eh bien, le diplôme obtenu est un diplôme de l’université de Bologne et du Collège européen de Cluny. Le premier mois de formation (en novembre) a lieu à l’université de Bologne, sur son campus situé à Ravenne‎. Les cours y sont donnés en anglais par des professeurs de l’Université de Bologne. La suite de la formation, de décembre à mars a lieu à Cluny, sur le campus Arts et Métiers, au sein de l’ancienne abbaye, par des enseignants-chercheurs et des acteurs des territoires français. Le projet d’innovation en immersion professionnelle se déroule de mars à juillet.
logo de l'université de Bologne. dans un cachet rond : alma mater studiorum, A.D. 1088 avec au centre une gravure médiévale. reprise du texte latéralement + "Università di Bologna"

Les frais de scolarité sont assez importants, mais vous vous démenez pour proposer des solutions à celles et ceux qui ont peu de moyens, dans une démarche d’ouverture et d’inclusion.

Les droits de scolarité sont de 5000 € pour le diplôme conjoint avec l’Université de Bologne. Mais d’une part nous avons organisé une souscription populaire : des dons de citoyens permettent de donner un coup de pouce aux personnes qui auraient du mal à boucler le budget, d’autre part l’organisation du cursus à raison de 2,5 jours par semaine sur 6 mois est compatible avec une activité à temps partiel. Et le Collège européen est en contact avec les employeurs locaux, qui recherchent des équipiers : secteur sanitaire et social, artisanat, hospitalité, mobilité. Ces activités peuvent être elles-mêmes une riche expérience contribuant à la réflexion sur la nécessité de changer les modes de vie et les services.

Pour finir, quelle formule magique tu proposerais pour convaincre quelqu’un de s’inscrire dès cette promo ? « Il y a urgence » ? « Engagez-vous »?

mmmh, disons :

N’attends pas le monde d’après, donne-toi les moyens de participer à son invention !

 

personnage à droite un peu prétentieux : "j'ai bifurqué, j'étais chez Total, mais l'énergie c'est mort. Je me suis inscrit en master "IA et finance internationale", c'est pas évident hein, mais faut bien sauver sa gueule." deuxième personnage, une femme souriante : " ah moi aussi j'ai bifurqué, je suis le post-master de Cluny, on se forme à innover autrement : intégrer les enjeux sociaux et environnementaux à l'échelle du territoire… faut bien essayer de sauver le monde !

~~~~~~

  • En savoir plus ? Tous les détails nécessaires figurent dans la plaquette de l’établissement
  • … et Framasoft dans tout ça ?
Se connecter sans exclure, un module animé par Framasoft.
Le développement rapide du numérique (médias sociaux, services en ligne, intelligence artificielle…) ouvre des opportunités, mais il génère également des situations douloureuses (exclusion, dépendance, prolétarisation…). Il pose également des questions environnementales complexes, loin de la promesse originelle de la dématérialisation.
Le cours permet de questionner les principales conséquences économiques, sociales et environnementales de l’usage du numérique, à partir de constats actuels et de projections à court et moyen terme. On se penche sur des questions éthiques (accès à l’administration, illettrisme numérique, vie privée, croissance exponentielle…) en partageant des exemples (politiques publiques, initiatives citoyennes, recherches et formations…) pour anticiper et surmonter les risques qui accompagnent la révolution numérique.–> Le détail du module



Refuser les rapports et soutenances de stages confidentiels

Aujourd’hui, nous vous proposons de sortir un peu des sentiers (re)battus du libre et des communs pour explorer un peu plus ceux de l’éducation et du partage. Stéphane Crozat, membre de Framasoft et prof. à l’Université de Technologie de Compiègne, souhaite partager ici une réflexion autour des conditions de publication des rapports de stage. Profitons du fait que le Framablog est aussi le blog des membres de l’association Framasoft pour lui donner la parole.

Stéphane Crozat, Framasoft

Chaque semestre, une partie significative des entreprises qui accueillent des stagiaires de l’Université Technologique de Compiègne dont je suis suiveur font une demande de procédure de confidentialité concernant le rapport et/ou la soutenance de l’étudiant. Je suis opposé à cette pratique.

Récemment encore une grande société française impliquée notamment dans des activités en lien avec la défense m’a fait une telle demande.

Ce semestre, j’ai pris le temps de poser mes arguments à plat, à la suite de quoi la demande a été retirée. Le mail que j’ai reçu en réponse faisait état du bien-fondé de ces arguments. Je les partage donc afin de contribuer peut-être à rendre les demandes de confidentialité plus marginales.

Préambule : la confidentialité est un droit de l’entreprise

Je ne suis pas opposé aux besoins de confidentialité des entreprises. De nombreux contextes l’exigent. À titre personnel il est par exemple évident que les informations dont je dispose sur les étudiants ne sauraient être divulguées publiquement.

Il est à noter que :

  • le principe de confidentialité est inclus par défaut dans le droit de travail : « le contrat de travail est exécuté de bonne foi (article L1222–1 du Code du travail) » ce qui implique notamment la loyauté, la non-concurrence ou la confidentialité ;
  • le stagiaire n’est pas complètement soumis au code du travail mais le principe de confidentialité reste présent dans la logique du stage et est communément explicité par une clause de non divulgation qui peut être ajoutée au contrat de travail ou à la convention de stage.

Donc, la confidentialité est une règle qui s’applique légitimement par défaut.

Entretien d'embauche. À la question "pouvez-vous m'en dire plus sur votre stage" le candidat répond "euh, non".

Argument 1 : Le rapport de l’étudiant est un élément de son CV, s’il est confidentiel, il ne pourra pas le produire.

Si un rapport est confidentiel, alors il ne pourra pas être produit pour faire valoir le travail réalisé, lors de la recherche d’un stage ultérieur ou lors de la recherche d’un emploi.

  • Un mémoire de stage est un travail personnel significatif pour le stagiaire qui mérite de figurer au rang des choses dont il peut être fier et qu’il peut montrer. C’est le déposséder de quelque chose d’important que de lui interdire de produire le résultat de son travail.
  • À défaut, c’est minorer l’importance de ce travail de restitution, ce qui peut conduire à des rapports sans intérêt, puisqu’en fin de compte personne ne les lira (à part peut-être à des fins d’évaluation, une fois, peut-être distraitement).

Proposition 1 : faire un rapport court et public

Je propose d’écrire un rapport synthétique et de bonne facture, non confidentiel et éventuellement de lui annexer un document confidentiel (qu’il n’est pas nécessaire de diffuser hors de l’entreprise).

On aura d’emblée l’ambition que ce rapport soit public, destiné à être diffusé sur le Web typiquement.

Le stagiaire cherchera à faire valoir les actions qu’il a pu mener sans divulguer d’information sensible. On peut pour cela procéder à de l’anonymisation, ou encore à la troncature d’information, sans nuire à la bonne compréhension du propos général. C’est en soi un bon exercice. La stagiaire pourra bien entendu mentionner en préambule qu’il a rédigé son rapport sous cette contrainte (un exemple d’approche : librecours.net/module/ing/rap).

Cette proposition a également le mérite de simplifier la gestion de la confidentialité et d’éviter les entre-deux inconfortables où personne ne sait exactement ce qu’il peut faire et laisser faire :

  1. un rapport public accessible à tous tout le temps,
  2. un rapport privé accessible à l’entreprise uniquement.

Argument 2 : La soutenance est un moment de mise en commun, cela ne peut pas fonctionner si tout le monde ne joue pas le jeu.

La soutenance est un moment d’échange entre étudiants, enseignants et entreprises. Les sessions sont organisées de telle façon que chacun profite des expériences des autres. Lorsque quelqu’un demande une soutenance confidentielle, il exclut de fait les autres de ce partage, c’est donc un appauvrissement de cette phase de restitution de stage. Si tout le monde procède ainsi, l’exercice perd tout intérêt, c’est en quelque sort un cas de dilemme du prisonnier2 : si personne ne se fait confiance, alors tout le monde perd.

Les paroles de l'étudiant sont "caviardées" dans sa bulle

Pour que la situation reste équitable, les soutenances confidentielles doivent se dérouler à part, en dehors de l’espace commun partagé par les autres. Ainsi ceux qui refusent de partager leur expérience se privent de la possibilité de profiter de l’expérience des autres.

C’est donc une dégradation de la situation d’apprentissage pour le stagiaire.

Proposition 2 : sélectionner ce qui est présenté en excluant ce qui est confidentiel

Je propose une soutenance non confidentielle sans information sensible. Il est possible qu’une soutenance ne porte pas sur l’ensemble du stage, c’est même souvent le cas, on peut donc se focaliser sur quelques-unes des tâches les moins sensibles et les exposer avec soin.

Le but d’une soutenance n’est pas de rendre compte dans le détail de tout ce qui a été fait, le temps ne le permettrait pas, mais de donner à voir une partie de ce que l’on a appris, ce que l’on sait faire, et, peut être en premier lieu : de communiquer des choses intéressantes au public.

Le public de la soutenance : ses oreilles sont bouchées de gros tampons d'ouate.

Une bonne soutenance est pour moi une soutenance à l’issue de laquelle on a appris des choses que l’on ignorait grâce à la clarté de l’exposé du stagiaire.

Cela n’implique pas de révéler des secrets spécifiques, mais au contraire d’avoir été capable de monter en généralité pour présenter en dehors du contexte les compétences et connaissances acquises. C’est ce qui fait leur valeur pour le stagiaire et ses futurs collaborateurs.

Conclusion : un argument personnel complémentaire

Accepter un travail d’encadrement de stage correspond à la perspective d’instaurer un échange. On consacre un peu de temps, on fait éventuellement bénéficier un peu de son expérience lorsque c’est utile, et en échange on apprend des choses que l’on peut réinvestir dans sa propre pratique professionnelle.

Le métier d’un enseignant-chercheur consistant à publier de la connaissance au service de tous, les informations confidentielles lui sont mal utiles. Donc le bilan est négatif : on ne gagne rien et on perd un peu de ce temps si précieux pour tous.

Je refuse a priori tout engagement dans le suivi de stages comprenant des rapports ou soutenances confidentielles.




La réponse de l’hébergeur à la bergère

…ou considérations pratiques à l’attention des hébergeurs qui reçoivent une demande de retrait de contenu

L’association Scenari dont je suis membre a reçu un mail de la directrice juridique d’un important éditeur de manuels scolaires (que j’appellerai Éditions X), intitulé « contenus non autorisés ». Ce mail nous informait qu’avaient été découverts « des contenus non autorisés sur votre site et notamment « ​​Relation Client à Distance et Digitalisation »​ » et nous demandait « de supprimer tous les contenus non autorisés par nos maisons d’édition ».

On pourrait s’étonner que certains éditeurs de manuels scolaires jugent opportun en ce moment de chasser les copies illicites sur le Web. On pourrait préférer qu’ils concentrent l’ensemble de leurs forces pour chercher comment mettre à disposition leurs ressources au plus grand nombre. Mais ce n’est pas le sujet de cet article.

On pourrait aussi avoir envie de rappeler que les contenus pédagogiques devraient être sous licences libres, a fortiori quand ils ont été largement financés par l’argent public. Cela permettrait aux enseignants de se les réapproprier plutôt que de recréer des ressources à côté. Cela permettrait de favoriser des processus contributifs. Cela permettrait leur capacitation numérique, cela améliorerait leur autonomie quand il s’agit de mettre à disposition du contenu en ligne. Mais ce n’est toujours pas le sujet de cet article.

 

À la réception de cette demande, nous avons réagi promptement (on verra que c’est le terme employé dans la loi), mais avec un peu de recul, je me dis que nous avons réagi trop promptement. Le sujet de cet article est d’étudier comment un petit hébergeur associatif doit réagir en face d’une telle demande.

Rappel du contexte

L’association Scenari est hébergeur de contenus créés avec MyScenari, un logiciel libre combiné à un hébergement offert à ses membres, qui permet notamment de créer des sites et de les mettre en ligne. Pendant la crise Covid-19 l’association a lancé une « Action solidaire Scenari » permettant à tout enseignant non membre de l’association de bénéficier de cet hébergement (scenari.org).

C’était la première fois que nous recevions une demande de retrait de contenus.

Des contenus non autorisés… par quelle autorité ?

Nous avons donc réagi promptement, c’est à dire que nous avons immédiatement répondu au mail reçu que nous allions « éliminer les contenus non autorisés » et nous avons presque aussi rapidement signifié à l’auteur que nous avions reçu cette demande. Celui-ci a retiré ses contenus aussitôt le message reçu, reconnaissant que c’était « borderline », mais regrettant que l’éditeur n’ait pas été « un peu plus compréhensif » dans le contexte actuel où il lui faut bien chercher des solutions pour maintenir la fameuse « continuité pédagogique », et s’étonnant que les Éditions X avec qui il est en contact ne l’aient pas interpellé directement.

Donc les contenus ont été éliminés. Grâce à nous.

Grâce à nous un éditeur a pu faire valoir son bon droit. Grâce à nous le travail d’un enseignant et de ses étudiants a été compliqué. Le travail d’un enseignant qui avait fait l’effort de chercher des solutions, par lui-même, d’en trouver, de les mettre en œuvre. Pas pour spolier des ayants droit, mais pour inventer des solutions à ces problèmes. Il a créé du contenu, nous l’avons détruit.

Pourquoi diable avons-nous fait cela ?

Parce que nous avons réagi, presque mécaniquement, à un argument d’autorité. Un argument d’autorité c’est un argument qui « consiste à faire appel à une autorité plutôt qu’à la raison », nous dit Arthur Schopenhauer dans L’Art d’avoir toujours raison (ouvrage que je recommande par ailleurs). Donc, la Directrice juridique (avec une majuscule) des Éditions X nous remercie de. Notez qu’il n’y a pas d’accent à Édition dans le mail reçu, qu’un éditeur devrait pourtant savoir que les majuscules s’accentuent, et qu’en faisant remarquer cela j’use également d’un stratagème rhétorique, l’attaque personnelle (argumentum ad personam) qui permet d’attaquer la personne plutôt que le discours. Je me dispense habituellement de le faire lorsque je m’en rends compte, c’est un des avantages de s’intéresser à la rhétorique. Disons que j’ai laissé celui-ci pour illustration de mon propos, et montrer que la rhétorique est une arme à double tranchant.
dessin humoristique fabriqué avec le générateur de geektionnerd. Titre : Soyons procéduriers avec Édith Sillon. à gauche une silhouette féminine mains sur les hanches déclare "Nous vous demandons donc de supprimer les contenus non autorisés, car nous défendons les intérêts des ayant-droits (ortho fautives avec trait d’union inutile et pluriel au mot "droit"). En face d’elle, une autre silhouette féminine, bras croisés , répond : Pas question parce que le pluriel c’est ayants droit (S à ayant, pas de trait d’union). Elle ajoute plus bas "et toc";
Argument d’autorité donc. Je vois pourtant au moins trois bonnes raisons de faire fonctionner sa raison, justement, et de ne pas répondre à une telle demande à moins, soit d’y être obligé légalement, soit de s’être construit son propre avis sur la question.

En répondant positivement à la demande sans y être légalement obligé, on fait le choix de léser celui qui est ciblé par la demande. Or nous n’avons pas forcément les éléments pour savoir qui est dans son droit de l’un ou de l’autre. D’une part au sens légal, qu’est-ce qui me prouve que ?… On verra que la loi actuelle va en ce sens et que la preuve est à la charge du demandeur. D’autre part au sens éthique : les ayants droit ont-ils vraiment raison d’interdire coûte que coûte l’accès à leurs contenus, en toutes circonstances ? Aaron Swartz est mort d’avoir refusé une réponse simpliste à cette question. On ne nous en demande pas tant, mais on peut au moins s’arrêter un peu et réfléchir.

En répondant positivement à la demande sans y avoir mûrement réfléchi, nous agissons comme les robots qui suppriment des contenus, parfois de façon tout à fait stupide et injustifiée. Or la majorité des hébergeurs, a fortiori petits, a fortiori libristes, sont contre les systèmes de filtrage automatisés et ont combattu leur systématisation prévue par la proposition de directive européenne sur le droit d’auteur.

En répondant positivement à la demande sans y être obligé, nous consommons de l’énergie qui n’est pas investie ailleurs. Les hébergeurs associatifs, sans orientation commerciale, ont mieux à faire que de s’occuper des intérêts des détenteurs de droits patrimoniaux. Faire tourner les services, les sécuriser, les faire connaître, les documenter, répondre aux utilisateurs, modérer les propos inappropriés, haineux ou discriminatoires… À tout cela on s’est engagé. Mais supprimer des corrigés d’exercices pour un BTS ? Vraiment ? Est-ce que les éditeurs ne peuvent pas se débrouiller pour cela ? (on verra que c’est également à peu près ce que dit la loi, pour le moment).

La loi qui s’applique actuellement est la loi n° 2004-575 du 21 juin 2004 pour la confiance dans l’économie numérique, dites LCEN.

L’article qui nous intéresse est en particulier l’article 6.

En voici quelques points saillants :

Les hébergeurs sont désignés par la périphrase : « Les personnes dont l’activité est d’offrir un accès à des services de communication au public en ligne », je garderai le terme hébergeur pour mon exégèse (Section I-1).

Les hébergeurs doivent être en mesure de prévenir le « téléchargement et la mise à disposition illicite d’œuvres et d’objets protégés par un droit d’auteur ou un droit voisin » (Section I-1 et référence à l’article L. 336-3 du CPI).

Les hébergeurs ne peuvent pas voir leur responsabilité engagée s’ils « n’avaient pas effectivement connaissance » du caractère illicite des données stockées ou s’ils « « ont agi promptement pour retirer ces données ou en rendre l’accès impossible » » (Section I-2 et I.3).

Les hébergeurs ne sont pas obligés de « surveiller les informations qu'[ils] transmettent ou stockent », ni de « rechercher des faits ou des circonstances révélant des activités illicites » » (sauf « « surveillance ciblée et temporaire demandée par l’autorité judiciaire ») (Section I-7).

Les hébergeurs ont l’obligation de « mettre en place un dispositif facilement accessible et visible permettant à toute personne de porter à leur connaissance » des données permettant « la répression de l’apologie des crimes contre l’humanité, de la provocation à la commission d’actes de terrorisme et de leur apologie, de l’incitation à la haine raciale, à la haine à l’égard de personnes à raison de leur sexe, de leur orientation ou identité sexuelle ou de leur handicap ainsi que de la pornographie enfantine, de l’incitation à la violence, notamment l’incitation aux violences sexuelles et sexistes, ainsi que des atteintes à la dignité humaine », « des activités illégales de jeux d’argent », des opérations liées au « tabac manufacturé dans le cadre d’une vente à distance » (l’atteinte au droit d’auteur n’est, logiquement, pas mentionné dans cette liste) (Section I-7).

Et la section I.5 nous précise que la connaissance des faits litigieux est présumée acquise lorsqu’il leur est notifié (je reproduis intégralement cette partie) :

  • la date de la notification ;
  • si le notifiant est une personne physique : ses nom, prénoms, profession, domicile, nationalité, date et lieu de naissance ; si le requérant est une personne morale : sa forme, sa dénomination, son siège social et l’organe qui la représente légalement ;
  • les nom et domicile du destinataire ou, s’il s’agit d’une personne morale, sa dénomination et son siège social ;
  • la description des faits litigieux et leur localisation précise ;
  • les motifs pour lesquels le contenu doit être retiré, comprenant la mention des dispositions légales et des justifications de faits ;
  • la copie de la correspondance adressée à l’auteur ou à l’éditeur des informations ou activités litigieuses demandant leur interruption, leur retrait ou leur modification, ou la justification de ce que l’auteur ou l’éditeur n’a pu être contacté.

On comprend donc que celui ou celle qui veut faire retirer du contenu par un hébergeur doit :

  • au moins avoir essayé de contacter directement l’auteur de l’infraction qu’elle pointe, avant de s’adresser à l’hébergeur,
  • fournir une motivation qui prouve les faits, ce n’est pas à l’hébergeur de mener l’enquête.

Évolutions attendues à moyen terme (directive européenne)

La directive européenne 2019/790 sur le « droit d’auteur et les droits voisins dans le marché unique numérique » a été adoptée le 17 avril 2019. Il s’agit d’une directive, c’est donc un texte qui ne s’applique pas encore mais qui doit être transposé dans la loi française.

L’article 13 du projet de directive, devenu l’article 17 de la directive adoptée, a été combattu, notamment par les hébergeurs et les défenseurs des libertés individuelles, parce qu’il renverse la charge des ayants droit vers les hébergeurs :

« Si aucune autorisation n’est accordée, les fournisseurs de services de partage de contenus en ligne sont responsables des actes non autorisés de communication au public, y compris la mise à la disposition du public, d’œuvres protégées par le droit d’auteur et d’autres objets protégés, à moins qu’ils ne démontrent que […] ».

L’hébergeur qui n’aura pas d’accord avec les ayants droit et/ou qui ne sera pas en mesure de filtrer a priori les contenus sera responsable. Ce qui implique la nécessité pour les hébergeurs de passer de tels contrats et de mettre en place des dispositifs automatisés de filtrage.

Je ne m’étends pas sur cette évolution à venir, pour le moment, le régime qui s’applique est celui décrit précédemment.

« La directive passe par deux étapes avant de produire ses effets : une fois votée par les institutions européennes, elle doit ensuite être transposée par les États membres dans leur droit national, à la différence du règlement, qui s’applique directement. »

Guide dont vous êtes le héros à l’usage des petits hébergeurs

1

Vérifiez que le sujet de la demande n’est relatif qu’au droit d’auteur.

Si on est bien uniquement dans le cas du droit d’auteur, allez en 2.
Si on est dans le cas d’un autre signalement portant sur une répression d’intérêt général tel que mentionné par la loi (crimes, haine, terrorisme, discrimination… cf. supra), allez directement en 6.

2

Vérifiez que la demande reçue est conforme à la forme prescrite par la LCEN, article 6, section I.5 (cf. supra).

Si oui, il faut la considérer, allez en 6.
Sinon, allez en 3.

3

La demande reçue n’est pas complète :

S’il y a des menaces associées à une demande incomplète, allez en 4.
Si la demande est presque complète, il ne manque qu’une information par exemple, allez en 5.
Sinon, allez en 9.

4

Vous avez été menacé alors que la demande de signalement n’est pas conforme à la loi :

  • signalez à votre tour la menace reçue au procureur de la république avec un mot pour lui expliquer la situation et mettre en évidence votre statut de petit hébergeur (ce sera utile notamment si le demandeur est un habitué des démarches cavalières) ;
  • si vous pouvez joindre l’auteur mis en cause, transmettez-lui la demande pour information, informez-le de votre démarche.

5

La demande est presque dans les formes, mais qu’il manque au moins une information :

  • accusez réception de la demande en répondant que vous êtes un prestataire technique dont l’activité est d’offrir un accès à des services de communication au public en ligne tel que défini par la loi n° 2004-575 du 21 juin 2004 pour la confiance dans l’économie numérique ;
  • n’entreprenez aucune autre démarche (au demandeur de rendre conforme sa demande s’il le souhaite) ;
  • si vous pouvez joindre l’auteur mis en cause, transmettez-lui la demande pour information, informez-le de votre démarche.

6

Vous avez reçu une demande conforme à la LCEN, vous êtes tenu d’y répondre, vérifiez les informations transmises.

Si vous êtes convaincu que les informations sont fausses, allez en 7.
Si vous avez un doute sur la véracité des informations, allez en 8.
Si les informations vous semblent vraies, allez en 10.

7

Vous avez reçu une demande conforme à la LCEN, mais vous êtes convaincu qu’elle est abusive :

  • accusez réception et informez le demandeur que vous pensez les informations transmises fausses et signalez-lui que l’article 6 de la loi n° 2004-575 du 21 juin 2004 pour la confiance dans l’économie numérique, prévoit que le fait de demander sciemment un retrait sur des bases inexactes est puni d’une peine d’un an d’emprisonnement et de 15 000 Euros d’amende ;
  • si vous pouvez joindre l’auteur mis en cause, transmettez-lui la demande pour information, informez-le de votre démarche.

8

Vous avez reçu une demande conforme à la LCEN, mais avez un doute sur la véracité des informations :

  • ​accusez réception et demandez un complément d’information au demandeur ;​
  • si vous pouvez joindre l’auteur mis en cause, transmettez-lui la demande pour information, informez-le de votre démarche, demandez-lui éventuellement son avis ;
  • une fois recueillies les informations complémentaires, décidez de vous rendre en 7 ou en 10.

9

La demande est incomplète, sans menace :

Ignorez la demande et ignorez les relances si elles ne sont pas plus circonstanciées (ou menaçantes).

10

Vous avez reçu une demande conforme à la LCEN et les informations vous semblent vraies :

  • procédez au retrait immédiat des données ou rendez-les inaccessibles (en cas de manipulation informatique présentant un risque de perte de données, procéder à une copie préalable) ;
  • si vous pouvez joindre l’auteur mis en cause, transmettez-lui la demande et informez-le de votre décision.

logigramme parodique avec des symboles de jeu dans les symboles et des phrases idiotes
Le trajet idéal vous est fourni dans une représentation simplifiée grâce à ce logigramme. On est comme ça chez Framasoft.

La responsabilité de l’hébergeur

Je précise que ce guide est juste un guide, chaque hébergeur est invité à l’adapter selon son éthique et les situations rencontrées. En particulier, la jurisprudence a déjà considéré que la responsabilité de l’hébergeur pouvait être engagée même si la demande était incomplète dès lors que la description des faits était suffisamment précise pour permettre le retrait. Donc, suivre ce guide comporte une part de risque, notamment si vous ne répondez pas ou peu (points 5 et 9 du guide).

Mais d’un autre côté le législateur a confié de facto à l’hébergeur la responsabilité de garantir l’équilibre entre liberté d’expression d’une part et le préjudice aux tiers d’autre part. Si l’hébergeur ne tient pas son rôle, en arbitrant systématiquement en faveur des retraits, de peur d’un jugement défavorable, y compris lorsque les faits ne sont pas avérés ou que les procédures ne sont pas respectées, alors il œuvre de fait contre la liberté d’expression. Le statut juridique de l’hébergeur ne lui permet pas d’être neutre, il doit prendre ses responsabilités.

Note concernant l’identité de l’éditeur

L’association Scenari a préféré ne pas divulguer le nom de l’éditeur, j’ai respecté ce choix, le propos de l’article étant moins de porter l’attention sur l’attitude de celui-ci que de proposer une réflexion pratique.

Note concernant le mail reçu

Ressentant peut-être une légère honte à faire cette demande en plein confinement, la directrice juridique a assorti sa demande du commentaire suivant : « En effet, nous nous opposons à la mise en ligne de corrigés de nos ouvrages et la majorité des enseignants nous demande de lutter contre ces pratiques qui perturbent leur enseignement. ».

J’ai choisi de ne pas considérer cet angle car :

  • Sa demande portait bien sur « tous les contenus non autorisés par nos maisons d’édition » et non pas sur tel ou tel corrigé.
  • Je souhaiterais une preuve que la préoccupation de la majorité des enseignants soient en ce moment de lutter contre ces pratiques et pas plutôt de lutter pour trouver des solutions.
  • Une recherche web circonstanciée ne faisait pas ressortir ces contenus, donc seuls les étudiants ayant déjà l’adresse fournie par l’enseignant pouvait en pratique accéder au contenu.

Remerciements

Merci aux membres de l’association Scenari, de Framasoft et du CHATONS de m’avoir aidé dans cette recherche, et en particulier à Denis Dordoigne à qui j’ai emprunté une part significative du guide proposé, à Stéphane Poinsart de m’avoir pointé la référence du JournalDuNet concernant la jurisprudence, à Christelle pour ses précieux compléments, à Benjamin pour m’avoir relu et rappelé que les hébergeurs avaient leur rôle à jouer, à tous les autres qui ont contribué anonymement.

 




Juste un autre article sur les licences libres

Dans le cadre du librecours Libre Culture qui a ouvert ses portes le 6 avril 2020 j’ai été amené à produire une synthèse sur les licences libres que je vous livre ici.

À noter : cet article bénéficie désormais d’une version audio.
Merci à Sualtam, auteur de lectureaudio.fr pour cette contribution active.

Le droit d’auteur et les licences libres forment un cadre général qui offre plusieurs régimes possibles pour le contenu publié sur le Web.

Je propose ici une classification en six grandes catégories :

  • contenus à péage monétaire ou publicitaire
  • contenus en accès gratuit tous droits réservés
  • contenus en libre accès quelques droits réservés
  • contenus libres et ouverts avec copyleft
  • contenus libres et ouverts sans copyleft
  • contenus « zéro restriction » (au plus près, voire au-delà, du domaine public)

dessin humoristique de gégé, le Geektionnerd generator : un gars présnte une vaste liste écrite et dit "Auijourd’hui je vous explique les licences libres". Un groupe de personnes lui tourne le dos et s’en va dans l’autre sens

Contenus à péage monétaire ou publicitaire (non FLOSS, non Open Access, all right reserved)

On appelle sites à péage (paywall) les sites mis à disposition par des organisations qui restreignent l’accès au contenu qu’elles publient. Ce sont en général des ayants droit, c’est-à-dire des personnes physiques ou morales qui disposent d’un accord de cession de droits patrimoniaux avec des auteurs.

L’accès au contenu est réservé aux personnes qui acceptent de verser une contrepartie. Usuellement on appelle contenus à péage ceux qui demandent une contrepartie monétaire, mais je propose également d’inclure ceux qui exposent de la publicité et donc demandent une contrepartie attentionnelle. L’accès n’est pas payé en monnaie, il est payé en temps (passé à regarder de la publicité).

On distingue donc :

  • les contenus à péage monétaire : il est nécessaire de payer pour consulter les contenus
  • les contenus à péage publicitaire : il est nécessaire de consulter de la publicité pour consulter les contenus

Le régime de ces contenus est strictement celui du droit d’auteur :

  • L’utilisateur seulement le droit de consulter le contenu (une fois le péage acquitté).
  • Il n’est pas possible de copier le contenu (en dehors des exceptions prévues, comme le droit de citation ou l’exception pédagogique par exemple).

Exemple de sites à péage monétaire (que je consulte) :

  • site à péage monétaire : Médiapart, NextInpact
  • site à péage publicitaire : Numérama

Considérations personnelles sur les sites à péage

« La documentation secrète est une injure faite à la documentation (Briet4, 1951) ». Je souhaite un monde dans lequel tous les documents sont librement accessibles, mais le fonctionnement économique de nos sociétés fait que certains éditeurs ont du mal à proposer d’autres solutions que les péages.

À titre personnel je ne consulte quasiment jamais volontairement de sites à péage publicitaire. J’utilise un bloqueur de publicité et je ne le désactive que très rarement. J’utilise un bloqueur de publicité non pas pour consulter du contenu sans payer le péage publicitaire, mais parce que la structure du Web fait que je suis régulièrement renvoyé vers de tels contenus. J’adopterais volontiers un système qui marquerait mes recherches ou mes liens de telle façon que je puisse choisir de ne pas consulter de sites à péage publicitaire.

Je suis en revanche abonné à quelques sites à péage monétaire.

strip de Nina Paley en 3 images où échangent Mimi et Eunice. "Mon œuvre est libre… sauf pour un usage commercial, c’est le mal, je l’interdis !" dit Eunice en montrant les dents. dans la dernière image toutefois "plus tard", il pleurniche "Ouin ! personne n’arrive à gagner de l’argent sur Internet ! "
extrait de Mimi & Eunice par Nina Paley – Traduction Framalang – Copyheart

Contenus en accès gratuit (non FLOSS, gratis Open Access, all right reserved)

Tout contenu publié sur le Web (sans être associé à une licence) entre dans cette catégorie.

Il s’agit de contenus publics pour lesquels s’applique le droit d’auteur :

  • Chacun peut librement le consulter.
  • Il n’est pas autorisé de le copier sans autorisation de l’auteur ou de l’ayant droit.

Quelques exemples et contre-exemples :

  • C’est le cas de la majorité des contenus publiés par des entreprises privées sur leurs sites web.
  • C’est le cas de la majorité des contenus publiés par les individus sur des supports tels que les blogs, posts de réseaux sociaux, sites personnels, etc.
  • C’est partiellement le cas des archives scientifiques ouvertes comme HAL, dont certains articles sont sous licence libre et d’autres non.
  • Ce n’est la plupart de temps pas le cas des sites publics qui ont de plus en plus obligation de publier leurs données sous des licences libres.
  • Ce n’est pas le cas de Wikipédia qui propose une licence libre.

Considérations personnelles sur l’accès gratuit

Une partie significative, sinon la totalité, de nos documents numériques devraient être a minima disponibles en accès gratuit. Le coût est quasi nul et le bénéfice du partage de l’information très important pour l’humanité.

Cela devrait être le cas notamment :

  • de la totalité des contenus pédagogiques
  • de la totalité des contenus scientifiques
  • de la totalité des contenus relatifs aux lois
  • de la totalité des contenus techniques liées à l’usage des machines
  • etc.

Contenu en libre accès (non FLOSS, libre Open Access, some right reserved)

Les mouvements Creative Commons1(principalement issu du domaine culturel) et Open Access2 (principalement issu du domaine scientifique) ont permis de proposer des licences intermédiaires entre les licences libres (FLOSS3) et les restrictions par défaut imposées par le droit d’auteur.

Les deux principales limites d’usage introduites par les Creative Commons sont :

  • la non autorisation de l’usage commercial (non commercial)
  • la non autorisation de la modification de l’œuvre (non dérivative)

On parle aussi de licences dites some right reserved (quelques droits réservés). On note qu’il ne s’agit pas d’une interdiction d’usage, mais d’une non autorisation à priori. Il est toujours possible d’établir un autre contrat avec l’auteur ou les ayants droit en dehors des droits libérés par la licence.

Exemples :

  • Les licences Creative Commons CC BY-NC, CC BY-ND, CC BY-NC-ND et CC BY-SA-NC comportent la clause non commercial et ou non derivative.
  • La licence éé (Édition Équitable) proposée par C&F Édition autorise la copie au sein du cercle familial et amical, mais ne permet pas la rediffusion massive à des inconnus.
  • À noter que certaines initiatives explorent la notion de licences éthiques, dont l’objectif est de ne pas autoriser certains usages à priori antagonistes avec le cadre éthique des auteurs (industries polluantes, industries de l’armement, partis politiques, etc.) ou d’autoriser uniquement les usages dans des cadres prévus à priori (protection de l’environnement, humanitaire, etc.)

Considérations personnelles sur le libre accès

Le libre accès est un intermédiaire, il en a les avantages et les défauts : c’est une réponse imparfaite à une question mal posée.

On notera que l’initiative éé ou certains projets de licences éthiques sont intéressants pour tenter de concilier volonté de diffusion et tentative de préservation de son modèle économique ou de ses valeurs. Mais ce sont dans les faits plus des projets de communication que des solutions légales, il sera très difficile de les défendre en dehors de cas emblématiques.

Comment définir un cadre « commercial » sur le Web ? Que se passe-t-il si une Scop fait une formation rémunérée pour une association loi 1901 avec des contenus en NC ? Comment décider de ce qui est une modification ou pas ? Que se passe-t-il pour le transcodage d’une vidéo sous licence ND ? On ne peut pas changer la résolution source d’une image sous NC, mais l’utilisateur peut changer la taille de l’image en utilisant le zoom de son navigateur ?

En fin de compte :

  • C’est plus ou moins équivalent à des licences libres pour lesquelles l’auteur aurait affiché : « je libère mon contenu, mais je souhaite qu’il ne soit pas utilisé pour ça et ça ».
  • C’est plus ou moins équivalent à des licences non libres pour lesquelles l’auteur aurait affiché : « je ne libère pas mon contenu, mais si vous êtes dans ce cadre, je suis content que vous l’utilisiez et je ne vous embêterai pas ».

dialogue entre Mimi artiste-peintre devant son chevalet et Eunice avec attaché-case : « le droit d’auteur favorise la création — La création de quoi ? — de procès ! »
extrait de Mimi & Eunice par Nina Paley – Traduction Framalang – Copyheart

Contenus libres avec copyleft (FLOSS, Open Access, copyleft)

Le mouvement libriste est né avec la licence libre copyleft. Cette licence promue par la Free Software Foundation pose les quatre règles fondatrices du logiciel libre (exécuter, étudier, copier, améliorer) dans la mesure où ces règles restent préservées. Il n’est typiquement pas autorisé de procéder à une redistribution qui n’autorise pas elle-même la copie selon les mêmes termes.

Le terme copyleft est un double jeu de mot, dérivation de copyright, droit d’auteur, en « gauche d’auteur » et « laisser copier ».

  • La licence historique de ce mouvement est la licence GPL, largement utilisée dans le monde du logiciel libre.
  • Pour les contenus culturels on peut citer la licence CC BY-SA, pour share-alike ou la Licence Art Libre (LAL).

À noter qu’un logiciel ou contenu libre n’est pas nécessairement gratuit, même si la possibilité de le copier tend en général à des formes de distribution gratuites. On peut avoir à payer un support pour se procurer un livre imprimé par exemple, ou un service, pour bénéficier de l’hébergement d’un service web. La liberté de copier n’est pas en cause, vous pouvez ré-imprimer le livre ou héberger le service par vos propres moyens.

Considérations personnelles sur le copyleft

Il s’agit de la licence que j’utilise le plus couramment, mes cours sont sous CC BY-SA, mon roman sous LAL et les quelques petits bouts de code que j’écris sous GPL.

 

couverture du Framabook de Stéphane Crozat > Traces
NDLR : le roman de Stéphane est beaucoup plus drôle que cet article. ^^

 

Il y a un débat historique entre les licences avec ou sans copyleft. Une terminologie s’est mise en place pour distinguer les logiciels « libres », qui seraient ceux avec copyleft, des logiciels « open source », qui seraient sans copyleft. Cette terminologie est née du fait que les premiers sont promus par la FSF et les seconds par l’OSI (Open Source Initiative). Mais c’est une terminologie discutable, car :

  • avec ou sans copyleft les logiciels sont bien open source,
  • la notion de liberté est ici et ailleurs toujours compliquée à cerner.

Certains argumenteront qu’un logiciel sans copyleft impose moins de restrictions et donc est plus libre ; d’autres que donner la liberté de priver de liberté c’est contraire à la liberté. C’est un débat intense au sein des communautés, je me contente ici de donner mon point de vue.

  • Je considère à priori que moins de règles, c’est mieux, donc j’aurais tendance à préférer en première approche une licence sans copyleft, mais il y a un rapport de force en place qui est problématique. Des acteurs puissants (éditeurs de logiciels et éditeurs de contenus culturels) ont la possibilité de se rapproprier les contributions libres et d’en faire bénéficier leur économie, dont acte. Mais s’ils ont la possibilité en plus d’améliorer ces contributions sans en reverser les améliorations, cela signifie qu’ils peuvent systématiquement prendre des objets libres, les améliorer et les distribuer sans licence libre. Cela aura comme conséquence d’affaiblir les solutions libres et de renforcer les solutions non libres, ce qui est l’exact contraire de l’objectif visé initialement.
    Encore une fois c’est un débat complexe et les opposants au copyleft feront également valoir des arguments intéressants comme le fait que ces éditeurs gardent un intérêt à repartager pour continuer de bénéficier des améliorations apportées par les communautés libristes ou par d’autres éditeurs.
  • Je fais le parallèle avec la notion de discrimination positive, ce n’est pas un choix de conviction, c’est un choix pragmatique, qui va plutôt à l’encontre de l’idée de base (liberté d’usage ou égalité de traitement) mais qui, dans un rapport de force défavorable, paraît nécessaire à l’établissement de la liberté ou l’égalité visées.
  • On a coutume de dire que le terme logiciel libre est mal choisi : ce n’est pas le logiciel qui est libre, mais l’humain qui l’utilise. On peut considérer que le copyleft donne moins de liberté à l’humain, mais plus à l’humanité.

Contenus libres sans copyleft (FLOSS, Open Access, non copyleft)

Les licences libres sans copyleft autorisent tous les usages à priori à condition que l’auteur, ainsi en général que la source et la licence, soient mentionnées. Cela autorise donc en particulier l’intégration d’un code logiciel dans un logiciel propriétaire ou un contenu culturel dans un ouvrage non libre.

  • Les licences MIT ou BSD sont des exemples de licences sans copyleft pour les logiciels libres.
  • La licence CC BY est la licence sans copyleft la plus commune pour les contenus culturels.

comic strip 3 images de Nina Paley avec les deux personnages Mimi et Eunice. Mimi veut retirer sa brique personnelle du mur que vinet de bâtir Mimi avec de la récup et du recyclage. "C’est MA brique" ! Résultat : le mur s’effondre dans la dernière image tandis qu’Eunice s’en va satisfait avec SA brique à la main
Extrait de Mimi & Eunice par Nina Paley – Traduction Framalang – Copyheart (à partager avec <3).

Considérations personnelles sur les licences sans copyleft

Je considère les licences sans copyleft lorsque j’évalue que :

  1. le copyleft peut bloquer ou ralentir des usages que je n’ai pas envie d’empêcher ;
  2. le contenu n’est pas facilement améliorable de toute façon.

Par exemple la vidéo d’une conférence ou d’un cours sera selon moi plus facilement diffusable sous CC BY parce que je n’imagine pas en quoi il est vraiment possible d’améliorer la vidéo. On peut imaginer une coupe d’un segment non pertinent, ou l’incrustation d’éléments complémentaires intéressants, mais on est dans des pratiques très marginales.

Contenus « zéro restriction » (ou Do What The Fuck You Want)

Certaines licences comme la licence Creative Commons Zero (CC0) consistent pour l’auteur à autoriser les usages les plus larges possible dans la limite de la loi. Cela équivaut à mettre volontairement son œuvre dans le domaine public.

La loi empêche dans certains pays, dont la France, de lever toute restriction sur le contenu. Ainsi le droit moral est inaliénable, il n’est donc pas légalement possible d’y renoncer et d’autoriser quelqu’un à utiliser son contenu sans a minima être cité en tant qu’auteur. Le domaine public français consiste en l’épuisement des droits patrimoniaux uniquement, on ne peut donc pas jouer un opéra de Mozart sans dire qu’il est de Mozart.

Techniquement cela revient à dire que des licences comme la CC BY sont les licences les plus permissives possible en France et donc que des licences comme la licence CC-0 sont équivalentes. Notons que c’est vrai pour le moment, mais qu’une évolution future du droit d’auteur vers plus de liberté d’usage (ce qui n’est pas la tendance historique) pourrait permettre aux licences zéro restriction d’ouvrir de nouveau droits.

On notera l’existence de licences « zéro restriction » plus poétiques que la CC0 :

La Copyheart dont le résumé est : Copying is an act of love, please copy, (« Copier est un acte d’amour, veuillez copier »)

La Do What The Fuck You Want to Public License, dont la seule clause, numérotée 0 est : « You just DO WHAT THE FUCK YOU WANT TO » (« Faites exactement ce que vous voulez, bordel ! »)

 

Considérations personnelles sur les licences « zéro restriction »

Ces licences n’ayant pas de valeur légale aujourd’hui différente des licences sans copyleft, leur usage relève avant tout d’un militantisme visant une réforme radicale du droit d’auteur (qu’à titre personnel je partage, considérant que le droit d’auteur fait en réalité plus de mal que de bien, rémunérant trop mal les auteurs, trop bien les éditeurs, entraînant des restrictions d’accès néfastes pour l’accès aux savoirs, et conduisant à une répression inadaptée).

Néanmoins je ne les utilise pas, car elles informent moins bien sur les devoirs de l’utilisateur : en particulier un utilisateur peu averti pourra croire qu’il est effectivement autorisé à faire ce qu’il a envie de faire, ce qui n’est pas vrai.

Mais la plupart du temps, je suis plutôt d’accord : just do what the fuck you want to!

Précision : la loi avant le contrat

Les licences sont des contrats passés dans le cadre juridique du droit d’auteur. La loi étant supérieure aux contrats, les licences libres restent soumises au régime du droit d’auteur. On notera l’adresse de leurs promoteurs qui ont réussi malgré tout à rendre possible une prise de distance d’avec les restrictions imposées par le droit d’auteur, pour ceux qui le souhaitent.

Conclusion : pour interdire il faut une bonne raison et une certaine détermination

Je ne suis pas contre toutes les interdictions en principe, mais je pense que pour interdire quelque chose, il faut une bonne raison et une volonté de faire appliquer l’interdiction. Si vous dites à quelqu’un : ne fais pas ça, alors que vous n’avez pas vraiment d’argument pour interdire et qu’en plus vous ne prenez aucune mesure s’il transgresse votre interdiction… la plupart du temps l’autorisation aurait été plus simple. Le fait pour un créateur de ne pas associer de licence à son contenu équivaut à maintenir les interdictions prévues par le droit d’auteur. Le fait de choisir une licence restrictive équivaut également à interdire quelque chose.

Les licences sont des outils légaux, donc pour choisir une licence avec des restrictions, il faudrait être prêt à poursuivre en justice ceux qui ne les respectent pas. C’est possible, et les associations de promotions des logiciels libres peuvent aider à cela. Mais il faut être prêt à le faire.

Si on n’est pas prêt à le faire, il faut au moins être prêt à dénoncer publiquement l’irrespectueux qui outrepassera les interdictions. C’est également possible. Mais il faut être prêt à le faire.

Si l’on n’est prêt ni pour l’un ni pour l’autre, le choix du cadre le plus permissif est certainement le plus adapté.

 

Merci à Pouhiou de ses retours qui m’ont permis de compléter la fin de l’article.

 

  1. CC (Creative Commons) : Creative Commons est une association à but non lucratif dont la finalité est de proposer une solution alternative légale aux personnes souhaitant libérer leurs œuvres des droits de propriété intellectuelle standard de leur pays.»
  2. OA (Open Access) : Le terme Open Access désigne la possibilité de consulter sans restriction un contenu publié sur le web. Il s’oppose aux contenus soumis à péage (paywall) pour lesquels il existe une contrepartie à la consultation du contenu.

    Pris dans sa généralité l’OA et synonyme de gratis OA et n’implique pas nécessairement le doit de recopier le contenu en Open Access, ce qui est prévu par le libre OA.

  3. FLOSS (free/libre/open-source software) : Le terme FLOSS désigne l’ensemble des logiciels libres au sens de la FSF (par exemple la GPL) et open source au sens de l’OSI (par exemple la BSD). Cela permet de désigner globalement cette classe de logiciels sans entrer dans le détail de leurs licences. Le terme de logiciel libre est souvent utilisé pour désigner globalement les logiciels FLOSS.
    On pourra l’utiliser par extension pour des contenus libres plutôt que des logiciels libres (par exemple les licences CC BY et CC BY-SA).

    On utilise parfois le terme FOSS (free and open-source software) : le terme français libre parait un peu étrange dans l’acronyme anglais, mais il résulte du fait que free est polysémique en anglais et qu’il signifie à la fois libre et gratuit (or c’est ici le sens libre est qui est visé et non gratuit, un logiciel ou contenu libre n’est pas forcément gratuit).
    Gratis OA (Gratis Open Access) : Le terme gratis Open Access désigne la possibilité pour chacun de consulter un contenu sans restriction, et en particulier sans avoir à verser aucune contre partie monétaire ou d’une autre nature.
    En revanche il n’implique pas le droit de copier et redistribuer le contenu, par opposition au libre Open Access qui prévoit ce droit en plus.
    Le terme gratis est préféré en anglais à free qui signifie à la fois libre et gratuit.
    Libre OA (Libre Open Access) : Le terme libre Open Access désigne la possibilité pour chacun de consulter un contenu sans restriction, ainsi que le droit de copier le contenu selon des termes prévus par une licence plus ou moins permissive. Le terme libre est préféré en anglais à free qui signifie à la fois libre et gratuit.

  4. Briet, 1951 : Briet Suzanne. 1951. Qu’est-ce que la documentation ?. Éditions documentaires, industrielles et techniques. http://martinetl.free.fr/suzannebriet/questcequeladocumentation.