Sauvegardez !

Temps de lecture 10 min

image_pdfimage_print

Régulièrement, un accident qui entraine la perte de données importantes nous rappelle l’importance des sauvegardes. L’incendie du centre de données d’OVH à Strasbourg le 10 mars dernier a été particulièrement spectaculaire, car de nombreuses personnes et organisations ont été touchées, mais des incidents de ce genre sont fréquents, quoique moins médiatisés. Un ami vient de m’écrire pour me demander mon numéro de téléphone car il a perdu son ordiphone avec son carnet d’adresses, un étudiant a perdu son ordinateur portable dans le métro, avec tout son mémoire de master dessus, et met une petite annonce dans la station de métro, une graphiste s’aperçoit que son ordinateur, avec tous ses travaux dessus, ne démarre plus un matin, une ville a perdu ses données suite au passage d’un rançongiciel, une utilisatrice de Facebook demande de l’aide car son compte a été piraté et elle ne peut plus accéder à ses photos de famille… Des appels au secours sur les réseaux sociaux comme celui-ci ou celui-là sont fréquents. Dans tous ces cas, le problème était l’absence de sauvegardes. Mais c’est quoi, les sauvegardes, et comment faut-il les faire ?

Le principe est simple : une sauvegarde (backup, en anglais) est une copie des données effectuée sur un autre support. Le but est de pouvoir récupérer ses données en cas de perte. Les causes de perte sont innombrables : vol de l’ordinateur portable ou de l’ordiphone (ces engins, étant mobiles, sont particulièrement exposés à ces risques), effacement par un logiciel malveillant ou par une erreur humaine, panne matérielle. Les causes possibles sont trop nombreuses pour être toutes citées. Retenons plutôt ce principe : les données peuvent devenir inaccessibles du jour au lendemain. Même si vous n’utilisez qu’un ordinateur fixe, parfaitement sécurisé, dans un local à l’abri des incendies (qui peut vraiment prétendre avoir une telle sécurité ?), un composant matériel peut toujours lâcher, vous laissant dans l’angoisse face à vos fichiers irrécupérables. Ne pensons donc pas aux causes de perte, pensons aux précautions à prendre.

(Au passage, saviez-vous que Lawrence d’Arabie avait perdu lors d’un voyage en train un manuscrit qu’il avait dû retaper complètement ? Il n’avait pas de sauvegardes. À sa décharge, avant le numérique, faire des sauvegardes était long et compliqué.)

La règle est simple : il faut sauvegarder ses données. Ou, plus exactement, ce qui n’est pas sauvegardé peut être perdu à tout instant, sans préavis. Si vous êtes absolument certain ou certaine que vos données ne sont pas importantes, vous pouvez vous passer de sauvegardes. À l’inverse, si vous êtes en train d’écrire l’œuvre de votre vie et que dix ans de travail sont sur votre ordinateur, arrêter de lire cet article et aller faire tout de suite une sauvegarde est impératif. Entre les deux, c’est à vous de juger de l’importance de vos données, mais l’expérience semble indiquer que la plupart des utilisateurices sous-estiment le risque de panne, de vol ou de perte. Dans le doute, il vaut donc mieux sauvegarder.

Comment on sauvegarde ?

Là, je vais vous décevoir, je ne vais pas donner de mode d’emploi tout fait. D’abord, cela dépend beaucoup de votre environnement informatique. On n’utilisera pas les mêmes logiciels sur macOS et sur Ubuntu. Je ne connais pas tous les environnements et je ne peux donc pas vous donner des procédures exactes. (Mais, connaissant les lecteurices du Framablog, je suis certain qu’ielles vont ajouter dans les commentaires plein de bons conseils pratiques.) Ensuite, une autre raison pour laquelle je ne donne pas de recettes toutes faites est que la stratégie de sauvegarde va dépendre de votre cas particulier. Par exemple, si vous travaillez sur des données confidentielles (données personnelles, par exemple), certaines stratégies ne pourront pas être appliquées.

Je vais plutôt me focaliser sur quelques principes souvent oubliés. Le premier est d’éviter de mettre tous ses œufs dans le même panier. J’ai déjà vu le cas d’une étudiante ayant bien mis sa thèse en cours de rédaction sur une clé USB mais qui avait la clé et l’ordinateur portable dans le même sac… qui fut volé à l’arrachée dans la rue. Dans ce cas, il n’y a pas de réelle sauvegarde, puisque le même problème (le vol) entraîne la perte du fichier et de la sauvegarde. Même chose si la sauvegarde est accessible depuis la machine principale, par exemple parce qu’elle est sur un serveur de fichiers. Certes, dans ce cas, une panne matérielle de la machine n’entrainerait pas la perte des données sauvegardées sur le serveur, en revanche, une fausse manœuvre (destruction accidentelle des fichiers) ou une malveillance (rançongiciel chiffrant tout ce qu’il trouve, pour le rendre inutilisable) frapperait la sauvegarde aussi bien que l’original. Enfin, si vous travaillez à la maison, et que la sauvegarde est chez vous, rappelez-vous que le même incendie peut détruire les deux. (Il n’est pas nécessaire que tout brûle pour que tous les fichiers soient perdus ; un simple début de fumée peut endommager le matériel au point de rendre les données illisibles.) Rappelez-vous : il y a plusieurs causes de pertes de données, pas juste la panne d’un disque dur, et la stratégie de sauvegarde doit couvrir toutes ces causes. On parle parfois de « règle 3-2-1 »  : les données doivent être sauvegardées en trois exemplaires, sur au moins deux supports physiques différents, et au moins une copie doit être dans un emplacement séparé. Bref, il faut être un peu paranoïaque et imaginer tout ce qui pourrait aller mal.

Donc, pensez à séparer données originelles et sauvegardes. Si vous utilisez un disque dur externe pour vos sauvegardes, débranchez-le physiquement une fois la sauvegarde faite. Si vous utilisez un serveur distant, déconnectez-vous après la copie.

(Si vous êtes programmeureuse, les systèmes de gestion de versions gardent automatiquement les précédentes versions de vos programmes, ce qui protège contre certaines erreurs humaines, comme d’effacer un fichier. Et, si ce système de gestion de versions est décentralisé, comme git, cela permet d’avoir facilement des copies en plusieurs endroits. Toutefois, tous ces endroits sont en général accessibles et donc vulnérables à, par exemple, un logiciel malveillant. Le système de gestion de versions ne dispense pas de sauvegardes.)

Ensuite, ne faites pas d’économies : il est très probable que vos données valent davantage que les quelques dizaines d’euros que coûte un disque dur externe ou une clé USB. Toutefois, il vaut mieux des sauvegardes imparfaites que pas de sauvegardes du tout. Simplement envoyer un fichier par courrier électronique à un autre compte (par exemple celui d’un ami) est simple, rapide et protège mieux que de ne rien faire du tout.

Enfin, faites attention à ce que la sauvegarde elle-même peut faire perdre des données, si vous copiez sur un disque ou une clé où se trouvent déjà des fichiers. C’est une des raisons pour lesquelles il est recommandé d’automatiser les sauvegardes, ce que permettent la plupart des outils. L’automatisation n’a pas pour but que de vous fatiguer moins, elle sert aussi à limiter les risques de fausse manœuvre.

backup chaque jour !
« Five Days’ Backup » par daryl_mitchell, licence CC BY-SA 2.0

À quel rythme ?

La règle est simple : si vous faites des sauvegardes tous les jours, vous pouvez perdre une journée de travail. Si vous en faites toutes les semaines, vous pouvez perdre une semaine de travail. À vous de voir quel rythme vous préférez.

Et le cloud magique qui résout tout ?

Quand on parle de sauvegardes, beaucoup de gens répondent tout de suite « ah, mais pas de problème, moi, tout est sauvegardé dans le cloud ». Mais ce n’est pas aussi simple. D’abord, le cloud n’existe pas : il s’agit d’ordinateurs comme les autres, susceptibles des mêmes pannes, comme l’a tristement démontré l’incendie d’OVH. Il est d’ailleurs intéressant de noter que beaucoup de clients d’OVH supposaient acquis que leurs données étaient recopiées sur plusieurs centres de données, pour éviter la perte, malgré les conditions d’utilisation d’OVH qui disaient clairement que la sauvegarde était de la responsabilité du client. (Mais qui lit les conditions d’utilisation ?)

Parfois, la croyance dans la magie du cloud va jusqu’à dire que leurs centres de données ne peuvent pas brûler, que des copies sont faites, bref que ce qui est stocké dans le nuage ne peut pas être perdu. Mais rappelez-vous qu’il existe d’innombrables causes de perte de données. Combien d’utilisateurs d’un service en ligne ont eu la mauvaise surprise de découvrir un matin qu’ils n’avaient plus accès à leur compte parce qu’un pirate avait deviné leur mot de passe (ou détourné leur courrier ou leurs SMS) ou parce que la société gestionnaire avait délibérément fermé le compte, en raison d’un changement de politique de leur part ou tout simplement parce que le logiciel qui contrôle automatiquement les accès a décidé que votre compte était problématique ? Il n’est pas nécessaire que la société qui contrôle vos fichiers perde les données pour que vous n’y ayez plus accès. Là aussi, c’est une histoire fréquente (témoignage en anglais) et elle l’est encore plus en cas d’hébergement gratuit où vous n’êtes même pas un client.

Ah, et un autre problème avec la sous-traitance (le terme correct pour cloud), la confidentialité. Si vous travaillez avec des données confidentielles (s’il s’agit de données personnelles, vous avez une responsabilité légale, n’oubliez pas), il n’est pas prudent de les envoyer à l’extérieur sans précautions, surtout vers les fournisseurs états-uniens (ou chinois, mais ce cas est plus rare). Une bonne solution est de chiffrer vos fichiers avant l’envoi. Mais comme rien n’est parfait dans le monde cruel où nous vivons, il faut se rappeler que c’est moins pratique et surtout que cela introduit un risque de perte : si vous perdez ou oubliez la clé de chiffrement, vos sauvegardes ne serviront à rien.

Tester

Un adage ingénierie classique est que ce qui n’a pas été testé ne marche jamais, quand on essaie de s’en servir. Appliqué aux sauvegardes, cela veut dire qu’il faut tester que la sauvegarde fonctionne, en essayant une restauration (le contraire d’une sauvegarde : mettre les fichiers sur l’ordinateur, à partir de la copie).

Une bonne discipline, par exemple, est de profiter de l’achat d’une nouvelle machine pour essayer de restaurer les fichiers à partir de la copie. Vous serez peut-être surpris·e de constater à ce moment qu’il manque des fichiers importants, qui avaient été négligés lors de la sauvegarde, ou bien que la sauvegarde la plus récente n’est… pas très récente. Ou bien tout simplement que la clé USB où vous aviez fait la sauvegarde a disparu, ou bien ne fonctionne plus.

Conclusion

Il faut sauvegarder. Je l’ai déjà dit, non ? Pour vous motiver, posez-vous les questions suivantes :

  • Si, un matin, mon ordinateur fait entendre un bruit de casserole et ne démarre pas, saurais-je facilement restaurer des données sauvegardées ?
  • Si toutes mes données sont chez un hébergeur extérieur et que je perds l’accès à mon compte, comment restaurerais-je mes données ?
  • Si je travaille sur un ordinateur portable que je trimballe souvent, et qu’il est volé ou perdu, où et comment restaurer les données ?

Si vous préférez les messages en vidéo, j’ai bien aimé cette vidéo qui, en dépit de son nom, n’est pas faite que pour les geeks.

 

 

 

27 Responses

  1. Noli

    Merci pour ce rappel très pédagogique des bases

  2. Timothey

    Personnellement et professionnellement j’utilise la méthode 3-2-1.

    La méthode 3-2-1 consiste à posséder 3 copies de vos données (vos données de production et deux sauvegardes), sur 2 supports différents (SDD, HDD, Clé USB, …), dont 1 sur un site distant pour permettre une récupération (en cas de vol ou incendie).
    Elle constitue la base de tout plan de sauvegarde.

    • Ackermann

      Oui, 3-2-1

      Est-ce le site disant peut du Cloud ?
      Existe t’il un service CHATONS pour des sauvegardes distantes ?

      • Timothey

        Oui le site distant peur etre en cloud, un NAS, …
        Je vais regarder pour CHATONS

  3. Flol

    Problématique parfaitement posée, merci !

    En résumé, en fonction de l’importance que l’on accorde à ses données,

    – définir sa stratégie de sauvegarde (quoi, à quelle fréquence, où, sur quels supports, avec quel niveau de sécurité (chiffrement)…);

    – choisir son/ses outils de sauvegarde (personnellement, plus c’est simple et standard, mieux c’est…Par exemple: RSync !);

    – mettre en oeuvre le tout, en n’oubliant pas de tester de temps en temps, jusqu’à ce que cela devienne un geste reflexe…

  4. lejocelyn

    Hum, ça a l’air intéressant comme billet, je le mets dans mon wallabag pour plus tard 😉

    • @rem

      En espérant que plus tard ne soit pas trop tard. 😉

  5. Marmotte

    Merci pour ce rappel, ça ne fait jamais de mal.

    Un point qui est sous-entendu dans l’article, mais que j’aimerais expliciter un peu plus : Il faut bien faire attention à la capacité d’accès aux sauvegardes.

    J’ai des sauvegardes distantes, je sais comment y accéder, ce n’est pas difficile du tout pour moi. Par contre, j’ai une connexion ADSL 1 Mbps (oui, ça existe encore en 2021). Je limite donc au maximum les besoins d’accéder à cette sauvegarde distante, en ayant deux autres sauvegardes chez moi (une sur mon PC lui-même, et une sur le NAS).

    Bien entendu, la sauvegarde réalisée sur le PC lui-même ne va pas augmenter la sécurité des données (si le disque dur lâche, la sauvegarde disparaît avec les données). Mais elle me permet un accès rapide aux données sauvegardées en cas de besoin si mon NAS est inaccessible/inutilisable/etc. plutôt que devoir tout télécharger via ma connexion ADSL.

  6. Stéphane Bortzmeyer

    Une personne m’a fait remarquer qu’un problème des sauvegardes multiples est celui de la confidentialité. Plusieurs fuites de données importantes trouvaient en effet leur source dans une copie mal faite, vers un serveur distant mal protégé (mot de passe trivial, par exemple). Mon article ne parlait que du risque dû à l’hébergeur des copies distantes, le risque de piratage n’est qu’un cas particulier mais suffisamment important pour le prendre en compte. La solution est la même, le chiffrement des données qu’on envoie à l’extérieur et, bien sûr, essayer de ne pas les copier sur un espace de stockage Amazon S3 sans mot de passe…

    On retombe ici dans une question classique de la sécurité (oui, le risque de perte de données est un problème de cybersécurité), le modèle de menace. Si un étudiant rédige sa thèse en philosophie, le risque de perte est probablement bien plus sérieux que celui de fuite de données et il est donc logique de multiplier les copies, y compris à l’extérieur dans des endroits pas toujours bien protégés. Si, en revanche, on travaille sur des données personnelles, on ne doit effectivement pas les copier n’importe où, même si cela augmente le risque de perdre sa base de données.

  7. Laurent Claessens

    Un point important, déjà signalé en particulier par Flol est qu’il faut essayer d’utiliser des outils aussi basiques que possibles.
    Je me souviens d’avoir utilisé un outil sur Ubuntu qui faisait des backup à la fois incrémentaux et chiffrés; la perle. Seul inconvénient : le logiciel lui-même est requis pour accéder aux données.

    À mon avis un bon mécanisme de backup est un mécanisme qui permet de récupérer les données avec une simple copie (simple ‘cp’ en bash).

    Bref, je fais mes backup vers un disque externe, dont le système de fichier est chiffré (luks); mais le backup lui-même ne chiffre pas.

    Je n’utilise pas rsync parce que, justement, un backup n’est pas une synchronisation. Si je supprime un fichier, je ne veux pas qu’il soit supprimé de mes backup; il me faut un mécanisme plus fin que ça.

    Au final, j’ai écrit mon propre programme de backup[1] parce que je n’en connais pas qui satisfont toutes mes exigences (et aussi parce que je devais remettre un projet en C++).

    [1] https://github.com/LaurentClaessens/lora

  8. Sébastien Dinot

    Il y a 5 mois, j’avais écrit sur mon blog un article à ce sujet, auquel celui-ci fait particulièrement écho :

    https://www.palabritudes.net/2020/11/21/quelques-reflexions-sur-la-sauvegarde.html

    Mon article s’adressait au grand public – d’où la considération du cout – car je ne pensais pas qu’en 2021, il était encore nécessaire d’expliquer un besoin aussi fondamental à des professionnels. Du coup, lorsque le data center d’OVH a brulé, j’ai été surpris de découvrir sur les listes de diffusion d’OVH et ailleurs des messages de professionnels, tantôt désespérés, tantôt en colère, car ils pensaient qu’OVH « s’occupait de tout ». Pour ma part, même si j’avais pensé cela, j’aurais fait des sauvegardes de mon côté pour garantir l’accès à mes données. S’il y a bien deux domaines dans lesquels il faut s’interdire toute candeur, c’est la sauvegarde et la sécurité.

    • Timothey

      Je vais lire ton article de ce pas.
      Oui en effet c’est assez fou que des professionnels ce soit retrouver dans des situations pas possibles après l’incendie chez OVH.
      Ca m’a fiat penser à une comptable qui il y a quelques temps m’a contacter car son PC avait claqué avec 5 ans de travail non sauvegardé … Je te laisses imaginer son état …

      Comme quoi les rappels comme tu dis en sauvegarde et en sécurité sont plus qu’essentiels.

  9. jcfrog

    bonjour,
    effectivement ça dépend beaucoup du profil de l’utilisateur et des données.
    Je m’occupe de gens qui sont grands débutants, je dois reconnaître au final après réflexion que je leur conseille un cloud synchronisé de type Dropbox qui me semble de loin le plus adapté pour ne pas perdre les photos de famille. Aux plus à l’aise on explique un peu les disques externes mais c’est pas toujours possible.
    L’usage de Dropbox n’est pas toujours une évidence non plus, faut expliquer 🙂

  10. Loz

    Pour moi l’automatisation n’est pas recommandée, elle est essentielle !
    Plus on s’éloigne du dernier incident, moins on est attentif, et plus la panne est probable (les supports vieillissent).

    • Stéphane Bortzmeyer

      Mais attention : si c’est automatique, cela veut dire qu’un logiciel malveillant ou une erreur humaine peuvent détruire les sauvegardes puisqu’ils auront accès aux mêmes unités de stockage. Je conseille par exemple de débrancher le disque dur externe après la sauvegarde, et ça ne peut pas s’automatiser.

  11. Stef

    Bonjour

    Je vous propose ma méthode de sauvegarde de photos :

    Imaginons que je dois sauvegarder mes photos de 2018 2019 2020 2021

    Je prendrais une clef USB pour 2018 est année précédente.
    Une seconde clef pour 2018 2019
    Une 3eme pour 2019 2020
    Une 4eme pour 2020 2021
    Une future clef pour 2021 2022

    Sachant que mon poste à l’ensemble des photos stocker.

    Il me faut une perte de 2 clefs d’année consécutive pour avoir un impact. Ou la dernier clef et le poste.

    Voila simple efficace à faible coût multi-systeme.

    Bien à vous

    • Timothey

      Ce qui fait que tu as tes données en 3 exemplaires.
      Pas mal mais tu conserves tes clés ou ?
      Parce qu’en cas de vol ou incendie …

      • Stef

        Dans la même maison 😉

        C’est plutôt une sauvegarde pour palier, un problème matériel ou humain. Non un incendie …

        Le truc c’est qu’il faudrait 2 maisons (donc on oublie le faible coût) ou avoir une confiance à la personne qui les gardes (sinon on doit chiffrer … mais ça complexifie)

  12. laliman

    Bonjour

    Merci pour l’article de rappel sur les sauvegardes.
    Malgré les bon conseils, il difficile pour le commun des mortels de mettre en place une stratégie de sauvegarde efficace.
    A l’heure actuel, j’utilise Anachronopete(https://korben.info/cronopete-clone-de-time-machine-linux.html) qui me permet de faire des sauvegardes régulières sur un disque externe (débranchés le soir et mis dans un autre endroit de la maison (accessible en cas de départ précipité en cas d’incendie) et qui me permet de tester la sauvegarde facilement en ouvrant quelques documents directement dans l’arborescence de la sauvegarde.
    Cela ne fait que une copie de mes données en plus de celle sur l’ordi.
    La question va être pour l’ordiphone, je fait comment pour le sauvegarder (de manière automatique, par connexion wifi, sur mon ordi qui lui sera copié sur un DDE) ?
    En vous remerciant de vos suggestions

    • Djan

      > La question va être pour l’ordiphone, je fait comment pour le sauvegarder (de manière automatique, par connexion wifi, sur mon ordi qui lui sera copié sur un DDE) ?

      J’utilise un duo Syncthing + BorgBackup pour cela (mon smartphone ne supporte pas l’USB en mode stockage de masse). L’inconvénient c’est que ça prend un peu de place sur le disque dur. L’avantage c’est que c’est semi-automatique mais je dois quand même activer les fonctions de sauvegardes des différentes applications.

  13. Ney

    Bonjour,
    J’utilise areca depuis très longtemps avec un DD externe. Une des autres possibilités d’areca est la sauvegarde sur SFTP ou FTPs. Je cherche un service en ligne genre chaton qui hébergerait un serveur SFTP pour mes sauvegardes. Un cloud ne convient pas, juste un serveur ftp de 50 Go. Une recherche sur le web ne m’a trouvé que des hébergements de sites web. Qqn connaît-il qq chose ? Merci.

  14. Cedric

    Bonjour, j’ai plusieurs plan de sauvegarde dans mon foyer,

    pour les photos fait avec nos smartphone, application moment de synology qui pousse sur le synology à la cave
    pour les documents, un nextcloud en datacenter (y a pas les photos pour des raisons de places)

    le synology backup le nextcloud chez lui et pousse toutes les données en chiffré sur un espace de sauvegarde chez infomaniak à Genève
    le synology backup aussi le serveur domotique (une debian 10), bon ils sont un à côté de l’autre mais tout par à Genève chaque nuit

    Un kimsufi sauvegarde les photos du synology chaque nuit (pour avoir le 3-2-1).

    Un chose importante, normalement pour une sauvegarde c’est la machine de destination qui vient chercher les données pas le contraire, la machine qui doit être sauvegardé ne doit pas pouvoir se connecter à la machine de sauvegarde comme ça en cas de ransomware ou autre corruption ça ne se propage pas à la machine de sauvegarde.

    Il faut tester la restauration de donnée ça on le répète pas asser.

    Bon ça fait peut être beaucoup mais je suis sysadmin 😉