Les données que récolte Google – Ch.6

Temps de lecture 11 min

image_pdfimage_print

Voici déjà la traduction du sixième chapitre de Google Data Collection, l’étude élaborée par l’équipe du professeur Douglas C. Schmidt, spécialiste des systèmes logiciels, chercheur et enseignant à l’Université Vanderbilt. Si vous les avez manqués, retrouvez les chapitres précédents déjà publiés.


Il s’agit cette fois de comprendre comment Google complète les données collectées avec les données provenant des applications et des comptes connectés des utilisateurs.

Traduction Framalang : Auteurs : Khrys, Piup, Goofy, David_m, Côme, Fabrice, Serici

 

VI. Données collectées par les applications clés de Google destinées aux particuliers

67. Google a des dizaines de produits et services qui évoluent en permanence (une liste est disponible dans le tableau 4, section IX.B de l’annexe). On accède souvent à ces produits grâce à un compte Google (ou on l’y associe), ce qui permet à Google de relier directement les détails des activités de l’utilisateur de ses produits et services à un profil utilisateur. En plus des données d’usage de ses produits, Google collecte également des identificateurs et des données de localisation liés aux appareils lorsqu’on accède aux services Google. 1

68. Certaines applications de Google (p.ex. YouTube, Search, Gmail et Maps) occupent une place centrale dans les tâches de base qu’une multitude d’utilisateurs effectuent quotidiennement sur leurs appareils fixes ou mobiles. Le tableau 2 décrit la portée de ces produits clés. Cette section explique comment chacune de ces applications majeures collecte les informations des utilisateurs.

Tableau 2 : Portée mondiale des principales applications Google

Produits  Utilisateurs actifs
Search  Plus d’un milliard d’utilisateurs actifs par mois, 90.6 % de part de marché des moteurs de recherche 2
Youtube  Plus de 1,8 milliard d’utilisateurs inscrits et actifs par mois 3
Maps  Plus d’un milliard d’utilisateurs actifs par mois 4
Gmail  1,2 milliard d’utilisateurs enregistrés 5

A. Recherche

69. Google Search est le moteur de recherche sur internet le plus populaire au monde 6, avec plus de 11 milliards de requêtes par mois aux États-Unis 7. En plus de renvoyer un classement de pages web en réponse aux requêtes globales des utilisateurs, Google exploite d’autres outils basés sur la recherche, tels que Google Finance, Flights (vols), News (actualités), Scholar (recherche universitaire), Patents (brevets), Books (livres), Images, Videos et Hotels. Google utilise ses applications de recherche afin de collecter des données liées aux recherches, à l’historique de navigation ainsi qu’aux activités d’achats et de clics sur publicités. Par exemple, Google Finance collecte des informations sur le type d’actions que les utilisateurs peuvent suivre, tandis que Google Flight piste leurs réservations et recherches de voyage.

70. Dès lors que Search est utilisé, Google collecte les données de localisation par différents biais, sur ordinateur ou sur mobile, comme décrit dans les sections précédentes. Google enregistre toute l’activité de recherche d’un utilisateur ou utilisatrice et la relie à son compte Google si cette personne est connectée. L’illustration 13 montre un exemple d’informations collectées par Google sur une recherche utilisateur par mot-clé et la navigation associée.

Un exemple de collecte de données de recherche extrait de la page My Activity (Mon Activité) d'un utilisateur
Illustration 13 : Un exemple de collecte de données de recherche extrait de la page My Activity (Mon Activité) d’un utilisateur

 

71. Non seulement c’est le moteur de recherche par défaut sur Chrome et les appareils Google, mais Google Search est aussi l’option par défaut sur d’autres navigateurs internet et applications grâce à des arrangements de distribution. Ainsi, Google est récemment devenu le moteur de recherche par défaut sur le navigateur internet Mozilla Firefox 8 dans des régions clés (dont les USA et le Canada), une position occupée auparavant par Yahoo. De même, Apple est passé de Microsoft Bing à Google pour les résultats de recherche via Siri sur les appareils iOS et Mac 9. Google a des accords similaires en place avec des OEM (fabricants d’équipement informatique ou électronique) 10, ce qui lui permet d’atteindre les consommateurs mobiles.

B. YouTube

72. YouTube met à disposition des utilisateurs et utilisatrices une plateforme pour la mise en ligne et la visualisation de contenu vidéo. Il attire plus de 180 millions de personnes rien qu’aux États-Unis et a la particularité d’être le deuxième site le plus visité des États-Unis 11, juste derrière Google Search. Au sein des entreprises de streaming multimédia, YouTube possède près de 80 % de parts de marché en termes de visites mensuelles (comme décrit dans l’illustration 14). La quantité de contenu mis en ligne et visualisé sur YouTube est conséquente : 400 heures de vidéo sont mises en ligne chaque minute 12 et 1 milliard d’heures de vidéo sont visualisées quotidiennement sur la plateforme YouTube.13

Illustration 14 : Comparaison d'audiences mensuelles des principaux sites multimédia aux États-Unis

 

Illustration 14 : Comparaison d’audiences mensuelles des principaux sites multimédia aux États-Unis 14

73. Les utilisateurs peuvent accéder à YouTube sur l’ordinateur (navigateur internet), sur leurs appareils mobiles (application et/ou navigateur internet) et sur Google Home (via un abonnement payant appelé YouTube Red). Google collecte et sauvegarde l’historique de recherche, l’historique de visualisation, les listes de lecture, les abonnements et les commentaires aux vidéos. La date et l’horaire de chaque activité sont ajoutés à ces informations.

74. Si un utilisateur se connecte à son compte Google pour accéder à n’importe quelle application Google via un navigateur internet (par ex. Chrome, Firefox, Safari), Google reconnaît l’identité de l’utilisateur, même si l’accès à la vidéo est réalisé par un site hors Google (ex. : vidéos YouTube lues sur cnn.com). Cette fonctionnalité permet à Google de pister l’utilisation YouTube d’un utilisateur à travers différentes plateformes tierces. L’illustration 15 montre un exemple de données YouTube collectées.

 

Illustration 15 : Exemple de collecte de données YouTube dans My Activity (Mon Activité)
Illustration 15 : Exemple de collecte de données YouTube dans My Activity (Mon Activité)

 

75. Google propose également un produit YouTube différencié pour les enfants, appelé YouTube Kids, dans l’intention d’offrir une version « familiale » de YouTube avec des fonctionnalités de contrôle parental et de filtres vidéos. Google collecte des informations de YouTube Kids, notamment le type d’appareil, le système d’exploitation, l’identifiant unique de l’appareil, les informations de journalisation et les détails d’utilisation du service. Google utilise ensuite ces informations pour fournir des annonces publicitaires limitées, qui ne sont pas cliquables et dont le format, la durée et le site sont limités.15.

C. Maps

76. Maps est l’application phare de navigation routière de Google. Google Maps peut déterminer les trajets et la vitesse d’un utilisateur et ses lieux de fréquentation régulière (ex. : domicile, travail, restaurants et magasins). Cette information donne à Google une idée des intérêts (ex. : préférences d’alimentation et d’achats), des déplacements et du comportement de l’utilisateur.

77. Maps utilise l’adresse IP, le GPS, le signal cellulaire et les points d’accès au Wi-Fi pour calculer la localisation d’un appareil. Les deux dernières informations sont collectées par le biais de l’appareil où Maps est utilisé, puis envoyées à Google pour évaluer la localisation via son interface de localisation (Location API). Cette interface fournit de nombreux détails sur un utilisateur, dont les coordonnées géographiques, son état stationnaire ou en mouvement, sa vitesse et la détermination probabiliste de son mode de transport (ex. : en vélo, voiture, train, etc.).

78. Maps sauvegarde un historique des lieux qu’un utilisateur connecté à Maps par son compte Googe a visités. L’illustration 16. montre un exemple d’un tel historique 16. Les points rouges indiquent les coordonnées géographiques recueillies par Maps lorsque l’utilisateur se déplace ; les lignes bleues représentent les projections de Maps sur le trajet réel de l’utilisateur.

Illustration 16 : Exemple d'un historique Google Maps (« Timeline ») d'un utilisateur réel
Illustration 16 : Exemple d’un historique Google Maps (« Timeline ») d’un utilisateur réel

79. La précision des informations de localisation recueillies par les applications de navigation routière permet à Google de non seulement cibler des audiences publicitaires, mais l’aide aussi à fournir des annonces publicitaires aux utilisateurs lorsqu’ils s’approchent d’un magasin 17. Google Maps utilise de plus ces informations pour générer des données de trafic routier en temps réel.18

D. Gmail

80. Gmail sauvegarde tous les messages (envoyés et reçus), le nom de l’expéditeur, son adresse email et la date et l’heure des messages envoyés ou reçus. Puisque Gmail représente pour beaucoup un répertoire central pour la messagerie électronique, il peut déterminer leurs intérêts en scannant le contenu de leurs courriels, identifier les adresses de commerçants grâce à leurs courriels publicitaires ou les factures envoyées par message électronique, et connaître l’agenda d’un utilisateur (ex. : réservations à dîner, rendez-vous médicaux…). Étant donné que les utilisateurs utilisent leur identifiant Gmail pour des plateformes tierces (Facebook, LinkedIn…), Google peut analyser tout contenu qui leur parvient sous forme de courriel (ex. : notifications, messages).

81. Depuis son lancement en 2004 jusqu’à la fin de l’année 2017 (au moins), Google peut avoir analysé le contenu des courriels Gmail pour améliorer le ciblage publicitaire et les résultats de recherche ainsi que ses filtres de pourriel. Lors de l’été 2016, Google a franchi une nouvelle étape et a modifié sa politique de confidentialité pour s’autoriser à fusionner les données de navigation, autrefois anonymes, de sa filiale DoubleClick (qui fournit des publicités personnalisées sur internet) avec les données d’identification personnelles qu’il amasse à travers ses autres produits, dont Gmail 19. Le résultat : « les annonces publicitaires DoubleClick qui pistent les gens sur Internet peuvent maintenant leur être adaptées sur mesure, en se fondant sur les mots-clés qu’ils ont utilisés dans leur messagerie Gmail. Cela signifie également que Google peut à présent reconstruire le portrait complet d’une utilisatrice ou utilisateur par son nom, en fonction de tout ce qui est écrit dans ses courriels, sur tous les sites visités et sur toutes les recherches menées. » 20

82. Vers la fin de l’année 2017, Google a annoncé qu’il arrêterait la personnalisation des publicités basées sur les messages Gmail 21. Cependant, Google a annoncé récemment qu’il continue à analyser les messages Gmail pour certaines raisons 22.

  1. « Règles de confidentialité et conditions d’utilisation », consulté le 15 août 2018, https://policies.google.com/privacy
  2. « Parts de marché des moteurs de recherche dans le monde » StatCounter Global Stats, avril 2018, http://gs.statcounter.com/search-engine-market-share#monthly-201704-201804
  3. Devindra Hardawar, « YouTube accueille 1,8 milliards d’utilisateurs connectés chaque mois », Engadget, 3 mai 2018, https://www.engadget.com/2018/05/03/youtube-1-8-billion-viewers/
  4. rapport annuel Form 10K de Google 10K pour la SEC, 2017, https://abc.xyz/investor/pdf/20171231_alphabet_10K.pdf
  5. Motek Moyen, « Gmail est très populaire mais Google persiste à ne pas corriger une faille de sécurité » Seeking Alpha, juillet 2017, https://seekingalpha.com/article/4088241-gmail-popular-google-still-fix-security-vulnerability
  6. « Parts de marché des moteurs de recherche dans le monde », StatCounter Global Stats, avril 2018, http://gs.statcounter.com/search-engine-market-share#monthly-201704-201804
  7. « Nombre de requêtes de recherche de bases réalisées par les moteurs de recherche aux Etats-Unis jusqu’en janvier 2018 (en milliards) » , Statista, février 2018, https://www.statista.com/statistics/265796/us-search-engines-ranked-by-number-of-core-searches/
  8. Denelle Dixon, « Firefox fournit le moteur de recherche Google par défaut aux Etats-Unis, au Canada, à Hong Kong et à Taiwan », The Mozilla Blog, 14 novembre 2017, https://blog.mozilla.org/blog/2017/11/14/firefox-features-google-as-default-search-provider-in-the-u-s-canada-hong-kong-and-taiwan/
  9. Matthew Panzarino, « Apple passe de Bing à Google pour les résultats de recherches de Siri sur iOS et Spotlight sur Mac », 25 septembre 2017, https://techcrunch.com/2017/09/25/apple-switches-from-bing-to-google-for-siri-web-search-results-on-ios-and-spotlight-on-mac/
  10. « Les accords de distribution des applications mobile Androids entre Google et les Fabricants d’équipement d’origine (OEM) ont fuités et révèlent beaucoup de restrictions strictes », Microsoft and Technology News, 13 février 2014, https://mspoweruser.com/mobile-application-distribution-agreement/
  11. « Classement des sites aux Etats-Unis” Alexa, https://www.alexa.com/topsites/countries/US
  12. « Nombres d’heures de vidéos postées sur YouTube chaque minute en date de juillet 2015,” Statista, July 2015, https://www.statista.com/statistics/259477/hours-of-video-uploaded-to-youtube-every-minute/
  13. Darrell Etherington, « Les utilisateurs regardent maintenant 1 milliard d’heures de vidéos sur YouTube par jour », TeachCrunch, 28 février 2017, https://techcrunch.com/2017/02/28/people-now-watch-1-billion-hours-of-youtube-per-day/
  14. « Sites multimédia dominants aux Etats-Unis en novembre 2016, en fonction des parts de marchés de visites »,Statista, décembre 2016, https://www.statista.com/statistics/266201/us-market-share-of-leading-internet-video-portals/
  15. « Faire de la publicité sur l’application YouTube Kids », Google, consulté le 15 août 2018, https://support.google.com/youtube/answer/6168681?hl=en
  16. « My Activity », Google, https://myactivity.google.com/myactivity
  17. « The Home Depot earns 8X in-store ROI with mobile display ads », Google, septembre 2016, https://www.thinkwithgoogle.com/intl/en-aunz/advertising-channels/mobile/home-depot-roi-mobile-display-ads/
  18. « Google Map’s real-time traffic layer », Spatial Unlimited, mars 2011, https://shreerangpatwardhan.blogspot.com/2011/03/google-maps-real-time-traffic-layer.html
  19. Julia Angwin, « Google has quietly dropped ban on personally identifiable web tracking,” ProPublica, Oct. 21, 2016, https://www.propublica.org/article/google-has-quietly-dropped-ban-on-personally-identifiable-web-tracking
  20. 78 Suzanne Monyak, « Google a modifié un élément majeur de sa politique de confidentialité il y a quatre mois et personne ne s’en est rendu compte », Slate, 21 octobre 2016, http://www.slate.com/blogs/future_tense/2016/10/21/google_changed_a_major_privacy_policy_and_no_one_really_noticed.html
  21. Mark Bergen, « Google va arrêter de lire vos mails pour les publicités Gmail », Bloomberg, June 23, 2017, https://www.bloomberg.com/news/articles/2017-06-23/google-will-stop-reading-your-emails-for-gmail-ads
  22. Ben Popken, « Google vend le futur, alimenté par vos données personnelles », NBC News, 10 mai 2018, https://www.nbcnews.com/tech/tech-news/google-sells-future-powered-your-personal-data-n870501
Suivre Framalang:

Framalang est le groupe de traduction bénévole et communautaire de Framasoft. Les membres traduisent des articles du monde du Libre à l'intention du public francophone. Pour participer à cette aventure, rejoignez notre liste de diffusion !

2 Responses

  1. Marc

    Fort intéressant. Merci.
    Est-ce-que Google collecte et stocke des données sur des personnes identifiée mais n’ayant pas de compte Google ? C’est tout a fait possible en analysant les mails que ces personnes envoient à des adresses gmail, notamment les mails envoyés sur des listes de discussion ou la probabilité qu’un des abonnés le soit avec une adresse gmail est importante, d’autant plus que le nombre d’abonnés est grand.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *