Let’s play with Google Insights Search

Classé dans : Communs culturels | 8

Temps de lecture 6 min

image_pdfimage_print

Google Insight Search - Linux - Monde

Vous voyez la carte ci-dessus ? Elle correspond à la distribution mondiale de recherches Google sur le mot-clé « linux » ces douze derniers mois.

Les dix premiers pays sont les suivants :

Google Insight Search - Linux - Monde - Pays

Et les dix premières villes sont les suivantes :

Google Insight Search - Linux - Monde - Villes

Ces informations proviennent de Google Insights Search, nouveau service d’analyse des requêtes des internautes mis à dispositon par Google (et ne concernant donc que les requêtes effectuées via le moteur Google).

Il fait suite, en l’améliorant, au service Google Trends que j’avais utilisé dans un précédent billet pour évoquer l’évolution de certaines distributions GNU/Linux.

L’idée c’est de comparer et contextualiser certaines requêtes dans le temps et dans l’espace mais aussi par rapport au nombre total des toutes les requêtes effectuées.

Linux en France

Pour illustrer mon propos conservons l’exemple « linux » mais cette fois-ci restreint au territoire français (toujours pour les douze derniers mois, ce qui est bien entendu paramétrable).

La première chose qui est proposée c’est une courbe d’évolution dans le temps considéré (ici donc pour « linux » en France c’est à peu près stable).

Google Insight Search - Linux - France - Graphique

Puis la repartition région par région :

Google Insight Search - Linux - France

Avec le détail des dix premières régions :

Google Insight Search - Linux - France - Régions

Que signifient ces chiffres à droite (qui n’apparaissent que si vous êtes connecté à un compte Google, eh oui, on a rien sans rien) ?

La première région étant la Franche-Comté (bravo pour elle !) elle est automatiquement affublée de la centaine. Cette première place veut dire, si j’ai bien compris, que parmi toutes les requêtes Google effectuées en France, c’est dans cette région que la proportion de recherches « linux » est le plus grande. Notez que cela ne nous indique pas la proportion (ou pourcentages) de requêtes « linux » par rapport à toutes les requêtes Google faites depuis la Franche-Comté sur la période (qui doit être bien faible de toutes les façons). Toujours est-il que c’est la Franche-Comté qui donne le la (le 100) et les autres régions qui suivent en conséquence.

Je me trompe peut-être mais du coup je lis qu’il y a environ un tiers de chercheurs Google « linux » en moins en Midi-Pyrénées (65) et quasiment moitié moins en Alsace (52). Au risque de me répéter on peut donc affirmer que selon Google il y aurait deux fois plus de chercheurs « linux » en Franche-Comté qu’en Alsace.

Ce qui ne signifie nullement qu’il y aurait deux fois plus de postes sous GNU/Linux en Franche-Comté qu’en Alsace parce qu’on peut très bien imaginer qu’un jour une région soit tellement à la pointe Linux qu’elle n’ait plus besoin de faire des recherches sur le terme générique « linux » (mais plutôt sur « bash », « emacs » ou que sais-je encore).

Sinon, on a aussi les villes :

Google Insight Search - Linux - France - Villes

Dans la mesure où Google ne prend pas uniquement le mot-clé « linux » en considération mais référence également les requêtes connexes qui contiennent ou non ce mot-clé, il nous est proposé deux tableaux.

Le premier tableau est constitué du top ten des requêtes associées au mot-clé « linux » (là encore si vous avez un compte Google vous aurez la possibilité d’avoir plus de dix résultats en téléchargeant le fichier CSV associé à votre recherche) :

Google Insight Search - Linux - France - top requêtes

Le second tableau est constitué des requêtes associées au mot-clé « linux » ayant connu le plus forte hausse sur la période étudiée (Breakout signifie que la hausse dépasse 5000 % !) :

Google Insight Search - Linux - France - requêtes en hausse

À la lecture de ces tableaux on peut supputer par exemple qu’Ubuntu est bien la reine des distributions en France (mais que Mandriva n’est pas morte), que les linuxiens ont de plus en plus envie de jouer sur leur ordi et que l’Eeepc (sous Xandros) a bien été le phénomène annoncé.

Digne de confiance ?

Bon, c’est bien gentil tout ça mais l’outil est-il fiable ? Telle est la question qui en fait n’aura pas de réponse. D’abord parce que la localisation via notre adresse IP n’est pas d’une rigueur absolue. Et ensuite parce que Google garde jalousement ses données et ses algorithmes de calculs.

La seule chose qu’il soit possible de faire c’est de taper des requêtes dont vous les résultats sont attendus afin de vérifier si l’outil est conforme à votre prévisions. Ainsi si l’on tape « marée » (en France) ce sont bien les régions de la côte atlantique qui apparaissent en premier.

Ce n’est pas très scientifique tout ça mais plusieurs exemples du même acabit m’ont fait supposer que globalement Google Insights Search donne des tendances plausibles.

Je pense néanmoins que des pays encore peu connectés peuvent venir fausser certains résultats car on se retrouve alors proportionnellement avec des internautes locaux pionniers et donc à mon avis plus technophiles que la moyenne. Et puis il y a aussi la question des langues, des alphabets différents, etc. N’hésitez pas à apporter d’autres bémols dans les commentaires.

En tout cas fiable ou pas, je suis sûr que de nombreux marketeux vont prendre d’assaut l’outil pour affiner leurs prochaines campagnes commerciales !

Quelques exemple d’un monde libre qui se cherche

Ces précautions d’usage étant posées, on peut faire mumuse avec l’outil, d’autant qu’il est permis de comparer plusieurs requêtes entre elles.

Quelques distributions GNU/Linux

Comparons mondialement Ubuntu, Fedora, Mandriva, OpenSuse et Debian. On retrouve bien la suprématie actuelle d’Ubuntu (aucune idée de la signification du 84 derrière Ubuntu, par contre je pense là encore qu’on peut supposer qu’Ubuntu est environ dix-sept fois plus recherchée que Mandriva).

Google Insight Search - Distros - Monde

Au niveau des trois pays de tête ça donne :

  • Cuba, Italie, Indonésie pour Ubuntu
  • Sri-Lanka, Inde, Taïwan pour Fedora
  • Russie, République Tchèque, Biélorussie (et France cinquième) pour Mandriva
  • République Tchèque, Russie, Allemagne pour OpenSuse
  • Cuba, Biélorussie, République Tchèque pour Debian.

Si l’on se restreint à la France, ça bouge un peu puisque par exemple Mandriva s’en sort mieux face à Ubuntu.

Google Insight Search - Distros - France

La petite guerre des suites bureautiques

J’ai tenté de comparer les suites bureautiques MS Office et OpenOffice.org (comparaison difficile en raison des différentes appellations)

Dans le monde (avec l’Allemagne et la France qui se classent premières pour « open office ») :

Google Insight Search - Office - Monde

Et en France :

Google Insight Search - Office - France

On s’en sort bien sur ce coup là ;-)

Open Source vs Free Software

Comparons les requêtes « Open Source » et « Free Software ». On constate tout d’abord que « Open Source » est plus demandé que « Free Software ». Va-t-il finir par s’imposer ?

Google Insight Search - FLOSS - Monde

Ce sont plusieurs villes indiennes (Delhi en tête), Djakarta et Singapour qui remportent la palme des recherches « Free Software ». Alors que les villes « Open Source » sont San Francisco, encore Delhi, puis Milan, Amsterdam, Washington, Sydney, Londres. Il y a clairement là une différence géographique (et éventuellement sociale).

En France cela ne sera à rien de comparer car « Free Software » est remplacé par « Logiciel Libre ». Du coup on obtient ceci :

Google Insight Search - FLOSS - France

Et tant qu’on y est pourquoi ne pas comparer « Richard Stallman » et « Linus Torvalds ». De notoriété mondiale équivalemente, vous constaterez avec moi que Stallman est très populaire dans les pays d’Amérique Latine tandis que Torvalds a une forte côte dans les contrées occidentales.

À vous de jouer

Fin de mon petit tour de manège avec Google Insights Search. J’en appelle aux commentaires pour nous signaler vos propres requêtes que vous aurez jugées intéressantes à communiquer.

8 Responses

  1. marns34

    Merci de m’avoir fait découvrir ce "joujoux"
    je viens de faire une analyse rapide pour la France avec framasoft 🙂
    ben voila le resultat

    framasoft : 7
    clubic : 85
    01 net : 16
    comment ca marche + ccm : 12

    à non c’était pas une bonne idée 🙁

  2. marns34

    le plus amusant c’est que les recherches rapporté pour clubic sont :
    Firefox, emule, avast

  3. Zef

    La localisation à la commune est assez surprenante. Dans l’exemple Linux par ville, "Le Puy" en 2 !? Là j’ai pas d’explication, d’autant qu’il faut encore savoir quel Puy. Pour Courbevoie en 4, outre le fait qu’il y ait la Défense sur cette commune, je pense que c’est surtout dut au fait que le cœur du réseau Neuf Cegetel est à Courbevoie. En gros une très grosse quantité de "trafic Internet" qui ne passe pas par le réseau France Telecom passe par là. On peut donc imaginer que nombre d’adresses IP sont de manière erronée localisées à Courbevoie.

    L’autre problème c’est la pondération de la distribution spatiale des adresses IP. En ne connaissant pas le nombre absolu de requêtes, il est difficile de pondérer ces données (par le nombre d’habitants par exemple) et donc de les exploiter judicieusement.

    Non seulement Google est incapable de maîtriser réellement la localisation des adresses, et de plus nous sommes incapables de maîtriser la méthodologie de Google (et donc l’honnêteté) quant à ces données dont il semble impossible de disposer d’indicateurs de qualité. Bref, ça reste globalement très intéressant… à des échelles nationales ou éventuellement régionales pour des usages compatibles avec une confiance aveugle.

  4. Spip

    un autre point est le suivant :
    on compte "100 connections linux" dans telle region et 50 ailleurs, oui mais… Il faudrait ramener cela au nombre d’habitants ou mieux, au nombre d’internaute ou de pc connecté à internet. Sinon, ce ne sont pas statistiques fiables. Il y a bien plus d’habitant en IdF qu’en corse…

  5. scls19fr

    C’est marrant j’ai fait une recherche un peu "opposée" à Linux.
    En effet, j’ai cherché la distribution nationale des recherches d’information à propos de WGA (WIndows Genuine Advantage… le système de validation de l’authenticité de Windows)
    Et les derniers sont Franche-Compté et Limousin…

  6. radio

    Bonjour,

    Je découvre votre blog suite à une recherche sur la radio, et j’en profite pour vous annoncer la publication du nouveau site d’RCM (radio locale de l’est). Je vous invite à passer faire un petit tour pour écouter le flux ( http://www.rcmlaradio.fr ).

    Amicalement,