Ca fait très longtemps que je dois poster un article sur le blog de Graphemeride (mon dernier remontant à la série "Le Web de demain"). J'ai eu un peu de pression ces temps-ci par Marie George qui est seule à écrire les articles ces temps-ci. Dès que je vois passer une news sympa ou que je découvre une petite technique, j'ai envie de venir poster mais je dédie malheureusement mon temps à mon projet WordiZ. Bref, j'ai le couteau sous la gorge à l'écriture de ces lignes, mais rassurez-vous le sujet est sympa et j'en ai encore plein d'autres dans mon chapeau pour plus tard. Je vais essayer de republier assez vite, mais je vous préviens de suite que ma motivitation dépendra grandement du nombre de commentaires reçus sur cet article ( ça tombe bien, les commentaires sont en dofollow et notre blog est passé en PR4 récemment).
Google est Sémantique et le sera encore plus
En 2014, l'avantage c'est qu'on a plus besoin de se demander si le web de demain sera sémantique ou ne le sera pas. Google y répond magistralement avec son algorithme Colibri et l'enrichissement des résultats de recherche. En plus de mieux comprendre les requêtes de l'utilisateur, il peut certaines fois y répondre directement (en plaçant la réponse au dessus des SERP ... pas cool, mais on y reviendra plus tard). Pour vous faire une idée complète sur le sujet, je vous conseille d'acheter le livre de mon ami David Amerland (aussi sur Google+) :
Si vous ne savez pas de quoi il s'agit, voici un petit résumé rapide. Avec son nouvel algorithme Colibri (Hummingbird dans le texte), Google peut mieux saisir le sens des questions qui lui sont posées. Il peut aussi y répondre directement. Plus besoin d'aller chercher vos réponses sur Wikipedia ou les sites web. Un exemple frappant est donné dans l'image suivante :
Forcément, l'algorithme marche bien mieux en anglais et répond à plus de questions. Mais, de plus en plus de requêtes en français reçoivent des réponses directes.
Lorsque la requête n'est pas sous forme de question, il est aussi possible d'obtenir une floppée dinformations reliée au mot cherché. Voici un autre exemple étonnant où j'ai cherché "moule" (mussel en anglais) et où Google me renvoie toutes les propriétés nutritives. Ces données sont importées via le site du ministère de l'alimentation et de l'agriculture américain.
Bref, je ne vais pas m'étendre sur le sujet, vous avez déjà du vous rendre compte de la tendance. En particulier, la grosse question qui se pose à présent est de savoir si il y a un intérêt quelconque à publier des sites informatifs si les réponses peuvent toutes être apportées par Google. Je vous laisse les commentaires ci-dessous pour en débattre. Pour ma part, mon opinion est déjà formée : la mise en place de Google Colibri va tuer les petits producteurs de contenu.
Des entités nommées issues de Freebase
Les connaissances de google sont générées via un système nommé le Google Knowledge Graph qui s'appuie fortement sur la plateforme Freebase. Freebase est une ressource où sont stockées les informations sous formes d'entités. Plusieurs entités peuvent porter le même nom, mais exprimer deux concepts différents. Par exemple, le mot "Hollande" peut décrire le nom de notre président, ou bien les Pays-Bas. Grâce à Freebase il est possible de trouver ces différentes entités en faisant une recherche sur un terme donné. Ainsi, l'expression "La vie en rose" peut s'appliquer à une liste impressionnante de choses :
- La chanson d'Edith Piaf
- Le film biographique sur la môme
- Une société de lingerie québecoise
- ... tout un tas de reprises de la chanson d'Edith Piaf par d'autres artistes
La liste des résultats fournis par Freebase est très (trop) longue. Dans un prochain article nous verrons (peut être) comment utiliser l'API de freebase pour prépopuler un site web avec quelques données de base.
Bon, tout cela n'est pas nouveau, passons donc maintenant à Google Trends
Google Trends révèle les fonctionnalités de l'outil de connaissance de Google
Google Trends est un outil intéressant qui permet de connaitre les volumes de recherche relatifs associés à différents mots clés. Vous pouvez comparer les expressions "Hollande" et "Sarkozy" par exemple, pour voir l'évolution des recherches sur ces sujets dans le temps. Pour celà, l'adresse à utiliser est : https://www.google.com/trends/explore .
L'outil est utile pour découvrir les tendances (trends en anglais) dans le temps, savoir quels pays cherchent plus un terme que d'autres etc. Jusqu'à présent rien de très neuf pour les amateurs de webmarketing. Là où ça change, c'est que depuis très peu de temps (quelques semaines ?) Google Trends est dorénavant relié à Knowledge Graph / Freebase. Et ce lien est beaucoup plus visible sur Trends que sur de la recherche classique. On voit par exemple, sur la requête 'François Hollande' les sujets similaires apparaissant souvent dans les recherches des internautes. Trends propose une option pour intégrer son code, donc je teste ça ci-dessous :
Si vous avez cliqué sur l'URL de trends (https://www.google.com/trends/explore#q=%2Fm%2F02qg4z) vous avez pu vous rendre compte qu'elle ne contient pas le mot clé 'françois hollande', mais une suite étrange de lettres : %2Fm%2F02qg4z (l'équivalent html de : /m/02qg4z). Pour ceux qui ont eu la curiosité d'aller visiter Freebase un peu plus haut, vous aurez reconnu là, sans doute, la syntaxe pour identifier les entités nommées. Voici par exemple la page de François Hollande sur Freebase : http://www.freebase.com/m/02qg4z
Si les informations de Freebase sont assez complètes, il n'y est pas fait mention de Julie Gayet, alors que celle-ci est présente sur Trends ! Trends ajoute donc une surcouche à Freebase et sélectionne pour vous les entités les plus importantes (tout seul comme un grand).
Trends peut donc maintenant faire la différences entre deux thèmes avec la même appelation mais au sens différent. Pour reprendre l'exemple de la vie en Rose, il lui est possible d'afficher l'évolution temporelle des recherches en fonction du contexte :
J'imagine que mon exemple n'est pas le plus simple et les recherches sont dures à décorreler, mais on voit quand même nettement se distinguer les recherches relatives au film à partir de 2007.
La fonctionnalité la plus frappante de Trends/Knowledge reste quand même la distinction des termes. Testez donc sur des termes ayant plusieurs sens. Je reste sur l'exemple "La vie en Rose". Sur Freebase on obtient une longue liste pas forcément facile à traiter, alors que dans la boite de recherche de Trends, on voit uniquement les termes les plus importants :
Hum ... dernier bonus pour ceux qui codent : les informations sur ces entités naviguent en clair depuis les serveurs Google. En trois quatre ligne de code vous pouvez rapatrier les informations qui donnent naissance aux suggestions de l'image ci-dessus. Voilà ce qui transite sur le réseau :
{"entityList":[{"mid":"/m/02q6gfp","title":"La Vie en Rose","type":"2007 Film"},{"mid":"/m/0b7vwz","title":"La Vie en rose","type":"Song"},{"mid":"/m/01wdzm_","title":"Édith Piaf","type":"Singer"},{"mid":"/m/0h95zw7","title":"La Vie en Rose","type":"Retail company"}]}
On peut très vite se créer un petit outil pour rapatrier plein de termes associés à Edith Piaf. Je vous mets d'ailleurs au défi : j'offre un article invité sur le blog Graphemeride au premier qui proposera un petit code pour importer ces informations et les utiliser pour générer un ensemble de mots clés.
Google Semantique, la fin du SEO ?
Avec la mise à jour de Colibri, les éditeurs de site auront de plus en plus de soucis à se faire. Si les informations recherchées par les utilisateurs peuvent être bien comprises par Google et si les réponses à leurs questions s'affichent avant les SERP, il y a fort à parier que de moins en moins de sites informatifs (j'entends par là des sites expliquant des choses, donnant des informations, tel feu Le Quid) survivront. Le mot de la fin (sans mauvais jeu de mot) sera une courbe pour un mot clé que nos amis du monde SEO chérissent ... plutôt frappant non ?