SEO : l’algorithme BERT de Google

C’est en ce début février 2020 et avec surprise que Google annonce le lancement officiel de l’algorithme BERT en France (dans 70 langues au niveau mondial).

Un algorithme apportant quelques modifications au SEO, mais rien de bien méchant non plus ! Voyons ensemble ce que ça donne.

L’algorithme BERT : c’est quoi ? 

Si vous ne le savez pas déjà, BERT est un nouvel algorithme de Google, signifiant Bidirectional Encoder Representations from Transformers, rien que ça.

Cet algorithme a d’abord été diffusé dans sa version open source à la communauté scientifique en 2018. C’est en octobre 2019 que Pandu Nayak (le vice-président de Google) a expliqué que l’entreprise utilise BERT sur son navigateur.  

A quoi sert-il pour Google ?

Vous le savez, le nerf de la guerre pour Google : pouvoir comprendre les requêtes de ses utilisateurs et leur renvoyer la bonne information. C’est là qu’intervient l’algorithme BERT. Celui-ci a pour objectif d’améliorer la compréhension des requêtes, afin de fournir des résultats toujours plus pertinents. L’algorithme BERT permet aussi de mieux comprendre les contenus que Google indexe dans son moteur de recherche. 

BERT est un algorithme très utile pour Google, notamment pour la compréhension et l’assimilation des informations récupérées lors des recherches vocales (qui se démocratisent de plus en plus).

Voici une liste plus détaillée de l’utilité de BERT pour Google sur différentes tâches :

  • comprendre la « cohésion textuelle », notamment pour les expressions et les phrases, notamment lorsque des nuances polysémiques interviennent et peuvent modifier le sens des mots. 
  • comprendre à quelles entités des pronoms font référence : l’objectif étant de générer automatiquement des featured snippets et améliorer la recherche vocale / conversationnelle. 
  • supprimer les problèmes d’homonymie
  • déterminer à quelles entités un texte fait référence
  • améliorer la prédiction des « phrases suivantes »
  • répondre à des questions directement dans les SERP de Google. 

Cet algorithme BERT, utilisé dans d’autres applications ? 

BERT est un algorithme utilisé et pouvant être utilisé dans d’autres applications que celles de Google, son origine étant open source. BERT excelle notamment dans la fonction de questions-réponses, mais aussi pour analyser les sentiments (les classifier puis les analyser), identifier des propos offensants (dans des tweets par exemple) et encore d’autres fonctions…

Comment fonctionne concrètement l’algorithme BERT ? 

L’algorithme BERT se base sur une technique de traitement du langage naturel (NLP), fondé sur des réseaux de neurones (rappelons que Google l’a diffusé en open source en novembre 2018). 

 « Bidirectional Encoder Representations from Transformers », le terme transformers est basé sur le principe d’analyse des mots en relation avec tous les autres dans la phrase, pour une compréhension d’un ensemble de mots structurés.

Plutôt que de faire une simple compréhension des mots un à un, l’algorithme BERT tient compte du contexte complet d’un mot en examinant les mots voisins à celui-ci. Une fonction particulièrement utile lorsqu’il est de question de comprendre les intentions de recherches de millions d’internautes… 

Les  « transformers » ont permis de faire de grandes avancées dans l’univers de la traduction automatique, la modélisation linguistique et le génération de textes de haute qualité. 

Pour faire tourner ce nouvel algorithme, Google a fait le choix d’installer pour la première fois des machines dédiées (Cloud TPU), pour offrir une puissance optimale dans le développement du machine learning

Les dérivés existant de l’algorithme BERT

Si vous vous intéressés de près ou de loin au SEO, vous devez impérativement connaître l’existence de l’algorithme BERT. Cependant, sachez que même si le SEO a découvert BERT en octobre 2019, les spécialistes du langage naturel connaissent celui-ci depuis au moins 2018. La version de l’algorithme baptisé BERT par Google, diffusé en open source, a permis une émergence d’une multitude de variantes et d’améliorations. Certains parlent même de BERTologie

Une version française de BERT existe même, développé par l’INRIA, camemBERT (c’est rigolo !). 

Algorithme BERT : son utilisation sur le moteur de recherche

Maintenant que vous avez bien compris l’étendue de l’algorithme BERT et son intérêt pour Google, voyons quelle est son utilisation concrète sur le moteur de recherche : 

La première particularité de BERT est que les avancées obtenues pour une langue (l’anglais par exemple), sont exploitables par d’autres langues. En version simplifiée : la barrière de la langue n’est plus avec BERT. Google utilise d’ailleurs la version originale en anglais pour améliorer les featured snippets dans 24 pays où ceux-ci sont disponibles. Il fut noté une amélioration significative en coréen et même en hindi, des langues qui ne sont pas parmi les plus simples… 

Selon Google, 15% des requêtes faites par jour sont totalement inédites et donc inconnues des algorithme de la firme internationale. Autant de requêtes qui doivent être reçus, analysées et comprises. 

Ben Gomes (une légende de chez Google) estime qu’avec l’utilisation de BERT sur le moteur de recherche, les utilisateurs feront plus de recherches, ce qui améliorera logiquement le trafic vers tous les sites… « comme nous répondons à des questions exotiques, nous espérons que cela conduira les gens à poser de plus en plus de questions exotiques. ». En bref, plus le temps avancera, plus les d’internautes auront des facilités à effectuer leurs recherches Google. 

Quel impact de BERT sur le référencement naturel

Google l’a annoncée, cette mise à jour est très importante : 

« BERT est une amélioration significative de notre compréhension des requêtes, ce qui représente le plus grand bond en avant des cinq dernières années et l’un des plus grands bonds en avant de l’histoire du moteur de recherche. Pandu Nayak (Google), le 25/10/2019 »

BERT permettant d’effectuer des recherches encore plus précises, les résultats (et donc vos pages) devront également l’être. Relativisons cependant l’impact de l’algorithme sur le référencement actuel. Celui-ci est estimé à moins de 10% sur l’existant. 

En bref, l’algorithme BERT doit être compris et pris en compte pour vos futurs contenus, pouvoir répondre à des questions précises sur Google sera de plus en plus important.