Actualité Google
Source : article d'actualité du site
Webrankinfo
Estimant
que le travail de l'équipe Qualité chez
Google n'est pas assez connu des
utilisateurs du célèbre moteur de recherche,
Udi Manber a décidé de donner
quelques explications sur leur
fonctionnement. Voici un petit résumé
des différentes équipes décrites par Udi,
avec quelques commentaires...
Equipes en charge de l'algorithme de
classement de Google
Créer un algorithme d'analyse de la
pertinence des pages en fonction des
requêtes des internautes est bien plus
difficile qu'il n'y parait. D'une part il y
a énormément de façon de présenter les
choses sur une page (cela diffère notamment
selon les langues) ; d'autre part il est
souvent difficile de deviner ce que cherche
réellement l'internaute au travers de sa
requête (parfois formulée de façon imprécise
ou ambigüe). L'élaboration de cet algorithme
est donc une tâche complexe qui doit tenir
compte d'une contrainte forte :
l'utilisateur doit obtenir une réponse en
quelques millisecondes, même s'il y a
plusieurs centaines de millions de requêtes
effectuées par jour sur Google !
La partie la plus populaire de
l'algorithme est le
PageRank (NDLR : car il fut un élément
clé du lancement de Google, également car il
fut décrit à l'origine par une formule
précise dans un article public et enfin car
les webmasters ont cru pouvoir le mesurer
par l'estimation fournie dans la barre
d'outils de Google). Le PageRank est
toujours utilisé par Google, mais d'une part
sa formule a changé (le dernier changement
remonte à Janvier 2008) et d'autre part le
PageRank est noyé au milieu d'un
grand nombre d'autres
critères utilisés par Google. Udi cite
aussi la modélisation de chaque langue et
les aspects temporels (il confirme ce qu'on
pensait : pour certaines requêtes traitant
par exemple de l'actualité, Google met en
avant des pages mises en ligne depuis très
peu de temps).
Equipes en charge de l'évaluation de la
qualité des résultats de Google
Il y a plusieurs types d'évaluation :
- évaluation automatique
faite chaque minute, pour être sûr que
tout fonctionne normalement
- évaluations manuelles
faites régulièrement par l'équipe
qualité
- évaluations de chaque nouvel
algorithme introduit sur
Google : en 2007, environ 450
modifications ou ajouts ont été apportés
à l'algorithme de Google (NDLR : ceci
concerne peut-être tous les services de
Google, pas seulement la recherche
classique)
- évaluations faites par des
volontaires chez Google pour ce
qui concerne les très nombreuses langues
gérées par le moteur de recherche
Equipes en charge de l'interface
utilisateur
Google essaie d'améliorer l'expérience
utilisateur en introduisant des nouveautés
dans l'interface. De nombreuses personnes
analysent tous les détails pour s'assurer
que ces changements sont appréciés des
internautes. On imagine qu'il y a eu ainsi
de très nombreux tests depuis le lancement
de
la recherche universelle, qui a
radicalement changé l'apparence des pages de
résultats.
Equipes en charge de la lutte contre le
spamdexing
Sans doute plus connue des webmasters et
de tous ceux qui s'intéressent au
référencement, l'équipe menée par
Matt Cutts est chargée de lutter contre
le spam chez Google. Les ingénieurs essaient
de détecter les nouvelles tendances afin de
trouver des parades (algorithmiques dans la
majorité des cas). Ils sont en dialogue avec
l'équipe de
Webmaster Central qui a pour objectif de
communiquer avec les webmasters du monde
entier.
Matt Cutts
rappelle qu'il n'est pas à la tête du
Search Quality chez Google mais de l'entité
qui lutte contre le spamdexing :
 En conclusion
On n'apprend pas tant de choses que ça
mais il ne fallait pas rêver, l'algorithme
de Google c'est leurs bijoux de famille ,
une formule magique dont la valeur marchande
se chiffre sans doute en
milliards de dollars... Espérons que les
prochains articles promis par Udi Manber
nous en apprendront plus sur les entrailles
de Google !
|