Google utilise-t-il l’analyse du sentiment pour classer les pages web ?

Article traduit librement depuis Google utilise-t-il l’analyse du sentiment pour classer les pages web ?

De nombreux OSEO estiment que le sentiment d’une page web peut influencer le classement d’une page par Google. Si toutes les pages classées dans les pages de résultats des moteurs de recherche (SERP) ont un sentiment positif, ils pensent que votre page ne pourra pas être classée si elle contient des sentiments négatifs.

Les preuves et les faits sont là pour montrer où les recherches de Google se sont concentrées en termes d’analyse des sentiments.

J’ai demandé à Bill Slawski (@bill_slawski), un expert en brevets liés à Google, ce qu’il pense de la théorie du SEO selon laquelle Google utilise l’analyse des sentiments pour classer les pages web.

« Le sentiment est comme une saveur, comme la vanille ou le chocolat. Il ne reflète pas le gain d’information potentiel qu’un article pourrait apporter.

Le gain d’information peut être compris en utilisant le traitement PNL pour extraire des entités et des connaissances à leur sujet, et cela peut conduire à une détermination du gain d’information.

Le sentiment est une valeur qui ne reflète pas nécessairement la quantité d’informations qu’un article peut apporter à un sujet.

Un sentiment positif ou négatif ne reflète pas la quantité de connaissances présentes et ajoutées à un sujet ».

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

Bill a affirmé que Google a tendance à montrer un éventail d’opinions pour les requêtes liées à l’examen.

« Je ne crois pas que Google favoriserait un sentiment plutôt qu’un autre. Cela sent la partialité potentielle sur un sujet.

Je m’attendrais à ce que Google souhaite une certaine diversité en matière de sentiments, de sorte que s’il envisageait un classement sur cette base, il ne montrerait pas tout ce qui est négatif ou positif ».

Bill fait une excellente remarque sur le manque d’utilité si les résultats de recherche de Google introduisaient un biais de sentiment.

Certains OSE croient que si tous les résultats de recherche ont un sentiment positif, alors cela reflète ce que les chercheurs recherchent. C’est une corrélation naïve.

Il existe de nombreux facteurs de classement connus, tels que des liens, qui peuvent expliquer ces classements. Il existe d’autres facteurs tels que les utilisateurs qui souhaitent consulter des sites spécifiques pour des questions spécifiques.

Il est naïf de se contenter d’isoler un facteur et de dire : « Aha, tous les sites ont ceci, c’est donc pour cela qu’il est classé », c’est choisir ce que vous voulez voir.

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

Par exemple, le même SEO peut regarder ces résultats de recherche et voir qu’ils utilisent tous la même marque de plugin SEO. Cela signifie-t-il que le plugin SEO est la raison pour laquelle ces sites sont classés ?

La réponse est non.

De même, le sentiment exprimé dans les résultats de la recherche ne reflète pas nécessairement ce que le chercheur recherche.

C’est pourquoi je dis qu’il est naïf de considérer un facteur tel que le sentiment et de dire que c’est la raison pour laquelle un site est classé. Ce n’est pas parce que vous voyez une corrélation que cela signifie que c’est la raison pour laquelle un site est classé.

Google utilise-t-il l’analyse du sentiment pour le classement ?

Depuis 2018, Google est largement silencieux sur l’analyse des sentiments.

En juillet 2018, quelqu’un sur Twitter a demandé:

« …il semble que votre algorithme de recherche reconnaisse et prenne en compte le sentiment. Y a-t-il un opérateur de recherche de sentiment ? »

a répondu Danny Sullivan :

« Il ne reconnaît pas les sentiments. Donc, pas d’opérateur pour cela ».

Danny a clairement indiqué que l’algorithme de recherche de Google ne reconnaît pas les sentiments.

Plus tôt cette année-là, Danny a publié une annonce officielle sur Google concernant des extraits de reportages où il mentionnait le sentiment. Mais le contexte du sentiment était que pour certaines requêtes, il peut y avoir une diversité d’opinions et que, pour cette raison, Google peut montrer deux extraits de reportages, l’un positif et l’autre négatif.

« …les personnes qui recherchent « sont de bons animaux de compagnie pour les reptiles » devraient obtenir le même extrait que « sont de mauvais animaux de compagnie pour les reptiles » puisqu’elles recherchent la même information : comment les reptiles sont-ils considérés comme des animaux de compagnie ? Cependant, les informations que nous fournissons se contredisent.

Une page affirmant que les reptiles sont de bons animaux de compagnie semble être la meilleure adéquation pour les personnes qui cherchent à savoir s’ils sont bons. De même, une page affirmant que les reptiles sont de mauvais animaux de compagnie semble être la meilleure adéquation pour les personnes qui cherchent à savoir s’ils sont mauvais. Nous explorons des solutions à ce défi, notamment en montrant des réponses multiples.”

L’intérêt de la section ci-dessus est qu’ils explorent la possibilité de montrer des réponses multiples.

Depuis 2018, Google a cessé d’afficher des extraits de sites pour des questions vagues comme « les reptiles sont-ils de bons animaux de compagnie » et encourage les utilisateurs à approfondir leur recherche et à choisir un reptile plus spécifique.

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

Danny a écrit :

« Les éditeurs offrent souvent des perspectives diverses et légitimes, et nous voulons offrir aux utilisateurs une visibilité et un accès à ces perspectives à partir de sources multiples », m’a dit Matthew Gray, l’ingénieur en logiciel qui dirige l’équipe des bribes présentées ».

Ces déclarations contredisent directement l’idée de référencement selon laquelle si le sentiment des SERP penche dans une direction, votre site doit pencher dans la même direction pour être classé.

Google affirme plutôt qu’il veut montrer la diversité des opinions.

Positifs et négatifs dans les revues

Un document de recherche Google intitulé « Structured Models for Fine-to-Coarse Sentiment Analysis » (PDF 2007) indique qu’un « système de réponse aux questions » nécessiterait une analyse des sentiments au niveau des paragraphes.

Un système qui résume les examens devrait comprendre l’opinion positive ou négative au niveau de la phrase ou de l’expression.

C’est ce qu’on appelle parfois l’extraction d’opinion. Le but de ce type d’analyse est de comprendre l’opinion.

Voici comment le document de recherche explique l’importance de l’analyse des sentiments :

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

« La capacité à classer les sentiments sur plusieurs niveaux est importante car les différentes applications ont des besoins différents. Par exemple, un système de résumé pour les examens de produits pourrait nécessiter une classification de la polarité au niveau de la phrase ou de l’expression ; un système de réponse aux questions nécessiterait très probablement le sentiment des paragraphes ; et un système qui détermine quels articles d’une source d’information en ligne sont de nature éditoriale nécessiterait une analyse au niveau du document ».

Le document décrit plus en détail l’utilité de l’analyse des sentiments :

« parsing and relation extraction (Miller et al., 2000), entity labeling and relation extraction (Roth et Yih, 2004), and part-of-speech tagging and chunking (Sutton et al,
2004). Un travail intéressant sur l’analyse des sentiments est celui de Popescu et Etzioni (2005) qui tente de classer le sentiment des phrases par rapport aux caractéristiques possibles des produits ».

Ce qui est remarquable dans cette recherche, c’est qu’il s’agit strictement de comprendre le sentiment du texte.

  • Il n’y a pas de contexte pour l’utiliser afin de montrer des résultats de recherche qui sont biaisés en faveur du sentiment dans la requête de recherche d’un utilisateur.
  • Le contexte ne consiste pas à classer les textes en fonction du sentiment.

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

Pourtant, même si le contexte ne concerne pas le classement en raison du sentiment, certains OSE citeront ce type de recherche et s’attaqueront ensuite au fait qu’elle est utilisée pour le classement. Et c’est une erreur, car le contexte de cette recherche et d’autres documents de recherche est toujours axé sur la compréhension du texte, bien en dehors du contexte du classement de ce texte.

L’analyse du sentiment ne se limite pas aux aspects positifs et négatifs

Un autre document de recherche, Ce qui est génial et ce qui ne l’est pas : Apprendre à classer la portée de la négociation pour une meilleure analyse du sentiment (PDF 2010) présente un moyen de comprendre le sentiment des critiques de produits.

L’objectif de la recherche est de trouver une meilleure façon de traiter l’ambiguïté dans la façon dont les idées sont exprimées.

Voici des exemples de ce genre de phrases de négation linguistique :

  • « Vu la mauvaise réputation du fabricant, je m’attendais à être déçu par l’appareil. Ce ne fut pas le cas ».
  • « Ne négligez pas de commander leur délicieux pain à l’ail. »
  • « Pourquoi n’ont-ils pas pu inclure un haut-parleur décent dans ce téléphone ? »

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

Les exemples ci-dessus montrent comment ce document de recherche vise à comprendre ce que les humains veulent dire lorsqu’ils structurent leur discours d’une certaine manière. C’est un exemple qui montre que l’analyse des sentiments ne se limite pas aux sentiments positifs et négatifs.

Il s’agit en fait de la signification des mots, des phrases, des paragraphes et des documents.

Le document commence par énoncer l’utilité de l’analyse des sentiments dans plusieurs scénarios, y compris la réponse aux questions :

« La détection automatique de la portée de la négation linguistique est un problème rencontré dans une grande variété de tâches de compréhension de documents, y compris, mais sans s’y limiter, l’exploration de données médicales, l’extraction de faits généraux ou de relations, la réponse à des questions et l’analyse de sentiments ».

Comment une classification précise de ce type de phrases aiderait-elle un moteur de recherche à répondre aux questions ?

Un moteur de recherche ne peut pas répondre avec précision à une question sans comprendre les pages web qu’il veut classer.

Il ne s’agit pas d’utiliser ces données comme facteurs de classement. Il s’agit d’utiliser ces données pour comprendre les pages afin qu’elles puissent ensuite être classées selon des critères de classement.

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

Une façon d’envisager l’analyse des sentiments est d’y voir l’obtention de pages web candidates au classement. Un moteur de recherche ne peut pas sélectionner un candidat s’il ne peut pas comprendre la page web.

Une fois qu’un moteur de recherche peut comprendre une page web, il peut alors appliquer les critères de classement des pages susceptibles de répondre à la question.

Ceci est particulièrement important pour les requêtes de recherche qui sont ambiguës en raison de facteurs tels que la négation linguistique, comme décrit dans le document de recherche ci-dessus.

Si Google utilise l’analyse des sentiments, une page web n’est pas classée en raison de l’analyse des sentiments. L’analyse des sentiments aide à comprendre une page web pour qu’elle puisse être classée.

Google ne peut pas classer ce qu’il ne peut pas comprendre. Google ne peut pas répondre à une question qu’il ne peut pas comprendre.

Plus de recherches sur l’analyse du sentiment

SUIT : A Supervised User-Item Based Topic Model for Sentiment Analysis (PDF 2014)

Ce document de recherche étudie comment mieux comprendre ce que les utilisateurs veulent dire lorsqu’ils laissent des commentaires en ligne sur des sites web, des forums, des microblogs, etc.

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

C’est ainsi qu’il décrit le problème à résoudre :

« …la plupart des méthodes existantes ne modèlent que le texte du sentiment, mais ne tiennent pas compte de l’utilisateur, qui exprime le sentiment, et de l’objet sur lequel le sentiment est exprimé. Étant donné que différents utilisateurs peuvent utiliser différentes expressions de sentiments pour différents articles, nous pensons qu’il est préférable d’intégrer les informations sur l’utilisateur et l’article dans le modèle de sujet pour l’analyse des sentiments ».

Analyse du ressenti de la parole via les fonctions ASR de bout en bout (PDF 2020)

ASR signifie reconnaissance vocale automatique. Ce document de recherche porte sur la compréhension de la parole, et sur les moyens de donner plus de poids aux inflexions non vocales comme le rire et la respiration.

La recherche partage des exemples d’utilisation de la respiration et du rire comme éléments pondérés pour les aider à comprendre le sentiment dans le contexte de l’analyse du sentiment du discours, mais pas à des fins de classement.

En voici des exemples :

« 1. Oui, donc [LAUGHTER] il appelle maintenant.
2. Yay, eh bien félicitations, c’est vraiment cool. [BREATHING] J’ai hâte.
3. Exactement, [LAUGHTER] Je pense que ça va bien se passer, n’est-ce pas ?
4. Ce serait merveilleux, ce serait formidable, sérieusement. “

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

Le document décrit le contexte dans lequel il est utile :

« L’analyse du sentiment de la parole est un problème important pour les systèmes d’intelligence interactive qui ont de vastes applications dans de nombreux secteurs, par exemple le service à la clientèle, les soins de santé et l’éducation.

La tâche consiste à classer un discours dans l’une des catégories d’un ensemble fixe de catégories, telles que positive, négative ou neutre ».

Cette recherche est très récente, elle date de 2020 et, bien qu’elle ne soit évidemment pas spécifique à la recherche, elle est révélatrice du type de recherche que fait Google et de sa sophistication, bien plus que ce que le SEO réductionniste moyen considère comme un simple facteur de classement.

Pas de biais dans l’analyse du sentiment chez Google

Google a toujours déclaré qu’il s’efforçait de ne pas afficher les pages qui reflètent les intentions d’un chercheur (les geckos sont-ils de mauvais animaux de compagnie ?)

En fait, Google dit le contraire, qu’il essaie de montrer une diversité d’opinions. Google essaie de ne pas se laisser guider par un sentiment exprimé dans la requête de recherche.

Exemple de Google montrant la diversité des opinions

Capture d'écran d'un extrait de GoogleCapture d’écran d’un résultat de recherche sur Google à partir d’une requête avec un sentiment négatif.

Comme vous pouvez le voir dans la capture d’écran ci-dessus, Google ne permet pas que le sentiment négatif exprimé dans la requête de recherche l’influence pour montrer une page Web avec un sentiment négatif.

PUBLICITÉ

CONTINUER LA LECTURE CI-DESSOUS

Cela contredit directement l’idée que Google affiche des résultats de recherche avec un biais de sentiment spécifique si ce biais existe dans la requête de recherche.

Vous pouvez faire des recherches sur les recherches et les brevets de Google concernant l’analyse des sentiments et vous verrez que le contexte consiste à comprendre les requêtes de recherche et les pages web.

Vous ne verrez pas de recherches qui disent que le sentiment sera utilisé pour classer une page en fonction de son parti pris.

Si les pages que Google classe ont toutes le même sentiment, ne supposez pas que c’est pour cela qu’elles sont là.

Il est clair, d’après les documents de recherche de Google, les déclarations de Google et les résultats de recherche de Google, que Google ne permet pas que le sentiment de la requête de l’utilisateur influence le type de sites que Google va classer.