Date de publication : 21 août 2014
Temps de lecture : 12 min.
Niveau : Débutant
Un article très intéressant de Razvan Gavrilas pour Cognitiveseo.com nous explique plus en détail comment Google traite les images ainsi que leurs informations et ce qui influe sur leur positionnement dans les résultats de recherche.
Article rédigé dans sa version originale par Razvan Gavrilas, intitulé Did Google Just Read the Text on My Image and Can This Affect My Rankings? | 25 juin 2014
Il est très probable que Google puisse lire les métadonnées intégrées dans les photos. La question est aujourd’hui de savoir si cela influe sur le référencement d’une certaine manière.En effet, on considère souvent que les moteurs de recherche ne prennent pas en compte le texte intégré aux photos (en supposant qu’ils puissent le faire) et que la pratique consistant à intégrer du texte dans les photos est généralement une mauvaise idée pour un certain nombre de raisons non liées au SEO (tenant principalement du manque d’accessibilité de l’information pour l’utilisateur).
Dans le même temps, affirmer que le texte inclus dans les photos “ne peut pas être lu par les moteurs de recherche” est un peu prématuré. Google fait des efforts remarqués en matière de technologie de reconnaissance d’image, ayant récemment acquis Deepmind, il est donc difficile de croire que le texte intégré aux photos ne présente pas d’intérêt. Dans cet article, long mais néanmoins intéressant (nous l’espérons), nous avons fait quelques expériences intéressantes pour comprendre comment Google réagissait à la question de la recherche d’images et pour voir quelles étaient les implications pour le SEO et le secteur du marketing numérique. Si vous avez besoin d’informations supplémentaires, n’hésitez pas à contacter notre agence SEO (référencement naturel) !
Que ce passe-t-il dans le cas d’un texte intégré à une photo? Nous pouvons, dans ce cas, penser à plusieurs scénarios, même si le cas des logos semble être le plus évident. Les logos contiennent essentiellement des informations sous forme de texte, et dans de nombreux cas, sous forme d’image. La plupart du temps, il s’agit d’une autre représentation de la marque, mais c’est une représentation très pertinente. Une technologie brevetée à ce sujet existe et est déjà utilisée. D’autres exemples liés à la marque peuvent être trouvés, la plupart du temps sous la forme de publicités d’images en ligne.
Il y a évidemment un intérêt à cela. Mais revenons à la question initiale: pourquoi devrions-nous nous préoccuper du texte intégré dans des images (autres que sur les logos)? La meilleure réponse vient d’une observation simple… c’est la façon dont les gens parlent sur Internet de nos jours. Grâce aux photos! Et je ne veux pas rentrer dans l’idée classique qu’ “une image vaut mille mots” au sens métaphorique. Pour autant, le contenu et la façon dont les contenus sont structurés est liée à l’utilisation d’images sous forme de lignes dans un dialogue imaginaire, avec du texte intégré dans les images.
Il est monnaie courante de dire qu’une image vaut mille mots. Il est déjà moins fréquent de savoir exactement combien de mots (et de mots-clés) Google prend en compte sur une image. Ce que nous pouvons dire avec certitude, c’est que dans de nombreux cas, et lors de la plupart de nos expériences, Google s’est montré très à l’aise avec l’interprétation des images. Cela expliquerait pourquoi il a interprété l’image d’une vue arrière d’une voiture de sport rouge comme “voitures des années 90” au lieu de la nouvelle Ferrari représentée. On constatera pour les images similaires, le texte accompagnant l’image faisait référence aux voitures des années 90. Certes, le design rappelle une marque particulière de cette époque et des voitures de sport très visibles. La théorie du texte adjacent explique également pourquoi l’image avec le texte “Essayez-le gratuitement” a été mal interprétée. Cela soutient également l’idée que, même si la lecture du texte intégré à une image peut faire partie des prouesses de Google, l’entreprise ne dispose pas encore du niveau de maîtrise nécessaire pour l’appliquer universellement.
En répétant l’expérience avec notre logo (qui ne contient pas de texte intégré), le moteur de recherche a fait un très bon travail et a su déterminer que celui-ci est principalement lié à “seo cognitive”, notamment en se basant sur le texte à côté de l’image à plusieurs reprises et en faisant une estimation, sur la base de la similitude visuelle des images et du nombre de pixels de l’image.
Les jeunes d’aujourd’hui sont fatigués d’avoir à chercher pendant des heures et des heures le .gif d’un chat drôle en particulier (oui, vous savez lequel) avec quelque chose d’écrit dessus, sans obtenir les résultats escomptés. Nous ne devrions probablement pas nous soucier de cela, mais ce ne sont pas seulement les consommateurs de demain, mais déjà les consommateurs d’aujourd’hui. Selon les données, les personnes de 18-29 ans représentent 90% des utilisateurs d’Internet dans le monde entier. Si les plus jeunes sont différents, la tendance ne fera que s’accentuer.
En fin de compte, la majorité du contenu sur Internet est constitué d’images que vous ne pouvez pas ignorer. C’est aussi le cas des moteurs de recherche. Les gens sont attirés par les images (Lorsqu’elles sont pertinentes) plus que par le texte. Ainsi, être capable de mettre du texte sur les images, contrairement à ce que l’on voit ci-dessous, pourrait bien être la prochaine étape. Ce n’est pas seulement une tendance et cela ira probablement plus loin. Quelqu’un travaille-t-il déjà sur le sujet ?
Oui, Google peut lire le texte intégré dans les images et il fait ça très bien. Prenons par exemple Google Keep, le service de prise de notes de Google qui fait de la «prise de notes» une toute autre expérience. Google Keep peu en effet transcrire le texte pour vous, instantanément, si votre contenu est une image, telle que celle d’un livre.
Les technologies de reconnaissance de caractères optiques (OCR) sont déjà utilisées à une large échelle, la plupart du temps par Google lui-même pour la numérisation des livres dans le service Google Livres. Le principal problème que les développeurs OCR doivent résoudre est d’atteindre une précision de 100%. Ceci est essentiel pour rendre le processus entièrement automatique. C’est peut-être quelque chose qui pourrait faire que Google déploie régulièrement sa technologie de recherches, mais pas encore au point d’affecter les classements.
En outre, Google fait un excellent travail pour l’extraction de texte à partir de fichiers PDF numérisés : les PDF numérisés où le texte n’est pas sélectionnable. Nous avons pris une partie du texte et fait une requête de recherche dans Google. Devinez ce qui s’est passé! Le grand G a réussi à numériser le contenu et a retourné la phrase exacte que nous cherchions, même si ce texte se trouvait dans un document PDF numérisé. C’est-à-dire une image.
Il existe un grand nombres de brevets sur la reconnaissance d’image, principalement liés à la reconnaissance d’objets (brevet de recherche de reconnaissance d’images , brevet sur les méthodes de reconnaissance d’image , système de reconnaissance d’image par hachage de pixels , etc.) qui vont de la vie privée aux réseaux sociaux et aux conducteurs de voitures. Identifier et utiliser des mots-clés extraits des images semble être l’une des principales préoccupations de Google, à en juger par l’un des brevets de la Firme.
Google prend en effet en compte d’autres types de données. Sur la question des données EXIF (métadonnées sur l’image provenant d’un appareil photo, les informations telles que la distance focale, l’ISO, le type d’objectif, etc.)
Matt Cutts a admis que Google se “réserve le droit d’utiliser potentiellement” les données à des fins de classement.
Ainsi, si vous avez pris votre photo avec un objectif de 50 mm d’une certaine marque et d’un certain type, ces informations seront enregistrées sous forme de données EXIF. Chaque fois que quelqu’un cherche des données sur cette marque et un type d’objectif en particulier, cette personne pourra également être dirigée vers des exemples de photos prises avec cet appareil, et en particulier vers votre site. Même si Cutts traite la question dans une atmosphère détendue, il est toujours préférable de connaître cette information que de l’ignorer. Cela explique l’existence d’un site “EXIFies” qui modifie vos photos altérées à la «naissance» et y ajoute des métadonnées EXIF comme si elles étaient réelles et tout droit sorties de l’objectif de l’appareil photo.
Ce n’est pas encore ce qui nous intéresse. Y’a-t-il quelque chose de plus sous la surface, un peu comme le cliché de l’iceberg? Ou le sujet s’épuisera-t-il rapidement, tout comme la calotte glaciaire arctique qui rétrécit? En parlant de cela, comment savons-nous combien y’a-t-il de glace dans les calottes polaires à un moment donné? Contrairement aux algorithmes de classement de Google, la réponse à cette question est assez simple: les scientifiques utilisent ce qu’on appelle le Pan-Arctic Ice Ocean Modeling and Assimilation System (en abrégé: PIOMAS). Mis à part l’avantage d’être une futilité des plus intéressantes, c’est aussi une question utile pour nos requêtes liées au SEO.
Nous avons essayé de faire une recherche d’image pour “Volume de la glace de la mer Arctique piomas”. Sur les images apparues lors de la recherche, l’une d’elles en particulier avait cette phrase exacte, sous forme de texte intégré à l’image.
Sur le site, nous n’avons pas trouvé de correspondance avec le mot clé exact que nous avons cherché. Selon la version officielle, cela s’explique aisément car le site affiche le texte “volume arctique de la mer de glace” à proximité de l’image, et l’image elle-même avait le titre “Spirale PIOMAS”.
À une exception près, toutes les autres photos sur le dessus de cette recherche ont “PIOMAS” quelque part dans le nom ou en Alt texte “volume arctique de glace de mer” quelque part dans un texte à proximité de l’image. L’explication précédente vient se confronter à cette observation. Rien à voir, circulez. Mais d’un autre côté, prenez en compte le fait que sur les sept meilleures photos, cinq ont entre 4 et 5 mots de recherche sous forme de texte intégré, et deux photos ont 3 des 5 mots de recherche sous forme de texte intégré. Pas assez pour prouver notre théorie, mais suffisant pour mettre en lumière le fait qu’il y a assez peu de résultats de recherche, mais que ces images particulières sont arrivées en premières.
Malheureusement, la question de savoir si oui ou non Google lit le texte intégré dans les images est un problème moins facile à trancher que celui des calottes polaires en fusion.
Il est toujours plus facile de réfuter que de prouver quelque chose. Nous avons donc réalisé une expérience différente cette fois, en commençant avec une image.
Nous avons fait une recherche d’image avec une image du texte “Google” (méta ici), en s’attendant à ce que Google réagisse. Ce ne fut pas le cas! En fait, nous avons attendu un peu et pour des raisons qui ne sont pas claires, l’image a été associée aux mots clés « solution vision aigle ». Néanmoins, les images qu’il a reportées comme étant les plus semblables à la nôtre y faisaient souvent référence. Les résultats des images sont variables, mais si nous devons nous prononcer, nous dirions que ceci est le résultat d’un algorithme de similarité de base fait avec un niveau de pixel et de couleur. Toutes les images utilisent, la plupart du temps, si ce n’est tout le temps, le texte en noir et sont à peu près de la même largeur et de la même hauteur. Malheureusement, ce sont les seules similitudes. En supposant que Google n’ait pas fait cela pour vous amuser avec cet article (non, ce n’est pas le cas), cette recherche est la preuve que le moteur de recherche extrait le texte à partir d’images et les utilise dans ses requêtes de recherche. Du moins pas en règle générale.
5. Comment optimiser vos images pour le Référencement
Comment peut-on utiliser des images à notre avantage pour le référencement ? Comment optimiser le référenement des images de son site internet ? Google lui-même a quelques idées à ce sujet. Les deux conditions préalables pour que vos images soient utiles dans les recherches sont:
Jusqu’ici tout va bien, non ? Rappelez-vous cependant que ces deux conditions vous assurent simplement que vos images soient indexées. Il y a, bien sûr, d’autres choses que vous pouvez faire pour essayer de maximiser vos chances d’apparaitre dans la partie supérieure de la page des résultats. Donnez un nom au fichier qui soit directement lié à la teneur de l’image et une description qui le rende plus facile à comprendre par vos lecteurs et placez-le sur une page où il complémente effectivement et améliore le texte (éviter le bourrage de mots clés pour l’image ALT). Que vous utilisiez ou non une SiteMap pour les images, de nombreuses métadonnées dans votre image ou que vous indiquiez ou non qu’une image est réservée à un public adulte, cela influencera la fréquence des résultats et leur position pour une recherche donnée. Rappelez-vous que même si vous n’avez rien à perdre à ajouter du texte dans vos images (et potentiellement quelque chose à gagner), n’ajoutez pas de texte important que vous n’auriez pas écrit quelque part sur la même page.
Tout n’est cependant pas lié au classement, et ce qui compte est la vue d’ensemble: votre marque. Certaines choses importantes concernant votre marque sont entièrement différentes: les droits d’auteur. Ici aussi, la capacité de Google à traiter des images peut être utile pour un certain nombre de raisons.
1. Comment faire pour trouver les personnes qui utilisent vos Images
Une des choses les plus faciles à gagner en ligne est l’augmentation rapide de votre popularité. C’est très utile, surtout si vous êtes un jeune artiste ou nouveau dans le domaine du design. Vous créez une image, ou prenez une photo de quelque chose qui apaise (et enchante) les utilisateurs d’Internet tout-puissants. Ils disposent alors d’une multitude de façons de partager cette image (reblogging, republication, retweeter, etc.) sur leurs propres pages et sites web. Voila : vous avez pressé du jus de SEO frais. Parfois les internautes vous donnent le crédit et certaines (de nombreuses fois), ils vous ignorent. Si vous êtes tout simplement curieux de savoir dans quelle mesure votre renommée s’est répandue, vous pouvez faire une recherche d’images avec l’image réelle qui vous intéresse. Google va rechercher les diverses utilisations de l’image sur le web, y compris sa présence sur les sites sociaux. De là, vous pouvez consulter chaque résultat de recherche pour voir exactement le contexte dans lequel l’image apparaît.
À lire aussi :
Diversifier sa stratégie avec la publicité sur TikTok
Vous avez peut-être entendu que les mentions des marques sont désormais considérées comme de nouveaux liens. Pour mettre les choses au clair, Google dispose d’un brevet où il est écrit noir sur blanc que la mention d’une marque ou d’une citation est un «lien implicite». Ainsi, trouver des gens qui mentionnent votre marque dans les images pourraient vraiment vous donnez un coup de main compte tenu des changements récents. Comme nous pouvons le voir dans la capture d’écran ci-dessous, le processus de recherche des mentions de votre marque peut vraiment améliorer la journée de votre gestionnaire de communication. Le moteur de recherches est non seulement capable de “deviner” le symbole que je cherchais, mais il m’a aidé à trouver facilement les pages qui contiennent l’image nouvelle ou les anciennes mentions de la marque.
C’est aussi un processus utile pour essayer de savoir qui a republié votre image sans votre permission ou sans vous citer. Considérant combien il est facile de reblogger ou de rediffuser une image sans copier également le texte d’accompagnement, il est logique que le crédit soit facilement éliminé en cours de route dans un grand nombre de cas. En outre, il est tout à fait possible qu’une image soit republiée à un rang plus élevé que sa source d’origine. Comme il n’existe aucune possibilité d’automatisation pour ce genre de chose, votre meilleure chance est de garder un œil attentif sur la libre circulation de l’information. Gardez à l’esprit que même si cela semble compliqué pour certaines images, vous pourrez combiner l’image et le texte comme critères de recherche pour une enquête plus affinée. Google ajoute généralement le texte par lui-même, mais il est utile de le guider à certains moments.
Pire encore que quelqu’un qui vole vos dessins ou vos images, certaines personnes vont jusqu’à voler votre idée de logo. Il est donc utile de veiller également à cela. Nous avons recherché un logo et avons abouti à deux entreprises différentes utilisant le même design. Le problème avec les logos, c’est qu’il y a toujours une chance que la partie du logo qui nous intéresse ait elle-même été “intégrée” (ou simplement une partie) à de plus grandes images, qui comprennent du texte intégré ou des graphiques. Si la grande image est indexée et analysée en tant que tel, il y a une chance beaucoup plus élevée que Google ne la renvoie pas comme le meilleur résultat, ou ne la trouve pas du tout. Dans la mesure où la plupart des voleurs de logo volent parce qu’ils sont paresseux, le scénario le plus courant est que le design des logos soit volé en tant que tel et vous pouvez au moins passer au crible les cas les plus flagrants de vol.
Il va sans dire que Google tente de gagner une bataille à long terme contre ceux qui cherchent à manipuler les résultats des recherches à leurs propres fins et offre aux utilisateurs les meilleurs résultats possibles. Google ne cesse de changer ou d’améliorer son algorithme afin de stimuler les webmasters à offrir le meilleur contenu pour leurs utilisateurs. Ainsi, si Google se concentre sur le renforcement du contenu attrayant et pénalise la faible qualité, cela aurait du sens d’appliquer les mêmes règles pour les images et les photos? Google a des standards élevés en matière de contenu original. Cependant, Matt Cutts lui-même le mentionne: il n’y a aucune incidence sur le classement web organique si vous utilisez des images stockées par rapport aux images originales. C’est une contradiction intéressante, la façon dont je vois les choses. N’est-il pas possible que l’algorithme de Google utilise les balises ALT, les légendes des images ou le texte sur des images comme mesure de classement? Matt Cutts essaie de clarifier les choses dans ce domaine, en répondant que «non». Pourtant, le chef de l’équipe anti-spam de Google voit la possibilité que Google mette à jour son algorithme de référencement pour filtrer les images originales. A en juger par la façon dont Google continue la valse des algorithmes, on peut s’attendre à une réaction du public dans un proche avenir vis-à-vis des grands représentants de Google, nous informant que les images sont prises en compte au moment de décider du positionnement.
La meilleure façon de prédire l’avenir est de l’inventer – Alan Kay
Même si vous pourriez avoir dernièrement ignoré la recherche d’images sur Google, cela fait peut-être un certain temps que vous l’utilisez. Vous pouvez non seulement gérer clairement l’activité de votre marque, mais également comprendre la tendance du marché ou la stratégie de vos concurrents. Comme je le disais au début de l’article, Google peut lire et lit probablement les métadonnées intégrées dans les photos. S’en sert-il à chaque fois? L’utilisera-t-il comme un facteur de positionnement dans un avenir proche? Nous ne pouvons pas le savoir avec certitude, mais nous pouvons néanmoins nous y préparer.
En d’autres termes, il vaut mieux être prudent que désolé. Le meilleur moment de prendre soin des images que vous utilisez est maintenant. Dans un avenir proche, Google pourrait pénaliser le contenu pauvre ou dupliqué dans les images ou pourra revoir sa façon de «lire» et de classer les images. Il vaut donc mieux se préparer dès maintenant avant qu’une telle chose se produire, car même si rien ne se passe, vous bénéficierez toujours d’un meilleur contenu.
Toute l'équipe SLAP digital se tient à votre disposition pour vous accompagner dans l'optimisation du SEO de votre site Internet.
Découvrez nos prestationsDécouvrez nos livres blancs spécialisés sur les divers thèmes du marketing digital et téléchargez les gratuitement.
Nos livres blancsArticle
Optimiser ses campagnes Google Ads : Le Guide ultime de la stratégie Feeder en 2 Étapes
Article
Tout comprendre sur le Google Consent Mode V2
Article
Révolutionnez l'Expérience Client grâce à l'IA et l'hyperpersonnalisation
Article
Le référencement vocal : comment optimiser votre site web pour la recherche vocale
Besoin d'un coup de main ?
Vous souhaitez nous faire part de vos projets ou de vos besoins d’accompagnement ?
N’hésitez pas à nous contacter par téléphone au 01 85 08 03 49 ou à remplir le formulaire. Nous vous contacterons rapidement pour en savoir plus. Venez nous challenger, nous en ferons autant !
Contactez-nous