Google et moi

Même si la plupart des auteurs de blogs prétendent ne pas s'intéresser aux statistiques de visites de leur blog, il paraît que c'est un souci très largement partagé. Moi au moins, je ne me cache de regarder ce que ça donne, quand j'ai le temps.

J'ai bien noté depuis janvier une diminution progressive de tous les indicateurs de visites, que ce soit le nombre de pages chargées, le nombre de visites, le nombre de visiteurs uniques (avec toutes les subtilités techniques qui se cachent derrière ces mots), etc. Dit comme ça, il me semble qu'il est clair que le présent site est de moins en moins intéressant (ou attractif).

Mais ce n'est pas tout à fait le sujet du présent article. J'ai en ce moment un problème avec un public très spécifique et très particulier : google.

Avant le lancement de ce blog, j'ai cherché conseil auprès de quelqu'un qui semblait s'y connaître sur le référencement et autres SEO, qui m'a répondu dans un poste public : Conseils pour améliorer le trafic d'un site web.

Il me semble avoir bien suivi la plupart des conseils donnés sur cette page, dans notre correspondance privée, et chez Google. J'ai un blog qui ne rend pas trop mal en mode texte. J'ai fait bien attention à bien renseigner les balises META robots et keywords. J'ai évité autant que possible la duplication de contenu. J'ai multiplié les liens internes pour faciliter la navigation. J'ai fait une sitemap pour le site. Je me suis inscrite aux Google Webmaster Tools pour renseigner cette sitemap et quelques autres détails. Etc.

Et pourtant, on dirait bien que quelque part j'ai raté quelque chose. Je ne vois absolument pas quoi, c'est pourquoi je vous soumets mon problème ici, dans l'espoir qu'un lecteur expert reconnaisse mon erreur et m'aide à la corriger.

Certes, mon site est bien référencé par google, comme en témoigne une recherche appropriée. Certes, plus de 20 % des visites viennent d'une recherche google. Que demander de plus ?

Déjà, lorsque je fais une recherche textuelle sur une phrase issus d'un de mes articles (pour vérifier que je n'ai pas été victime de plagiat comme Cinnamon), google ne renvoit que planet.komite.net, qui est un agrégateur de blog dont je fais partie. D'ailleurs ce n'est pas sans me donner envie d'arrêter de mettre le contenu complet de mes articles dans le flux ATOM.

Et puis par curiosité, j'ai voulu regarder le pagerank de mon site (ou plus précisément, de la page d'accueil de mon site). Je ne sais pas s'il y a une méthode « officielle » pour le faire, je n'ai trouvé que des sites tiers qui proposaient de le faire, mais le résultat est uniname : 0. Genre soit c'est la dernière merde qu'il existe sur internet, et pour Google renvoyer ça c'est juste l'étape avant ne rien renvoyer, soit il n'est pas encore référencé. En onze mois d'existence, et vu le paragraphe précédent, et vu le nombre de visites du googlebot, il est presque certain qu'il a été bien été référencé.

J'ai voulu aller plus loin, pour diagnostiquer toute seule le problème (le présent article est la preuve que je n'ai pas réussi). J'ai donc été faire un tour sur les Webmaster Tools.

La page d'accueil des Webmaster Tools confirme à quel point c'est pas la joie :

  • Googlebot last successfully accessed your home page on Jul 31, 2007.
  • Warning: No pages from your site are currently included in Google's index. Indexing can take time. You may find it helpful to review our information for webmasters and webmaster guidelines.

Donc ils n'ont pas regardé ma page d'accueil depuis neuf mois, mais c'est normal. Ben voyons. Pour leur décharge, ils parlent peut-être de http://vibrissae.org/, qui n'a effectivement pas changé depuis le lancement de ce site : c'est toujours une redirection sur http://vibrissae.org/fr/. D'ailleurs je me demande si ce n'est pas la source de tous mes maux, en fait.

Et en plus, ils ne trouvent aucune page de mon blog dans leur index. Ce qui est faux, comme l'a déjà montré la recherche appropriée. Il paraît que ce qui est considéré comme vrai est vrai par ses conséquences, et c'en est une belle illustration : toutes les statistiques que peuvent donner ces Webmaster Tools sont vides, aussi bien les erreurs rencontrées que les liens internes que les liens externes que les mots-clés qui y mènent. Du néant on-ne-peut-plus vide.

Bon, je ne sais pas trop si ces résultats sont réellement alarmants ou s'ils sont juste le résultat d'un petit souci technique ; et je ne sais pas non plus s'ils ont une véritable incidence sur le nombre de vraies visites par des vrais humains.

Mais ça m'inquiète assez pour que je veuille en savoir plus sur l'origine de ce problème, et malheureusemenet je n'ai pas réussi à contrainre google à répondre à cette question. C'est pourquoi j'appelle à l'aide mon lectorat, tout indice sur l'origine du problème et/ou sur les mots-clés à donner à google pour avoir une solution seront les bienvenus.

Note personnelle : regarder si Ralphy suit encore mon blog, et le cas échéant lui montrer cet article.

Publié le mardi 22 avril 2008 à 16:10.

Dernière modification le samedi 17 mai 2008 à 13:40.

Catégorie : Site

Commentaires

1. Le mardi 22 avril 2008 à 17:53, par K :

1% des visiteurs viennent sur mon site via google (et j'imagine que c'est google lui même qui vient voir de temps à autre). Cela m'a alarmé 5 minutes et j'ai laissé tomber. J'aurais aimé être plus visible pour que d'autres personnes dans mon cas tombe sur mon blog (comme moi même j'aurais aimé tombé sur un blog du même style, chose que je n'ai jamais trouvé via google, alors que j'imagine bien qu'il doit y en avoir).
20% c'est pas mal. Maintenant faut voir avec quels mots clés ils sont venus.

2. Le mercredi 23 avril 2008 à 14:39, par Keeh :

Je viens de chercher des lignes de cet article sous google, ils ramènent tous ici. Problème résolu depuis la mise en ligne ?

3. Le mercredi 23 avril 2008 à 14:49, par Natacha :

K, pour ce qui est des mots-clés, ce n'est pas encore tout à fait ça : pour le mois d'avril, j'ai une écrasante majorité de vie de merde, un peu d'empathie, des variations sur je suis nulle et des variations sur la fatigue plus ou moins chronique, plus ou moins tyroïdienne, et plus ou moins liée au Séroplex.

Keeh, effectivement, je viens de tester, sur mes six dernières pages publiques, il n'y en a qu'une qui sort Planet KomiTê, les autres donnent le vrai lien de la page. Ce n'était pas le cas hier, pourtant au moins de mon côté, rien n'a changé. Et les problèmes de pagerank et de Webmaster Tools évoqués sont toujours bien présents.

4. Le jeudi 24 avril 2008 à 21:14, par Olivier :

Bonsoir !

Tu dois connaître l'histoire merveilleuse du PR... Le Page Rank, invention incroyable de Google, permettait de classer des pages suivant les liens qu'elles se faisaient entre elles. Bien sûr, maintenant, le PR est quelque peu oublié, mis sous le tapis, car moins important d'avant dans l'algo de Google. Seulement, les liens entrants vers ton site sont encore les plus importants dans les classements de ton site.

Tu peux voir les liens vers ton site avec la commande
link:vibrissae.org

Tu verras que le problème est de taille. Moi, j'ai la chance d'avoir un bon réseau de sites qui me font des liens, et d'être en première page pour des mots-clefs très très concurrentiels, et ça vient très souvent grâce aux liens entrants. En gros, si ton PR est à 0, c'est totalement normal : aucun site ne te fait de liens. Il faut que tu développes des partenariats, un réseau "d'amis" qui te feront des liens contre des liens de toi.

De plus, mets une meta description dans toutes tes pages, il me semble qu'elle manque, et c'est pourtant un bon moyen d'expliquer le contenu de ta page.
Tu sais, je reste persuadé qu'un blog, à part d'une personnalité connue, aura du mal à être très bien classée sur Google. Il y a des millions de blogs, des millions d'histoires, et surtout des milliers de commerciaux riches qui veulent se placer sur tous les mots clefs recherchés par les internautes.
Bonne chance en tout cas :)

5. Le samedi 26 avril 2008 à 20:19, par Martin :

Il faudrait dans un tout premier temps que tu corriges ton "robots.txt" : celui-ci n'est pas standard, ce qui peut gêner certains robots d'indexation des moteurs de recherche.

Ensuite, corrige les défauts (X)HTML de ton site via http://validator.w3.org/ . Même si ce n'est pas une obligation, cela améliorera la compréhensibilité de ton site aux yeux des robots d'indexation, surtout si l'un de ces robots butte sur un défaut quelconque. Par exemple, tu as une balise "p" auto-fermante, alors que je ne crois pas que cela soit valide, d'où une répercussion sur l'ensemble du document, faussant sa compréhension.

Enfin, la cause probable de cette perte de référencement provient sans doute de ta redirection. En effet, tu as mis en place une redirection de type "302", en l'occurrence une redirection temporaire depuis la racine de ton site vers le sous-dossier "fr". Il faudrait une redirection "301" pour que les robots d'indexation la suivent pour de bon.

6. Le mardi 29 avril 2008 à 13:04, par Natacha :

Olivier, je connais d'autres sites qui ont un page-rank, et dont je n'ai pas à envier la quantité de lien. Par exemple, komite.net avec un PR 3 et moins de liens entrants que moi. Alors, pourquoi moi j'en aurais pas ?

Quant au classement d'un blog dans google, je trouve que tu vas un peu vite. Quelle est la différence entre un blog et un site d'un autre type ? Déjà là, c'est loin d'être évident, et si vibrissae.org avait été ce que j'avais voulu, ça n'aurait pas été si évident de savoir de quel côté le placer. Et quand tu en auras fini avec celle-là, dis moi quel système automatisé saura distinguer cette différence.

Cela dit, je n'ai aucune prétension à être bien classée chez Google. Être classée me suffirait amplement.

Martin, quel est le problème exactement avec mon robots.txt ? La seule ligne qu'il contient est le lien vers ma sitemap, conforme aux indications de sitemaps.org, qui sont supportées par tous les "grands" moteurs de recherche, y compris Google dont il est question dans cet article. Le même Google dont l'outil de vérification de robots.txt me dit que tout va bien.

Je n'ai pas de balise autofermante. Le concept même de balise autofermante est complètement étranger à ce site et au XHTML qu'il sert. Je concède que depuis quelques mois j'avais un problème de validité XML, qui est à présent corrigé, mais ce problème d'indexation dure depuis la création de ce site, soit au moins sept bons mois de pages complètement valides.

Pour ce qui est de la redirection, ça m'a l'air plus vraisemblable comme explication, mais on m'a fait croire que le page-rank n'est pas quelque chose lié à site, mais quelque chose lié à une page. Pourquoi cette redirection influencerait-elle toutes les pages du sites, alors que tous les liens pointent sur la cible de la redirection (/fr/) et non sur sa source (/) ?

Parce que sur le plan purement sémantique, il ne s'agit pas d'une redirection permanente. Si je voulais une redirection permanente, je ne mettrais pas de /fr/ dans mes URI, je mettrais directement toutes les pages à la racine. La redirection est là pour faire du content negociation, c'est-à-dire rediriger chaque requête vers l'index dans la langue préférée de l'utilisateur. C'est juste qu'en ce moment il n'y a le choix qu'entre une seule possibilité, mais dans l'idée, une telle redirection qui ne renvoit pas toujours au même endroit est bien un 302 (ou plutôt un 303, mais le support de cette partie de HTTP/1.1 est mal gérée par un navigateur très populaire), et non pas un 301.

Pour la prochaine version de mon blog, je vais peut-être mettre la langue dans un sous-domaine plutôt que dans un répertoire, mais il faudra quand même fatalement une redirection pour les requêtes sans sous-domaine et celles sur le sous-domaine www.

7. Le mardi 29 avril 2008 à 22:06, par Martin :

@Natacha : En effet, le PageRank n'est pas lié à un site, mais à une page. Néanmoins, si tous tes liens externes pointent à la racine du site, et aucun vers les autres pages de contenu, et que la racine redirige vers une page du site via une redirection temporaire, je crains que le référencement de ces pages internes au site ne soit compromis.

Pour ce qui est du robots.txt, j'avoue n'avoir encore jamais remarqué ni utilisé la notation qui est la tienne, à savoir l'indication du chemin du fichier sitemaps.xml. Mais si tu es sûre de ton coup, alors je m'incline. Disons que dans le web, j'aurais tendance à penser qu'il est préférable de miser sur les habitudes plutôt que sur les standards au sens strict, tout en respectant ces derniers. En effet, compte tenu de la nature collaborative du net et de la quantité des bugs que nous insérons tous dans nos programmes, il est bon de niveler par le bas, en matière de compatibilité...

8. Le jeudi 1 mai 2008 à 18:09, par Olivier :

Ok Natacha, 1 point pour toi. Komité a un PR3 pour 0 lien entrant. Je vais réfléchir à la question, ça me paraît surprenant. Sache quand même que le PR affiché est un gadget, qu'il existe des scripts pour afficher le PR que tu veux, et que je connais des gens qui se sont mis un petit PR10 sur leur site, pour rire. Là, je ne sais qu'en penser. De toute façon, le PR n'influe en rien sur le positionnement sur Google. Ce n'est donc pas de ce côté-là qu'il faut vraiment chercher.

Pour la redirection, j'avoue être un peu sceptique aussi.

Pour le classement du blog, c'est pas parce que c'est un blog. C'est à cause de la constitution d'un blog... Mais je te rassure, c'est pareil pour les petits sites. Déjà un blog, il y a peu de gens qui les lient, pour la simple et bonne raison qu'il y en a des milliards sur Terre, et qu'ils ne sont que rarement les cibles de liens naturels. Tu verras rarement "Plus d'information sur le blog machintruc", à part pour des blogs très spécialisés. L'outil Google pour voir les liens ne marche plus, en fait. Il donne des chiffres rocambolesques, ne tient plus compte de tout. Bref, il devient difficile de regarder qui nous a fait un lien, sauf grâce à tes outils de statistiques, et les fameux référents.

De plus, un blog contient peu de pages, donc moins de chance d'avoir un nombre de mots clefs conséquents. C'est pas pareil qu'un forum généraliste, avec 30 nouveaux sujets par jour, donc un nombre de pages conséquent. Par exemple sur un de mes sites, j'ai 7800 pages indexées. Et je peux te dire que le nombre de mots-clefs provenant de ces pages est très important.
Ca entraîne ce qu'on appelle la "traînée", c'est-à-dire un nombre substantiel de visiteurs qui arrivent avec des mots-clefs rares, mais sur lesquels le site est placé.
C'est un peu l'unique chance d'un blog à mes yeux, à part en développant une politique de partenariat importante, et en sautant sur des mots-clefs buiseness qui marchent quelques jours : cindy sander, laure manaudou à un moment, ou "casse-toi pauvre con", des choses du genre.

Bref, je sais que tu ne seras pas forcément d'accord avec tout ce que je te raconte, mais j'essaye de te faire passer une partie de mon expérience en référencement. Personne n'y comprend tout, mais on a parfois la chance de se retrouver bien placé. Juste une question : as-tu des mots-clefs sur lesquels tu tentes de te placer ?

10. Le jeudi 29 mai 2008 à 4:11, par ralphy :

Concernant les liens entrants, ne vous fiez pas juste à une requête "link:" sur nu moteur de recherche. Chez Google, ils proposent des outils pour webmasters qui semblent (j'insiste sur "semblent" employé à la place de "sont") exhaustifs.

Copyright © 2007-2008 Natacha Kerensikova

Lithium Blog - commit dad867adc7a3fc6476990c37fcfa09685831b7d9 - Thursday 7 February 2008