Comment Google voit-il mon site quand son robot passe sur mes pages ?

Votre site avec les yeux de Lynx

5mai2008

«Les règles du W3C comme vous faites état dans votre document, je m’en fiche.
Ce qui compte c’est que vous créiez un site de qualité et que vous mettiez en valeur notre contenu.
De par mon expérience personnelle, l'aspect compte plus que la technique. »

C’est ainsi que le responsable informatique d’une PME de ma région a ce matin réagi à ma proposition.
J’étais décontenancé.

Présomptueux, je n’avais, à l’issue de notre premier entretien en présence du dirigeant, considéré que l’objectif commercial : celui de générer du trafic et celui d’acquérir de nouveaux clients.
Or, un concurrent —qui est loin d’être manchot d’ailleurs— leur a montré ses réalisations en Flash et fait une proposition sur une approche très « plaquette ».
Je lui ai bien sûr objecté qu’un site en Flash uniquement n’était pas très pertinent par rapport à leurs objectifs de référencement.
Y avait-il dans sa proposition une version HTML alternative pour que les moteurs de recherche indexent le contenu ?

Je me suis lancé alors dans des explications que je n’avais pas élaborées ne m’attendant pas à devoir défendre mon bout de gras sur la nécessité de disposer d’un code lisible par les moteurs de recherche :

Qu'est-ce que le balisage sémantique ?

Les spécifications du HTML comprennent un certain nombre de balises qui ont une fonction « sémantique ».
Elles apportent des indications précieuses sur l’organisation du contenu par le sens qu’elles produisent à la fonction des éléments balisés.
Ces balises sont prises en compte par les moteurs : un contenu balisé comme un titre se verra donc reconnaître un poids plus fort, parce qu'un titre est censé résumer le contenu qui le suit. Le robot du moteur de recherche lira le site comme on lit un livre —lui expliqué-je— structuré par chapitres, titres, sous titres, paragraphes etc.
La balise title doit décrire ce dont parle votre page.
Les titres et sous-titres devraient ainsi utiliser les balises h1 à h6.
Les paragraphes, la balise p.
Les listes et menus, les balises ul et ol.
Les emphases enfin, la balise strong ou em.

C’est donc dès la conception du site qu'il faut penser à sa structuration ; le contenu et le design prennent ensuite le relais conclue-je.

C’est sur le chemin de retour que je me suis interrogé : comment faire comprendre simplement la manière dont les robots indexent un site ?
Google est notre ami disent certains et il m’a apporté la réponse : Lynx !
Les robots voient les sites avec le même regard que le navigateur web qui porte le nom de Lynx.

Ce navigateur est un navigateur en mode texte. Il ne voit que le contenu : toute la couche du design (images, couleur, mise en page css, fonctionnalités de navigation javascript... etc.) est ignorée.

Ce sera ma réponse *.

Ressources

* Ce fut ma réponse. Cet article a été publié en fait il y a 1 an sur un autre blog.

Ils ont dit :

1

funlw65 le 07.05.2008 @ 13:59

Mr.Sven, I`m using pretty captcha in Codie style. Look at my current package. There I have implemented 4 captcha systems, selectable from control panel. Also, I have akismet.

Akismet is for spam manually introduced.
Here is my package (...)

2

Philippe le 07.05.2008 @ 15:27

Okey dokey Dude Fun.
I'm gonna try your code in the next few days.
Thanks for helping to kick out those bloody spammers.
Truly yours.

3

funlw65 le 10.05.2008 @ 01:32

Other www text browsers:

elinks, w3m, links2, netrik.

All are available under Ubuntu Linux. Netrik can show also images.

4

funlw65 le 10.05.2008 @ 01:35

Sorry, not netrik, links2 can show also images.


En 2 mots
  • hiseo
    est le site d'un prestataire indépendant en stratégie et marketing Web BtoB.
    Concepteur Rédacteur Web, j'aide les entreprises dans leurs projets de communication et les accompagne dans la réalisation de leurs objectifs.
    Mais qui suis-je ? (...)
  • Adresse :
    27780 Garennes
    France
  • Courriel :

© Hiseo 2007 - 2010

Fil RSS

Articles du blog les plus lus

Écrire pour le Web Être lisible pour être visible. Voici les enjeux du référencement naturel (ou référencement organique)...

L'optimisation du contenu rédactionnel »

Savoir rédiger [1] À l’école vous étiez mauvais en dissertation ? Les difficultés de notre langue vous ont dégoûté d’écrire ? Rassurez-vous...

Écrire pour convaincre »

Choisir son CMS [2] Vous avez maintenant défini vos objectifs et constitué une équipe motivée. Nous l'avons vu, la création ou la refonte d’un site...

Avez-vous besoin d'un CMS ? »

HTML : un langage descriptif L'Histoire de l'écrit nous enseigne que le texte est découpé en éléments distincts (titre, sous-titre, paragraphe, note, etc.)...

Respecter la sémantique des balises »

Les origines de l'hypertexte et du Web L'histoire du Web en 3 parties : le panthéon du Web de Diderot à Berners Lee. Comment des rêveurs ont dessiné le Web...

L'Histoire du Web »