Le google sitemap (plan de site en anglais) est en faite juste un plan de votre site optimisé au format XML. Vous allez me dire : mais pourquoi XML ? Parce que c'est un format mondialement reconnu et très facile à gérer. (si si, je vous assure).
Pour l'instant, votre page sitemaps.xml ne peut pas comporter plus de 50 000 pages ou encore doit faire moins de 10mo. (la plupart d'entre vous ont de la marge hein non?) . Le fichier peut être compressé au format gzip. Le fichier xml doit être au format UTF-8.
Information importante : si vous n'avez pas un compte sitemap google, il vous faut en créer un. Une fois que vous avez votre compte google, allez sur ce lien, connecté vous, et ajouter l'url ou ce trouve votre site sitemap.xml.
Pour les sites qui ont pas de page dynamiques en php ou autre et une architecture simple, il suffit de créer une lecture de l'arborescence de votre site en PHP (ou python pour les courageux). Un script déjà fais pour ceci peut être télécharger ici : http://enarion.net/google/. Il génère même le fichier XML au bon format ^^.
Si vous avez un site plus complexe, voir avec de l'url rewriting, vous pouvez faire la même chose bien sur, en utilisant des cas de figures pour chaque module de votre site, mais, j'ai trouvé ça long à faire (oui, un peut fainéant des fois). Pour trouver une méthode que je trouve aps mal du tout pour les assès gros site : création de votre google sitemap.
N'hésiter pas à en parler sur le forum si vous avez des problèmes.
Voici un exemple de Sitemap (plan de site) au format XML. Cet exemple contient qu'un petit nombre de lien qui sont identifiés grace à la balise XM loc. Divers attributs supplémentaires sont possibles. Vous pouvez aussi regarder le sitemap de graphiks.net.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.yoursite.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=12&desc=vacation_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=73&desc=vacation_new_zealand</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=74&desc=vacation_newfoundland</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=83&desc=vacation_usa</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>
Caractère |
Formes échappés |
||
Entités |
Codes caractères |
||
| ET commercial | & |
& |
& |
| Quote simple | ' |
' |
' |
| Quote double | " |
" |
" |
| Plus grand que | > |
> |
> |
| Plus petit que | < |
< |
< |
changefreq
Attribut optionel. Il indique la fréquence auquelle la page peut être mis à jours. La valeur doit être une de ces valeur : "always" (toujours), "hourly" (par heure), "daily" (par jours), "weekly" (par semaine), "monthly" (par mois), "yearly" (par an), "never" (jamais). La valeur "always" doit être utilisé que pour des document qui change à CHAQUE fois qu'ils sont visité. la valeur "never" devrai être utilisé pour les pages archives.
Exemple : <changefreq>monthly</changefreq>
lastmod
Attribut optionel. L'heure où la page a été modifiée pour la derniere fois. Vous edvrez utiliser le format ISO 8601; par exemple : 2004-09-22T14:12:14+00:00. Vus pouvez omettre la partie au format ISO 8601; par exemple : 2004-09-22 est aussi valide. Ce format évite aux bot de revenir voir les pages qui n'ont pas changés.
Exemple : <lastmod>2005-02-21</lastmod> ou <lastmod>2005-02-21T18:00:15+00:00</lastmod>
loc
Attribut obligatoire ! Contient une url qui doit être <= 2048 caractères.
Exemple : <loc>http://www.yoursite.com/catalog?item=1&desc=vacation_hawaii</loc>
priority
Attribut optionel. La prioritée d'une page en particulier par rapport aux autres page du site. la valeur de cette attribut est un nombre entre 0.0 et 1.0 où 0.0 est la valeur la plus basse et 1.0 est la plus haute.
La priorité par défaut est 0.5. La priorité assigné à une page n'a aucune influence sur la positions de votre site durant une recherche. Les moteurs de recherchent se servent de la priorité quand ils doivent choisir entre plusieur urls sur le même site pour pouvoir amélioré le résultats de la recherche.
Il faut aussi noter que si vous attribué une très haute valeur à TOUTE vos page, ça reviendra à laisser la priorité à 0.5 car la priorité est relative. La valeur ne sera pas comparé avec une apge sur un autre site.
Exemple : <priority>0.7</priority>
Nous - Plan du site - Informations légale - Contact - © Graphiks.net