WebToDate/Generování sitemap.xml/O produktu

Z WebToDate
Verze z 4. 7. 2011, 14:35, kterou vytvořil Jardac (diskuse | příspěvky) (Založena nová stránka: Category:WebToDate Generování sitemap.xml == Co je sitemap.xml == Soubor ''sitemap.xml'' slouží k publikaci jednoduchého seznamu URL daného webu k indexaci vyhled…)
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)
Skočit na navigaciSkočit na vyhledávání

Co je sitemap.xml

Soubor sitemap.xml slouží k publikaci jednoduchého seznamu URL daného webu k indexaci vyhledávacími stroji jako je např. Google. Tento seznam adres slouží v podstatě jako nápověda pro indexování, neznamená např., že jiné adresy než uvedené v tomto seznamu nebudou indexovány.

Je pro něj definován XML formát popsaný např. na http://en.wikipedia.org/wiki/Sitemaps resp. http://www.sitemaps.org, musí být v kódování utf-8. Maximální velikost souboru může být 10 MB a může obsahovat max. 50 000 adres, pokud je vyžadován větší rozsah, lze to řešit přes sitemap index (http://en.wikipedia.org/wiki/Sitemap_index), který pak obsahuje seznam jednotlivých sitemap.

Umístění tohoto souboru lze buď sdělit vyhledávači pomocí příslušných nástrojů daného vyhledávače (např. Google Webmaster Tools) nebo uvést jeho umístění v souboru robots.txt (pomocí řádku Sitemap: <sitemap_location>).

Formát souboru je následující:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
   <loc>http://VaseDomena/</loc>
   <lastmod>2008-05-14T14:20:29+01:00</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.5</priority>
  </url>
</urlset>

Užívané XML elementy jsou:

  • <urlset>: Zapouzdřuje soubor a odkazuje na aktuální standard protokolu.
  • <url>: Nadřazená značka pro každou zadanou adresu URL.
  • <loc>: Adresa URL stránky musí být v absolutním tvaru
  • <lastmod>: Datum poslední změny souboru ve formátu W3C pro datum a čas (viz http://www.w3.org/TR/NOTE-datetime).
  • <changefreq>: Předpokládaná frekvence změn stránky. Tato hodnota je základní informací pro vyhledávače a nemusí přesně odpovídat tomu, jak často budou stránku procházet. Možné hodnoty jsou
  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never
  • <priority>: Priorita dané adresy URL ve vztahu k ostatním URL adresám na vašem webu. Rozmezí platných hodnot je 0.0 až 1.0.

Povinné elementy jsou <urlset>, <url> a <loc>, ostatní jsou nepovinné.

Formát souboru sitemap index je:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.example.com/sitemap1.xml</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap2.xml</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
</sitemapindex>

Všechny elementy kromě <lastmod> jsou povinné.

Základní vlastnosti produktu

Co rozšíření umožňuje