Google搜索中心:https://developers.google.cn/search/docs?hl=zh-cn
Sitemap 站点地图
站点地图是一种文件,您可在其中提供与您网站中的网页、视频或其他文件有关的信息。搜索引擎会读取此文件抓取您的网站。站点地图会告诉搜索引擎您认为网站中的哪些网页和文件比较重要。
应用场景
1、您的网站很大。
2、网站为新网站且指向该网站的外部链接不多。Googlebot 及其他网页抓取工具是通过跟踪网页之间的链接来抓取网页的。因此,如果没有其他网站链接到您的网页,Googlebot 可能发现不了您的网页。
3、您的网站包含大量富媒体内容(视频、图片)或显示在 Google 新闻中。
以下情况无需站点地图
1、网站上的网页数(您认为需要纳入搜索结果中的网页)不超过 500 个。
2、Googlebot 可以沿着首页的链接找到您网站上的所有重要网页。
分类
xml
优点:
可扩展且用途广泛。
它可以提供有关网址的最详细信息。
大多数内容管理系统 (CMS) 会自动生成站点地图,或者 CMS 用户可以找到大量站点地图插件。
缺点:
在大型网站或网址经常改变的网站上维护映射可能会比较复杂。
sitemaps文档:https://www.sitemaps.org/protocol.html
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/foo.html</loc>
<!--<lastmod>反映对网页的最后一次重大更新的日期和时间-->
<lastmod>2022-06-04</lastmod>
</url>
</urlset>
Google 会忽略 <priority> 和 <changefreq> 值。
txt
如果您只想提供网页网址,您可以将它们添加到位于 https://www.example.com/my_sitemap.txt 的文本站点地图中,要确保它的扩展名为 .txt。
优点:
易于执行和维护,尤其是在大型网站上。
缺点:
仅限 HTML 和其他可编入索引的文本内容。
RSS、mRSS 和 Atom 1.0
如果您的 CMS 会生成 RSS 或 Atom Feed,您可以将该 Feed 的网址作为站点地图提交。 但此类 Feed 仅提供近期网址的相关信息。
优点:
大多数 CMS 会自动生成 RSS 和 Atom Feed。
可提供有关您视频的信息。
缺点:
除了 HTML 和其他可编入索引的文本内容之外,它只能提供视频相关信息,而不能提供图片或新闻相关信息。
规范
1、单个站点地图的文件大小不得超过 50MB(未压缩),其中包含的网址数量不得超过 50,000 个。
2、站点地图文件必须采用 UTF-8 编码,站点地图只会影响父级目录中的下级目录。因此,我们建议将站点地图发布在根目录下。
3、请在站点地图中使用完全限定的绝对网址。
/mypage.html(相对网址)
绝对网址:https://www.example.com/mypage.html。
创建站点地图
站点地图中的网址顺序无关紧要。
如果您使用的是 WordPress、Wix 或 Blogger 等 CMS,那么您的 CMS 可能已经向搜索引擎提供了站点地图(搜索:CMS 如何生成站点地图,或者如何创建站点地图)。
如果要创建的站点地图包含的网址比较少,可以手动创建站点地图。
使用工具自动生成站点地图。
将站点地图提交给 Google
1、在 Search Console 中提交站点地图:https://support.google.com/webmasters/answer/7451001?hl=zh-cn。 您可以查看 Googlebot 何时访问了站点地图。
2、使用 Search Console API 程序化地提交站点地图:https://developers.google.cn/webmaster-tools/v1/sitemaps/submit?hl=zh-cn。
3、在 robots.txt 文件中添加:Sitemap: https://example.com/my_sitemap.xml