
Sitemap.xml 站点地图是向搜索引擎提供网站 URL 列表和额外元数据(如上次修改时间、更改频率)的指南文件。
Sitemap 不应包含什么?
技术 SEO 的核心原则之一是保持站点地图的“清洁”。站点地图中不应包含:
- 已使用
noindex标记的页面。 - 被
robots.txt阻止抓取的页面。 - 重定向(3xx)或返回错误(4xx/5xx)状态码的 URL。
- 重复或低价值的内容页面。
大型网站的 Sitemap 分割:
如果您的网站拥有超过 50,000 个 URL,或者文件大小超过 50MB,则必须进行分割。您可以创建多个 Sitemap 文件,然后在一个 Sitemap Index File 中引用它们。
关键点: 虽然 <priority> 和 <changefreq> 标签在过去很常用,但现代搜索引擎(尤其是 Google)已基本忽略它们。重点应放在提供所有规范的、可索引的 URL。
