Meta Robots 详解

78 阅读2分钟

Meta Robots 详解

UEditor是由百度web前端研发部开发所见即所得富文本web编辑器

Linux系统配置SSL指南

MeiliSearch是一个快速、开源的全文搜索引擎-宝塔

SimpleDocker 是一个轻量级 Docker 管理工具

如何配置边缘脚本规则

如何配置源站响应的缓存策略

CDN客户端缓存策略配置指南

如何配置强制内容重新验证?

Meta Robots 详解

MetaRobots详解

参考资料

  1. Robots.txt disallow

  2. robots.txt 参数设置

  3. robots.txt 禁止所有

  4. 搜狗资源平台

  5. 优化robots.txt提升搜索抓取效率

  6. robots.txt文件

  7. robots.txt怎么看

  8. 360站长平台

Meta Robots 详解

Meta Robots 详解

1. 什么是 Meta Robots?

是 HTML 的元标签,用于控制搜索引擎爬虫如何索引和跟踪网页内容

2. 如何设置 Meta Robots?

在网页的 部分添加以下代码:

其中 content 属性可包含多个指令,用逗号分隔。

3. 常用 Meta Robots 指令及示例

指令

作用

示例

index

允许搜索引擎索引该页面

noindex

禁止搜索引擎索引该页面

follow

允许爬虫跟踪页面上的链接

nofollow

禁止爬虫跟踪页面上的链接

none

等同于 noindex, nofollow

noarchive

禁止搜索引擎缓存页面快照

nosnippet

禁止在搜索结果中显示摘要

notranslate

禁止自动翻译该页面

noimageindex

禁止索引页面上的图片

unavailable_after:[date]

在指定日期后停止索引

4. 常见组合示例

① 允许索引和跟踪链接(默认)
② 禁止索引但允许跟踪链接
③ 允许索引但禁止跟踪链接
④ 完全禁止索引和跟踪
⑤ 禁止缓存和摘要

5. 注意事项

  • 优先级meta robots 的优先级低于 robots.txt,但高于搜索引擎的默认行为。

  • X-Robots-Tag:在 HTTP 头部也可以设置类似规则(适用于动态页面)。

  • 搜索引擎兼容性:大多数主流搜索引擎(Google、Bing、百度)都支持 meta robots

6. 实际应用场景

禁止收录登录页、隐私政策页noindex
允许收录但阻止权重传递index,nofollow
禁止缓存敏感内容noarchive
设置页面过期时间unavailable_after

这样设置后,搜索引擎会按照你的指令处理网页。