robots.txt的作用是什么,看完了我默默加在了自己网站上

news2025/1/11 15:06:14

文章目录

  • 背景
  • robots.txt的主要作用
  • 使用示范
    • User-agent
    • Disallow
    • Allow
    • Sitemap
  • 总结


背景

最近在研究网站SEO相关的东西,第一次接触到robots.txt,才发现实际上很多网站都用到了它,尤其是对搜索引擎依赖特别高的C端系统或者网站,是一个必不可少的配置。
在这里插入图片描述

通过使用robots.txt文件控制搜索引擎爬虫的访问,可以优化SEO策略。例如,网站中某些页面可能没有足够的价值或含有重复内容,这时可以通过在robots.txt文件中排除这些页面来避免影响SEO排名。此外,通过插入Sitemap指令在robots.txt文件中,可以帮助搜索引擎更好地了解网站架构和内容。

那么如何真正的把robots.txt应用起来,把我们自己的网站SEO上做的更加优化,相信下面的内容值得一看。看之前记得三连一波。

robots.txt的主要作用

robots.txt是一个文本文件,通常位于网站的根目录下,用于告诉搜索引擎蜘蛛(也称爬虫)哪些页面可以被抓取,哪些页面不应该被抓取。它包含了一些指令,用于限制蜘蛛的访问范围,以及提供关于网站内容的其他有用信息。
在这里插入图片描述

具体来说,robots.txt的主要作用如下:

  • 控制搜索引擎蜘蛛的访问:网站所有者可以通过robots.txt文件控制搜索引擎蜘蛛的访问,以限制蜘蛛只抓取特定的页面或目录,从而避免不必要的带宽消耗和服务器负载。

  • 隐藏敏感页面:网站所有者可以使用robots.txt文件来阻止搜索引擎抓取某些敏感页面,例如账户管理、登录等页面,以避免这些敏感页面被搜索引擎收录和暴露在公共搜索结果中。

  • 提高SEO效果:通过robots.txt文件,网站所有者可以指示搜索引擎如何处理网站内部链接和外部链接,从而提高SEO效果。

  • 给搜索引擎提供重要信息:在robots.txt文件中,网站所有者可以提供其他有用的信息,例如Sitemap的地址、Crawl-delay(抓取时间间隔)、Host等信息,以帮助搜索引擎更好地理解和处理网站内容。

robots.txt文件对于网站所有者来说是一个非常重要的工具,它可以帮助网站实现自己的SEO目标,同时也可以保护敏感的页面不被搜索引擎收录和公开。

使用示范

说了这么多,应该怎么使用呢,一般来说robots.txt直接放置于网站根目录下面,比如说nginx配置的root /usr/share/nginx/html,那么把它放于html文件下即可。并且要求通过域名能够直接访问到它,搜索引擎会解析到这个文件。就能够知道哪些是我们自己网站下面重点需要被收录的网页,哪些是不要被收录的。

User-agent

这个配置项用于指定搜索引擎的蜘蛛类型,可以具体到某个搜索引擎的蜘蛛(如 BaiduSpiderboochGooglebot等),也可以使用通配符*代表所有类型的蜘蛛。

User-agent: *
Disallow: /private/

在上面的例子中,*表示所有类型的蜘蛛,Disallow指示不允许搜索引擎抓取/private/目录下的所有页面。

Disallow

这个配置项用于指定不允许搜索引擎抓取的页面或目录。例如:

User-agent: *
Disallow: /admin/
Disallow: /private/

在上面的例子中,不允许搜索引擎抓取/admin//private/两个目录下的所有页面。

Allow

这个配置项用于指定允许搜索引擎抓取的页面或目录。和Disallow相反,Allow指示某个目录下的某些页面是允许被搜索引擎抓取的。

Sitemap

这个配置项用于告诉搜索引擎网站地图的位置,以便引导搜索引擎更快地找到网站的所有页面,提高抓取效率。

下面是一个简单综合的robots.txt配置文件示例:

User-agent: *
Disallow: /admin/
Disallow: /private/
Allow: /public/
Sitemap: http://www.example.com/sitemap.xml

上面的示例中,*表示所有类型的蜘蛛,Disallow指示不允许搜索引擎抓取/admin//private/两个目录下的所有页面,Allow指示/public/目录下的页面可以被搜索引擎抓取,Sitemap指示网站地图的位置。


总结

以上就是本篇所讲解的内容,robots.txt的作用是什么,看完了我默默加在了自己网站上,后面会分享更多有深度的相关内容,记得先点个关注不迷路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/629795.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

论文解读:SuperGlue: Learning Feature Matching with Graph Neural Networks

SuperGlue: Learning Feature Matching with Graph Neural Networks 发表时间:2020 论文地址:https://arxiv.org/abs/1911.11763 项目地址:http://github.com/magicleap/SuperGluePretrainedNetwork。 本文介绍了一种通过联合寻找对应和拒绝…

Git介绍及安装

⭐作者介绍:大二本科网络工程专业在读,持续学习Java,努力输出优质文章 ⭐作者主页:逐梦苍穹 ⭐所属专栏:Git ⭐如果觉得文章写的不错,欢迎点个关注一键三连😉有写的不好的地方也欢迎指正&#x…

通往AGI之路;首个自研全开源自然语言低代码 GPT 应用快速开发框架PromptAppGPT

🦉 AI新闻 🚀 商汤科技将发布元萝卜AI下棋机器人新品(围棋版) 摘要:商汤科技将于6月14日召开元萝卜AI下棋机器人新品发布会,预计会发布下棋机器人(围棋版)。这款AI下棋机器人融合了传统围棋文化和人工智能技术,拥有落…

论文解读:Segment Anything

Segment Anything 发表时间:2023 论文地址:https://arxiv.org/abs/2304.02643 项目地址:https://github.com/facebookresearch/segment-anything 介绍了Segment Anything(SA)项目:一个新的任务、模型集和…

ViT 论文逐段精读——B站up:跟李沐学AI讲解笔记

https://www.bilibili.com/video/BV15P4y137jb Vision Transformer 挑战了 CNN 在 CV 中绝对的统治地位。Vision Transformer 得出的结论是如果在足够多的数据上做预训练,在不依赖 CNN 的基础上,直接用自然语言上的 Transformer 也能 CV 问题解决得很好…

PotPlayer结合alist播放网盘视频

目录 1. PotPlayer的下载安装2. 新建专辑3. 测试播放视频总结 欢迎关注 『发现你走远了』 博客,持续更新中 欢迎关注 『发现你走远了』 博客,持续更新中 书接上文 AList挂载工具安装搭建使用教程,快速访问多个网盘的资源(保姆级图…

12-git-pycharm配置.ignore文件

pycharm配置.ignore文件 前言安装插件使用添加其他忽略文件 前言 在开发中经常需要配置提交git的忽略文件,本篇来学习下使用pycharm自动生成.ignore文件 安装插件 Files->setting->Plugins,搜索ignore 使用 右键项目根目录,新建.…

AI大模型私有化部署流程

私有化部署AI大模型需要一定的GPU支持,适合有一定经济实力的公司,今天和大家分享一下如何进行私有化部署,这涉及很专业的知识,包括硬件和软件环境、模型部署、API集成、测试验证等,这里只是初步讨论一下,希…

chatgpt赋能python:Python分词:从原理到实践

Python分词:从原理到实践 分词是自然语言处理中的关键步骤之一,它是指将一句话或一段文本分成若干个词语(token)并进行标注。Python作为一种非常流行的编程语言,具备强大的文本处理能力,而分词也是它的强项…

chatgpt赋能python:Python函数调用函数

Python函数调用函数 Python中的函数是一组可重用的代码,用于执行特定的任务。当我们需要在一个程序中执行类似的操作多次时,就可以定义一个函数来完成该操作,这样可以减少重复代码,使程序更加易读、易维护。 在Python中&#xf…

OpenCV实战——提取视频中的前景对象

OpenCV实战——提取视频中的前景对象 0. 前言1. 提取视频中的前景对象2. 混合高斯方法3. 完整代码相关链接 0. 前言 当固定摄像机观察场景时,背景基本保持不变。在这种情况下,我们真正感兴趣的目标是场景中的移动物体。为了提取这些前景物体&#xff0c…

关系数据模型

1.键的概念 超键:在一个关系中,能唯一标识元组的属性或属性集(可能存在多余的属性) 侯选建:如果一个属性集能唯一标识元组(超键),且又不含有多余的属性,那么这个属性集…

C#,码海拾贝(40)——求解“线性最小二乘问题”的“豪斯荷尔德Householder变换法”之C#源代码

using System; namespace Zhou.CSharp.Algorithm { /// <summary> /// 求解线性方程组的类 LEquations /// 原作 周长发 /// 改编 深度混淆 /// </summary> public static partial class LEquations { /// <summary> /…

6月9日复盘总结|8H30min|7:30-7:50

7:20-8:10 乐词*93 【50min】 8:20-9:20 背书 【1h】 9:20-10:20 词汇笔记 【1h】 10:20-11:00 词汇笔记 【50min】 11:00-12:10 去上马吃饭啦 12:20-13:00 不背单词 【40min】 13:00-13:30 收作业 13:30-14:30 午休♨️ 14:40-15:59 不背单词 *1…

node.js的http模块

http模块 http协议:超文本传输协议&#xff08;互联网应用最广泛的协议之一&#xff09; http请求方法&#xff1a; get获取数据 post新增数据 put/patch更新数据 delete删除数据 head/options/connect/trace URL统一资源定位符&#xff0c;其本身也是一个字符串。 客户端与…

chatgpt赋能python:Python运算简介:从基础运算到高级应用

Python运算简介&#xff1a;从基础运算到高级应用 Python是一种优秀的编程语言&#xff0c;它能够进行各种运算&#xff0c;从简单的加减乘除到高级的科学计算和模拟。在这篇文章中&#xff0c;我们将介绍Python的各种运算方式&#xff0c;并向您展示如何使用它们来进行一些最…

chatgpt赋能python:Python怎么免费用的?

Python 怎么免费用的&#xff1f; Python 是一种高级编程语言&#xff0c;自带简洁优美的语法和强大的开发库。因此&#xff0c;它成为了各种应用程序、网站和服务的主要编程语言之一。如果你对编程语言有些了解&#xff0c;那么你应该知道 Python 很适合开发各类工具、脚本和…

SpringBoot整合MongDB

文章目录 1. MongoDB概述2. MongoDB安装3. MongoDB快速入门3.1 数据库以及表的操作3.2 新增数据3.3 更新数据3.4 删除数据3.5 查询数据3.6 索引3.7 执行计划 4、SpringBoot整合MongoDB4.1 环境搭建4.2 新增文档4.3 查询文档4.4 更新文档4.5 删除文档 人生哪能多如意&#xff0c…

黑马Redis视频教程高级篇(安装Canal)

目录 1、开启MySQL主从 1.1、开启binlog 1.2、设置用户权限 2、安装Canal 2.1、创建网络 2.3、安装Canal 1、开启MySQL主从 Canal是基于MySQL的主从同步功能&#xff0c;因此必须先开启MySQL的主从功能才可以。 这里以之前用Docker运行的mysql为例&#xff1a; 1.1、开…

chatgpt赋能python:如何将Python切换成中文界面

如何将Python切换成中文界面 Python 是一门非常受欢迎的编程语言&#xff0c;有着强大的编程能力和广泛的应用范围。一些朋友可能需要在中文环境下使用 Python&#xff0c;但是默认的 Python 界面是英文的&#xff0c;这给一些初学者带来了不便。本文将介绍如何切换 Python 的…