WordPress网站的robots文件代码怎样写比较好

news2025/1/14 1:17:50

本文记载和介绍的是wordpress的robots.txt的在哪儿?以及如何修改robots文件来禁止搜索引擎爬取/ajax目录下的文章。以及如何优化WordPress网站的robots文件

wordpress设置robots文件的目录:/wp-includes/functions.php,然后搜索do_robotstxt,大概在1699行。

在functions.php中,wordpress默认设置的robots文件是:

$output = "User-agent: *\n";
    $public = get_option( 'blog_public' );

    $site_url = parse_url( site_url() );
    $path     = ( ! empty( $site_url['path'] ) ) ? $site_url['path'] : '';
$output  .= "Disallow: $path/wp-admin/\n";
$output  .= "Allow: $path/wp-admin/admin-ajax.php\n";
  • 第一个output变量是允许所有的蜘蛛爬取页面,
  • 第二个output变量是禁止爬取/wp-admin/目录下的所有文件,
  • 第三个则是允许爬取/wp-admin/admin-ajax.php文件。

如果需要修改wordpress默认的robots禁止蜘蛛爬取某一个文件目录,这个时候直接再写入一个output变量,后面再写入需要禁止的目录名称即可。我需要禁止ajax目录,直接写入一个output变量,禁止爬取ajax目录就OK了。

关于wordpress的robots.txt文件在哪儿?wordpress修改robots文件的方法一文就记载到这,后续将观察禁止蜘蛛爬取ajax目录后,百度会不会继续收录此类目录下的页面。

下面小编整理的一些WordPress网站的robots.txt内容参考:

User-Agent: * (*星号,表示允许所以的搜索引擎蜘蛛)

Disallow: /wp-admin/ (disallow 表示不允许,不允许爬取/wp-admin/核心文件目录)

Disallow: /wp-includes/ (不允许爬取/wp-includes/核心文件目录)

Disallow: /wp-content/plugins (不允许爬取wordpress插件目录)

Disallow: /wp-content/themes (不允许爬取wordpress主题目录)

Disallow: /plus/ad_js.php (不允许爬取这个PHP文件)

Disallow: /plus/posttocar.php

Disallow: /anli/weixin (其它目录)

Disallow: /themes

Disallow: /get_activation

Disallow: /*?* (不允许蜘蛛爬取URL中带问号的链接)

Disallow: /*&* (不允许蜘蛛爬取URL中带&的链接)

Disallow: /*.rar (不允许蜘蛛爬取rar后缀的文件)

Disallow: /*.zip (不允许蜘蛛爬取zip后缀的压缩文件)

Sitemap: http : //xxx . com/sitemap.html (允许蜘蛛爬取网站静态地图)

Sitemap: http : //xxx . com/sitemap.xml (允许蜘蛛爬取sitemap网站地图)

robots.txt代码的规则还是非常简单的,就那么几个关键词:

User-Agent(搜索引擎蜘蛛名)、

Disallow(不允许)、

Allow(允许)、

Sitemap(指定网站的地图文件)。

如果我们只想让百度蜘蛛爬取我们的wordpress网站,而不让其它的搜索引擎蜘蛛进我的网站爬取,我们可以把上面代码中的User-Agent:* 修改成 User-Agent:baiduspider

另外,“Disallow: /wp-admin/” 与 “Disallow: /wp-admin”也表示不同的意思,虽然后面的只少了一个斜杠。“Disallow: /wp-admin/”表示禁止搜索引擎蜘蛛爬取网站wp-admin目录下的目录,但include目录中的文件仍然可以爬取;而“Disallow: /wp-admin”表示禁止搜索引擎蜘蛛爬取网站wp-admin整个目录,包括其下的所有文件。

如果想禁止搜索引擎蜘蛛爬取全站,可以用 Disallow: / ;

如果想允许搜索引擎蜘蛛可以爬取全站,可以用Allow:/;

如果想禁止搜索引擎蜘蛛爬取wordpress网站的全部PHP文件,可以用Disallow: /*.php 。

以上就是我们今天介绍的所有内容——如何为我们的wordpress网站添加robots.txt文件?每一个wordpress网站,可能的限制不一样,所以,我们都要根据自己网站情况,做出相应的修改,以达到最佳效果。注意:Disallow: /可千万要小心用哦,除非在我们wordpress网站的建站初期——网站还在建设当中,不希望搜索引擎来打扰。但一定要记住,等网站做好了,一定要去掉这个Disallow: / 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/679238.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【雕爷学编程】Arduino动手做(123)---Multi-function扩展板

37款传感器与执行器的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止这37种的。鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的&am…

随机数检测(一)

随机数检测(一)- 随机数自测试概述 1 概述2 产品形态划分和检测项目3 测试方式3.1 概述3.2 单比特频数检测方法3.3块内频数检测方法 1 概述 随机数发生器设计完成后,使用随机数发生器的产品需对其执行测试,防止应用过程中产生不合…

Redis的数据类型及对应的数据结构(二)

接上篇:Redis的数据类型及对应的数据结构(一)_鱼跃鹰飞的博客-CSDN博客 本篇主要讨论剩下的几种数据结构的应用场景 应用场景 集合的主要几个特性,无序、不可重复、支持并交差等操作。 因此 Set 类型比较适合用来数据去重和保…

卧剿,6万字!30个方向130篇!CVPR 2023 最全 AIGC 论文!一口气读完。

一杯奶茶,成为 AIGCCV 视觉前沿弄潮儿! 25个方向!CVPR 2022 GAN论文汇总 35个方向!ICCV 2021 最全GAN论文汇总 超110篇!CVPR 2021 最全GAN论文梳理 超100篇!CVPR 2020 最全GAN论文梳理 在最新的视觉顶会 C…

Java多重捕获块

try块后面可以跟随一个或多个catch块。每个catch块必须包含一个不同的异常处理程序。因此,如果您在不同的异常发生时需要执行不同的任务,请使用Java多重捕获块。 需要记住的要点 一次只会发生一个异常,同时只有一个catch块被执行。 所有的ca…

实训五:数据库安全控制 - MySQL数据库 - 授权与撤销授权

MySQL数据库 - 授权与撤销授权 第1关:数据库授权任务描述相关知识用户管理授权方式 编程要求测试说明参考代码 第2关:数据库撤销权限任务描述相关知识撤销权限 编程要求测试说明参考代码 第1关:数据库授权 任务描述 本关任务:新…

Ubuntu安装Anaconda详细步骤(Ubuntu22.04.1,Anaconda3-2023.03)

本文主要讲述了在Ubuntu中安装anaconda的具体步骤 准备环境:Ubuntu22.04.1,Anaconda3 1.下载Anaconda3 在清华镜像下载Linux版本的anaconda 清华镜像官网Anaconda下载 我选择的是Anaconda3-2023.03-Linux-x86_64.sh 下载好的Anaconda3-2023.03-Linux-…

拦截器Interceptor及与过滤器Filter的区别

统一拦截–拦截器Interceptor 1.概述 概念:是一种动态拦截方法调用的机制,类似于过滤器。Spring框架中提供的,用来动态拦截控制器方法的执行。作用:拦截请求,在指定的方法调用前后,根据业务需要执行预先设定的代码。与过滤器Fil…

【Java|多线程与高并发】设计模式-单例模式(饿汉式,懒汉式和静态内部类)

文章目录 1. 前言2. 单例模式3. 如何保证一个类只有一个实例4. 饿汉式单例模式5. 懒汉式单例模式6. 实现线程安全的懒汉式单例7. 静态内部类实现单例模式8. 总结 1. 前言 设计模式是一种在软件开发中常用的解决复杂问题的方法论。它提供了一套经过验证的解决方案,用…

通信原理概述

通信是指人们通过某种媒介进行信息传递。通过某种介质或通道,将信息从一个地点传递到另一个地点的过程。通信可以是人与人之间的交流,也可以是设备、系统或网络之间的数据传输。 通信信号的分类方法: 1)模拟信号和数字信号(从信号…

数字游戏:如何统计能整除数字的位数?

本篇博客会讲解力扣“2520. 统计能整除数字的位数”的解题思路,这是题目链接。 本题的思路是:取出每一位,判断是否能整除。 如何取出每一位呢?可以采用“mod10除10”的策略。即:每次mod10取出最后一位数,再…

2022年软件测试面试题大全【含答案】

一、面试基础题 简述测试流程: 1、阅读相关技术文档(如产品PRD、UI设计、产品流程图等)。 2、参加需求评审会议。 3、根据最终确定的需求文档编写测试计划。 4、编写测试用例(等价类划分法、边界值分析法等)。 5、用例评审(…

C++面向对象 this指针 构造函数 析构函数 拷贝构造 友元

C面向对象 面向对象概念类与对象的区别 C中类的设计设计实例实例解释共有和私有类的认识 函数定义函数在类里定义和类外定义区别函数定义实例 C对象模型方案一:各对象完全独立地安排内存的方案方案二:各对象的代码区共用的方案: this指针this指针特点程序编译面向对象程序的过程…

【力扣刷题 | 第十四天】

目录 前言: 7. 整数反转 - 力扣(LeetCode) 面试题 16.05. 阶乘尾数 - 力扣(LeetCode) 总结; 前言: 今天仍然是无固定类型刷题, 7. 整数反转 - 力扣(LeetCode) 给你…

傅氏变换算法

半局积分算法的局限性是要求采样的波形为正弦波。当被采样的模拟量不是正弦波而是一个周期性时间函数时,可采用傅氏变换算法。傅氏变换算法来自于傅里叶级数,即一个周期性函数I(t)可用傅里叶级数展开为各次谐波的正弦项和余弦项之…

D117-72. 编辑距离

题目描述 链接:添加链接描述 跟只考虑删除的完全一样,只不过是dp[i-1][j-1]1 class Solution:def minDistance(self, word1: str, word2: str) -> int:# dp[i][j]:以i-1为结尾的字符串word1,和以j-1位结尾的字符串word2&…

Qt 将某控件、图案绘制在最前面的方法,通过QGraphicsScene模块实现

文章目录 前言一、效果二、代码实现1.工程文件夹结构2.BackWidget类2.1 backwidget.h2.2 backwidget.cpp 总结 前言 在用Qt做一些应用的时候,有可能遇到和“绘制顺序”相关的问题,即要控制一些控件之间的显示前后问题,在常用的QWidget体系中&…

【数据结构与算法】力扣:翻转二叉树

翻转二叉树 给你一棵二叉树的根节点 root ,翻转这棵二叉树,并返回其根节点。 示例 1: 输入:root [4,2,7,1,3,6,9] 输出:[4,7,2,9,6,3,1] 示例 2: 输入:root [2,1,3] 输出:[2,…

云HIS是什么?HIS系统为什么要上云?云HIS有哪些优点?

一、当前医疗行业HIS的现状与发展趋势 1.医院信息系统(HIS)经历了从手工到单机再到局域网的两个阶段,随着云计算、大数据新技术迅猛发展,基于云计算的医院信息系统将逐步取代传统局域网HIS , 以适应人们对医疗卫生服务越来越高的要…

BI-SQL丨角色和用户

角色和用户 在数仓的运维工作中,经常需要为用户开通不同权限的账号,使用户可以正常访问不同的数据,那么这就需要我们了解SQL Server的权限体系。 名词解释 登录名: 用来登录服务器的用户账号,例:sa&…