- 💂 个人网站:【海拥】【摸鱼游戏】【神级源码资源网】
- 🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】
- 💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】
搭建背景
最近工作中需要用上 Google SEO(搜索引擎优化),有了解过的朋友们应该都知道SEO必不可少的工作之一就是查询关键词的搜索排名。关键词少的时候可以一个一个去查没什么问题,但是到了后期,一个网站都有几百上千的关键词,你再去一个一个查,至少要花费数小时的时间。
虽然市面上有很多SEO免费或者收费工具,但免费的基本都不能批量查,我看到网上最多也就只能10个10个查询,而且查询速度很慢。收费的工具如Ahrefs、SEMrush等以月为单位收费最低也都要 99$/月,当然如果觉得价格合适也可以进行购买,毕竟这些工具的很多功能都很实用。今天我给大家分享的这个排名搜索工具基于python实现,当然肯定是不需要花费任何费用,装上python开发环境即可。
实现步骤
话不多说,上代码:
import requests
from bs4 import BeautifulSoup
首先我们导入requests
和BeautifulSoup
两个库,requests
用于发送HTTP请求,BeautifulSoup
用于解析HTML。
def get_google_rank(keyword, website):
try:
url = f"https://www.google.com/search?q={keyword}"
headers = {'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Mobile Safari/537.36'}
response = requests.get(url, headers=headers)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')
search_results = soup.find_all('div', class_='g')
for i, result in enumerate(search_results):
link = result.find('a')['href']
if website in link:
return i + 1 # 返回排名(从1开始)
return -1 # 如果未找到网站,返回-1
except requests.exceptions.RequestException as e:
print(f"An error occurred: {e}")
return None
上述代码定义了一个名为get_google_rank
的函数,该函数接受两个参数:keyword
(关键词)和website
(网站域名)。函数的目标是获取指定关键词在谷歌搜索结果中的排名。
在函数内部,首先构建了一个URL,该URL使用指定的关键词进行谷歌搜索。然后设置了一个User-Agent头部,模拟一个浏览器的请求。使用requests.get
方法发送HTTP请求,获取搜索结果页面的响应。response.raise_for_status()
用于检查请求是否成功,如果返回的状态码不是200,会抛出一个异常。
接下来,使用BeautifulSoup
库解析响应的HTML内容,创建一个BeautifulSoup
对象,并使用html.parser
解析器进行解析。然后通过find_all
方法查找所有具有’class’属性为’g’的’div’元素,这些元素包含了搜索结果的信息。
接着使用enumerate
函数遍历搜索结果列表,并使用result.find('a')['href']
获取每个搜索结果中的链接。如果指定的网站域名出现在链接中,就返回当前的排名(从1开始计数)。
如果循环结束后未找到指定的网站域名,函数返回-1,表示未找到网站。
如果在请求过程中发生异常,会捕获requests.exceptions.RequestException
异常,并打印错误消息,然后返回None
。
# 示例用法
keywords = ['摸鱼小游戏','是男人就下100层','游戏']
website = 'haiyong.site'
for keyword in keywords:
rank = get_google_rank(keyword, website)
if rank is not None:
if rank == -1:
print(f"{keyword}没有排名")
else:
print(f"{keyword}排名第{rank}")
最后是一个示例用法的代码。定义了一个包含多个关键词的列表keywords
和一个指定的网站域名website
。
通过for
循环遍历关键词列表,调用get_google_rank
函数获取每个关键词在谷歌搜索结果中的排名。如果返回的排名不为None
,则根据排名的值进行条件判断,如果排名为-1,打印关键词没有排名的消息,否则打印关键词的排名信息。
以上就是整段代码的含义和逻辑。该代码实现了获取指定关键词在谷歌搜索结果中的排名,并通过示例展示了如何使用这个函数。
完整代码
import requests
from bs4 import BeautifulSoup
def get_google_rank(keyword, website):
try:
url = f"https://www.google.com.hk/search?q={keyword}"
headers = {'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Mobile Safari/537.36'}
response = requests.get(url, headers=headers)
response.raise_for_status()
soup = BeautifulSoup(response.text, 'html.parser')
search_results = soup.find_all('div', class_='g')
for i, result in enumerate(search_results):
link = result.find('a')['href']
if website in link:
return i + 1 # 返回排名(从1开始)
return -1 # 如果未找到网站,返回-1
except requests.exceptions.RequestException as e:
print(f"An error occurred: {e}")
return None
# 示例用法
keywords = ['摸鱼小游戏','是男人就下100层','游戏']
website = 'haiyong.site'
for keyword in keywords:
rank = get_google_rank(keyword, website)
if rank is not None:
if rank == -1:
print(f"{keyword}没有排名")
else:
print(f"{keyword}排名第{rank}")
梯子有点问题,先放个必应上查询的截图吧。