文章目录
- 前言
- 介绍
- 实现
- 帖子地址
- 请求地址
- 引入模块
- 提取代码
- 程序入口
- 提取到的数据
- 总结
- 最后
前言
博主 | 空空star |
---|---|
主页 | 空空star的主页 |
大家好,我是空空star,本篇给大家分享一下
《通过BeautifulSoup获取【领域赛道--大数据与算法】top100用户》
。
介绍
BeautifulSoup是一个Python第三方库,用于从HTML或XML等文档中提取数据。它可以自动解析HTML页面,并根据标签和属性等条件提取所需的数据,具有高效、灵活、易用等特点,是Python爬虫的重要工具之一。
使用BeautifulSoup,我们可以轻松地遍历HTML页面的标签和属性,并根据需要提取数据。
实现
帖子地址
[2023-06-29]2023博客之星候选–领域赛道–大数据与算法
请求地址
引入模块
import requests
from bs4 import BeautifulSoup
提取代码
def get_usernames():
usernames = []
response = requests.get('https://bbs.csdn.net/topics/616323734')
res = response.text
soup = BeautifulSoup(res, 'lxml')
for item in soup.find_all('a'):
url = item.get('href')
if 'https://edu.csdn.net/me/' in url:
username = url.split('/')[4]
usernames.append(username)
return usernames
程序入口
if __name__ == '__main__':
users = get_usernames()
print(f'获取到的用户数:{len(users)}')
print(f'获取到的用户列表:{users}')
提取到的数据
获取到的用户数:100
获取到的用户列表:[‘weixin_42241611’, ‘m0_74396439’, ‘weixin_43871785’, ‘zjjcchina’, ‘weixin_43412762’, ‘u011868279’, ‘weixin_44958787’, ‘weixin_55464238’, ‘baklib’, ‘wr_java’, ‘coder_ljw’, ‘chenwewi520feng’, ‘zuoan1993’, ‘weixin_38093452’, ‘qq_46548855’, ‘qq441540598’, ‘myrealization’, ‘csdnguoyuying’, ‘qq_66485519’, ‘oddrock’, ‘qq_41071754’, ‘m0_68111267’, ‘elon_520’, ‘weixin_39032019’, ‘m0_63613132’, ‘qq_44226094’, ‘zy_dreamer’, ‘2301_76957510’, ‘binghhb’, ‘weixin_72060925’, ‘kk702392702’, ‘m0_63398413’, ‘wwxdwrn’, ‘s2735365253’, ‘caryxp’, ‘fckbb’, ‘sugar_wolf’, ‘qq_42958831’, ‘qq_44766883’, ‘weixin_66151870’, ‘liqiu0913’, ‘m0_56069910’, ‘m0_60025795’, ‘qq_62839589’, ‘weixin_43894652’, ‘sun123234’, ‘oceanbasegfbk’, ‘dzk666123’, ‘weixin_42204569’, ‘weixin_42439274’, ‘weixin_44832243’, ‘qq_43714918’, ‘xiaoluobutou’, ‘jane9872’, ‘leread’, ‘steven_zhangxue’, ‘wangjun861205’, ‘yingjiayu12’, ‘qq_32727095’, ‘tikitian’, ‘weixin_47276960’, ‘jasonchen1224’, ‘cfy1226’, ‘ironmanjay’, ‘qq_66345100’, ‘actiontech’, ‘weixin_42011858’, ‘qq_46373141’, ‘weixin_43434369’, ‘w_chuanqi’, ‘stormsunshine’, ‘weixin_62633072’, ‘ziye_190’, ‘apr15’, ‘programnovice’, ‘qq_74310471’, ‘m0_73258399’, ‘weixin_48804451’, ‘liang921119’, ‘shangguanxiu’, ‘w2915w’, ‘jnrjian’, ‘weixin_73142957’, ‘m0_63488627’, ‘qq_44804713’, ‘so_zxn’, ‘qq_52097561’, ‘m0_73888323’, ‘2301_76549664’, ‘weixin_43830137’, ‘liuliangcan’, ‘m0_62609939’, ‘weixin_42690036’, ‘m0_63951142’, ‘weixin_43894455’, ‘qq_64580912’, ‘u014571143’, ‘weixin_44904816’, ‘yiluohan0307’, ‘qq_43778500’]
总结
最后
如果您不知道如何支持我,
InsCode AI列了一些支持博主的句子供您参考:
博主写的文章很有深度,收获了很多知识。
博主的写作风格幽默风趣。
博主勇于分享自己的经验和教训,让初学者从中受益匪浅。
博主的思想独到,文章读起来让人格外振奋。
博主为人很好,乐于助人,回复读者的问题也非常及时。
博主的专业知识非常全面,无论是哪个领域的问题都能给出详细的解答。