2022某站百大up主公布名单,python如何快速获取up名单

news2025/1/17 14:07:20

前言 

2022年已经过去,各大厂商都在做年度总结。某站在1月13日中午19点30分公布了2022百大UP主名单,那么今年的某站年度UP主都是谁呢?接下来就让我们一起了解一下吧。不过,我们去用python获取名单,是非常有成就的。

环境使用

  • python 3.9
  • pycharm

模块使用

  • selenium
  • 谷歌驱动
from selenium import webdriver

模块介绍 

  • selenium

        之前,我们爬虫是模拟浏览器,但始终不是用的浏览器,但今天我们要说的是另一种爬虫方式,这次不是模拟浏览器,而是用程序去控制浏览器进行一些列操作,也就是selenium。selenium是python的一个第三方库,对外提供的接口可以操控浏览器,比如说输入、点击,跳转,下拉等动作。

  在使用selenium模块之前要做两件事,一是安装selenium模块,可以用终端用pip,也可以在pycharm里的setting安装;二是我们需要下载一款浏览器驱动程序,下载的驱动程序要和浏览器的版本一致。

  • 谷歌驱动

1.下载网址

        CNPM Binaries Mirror

2.文件安装(放置)位置
        可以把这个文件理解成一个脚本入口。说它是安装,其实就是把下载的 chromedriver.exe 文件复制到相应的位置。

        将文件复制到两个位置:1...\python\Scripts复制一份到安装Python的文件夹中的Scripts文件夹中;2.如果用的是Pycharm,再复制一份到..\python\site-packages\selenium\webdriver\chrome文件中。这个地址可以将鼠标放在Pycharm里面安装库的地方的相应库上就能看到。

代码实现

今天这个目标要求特别简单,只要几行代码就能实现。话不多说,直接进入正题。

1.确定我们的目标网址

目标网址:https://www.bilibili.com/blackboard/BPU2022-poweruplist.html

2.通过谷歌确定去访问

driver = webdriver.Chrome()

driver.get('https://www.bilibili.com/blackboard/BPU2022-poweruplist.html')

 效果如下:

 3.定位目标元素

 使用浏览器的开发者工具,我们找到了目标所在的位置,我们直接右击复制得到我们的selector。

selector = #app > div > div.main-content > div.list > ul > li > p.name

我们用一行代码得到我们所需要的数据。

names = driver.find_elements(By.CSS_SELECTOR,'#app > div > div.main-content > div.list > ul > li > p.name')

这是一个列表,我们都知道用for循环遍历。

for name in names:
    print(name.text)

到这里,我们就用了6行代码就获取到了我们想要的数据,为了看到我们是不是获得了100位up主的数据,我们加一个计数,效果如下:

 大家感兴趣的还可以获取up主的个人简介,什么照片的。下面这种效果也可以做,按字母排序。

2022百大up主:

A——矮乐多Aliga、AHALOLO、阿萨Aza

B——本喵叫兔兔、不刷题的吴姥姥

C——CSGO久菜合子、翠花不太脆

D——大狸子切切里、盗月社食遇记、电影最TOP

E——尔东和小明、二喵的饭

F——FoFTG、非非宇Fay、泛式、芳斯塔芙、范李猿

G——怪力老陈、尴尬的铁根er

H——HOPICO、侯翠翠、浑元Rysn、画渣不渣的三查、红警HBK08、HOLA小测佬

J——剑客范十三、极客湾Geekerwan、九三的耳朵不是特别好、嘉然今天吃什么

L——light是光华、-LKs-、老番茄、拉宏桑、利利那TD25、老实憨厚的笑笑、利维坦mY、老饭骨、凉风Kaze、绫人太太啊、罗翔说刑法、刘庸干净又卫生

M——Milk缪客、Mr迷瞪、猫不理咖啡、魔法Zc目录、某幻君、绵羊料理、木鱼水心

O——哦呼w、欧阳春晓Aurora

P——培根悖论唠唠嗑、怕上火暴王老菊、碰碰彭碰彭

Q——祁么么mo

S——STN工作室、Super也好君、山城小栗旬的理发日记、苏打baka、深海色带鱼、手工耿、设计师深海、酸梨大王、司墨尧smile、帅农鸟哥、森纳映画、 碎嘴企鹅、帅soserious、柿子菌meow

T——天才女友GG、谭乔、天真的和感伤的小说家

U——Upspeed盛嘉成

W——莴苣某人、王师傅和小毛毛、汪苏泷、网不红萌叔Joey、无穷小亮的科普日常

X——小潮院长、徐大虾咯、晓观队长、小Lin说、小片片说大片、吸奇侠、小王Albert、逍遥散人、星有野、咻咻满、小约翰可汗

Y——衣戈猜想、伊丽莎白鼠、影视飓风、雨说体育徐静雨、硬核的半佛仙人

Z——终极小腾、知了解压萌物、籽岷、真探唐仁杰、正直讲史-李正Str 

6adf31c8c5dd4e6a83314f4805b30bc1.jpg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/162000.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Git(1)基础命令

Git基础知识总结 Author:onceday date:2022年8月8日 满满长路有人对你微笑过嘛… Modified date:2022年11月22日,完成第一章部分内容。 windows安装可参考文章:git简易配置_onceday_CSDN博客 參考文档&#xff1a…

腾讯云短信服务——获取验证码

引言 之前介绍过阿里云短信服务,传送门:阿里云短信服务——短信发送验证码,但是由于阿里云现在短信调用门槛较高,申请有很多限制(我申请好几次都没有通过),所以只能使用测试账号给固定的手机号…

2023速卖通开店入驻流程及费用,新店运营思路

开店前准备 从卖家开始注册账户起,需速卖通平台的销售政策和全球速卖通平台规则。平台要求卖家在速卖通经营需遵循公平、诚实的行事原则,以确保安全的购买及销售体验。 1.注册账号 注册账户前,以下所有资料都是必须提供的资料。若资料不完…

AtCoder Beginner Contest 044(4/4)

Tak and Hotels (ABC Edit)前k晚花费x,k1晚以后花费yAC代码:import java.util.*; import java.io.*; public class Main {public static void main(String[] args) {InputStream inputStream System.in;OutputStream outputStream System.out;InputRea…

喜报 | 迅镭激光荣获2022年度江苏省科学技术奖

1月6日,江苏省科技厅发布了2022年度江苏省科学技术奖综合评审结果公示名单,迅镭激光与江苏师范大学等单位合作的“高功率2微米激光器关键技术及应用”项目,荣获2022年度江苏省科学技术二等奖。 江苏省科学技术奖是省内科技领域最高级别的奖项…

Java 23种设计模式(1.设计模式概念和UML)

1. 设计模式概念 软件设计模式(Software Design Pattern),又称设计模式是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结 1.1 设计模式学习必要性理由 设计模式的本质是面向对象设计原则的实际运用,是对类的…

2022边缘计算开源项目

在边缘计算社区,统计边缘计算开源项目发展情况,开源软件生态蓬勃发展,边缘计算开源项目又是开源软件生态中不可忽视的重要力量。 2022 年边缘计算领域较为活跃和热门的十个开源项目:KubeEdge、EdgeXFoundry、Akraino、OpenYurt、B…

【UE4 第一人称射击游戏】47-修改AI为僵尸样貌

上一篇:【UE4 第一人称射击游戏】46-蹲高调整本篇效果:将AI修改成了僵尸的模样步骤:可以先从Mixamo网站下载 僵尸 资源,相关教程可以参考这篇文章:UE4 利用Mixamo自动绑骨并导入虚幻4我下载的是这个僵尸资源下载的时候…

【Qt】富文本处理简单介绍

文章目录Qt富文本处理富文本文档结构文本块QTextBlock表格、列表、图片查找功能语法高亮与HTML参考《Qt Creator快速入门(第三版)》。 Qt富文本处理 富文本Rich Text,简单说就是在文档中可以使用多种格式,比如字体颜色、图片和表格等,是与纯…

给定一个有序数组arr,代表坐落在X轴上的点 给定一个正数K,代表绳子的长度 返回绳子最多压中几个点? 即使绳子边缘处盖住点也算盖住

目录暴力求解贪心二分法滑动窗口对数器测试题目: 给定一个有序数组arr,代表坐落在X轴上的点 给定一个正数K,代表绳子的长度 返回绳子最多压中几个点? 即使绳子边缘处盖住点也算盖住 这道题有三个解决方案 暴力求解 //暴力求解O(N…

Docker容器MySQL数据库的备份与还原,以及每天定时自动备份.

1.快速启动mysql容器 1:拉取mysql镜像: 根据自己需要,我这个是5.7版本的镜像。 docker pull nanlist/mysql:5.72:宿主机建立挂载目录: mkdir三个文件夹,方便持久化。 /home/mysql/conf /home/mysql/log…

java面试资料(二)

这里写目录标题Spring什么是 Spring Framework?列举 Spring Framework 的优点。Spring Framework 有哪些不同的功能?Spring Framework 中有多少个模块,它们分别是什么?什么是 Spring 配置文件?Spring 应用程序有哪些不…

MySQL数据同步ES的4种方法,你能想到几种?

大家好,我是老三,这期给大家分享一个电商中常见的场景——MySQL数据同步Elasticsearch。 大家应该都在各种电商网站检索过商品,那么检索商品一般都是通过什么实现呢?搜索引擎Elasticsearch。 那么问题来了,商品上架&a…

【布隆过滤器】如何防止缓存穿透、海量邮箱的垃圾邮件过滤等问题?

目录 一、布隆过滤器是什么? 二、布隆过滤器的模拟实现 2.1、模拟实现 2.2、布隆过滤器的优点和缺点 优点: 缺点: 2.3、布隆过滤器的删除功能 2.4、布隆过滤器的使用场景 一、布隆过滤器是什么? 它是一种概率型数据结构&am…

敏捷.概念辨析

第一部分 1. 最小可行产品MVP(Minimum Viable Product) 在很多同学的脑海里,MVP就是你想传达给用户的功能的最小集合。 错,完全错。 问题不在于“你觉得应该……”,关键是“用户目前感觉……”。我们预设了立场&am…

Android Glide 4.9 常见方法总结

转载请标明出处:http://blog.csdn.net/zhaoyanjun6/article/details/128665358 本文出自【赵彦军的博客】 文章目录依赖submit 下载图片DrawableImageViewTargetRequestListener 加载圆角图片回调圆形 CircleCrop圆角 RoundedCornersFitCenterCenterCropCenterInsid…

RK3399平台开发系列讲解(中断篇)ARM64异常处理详解

🚀返回专栏总目录 文章目录 一、异常级别二、异常分类三、异常向量表四、异常处理沉淀、分享、成长,让自己和他人都能有所收获!😄 一、异常级别 📢ARM64的处理器支持多个异常等级(exception level),其中EL0是用户模式,EL1是内核模式,也称为特权模式;EL2 是虚拟化…

算力狂热时代的冷静之道:宁畅总裁秦晓宁分享企业的算力最优解

算力是数字化时代的生产力之源,近年来已经成为共识。所以,我们能看到各个层面对算力的追逐,无论是国家层面的政策利好,算力基础设施建设的加速,还是诸多行业和企业积极地增加算力部署,呈现出一片如火如荼的…

958. 二叉树的完全性检验

958. 二叉树的完全性检验 难度中等 给定一个二叉树的 root ,确定它是否是一个 完全二叉树 。 在一个 完全二叉树 中,除了最后一个关卡外,所有关卡都是完全被填满的,并且最后一个关卡中的所有节点都是尽可能靠左的。它可以包含 …

AWVS扫描Web应用程序

AWVS扫描Web应用程序 系列文章 AWVS安装与激活 1.账户密码登录扫描 我们准备了一个靶场用来做测试扫描: 1.点击【Targets】,点击【add Target】 2.输入扫描地址和扫描描述,点击【save】 3.点击【Site Login】 4.选择【try to auto-login into the si…