需求故事:
最近时间一下子多了起来,用来学习Java是最合适不过了,但是去b站看视频难免会没有自制力,于是决定用selenium来抓取b站黑马Java视频的目录创建一个学习计划的Excel,便于进行学习进度的管理。
注:纯手打,如有错误欢迎评论区交流!
转载请注明出处:https://blog.csdn.net/testleaf/article/details/130330760
多谢!!!
目录
- 一、版本说明
- 二、导入需要使用的库
- 三、创建并初始化Excel
- 四、打开网站并窗口最大化
- 五、获取视频目录列表及其长度
- 六、遍历视频目录列表内容并存入Excel
- 七、Excel附加行头
- 八、保存Excel
- 九、对生成的Excel进行一些额外的操作
- 十、后续操作
一、版本说明
Python:3.8.2
selenium:4.8.2
openpyxl:3.0.10
Chrome浏览器版本:112.0.5615.121(正式版本)(64 位)
chromedriver版本:112.0.5615.49
二、导入需要使用的库
from selenium import webdriver
from openpyxl import Workbook
from selenium.webdriver.common.by import By
三、创建并初始化Excel
wb = Workbook()
sheet = wb.create_sheet('20天学会Java', 0)
四、打开网站并窗口最大化
driver = webdriver.Chrome()
driver.get('https://www.bilibili.com/video/BV1Cv411372m') ## 打开网站
driver.maximize_window() ## 使浏览器的窗口最大化
五、获取视频目录列表及其长度
videoList = driver.find_elements(By.XPATH,'//ul[@class="list-box"]/li') ## 获取视频目录列表
listLength = len(videoList) ## 获取视频目录列表的长度
六、遍历视频目录列表内容并存入Excel
for listIndex in range(listLength):
print(listIndex+1) ## 打印当前序号,便于知道进度
element1 = driver.find_element(By.XPATH,'//ul[@class="list-box"]/li['+str(listIndex+1)+']/a/div/div/span[1]')
element2 = driver.find_element(By.XPATH, '//ul[@class="list-box"]/li[' + str(listIndex + 1) + ']/a/div/div/span[2]')
element3 = driver.find_element(By.XPATH, '//ul[@class="list-box"]/li[' + str(listIndex + 1) + ']/a/div/div[2]')
element3List = element3.get_attribute('innerText').split(':')
if(len(element3List)==2): ## 把时长转化为以秒为单位的形式
element3Value = int(element3List[0])*60+int(element3List[1])
else:
element3Value = int(element3List[0]) * 3600 + int(element3List[1])*60+int(element3List[2])
sheet.cell(row=listIndex + 3, column=1, value=element1.get_attribute('innerText'))
sheet.cell(row=listIndex + 3, column=2, value=element2.get_attribute('innerText'))
sheet.cell(row=listIndex + 3, column=3, value=str(element3.get_attribute('innerText')))
sheet.cell(row=listIndex + 3, column=4, value=element3Value)
七、Excel附加行头
sheet.cell(row=2, column=1, value="序号")
sheet.cell(row=2, column=2, value="标题")
sheet.cell(row=2, column=3, value="时长")
sheet.cell(row=2, column=4, value="时长(秒)")
sheet.cell(row=2, column=5, value="完成情况")
sheet.cell(row=2, column=6, value="完成时间")
八、保存Excel
wb.save(filename=r'b站黑马视频学习进度表.xlsx')
九、对生成的Excel进行一些额外的操作
运行完上述代码,得到一个Excel文件:
调整单元格使其宽度自适应内容,双击一下这个东西就可以:
效果如下:
冻结至第2行:
在首行第2列插入数据:
="进度:"&ROUND(SUM(E3:E202)/SUM(D3:D202),4)*100&"%;已学:"&ROUND(SUM(E3:E202)/3600,2)&"小时;还剩:"&ROUND((SUM(D3:D202)-SUM(E3:E202))/3600,2)&"小时"
然后回车;
说明:
1、ROUND(A,2)
:将A保留两位小数
2、SUM(D3:D202)
:求D3到D202所有数据的和
3、&
:连接字符串
效果:
十、后续操作
1、看完一集视频就在这里写上与左侧相等的数值:
第一行进度栏的数值会自动变化:
2、完成时间右边直接写上:
=NOW()
回车,然后复制后到左边粘贴为数值:
效果: