前言
每天你都可能会执行许多重复的任务,例如阅读新闻、发邮件、查看天气、打开书签、清理文件夹等等,使用自动化脚本,就无需手动一次又一次地完成这些任务,非常方便。而在某种程度上,Python就是自动化的代名词。
1、自动化阅读网页新闻
这个脚本能够实现从网页中抓取文本,然后自动化语音朗读,当你想听新闻的时候,这是个不错的选择。
代码分为两大部分,第一通过爬虫抓取网页文本呢,第二通过阅读工具来朗读文本。
需要的第三方库:
- Beautiful Soup - 经典的HTML/XML文本解析器,用来提取爬下来的网页信息
- requests - 好用到逆天的HTTP工具,用来向网页发送请求获取数据
- Pyttsx3 - 将文本转换为语音,并控制速率、频率和语音
import pyttsx3
import requests
from bs4 import BeautifulSoup
engine = pyttsx3.init('sapi5')
voices \= engine.getProperty('voices')
newVoiceRate \= 130 #\# Reduce The Speech Rate
engine.setProperty('rate',newVoiceRate)
engine.setProperty('voice', voices\[1\].id)
def speak(audio):
engine.say(audio)
engine.runAndWait()
text \= str(input("Paste article\\n"))
res \= requests.get(text)
soup \= BeautifulSoup(res.text,'html.parser')
articles \= \[\]
for i in range(len(soup.select('.p'))):
article \= soup.select('.p')\[i\].getText().strip()
articles.append(article)
text \= " ".join(articles)
speak(text)
# engine.save\_to\_file(text, 'test.mp3') ## If you want to save the speech as a audio file
engine.runAndWait()
2、自动化数据探索
数据探索是数据科学项目的第一步,你需要了解数据的基本信息才能进一步分析更深的价值。
一般我们会用pandas、matplotlib等工具来探索数据,但需要自己编写大量代码,如果想提高效率,Dtale是个不错的选择。
Dtale特点是用一行代码生成自动化分析报告,它结合了Flask后端和React前端,为我们提供了一种查看和分析Pandas数据结构的简便方法。
我们可以在Jupyter上实用Dtale。
需要的第三方库:
- Dtale - 自动生成分析报告
#\## Importing Seaborn Library For Some Datasets
import seaborn as sns
#\## Printing Inbuilt Datasets of Seaborn Library
print(sns.get\_dataset\_names())
#\## Loading Titanic Dataset
df=sns.load\_dataset('titanic')
#\## Importing The Library
import dtale
#\### Generating Quick Summary
dtale.show(df)
3、自动发送多封邮件
这个脚本可以帮助我们批量定时发送邮件,邮件内容、附件也可以自定义调整,非常的实用。
相比较邮件客户端,Python脚本的优点在于可以智能、批量、高定制化地部署邮件服务。
需要的第三方库:
- Email - 用于管理电子邮件消息;
- Smtlib - 向SMTP服务器发送电子邮件,它定义了一个 SMTP 客户端会话对象,该对象可将邮件发送到互联网上任何带有 SMTP 或ESMTP 监听程序的计算机;
- Pandas - 用于数据分析清洗地工具;
import smtplib
from email.message import EmailMessage
import pandas as pd
def send\_email(remail, rsubject, rcontent):
email \= EmailMessage() #\# Creating a object for EmailMessage
email\['from'\] = 'The Pythoneer Here' #\# Person who is sending
email\['to'\] = remail #\# Whom we are sending
email\['subject'\] = rsubject #\# Subject of email
email.set\_content(rcontent) #\# content of email
with smtplib.SMTP(host='smtp.gmail.com',port=587)as smtp:
smtp.ehlo() #\# server object
smtp.starttls() #\# used to send data between server and client
smtp.login("deltadelta371@gmail.com","delta@371") #\# login id and password of gmail
smtp.send\_message(email) #\# Sending email
print("email send to ",remail) #\# Printing success message
if \_\_name\_\_ == '\_\_main\_\_':
df \= pd.read\_excel('list.xlsx')
length \= len(df)+1
for index, item in df.iterrows():
email \= item\[0\]
subject \= item\[1\]
content \= item\[2\]
send\_email(email,subject,content)
4、将 PDF 转换为音频文件
脚本可以将 pdf 转换为音频文件,原理也很简单,首先用 PyPDF 提取 pdf 中的文本,然后用 Pyttsx3 将文本转语音。
import pyttsx3,PyPDF2
pdfreader \= PyPDF2.PdfFileReader(open('story.pdf','rb'))
speaker \= pyttsx3.init()
for page\_num in range(pdfreader.numPages):
text \= pdfreader.getPage(page\_num).extractText() #\# extracting text from the PDF
cleaned\_text = text.strip().replace('\\n',' ') #\# Removes unnecessary spaces and break lines
print(cleaned\_text) #\# Print the text from PDF
#speaker.say(cleaned\_text) ## Let The Speaker Speak The Text
speaker.save\_to\_file(cleaned\_text,'story.mp3') #\# Saving Text In a audio file 'story.mp3'
speaker.runAndWait()
speaker.stop()
5、从列表中播放随机音乐
这个脚本会从歌曲文件夹中随机选择一首歌进行播放,需要注意的是 os.startfile 仅支持 Windows 系统。
import random, os
music\_dir \= 'G:\\\\new english songs'
songs \= os.listdir(music\_dir)
song \= random.randint(0,len(songs))
print(songs\[song\]) #\# Prints The Song Name
os.startfile(os.path.join(music\_dir, songs\[0\]))
6、智能天气信息
国家气象局网站提供获取天气预报的 API,直接返回 json 格式的天气数据。所以只需要从 json 里取出对应的字段就可以了。
下面是指定城市(县、区)天气的网址,直接打开网址,就会返回对应城市的天气数据。比如:
http://www.weather.com.cn/data/cityinfo/101021200.html 上海徐汇区对应的天气网址。
具体代码如下:
mport requests
import json
import logging as log
def get\_weather\_wind(url):
r \= requests.get(url)
if r.status\_code != 200:
log.error("Can't get weather data!")
info \= json.loads(r.content.decode())
# get wind data
data = info\['weatherinfo'\]
WD \= data\['WD'\]
WS \= data\['WS'\]
return "{}({})".format(WD, WS)
def get\_weather\_city(url):
# open url and get return data
r = requests.get(url)
if r.status\_code != 200:
log.error("Can't get weather data!")
# convert string to json
info = json.loads(r.content.decode())
# get useful data
data = info\['weatherinfo'\]
city \= data\['city'\]
temp1 \= data\['temp1'\]
temp2 \= data\['temp2'\]
weather \= data\['weather'\]
return "{} {} {}~{}".format(city, weather, temp1, temp2)
if \_\_name\_\_ == '\_\_main\_\_':
msg \= """\*\*天气提醒\*\*:
{} {}
{} {}
来源: 国家气象局
""".format(
get\_weather\_city('http://www.weather.com.cn/data/cityinfo/101021200.html'),
get\_weather\_wind('http://www.weather.com.cn/data/sk/101021200.html'),
get\_weather\_city('http://www.weather.com.cn/data/cityinfo/101020900.html'),
get\_weather\_wind('http://www.weather.com.cn/data/sk/101020900.html')
)
print(msg)
运行结果如下所示:
7、长网址变短网址
有时,那些大URL变得非常恼火,很难阅读和共享,此脚可以将长网址变为短网址。
import contextlib
from urllib.parse import urlencode
from urllib.request import urlopen
import sys
def make\_tiny(url):
request\_url \= ('http://tinyurl.com/api-create.php?' +
urlencode({'url':url}))
with contextlib.closing(urlopen(request\_url)) as response:
return response.read().decode('utf-8')
def main():
for tinyurl in map(make\_tiny, sys.argv\[1:\]):
print(tinyurl)
if \_\_name\_\_ == '\_\_main\_\_':
main()
这个脚本非常实用,比如说有内容平台是屏蔽公众号文章的,那么就可以把公众号文章的链接变为短链接,然后插入其中,就可以实现绕过。
8、清理下载文件夹
世界上最混乱的事情之一是开发人员的下载文件夹,里面存放了很多杂乱无章的文件,此脚本将根据大小限制来清理您的下载文件夹,有限清理比较旧的文件。
import os
import threading
import time
def get\_file\_list(file\_path):
#文件按最后修改时间排序
dir\_list = os.listdir(file\_path)
if not dir\_list:
return
else:
dir\_list \= sorted(dir\_list, key=lambda x: os.path.getmtime(os.path.join(file\_path, x)))
return dir\_list
def get\_size(file\_path):
"""\[summary\]
Args:
file\_path (\[type\]): \[目录\]
Returns:
\[type\]: 返回目录大小,MB
"""
totalsize\=0
for filename in os.listdir(file\_path):
totalsize\=totalsize+os.path.getsize(os.path.join(file\_path, filename))
#print(totalsize / 1024 / 1024)
return totalsize / 1024 / 1024
def detect\_file\_size(file\_path, size\_Max, size\_Del):
"""\[summary\]
Args:
file\_path (\[type\]): \[文件目录\]
size\_Max (\[type\]): \[文件夹最大大小\]
size\_Del (\[type\]): \[超过size\_Max时要删除的大小\]
"""
print(get\_size(file\_path))
if get\_size(file\_path) > size\_Max:
fileList \= get\_file\_list(file\_path)
for i in range(len(fileList)):
if get\_size(file\_path) > (size\_Max - size\_Del):
print ("del :%d %s" % (i + 1, fileList\[i\]))
#os.remove(file\_path + fileList\[i\])
最后这里免费分享给大家一份Python全台学习资料,包含视频、源码。课件,希望能帮到那些不满现状,想提升自己却又没有方向的朋友,也可以和我一起来学习交流呀。
编程资料、学习路线图、源代码、软件安装包【点击这里】领取!
① Python所有方向的学习路线图
,清楚各个方向要学什么东西
② 100多节Python课程视频
,涵盖必备基础、爬虫和数据分析
③ 100多个Python实战案例
,学习不再是只会理论
④ 华为出品独家Python漫画教程
,手机也能学习
⑤ 历年互联网企业Python面试真题
,复习时非常方便