实用Python自动化脚本案例分享

news2025/1/11 11:19:03

前言
每天你都可能会执行许多重复的任务,例如阅读新闻、发邮件、查看天气、打开书签、清理文件夹等等,使用自动化脚本,就无需手动一次又一次地完成这些任务,非常方便。而在某种程度上,Python就是自动化的代名词。
1、自动化阅读网页新闻

这个脚本能够实现从网页中抓取文本,然后自动化语音朗读,当你想听新闻的时候,这是个不错的选择。

代码分为两大部分,第一通过爬虫抓取网页文本呢,第二通过阅读工具来朗读文本。

需要的第三方库:

  • Beautiful Soup - 经典的HTML/XML文本解析器,用来提取爬下来的网页信息
  • requests - 好用到逆天的HTTP工具,用来向网页发送请求获取数据
  • Pyttsx3 - 将文本转换为语音,并控制速率、频率和语音
import pyttsx3
import requests
from bs4 import BeautifulSoup
engine = pyttsx3.init('sapi5')
voices \= engine.getProperty('voices')
newVoiceRate \= 130                       #\# Reduce The Speech Rate
engine.setProperty('rate',newVoiceRate)
engine.setProperty('voice', voices\[1\].id)
def speak(audio):
  engine.say(audio)
  engine.runAndWait()
text \= str(input("Paste article\\n"))
res \= requests.get(text)
soup \= BeautifulSoup(res.text,'html.parser')

articles \= \[\]
for i in range(len(soup.select('.p'))):
    article \= soup.select('.p')\[i\].getText().strip()
    articles.append(article)
text \= " ".join(articles)
speak(text)
# engine.save\_to\_file(text, 'test.mp3') ## If you want to save the speech as a audio file
engine.runAndWait()

2、自动化数据探索

数据探索是数据科学项目的第一步,你需要了解数据的基本信息才能进一步分析更深的价值。

一般我们会用pandas、matplotlib等工具来探索数据,但需要自己编写大量代码,如果想提高效率,Dtale是个不错的选择。

Dtale特点是用一行代码生成自动化分析报告,它结合了Flask后端和React前端,为我们提供了一种查看和分析Pandas数据结构的简便方法。

我们可以在Jupyter上实用Dtale。

需要的第三方库:

  • Dtale - 自动生成分析报告
#\## Importing Seaborn Library For Some Datasets
import seaborn as sns

#\## Printing Inbuilt Datasets of Seaborn Library
print(sns.get\_dataset\_names())

#\## Loading Titanic Dataset
df=sns.load\_dataset('titanic')

#\## Importing The Library
import dtale

#\### Generating Quick Summary
dtale.show(df)

3、自动发送多封邮件

这个脚本可以帮助我们批量定时发送邮件,邮件内容、附件也可以自定义调整,非常的实用。

相比较邮件客户端,Python脚本的优点在于可以智能、批量、高定制化地部署邮件服务。

需要的第三方库:

  • Email - 用于管理电子邮件消息;
  • Smtlib - 向SMTP服务器发送电子邮件,它定义了一个 SMTP 客户端会话对象,该对象可将邮件发送到互联网上任何带有 SMTP 或ESMTP 监听程序的计算机;
  • Pandas - 用于数据分析清洗地工具;
import smtplib 
from email.message import EmailMessage
import pandas as pd

def send\_email(remail, rsubject, rcontent):
    email \= EmailMessage()                          #\# Creating a object for EmailMessage
    email\['from'\] = 'The Pythoneer Here'            #\# Person who is sending
    email\['to'\] = remail                            #\# Whom we are sending
    email\['subject'\] = rsubject                     #\# Subject of email
    email.set\_content(rcontent)                     #\# content of email
    with smtplib.SMTP(host='smtp.gmail.com',port=587)as smtp:     
        smtp.ehlo()                                 #\# server object
        smtp.starttls()                             #\# used to send data between server and client
        smtp.login("deltadelta371@gmail.com","delta@371") #\# login id and password of gmail
        smtp.send\_message(email)                    #\# Sending email
        print("email send to ",remail)              #\# Printing success message

if \_\_name\_\_ == '\_\_main\_\_':
    df \= pd.read\_excel('list.xlsx')
    length \= len(df)+1

    for index, item in df.iterrows():
        email \= item\[0\]
        subject \= item\[1\]
        content \= item\[2\]

        send\_email(email,subject,content)

4、将 PDF 转换为音频文件

脚本可以将 pdf 转换为音频文件,原理也很简单,首先用 PyPDF 提取 pdf 中的文本,然后用 Pyttsx3 将文本转语音。

import pyttsx3,PyPDF2 
pdfreader \= PyPDF2.PdfFileReader(open('story.pdf','rb')) 
speaker \= pyttsx3.init() 
for page\_num in range(pdfreader.numPages):    
    text \= pdfreader.getPage(page\_num).extractText()  #\# extracting text from the PDF 
    cleaned\_text = text.strip().replace('\\n',' ')  #\# Removes unnecessary spaces and break lines 
    print(cleaned\_text)                #\# Print the text from PDF 
    #speaker.say(cleaned\_text)        ## Let The Speaker Speak The Text 
    speaker.save\_to\_file(cleaned\_text,'story.mp3')  #\# Saving Text In a audio file 'story.mp3' 
    speaker.runAndWait() 
speaker.stop() 

在这里插入图片描述

5、从列表中播放随机音乐

这个脚本会从歌曲文件夹中随机选择一首歌进行播放,需要注意的是 os.startfile 仅支持 Windows 系统。

import random, os 
music\_dir \= 'G:\\\\new english songs' 
songs \= os.listdir(music\_dir) 
song \= random.randint(0,len(songs)) 
print(songs\[song\])  #\# Prints The Song Name 
os.startfile(os.path.join(music\_dir, songs\[0\]))  

6、智能天气信息

国家气象局网站提供获取天气预报的 API,直接返回 json 格式的天气数据。所以只需要从 json 里取出对应的字段就可以了。

下面是指定城市(县、区)天气的网址,直接打开网址,就会返回对应城市的天气数据。比如:

http://www.weather.com.cn/data/cityinfo/101021200.html 上海徐汇区对应的天气网址。

具体代码如下:

mport requests 
import json 
import logging as log 
 
def get\_weather\_wind(url): 
    r \= requests.get(url) 
    if r.status\_code != 200: 
        log.error("Can't get weather data!") 
    info \= json.loads(r.content.decode()) 
 
    # get wind data 
    data = info\['weatherinfo'\] 
    WD \= data\['WD'\] 
    WS \= data\['WS'\] 
    return "{}({})".format(WD, WS) 
 
 
def get\_weather\_city(url): 
    # open url and get return data 
    r = requests.get(url) 
    if r.status\_code != 200: 
        log.error("Can't get weather data!") 
 
    # convert string to json 
    info = json.loads(r.content.decode()) 
 
    # get useful data 
    data = info\['weatherinfo'\] 
    city \= data\['city'\] 
    temp1 \= data\['temp1'\] 
    temp2 \= data\['temp2'\] 
    weather \= data\['weather'\] 
    return "{} {} {}~{}".format(city, weather, temp1, temp2) 
 
 
if \_\_name\_\_ == '\_\_main\_\_': 
    msg \= """\*\*天气提醒\*\*:   
 
{} {}   
{} {}   
 
来源: 国家气象局 
""".format( 
    get\_weather\_city('http://www.weather.com.cn/data/cityinfo/101021200.html'), 
    get\_weather\_wind('http://www.weather.com.cn/data/sk/101021200.html'), 
    get\_weather\_city('http://www.weather.com.cn/data/cityinfo/101020900.html'), 
    get\_weather\_wind('http://www.weather.com.cn/data/sk/101020900.html') 
) 
    print(msg) 

运行结果如下所示:
在这里插入图片描述

7、长网址变短网址

有时,那些大URL变得非常恼火,很难阅读和共享,此脚可以将长网址变为短网址。

import contextlib 
from urllib.parse import urlencode 
from urllib.request import urlopen 
import sys 
 
def make\_tiny(url): 
 request\_url \= ('http://tinyurl.com/api-create.php?' +  
 urlencode({'url':url})) 
 with contextlib.closing(urlopen(request\_url)) as response: 
  return response.read().decode('utf-8') 
 
def main(): 
 for tinyurl in map(make\_tiny, sys.argv\[1:\]): 
  print(tinyurl) 
 
if \_\_name\_\_ == '\_\_main\_\_': 
 main() 

这个脚本非常实用,比如说有内容平台是屏蔽公众号文章的,那么就可以把公众号文章的链接变为短链接,然后插入其中,就可以实现绕过。

8、清理下载文件夹

世界上最混乱的事情之一是开发人员的下载文件夹,里面存放了很多杂乱无章的文件,此脚本将根据大小限制来清理您的下载文件夹,有限清理比较旧的文件。

import os 
import threading 
import time 
  
  
def get\_file\_list(file\_path): 
#文件按最后修改时间排序 
    dir\_list = os.listdir(file\_path) 
    if not dir\_list: 
        return 
    else: 
        dir\_list \= sorted(dir\_list, key=lambda x: os.path.getmtime(os.path.join(file\_path, x))) 
    return dir\_list 
  
def get\_size(file\_path): 
    """\[summary\] 
    Args: 
        file\_path (\[type\]): \[目录\] 
 
    Returns: 
        \[type\]: 返回目录大小,MB 
    """ 
    totalsize\=0 
    for filename in os.listdir(file\_path): 
        totalsize\=totalsize+os.path.getsize(os.path.join(file\_path, filename)) 
    #print(totalsize / 1024 / 1024) 
    return totalsize / 1024 / 1024 
  
def detect\_file\_size(file\_path, size\_Max, size\_Del): 
    """\[summary\] 
    Args: 
        file\_path (\[type\]): \[文件目录\] 
        size\_Max (\[type\]): \[文件夹最大大小\] 
        size\_Del (\[type\]): \[超过size\_Max时要删除的大小\] 
    """ 
    print(get\_size(file\_path)) 
    if get\_size(file\_path) > size\_Max: 
        fileList \= get\_file\_list(file\_path) 
        for i in range(len(fileList)): 
            if get\_size(file\_path) > (size\_Max - size\_Del): 
                print ("del :%d %s" % (i + 1, fileList\[i\])) 
                #os.remove(file\_path + fileList\[i\]) 

最后这里免费分享给大家一份Python全台学习资料,包含视频、源码。课件,希望能帮到那些不满现状,想提升自己却又没有方向的朋友,也可以和我一起来学习交流呀。
编程资料、学习路线图、源代码、软件安装包【点击这里】领取!

Python所有方向的学习路线图,清楚各个方向要学什么东西
100多节Python课程视频,涵盖必备基础、爬虫和数据分析
100多个Python实战案例,学习不再是只会理论
华为出品独家Python漫画教程,手机也能学习
历年互联网企业Python面试真题,复习时非常方便
请添加图片描述
请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2076012.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【书生大模型实战营第三期 | 进阶岛第5关-茴香豆:企业级知识库问答工具】

学习心得:茴香豆:企业级知识库问答工具 摘要 《茴香豆:企业级知识库问答工具》课程详细介绍了由书生浦语团队开发的开源知识问答工具——茴香豆。该系统针对国内企业级使用场景进行了专门的设计和优化,具备三阶段Pipeline架构&am…

【Node】【3】回调函数

nodejs 是一个基于事件驱动和非阻塞异步的JavaScript运行时环境。 Node.js 采用单线程模型, 单线程意味着 Node.js 在任何给定时刻只能执行一段代码,但通过异步执行回调函数,可以在等待 I/O 操作完成的同时继续执行其他代码,从而…

【PL/pgSQL】华为数据库GaussDB及PostgreSQL 数据库系统的过程语言

文章目录 介绍 PL/pgSQL为什么选择 PL/pgSQL?基本语法和结构1. 基本结构2. 变量声明3. 控制结构4. 循环 存储过程与函数1. 创建存储过程2. 调用存储过程3. 自定义函数 触发器1. 创建触发器函数2. 创建触发器 异常处理高级语法特性示例控制结构条件语句循环 异常处理…

【Linux】06.Linux 下的编译器——gcc/g++

在之前的C语言的博客中,我们有谈到过编译与链接 从源代码到可执行程序要经过如下过程: 预处理(进行宏替换)编译(将C语言代码翻译成汇编代码)汇编(将汇编代码解析成二进制指令)链接&…

Python基础—Python保护代码和数据的方法

保护代码和数据的安全性至关重要。无论是防止代码被轻易修改,还是确保数据的隐私与完整性,采取适当措施都是必不可少的。今天,我们就来揭开六大保护策略的神秘面纱,让初学者也能轻松掌握这些实用技巧。 1. 使用加密技术保护敏感…

无需代码,快速搭建:JNPF低代码平台的创新应用案例

在数字化转型的浪潮中,企业对于迅速开发和部署应用的需求不断上升。传统的软件开发方法耗时较长、成本较高,难以适应快速变化的市场需求。低代码平台应运而生,它通过可视化界面和配置化手段,显著简化了应用开发流程。JNPF作为一款…

Java 中的抽象工厂模式:优雅地掌握对象创建

文章目录 一、概述三、抽象工厂设计模式的意图四、抽象工厂模式的详细解释及实际示例五、Java 中抽象工厂模式的编程示例六、抽象工厂模式类图七、Java 中何时使用抽象工厂模式八、抽象工厂模式 Java 教程九、抽象工厂模式的优点和权衡十、Java 中抽象工厂模式的实际应用十一、…

Python中的random模块及相关模块详解例子2解析

Python 的 random 模块提供了生成随机数的函数,这些函数可以用于各种场景,如模拟、游戏开发、加密等。以下是 random 模块的一些常用功能和示例。 基本函数 random.seed(aNone, /) - 初始化随机数生成器。如果提供相同的种子值,将生成相同的…

elastic-job定时任务

静态任务案例 ​ 使用elastic-job很容易,我们接下来学习下elastic-job的使用,这里的案例我们先实现静态任务案例,静态任务案例也就是执行时间事先写好。 实现步骤: 1.引入依赖包 2.配置zookeeper节点以及任务名称命名空间 3.实…

数据分析:锚定黄金营销节点,【出行+文化】成小红书大势

导语 据悉,小红书发布《十大搜索趋势洞察》,小编发现其中涉及到热门趋势【理性听劝】。本期,小编将以此展开,为即将到来的十一长假,为品牌提供营销启示。 洞察【出行文化】这件大事 在出行这件事上,小红…

FuTalk设计周刊-Vol.071

#AI漫谈 热点捕手 1.Midjourney 网页版开放,提供了免费的使用额度 链接https://x.com/midjourney/status/1826305298560418171 2.Stability AI推出Stable Video 4D模型 Stability AI最新推出Stable Video 4D模型,支持多视角生成、4D模型生成等能力。S…

【网络】传输层协议——TCP协议(进阶)

目录 1.TCP连接的11种状态 2.再次理解三次挥手 2.1.再次理解三次握手 2.2.Socket编程和三次握手的关系 2.2.1.listen的参数 2.2.2.accept函数 2.3.TCP三次握手的优点 2.3.1.阻止重复历史连接的初始化 2.3.2.为什么两次握手不能防止旧的重复连接初始化造成混乱呢&am…

Java开发笔记-spring的@schedule低级错误

最近在追一个数据库等待锁超时,数据库死锁导致的数据问题。考虑是定时任务占用锁,触发器sql冲突导致。于是在研究程序日志。发现了另外一个问题:我的定时任务明明注解的 每天七点执行,他偏偏9点才执行。 之前也没去管它&#xff0…

三维扫描建模是什么?有什么优势?适用于哪些场景?

扫描建模是指通过专业的三维扫描仪对产品进行三维数据的采集,快速获取物体精确的3D数据,实现1:1复刻原物体,扫描后所得的数字化3D模型以obj、fbx、glb、gltf等格式保存。 积木易搭自主研发多款三维扫描设备,通过非接触式扫描硬件设…

ant-design-vue@1在线主题编辑器实现

::: tip 本文介绍工作中碰到的需求,需要基于vue2、ant-design-vue1版本和less实现使用了ant-design-vue组件库的项目在线配置主题。其中核心就是html支持直接引入stylesheet/less,可以使用less.modifyVars修改变量动态编译。 ::: 项目依赖 ant-design-…

DevOps实现CI/CD实战(二)-Jenkins配置

六、 CI/CD入门操作 基于Jenkins拉取GitLab的SpringBoot代码进行构建发布到测试环境实现持续集成 基于Jenkins拉取GitLab指定发行版本的SpringBoot代码进行构建发布到生产环境实现CD实现持续部署 1. 创建springboot项目 编写简单的程序 修改pom.xml,添加打包的…

论文学习—Efficient Multi-label Classification with Many Labels

论文学习:Efficient Multi-label Classification with Many Labels 摘要2. 多标签分类相关工作2.1 Label Transformation1. **降维(Dimensionality Reduction)**2. **回归模型(Regression Model)**3. **逆变换&#xf…

深圳MES制造管理系统在企业中的应用

深圳是中国制造业的重要基地,许多制造企业在深圳地区都在使用MES制造管理系统来优化生产管理、提高生产效率和产品质量。深圳MES制造管理系统的应用主要体现在以下几个方面: 生产计划管理:深圳的制造企业通常面临订单量大、交货期紧的情况&am…

nginx + lnmp架构部署

一、nginx简介 Nginx是一款轻量级的Web服务器/反向代理服务器及电子(IMAP/POP3)代理服务器。 Nginx由俄罗斯的程序设计师Igor Sysoev所开发,最初供俄国大型的入口网站及搜寻引擎Rambler使用。 第一个公开版本0.1.0发布于2004年10月4日。其…

一文彻底搞懂CNN - 2012年ImageNet大赛冠军(AlexNet)

AlexNet是一种深度卷积神经网络(CNN),由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton于2012年在ImageNet图像分类竞赛中首次引入。AlexNet是第一个在ImageNet数据集上取得最佳结果的深度学习模型,它的出现标志着深度学习在图…