python爬虫学习第二天----类型转换

news2024/11/13 9:41:03

🎈🎈作者主页: 喔的嘛呀🎈🎈
🎈🎈所属专栏:python爬虫学习🎈🎈
✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天开心哦!✨✨ 

目录

类型转换

 转换成为整数

 转换成为浮点数

 转换成为字符串

转换成为布尔值

字符串转换为数字

数字转换为字符串

字符串转换为日期

日期转换为字符串

其他类型转换


 

类型转换

当你在编写Python爬虫时,类型转换是一个常见的操作,因为你经常需要处理从网页中提取的数据,将其转换为适合你处理的类型。在本文中,我们将深入探讨Python中的类型转换,包括字符串转换为数字、日期,以及其他一些常见的类型转换。

函数说明
int(x) 将x转换为一个整数
float(x)将对象 x 转换为字符串
str(x)将对象 x 转换为字符串
bool(x)将对象x转换成为布尔值

 转换成为整数

print(int("123"))  # 123 将字符串转换成为整数
print(int(123.78))  # 123 将浮点数转换成为整数
print(int(True))  # 1 布尔值True转换成为整数是 1
print(int(False)) # 0 布尔值False转换成为整数是 0
# 以下两种情况将会转换失败
'''
123.456 和 12ab 字符串,都包含非法字符,不能被转换成为整数,会报错
print(int("123.456"))
print(int("12ab"))

 转换成为浮点数

f1 = float("12.34")
print(f1)   # 12.34
print(type(f1)) # float 将字符串的 "12.34" 转换成为浮点数 12.34
f2 = float(23)
print(f2)  # 23.0
print(type(f2)) # float 将整数转换成为了浮点数

 转换成为字符串

str1 = str(45)
str2 = str(34.56)
str3 = str(True)
print(type(str1),type(str2),type(str3))

转换成为布尔值

print(bool(''))
print(bool(""))
print(bool(0))
print(bool({}))
print(bool([]))
print(bool(()))

字符串转换为数字

在爬虫中,你经常需要将从网页中提取的数字数据转换为整数或浮点数,以便进行数值计算或比较。你可以使用**int()float()**函数来实现这一转换。

num_str = "123"
num_int = int(num_str)
print(num_int)  # 输出:123

float_str = "3.14"
num_float = float(float_str)
print(num_float)  # 输出:3.14

数字转换为字符串

有时候,你可能需要将数字转换为字符串,比如将爬取的数字数据保存到文件或数据库中时。你可以使用**str()**函数将数字转换为字符串。

num_int = 123
num_str = str(num_int)
print(num_str)  # 输出:"123"

num_float = 3.14
float_str = str(num_float)
print(float_str)  # 输出:"3.14"

字符串转换为日期

当你从网页中提取日期数据时,通常会得到一个字符串表示的日期,你可以使用**strptime()**方法将其转换为Python的日期对象。

from datetime import datetime

date_obj = datetime.now()
date_str = date_obj.strftime("%Y-%m-%d %H:%M:%S")
print(date_str)  # 输出:当前日期和时间的字符串表示

日期转换为字符串

如果你需要将日期对象转换为特定格式的字符串,可以使用**strftime()**方法。

 

from datetime import datetime

date_obj = datetime.now()
date_str = date_obj.strftime("%Y-%m-%d %H:%M:%S")
print(date_str)  # 输出:当前日期和时间的字符串表示

其他类型转换

除了上述类型转换外,你可能还会遇到其他类型的转换需求。比如将列表转换为字符串、字符串转换为列表,以及将字典转换为字符串、字符串转换为字典等。你可以使用**join()split()json.dumps()json.loads()**等方法来实现这些转换。

# 将列表转换为字符串
list_data = ["apple", "banana", "cherry"]
str_data = ", ".join(list_data)
print(str_data)  # 输出:"apple, banana, cherry"

# 将字符串转换为列表
str_data = "apple, banana, cherry"
list_data = str_data.split(", ")
print(list_data)  # 输出:['apple', 'banana', 'cherry']

# 将字典转换为字符串
dict_data = {"name": "Alice", "age": 30}
str_data = json.dumps(dict_data)
print(str_data)  # 输出:'{"name": "Alice", "age": 30}'

# 将字符串转换为字典
str_data = '{"name": "Alice", "age": 30}'
dict_data = json.loads(str_data)
print(dict_data)  # 输出:{'name': 'Alice', 'age': 30}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1532830.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Word2vec学习笔记

(1)NNLM模型(神经网络语言模型) 语言模型是一个单纯的、统一的、抽象的形式系统,语言客观事实经过语言模型的描述,比较适合于电子计算机进行自动处理,因而语言模型对于自然语言的信息处理具有重…

Python基础入门 --- 6.数据容器

文章目录 Python基础入门第六章:6.数据容器6.1 列表6.1.1 列表下标索引6.1.2 列表常用操作查找指定某元素的下标修改指定位置的元素值插入元素追加元素方式1追加元素方式2删除元素删除某元素在列表中的第一个匹配项清空列表统计某元素在列表中的数量统计列表元素个数…

【Redis】Redis常见原理和数据结构

Redis 什么是redis redis是一款基于内存的k-v数据结构的非关系型数据库,读写速度非常快,常用于缓存,消息队列、分布式锁等场景。 redis的数据类型 string:字符串 缓存对象,分布式ID,token,se…

RAGGED: Towards Informed Design of Retrieval Augmented Generation Systems阅读笔记

论文链接:https://arxiv.org/abs/2403.09040 Github链接:GitHub - neulab/ragged: Retrieval Augmented Generation Generalized Evaluation Dataset 最近RAG(retrieval-augmented generation)真的好火,这不CMU的发了…

vscode用SSH远程开发c语言

vscode配置远程 这里我使用虚拟机进行展示,首先需要你的虚拟机安装好ssh 没安装好就执行下面的命令安装并开启服务 sudo apt-get install ssh sudo service ssh start ps -e | grep sshvscode安装 remote-ssh扩展 点击左下角的远程连接,我这里已经连接…

电脑小白入门|Windows系统下只要记住这几点,你就能流畅使用!

前言 前段时间发现有很多小伙伴在使用电脑这个问题上遇到了很大的难题:到底什么时候该用鼠标左键单击、什么时候该双击;电脑的快捷键那么多怎么记得住等等的问题。 今天小白就稍微来讲解一下,这个帖子适合Windows电脑都不会使用的小伙伴。 …

流畅的 Python 第二版(GPT 重译)(四)

第二部分:函数作为对象 第七章:函数作为一等对象 我从未认为 Python 受到函数式语言的重大影响,无论人们说什么或想什么。我更熟悉命令式语言,如 C 和 Algol 68,尽管我将函数作为一等对象,但我并不认为 Py…

iframe动态操作标签分享

前言 分享一个近期工作中遇到的关于IFrame的需求,以及解决方案。 需求大致是说在我们系统中嵌套了另一个文档页面,这个文档页面是爬取的,并且页面是原先使用后端渲染实现的,取到的css和script标签都是相对路径比如: "./mia…

【文件操作和IO】

文件操作和IO 1.文件2. 硬盘上文件的目录结构3. 文件路径4. 文件重要分类:5. Java中操作文件5.1 Java对于文件操作的API5.2 Java中使用File类来进行文件操作5.3 File类属性5.4 构造方法5.5 方法: 6. 文件内容的读写 -- 文件流(数据流&#xf…

32.768K晶振X1A000141000300适用于无人驾驶汽车电子设备

科技的发展带动电子元器件的发展电子元器件-“晶振”为现代的科技带来了巨大的贡献,用小小的身体发挥着大大的能量。 近两年无人驾驶汽车热度很高,不少汽车巨头都已入局。但这项技术的难度不小,相信在未来几年里,无人驾驶汽车这项…

改进粒子群优化算法||粒子群算法变体||Improved particle swarm optimization algorithm

粒子群算法(Particle Swarm Optimization,PSO)是一种基于群体智能的优化算法,其思想来源于鸟群寻食和鱼群捕食等自然现象。PSO算法通过模拟群体智能的行为,以一种启发式的方式寻找最优解,因此具有全局搜索能…

数学建模(熵权法 python代码 例子)

目录 介绍: 模板: 例子:择偶 极小型指标转化为极大型(正向化): 中间型指标转为极大型(正向化): 区间型指标转为极大型(正向化)&#xff1a…

【Web应用技术基础】HTML(4)——表单类的标签

目录 题目1:文本框 题目2:密码框 题目3:单选框 题目4:多选框 题目5:单选框选中 题目6:禁用disabled 题目7:lable标签 题目8:下拉框 题目9:textarea 题目10&…

【Java之老话常谈】学习Java可以用来做什么?

对于很多新手来说,刚开始接触Java会很迷惘,不知道Java可以做什么。其实Java 可以做的东西太多了,手机游戏、中间件、软件、网站,电脑游戏,以及现在流行的安卓手机app等,都是由java语言编写的。由于Java拥有很高的安全性、平台移植性等,所以受到广大程序员的喜爱。 java…

接口测试、postman、测试点提取【主】

接口测试是测试系统组件间接口的一种测试 接口测试主要用于检测外部系统与系统之间以及内部各个子系统之间的交互点 测试的重点是要检查数据的交换,传递和控制管理过程,以及系统间的相互逻辑依赖关系 文章目录 HTTP接口 & Web Service接口RESTful接口…

ubuntu10.04 apache2.2开启tls1.2的支持,使现代的edge和firefox浏览器能正常访问https

最近发现自己ubuntu10.04服务器上的apache https无法通过win11上的edge和firefox浏览器访问,但xp下的ie6和ie8没有问题。 firefox的错误提示为“此网站可能不支持TLS 1.2协议,而这是Firefox支持的最低版本”。 经过检查发现: IE6访问https所需的版本是SS…

virtualBox镜像复制

镜像复制 有一个镜像后,图方便,想直接使用这个vdi文件,但vdi有个uuid值,同一个虚拟机中不能同时存在两个同样的uuid的介质的,普通的复制文件所得到的uuid是一样的 ,所以需要用到自带的方法复制vdi文件&…

隐私计算实训营学习二:隐私计算开源如何助力数据要素流通

文章目录 一、数据要素流转与数据内外循环二、数据外循环中的信任焦虑三、数据要素流通对隐私计算的期望四、隐私计算开源助力数据要素流通 一、数据要素流转与数据内外循环 数据要素流转过程(从数据采集加工->到数据价值释放): 链路主要包括采集、存储、加工、…

计算机网络面经-什么是IPv4和IPv6?

前言 Internet协议(IP)是为连接到Internet网络的每个设备分配的数字地址。它类似于电话号码,是一种独特的数字组合,允许用户与他人通信。IP地址主要有两个主要功能。首先,有了IP,用户能够在Internet上被识别…

JUnit5的条件测试、嵌套测试、重复测试

条件测试 JUnit5支持条件注解,根据布尔值判断是否执行测试。 自定义条件 EnabledIf和DisabledIf注解用来设置自定义条件,示例: Test EnabledIf("customCondition") void enabled() { // ... } Test DisabledIf("cust…