Python之字符串的特点

news2025/1/8 5:43:00

1.布尔值

  • Python2中没有布尔值,直接用数字0表示Flase,用数字1表示True。
  • Python3中,把True和False定义成了关键字,但他们的本质还是1和0,甚至可以和数字相加。
>>> a = True
>>> b = 3
>>> a+b
4

2.比较运算符

所有比较运算符返回1表示真,返回0表示假。这分别与特殊的变量True和Flase等价,以下假设变量a为15,变量b为30;

运算符描述实例
==等于 - 比较对象的值是否相等(a == b)返回False
!=不等于不等于 - 比较两个对象的值是否不相等
>大于 - 返回x是否大于y(a>b)返回False
<小于 - 返回x是否小于y(a<b)返回true
<=小于等于 - 返回x是否小于等于y(a<=b)返回True

逻辑运算符

运算符格式说明
or 逻辑或x or yx为true,则返回true x为false,则返回y
and 逻辑与x and yx为true,则返回y的值 x为false,则返回false
notnot xx为true,返回false x为false,返回true

同一运算符

同一运算符用于比较两个对象的存储单元,实际比较的是对象的地址。

运算符描述
isis是判断两个标识服符是不是引用同一个对象
is notis not 是判断两个标识符是不是引用不同对象

is与 == 区别:
is用于判断两个变量引用对象是否为同一个,即比较对象的地址。
== 用于判断变量引用对象的值是否相等,默认调用对象的_eq_()方法。

  • 整数缓存问题
    Python仅仅对比较小的整数对象进行缓存(范围为[-5,256])缓存起来,而并非是所有整数对象。需要注意的是,这仅仅是在命令行中执行,而在Pycham或则和保存为文件执行,结果是不一样的,这是因为解释器做了一部分优化(范围是[-5,任意正整数])。

总结

  • is比较两个对象的id值是否相等,是否向同一个内存地址;
  • == 比较的是两个对象的内容是否相等,值是否相等;
  • 小整数对象[-5,256]在全局解释器范围内被放入缓存供重复使用;
  • is运算符比 == 效率高,在变量和None进行比较时,应该使用is。
    【操作】用户输入年龄,判断是否为青年(小于45岁)

3.字符串基本特点

很多初学编程时,总是担心自己数学不行,潜意识里认为数学好才能学编程,实际上,大多数程序员打交道最多的是"字符串"而不是"数字"。因为,编程是用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力。
字符串本质是:字符序列。Python的字符串是不可变的,我们无法对原字符串做任何修改。但,我们可以将字符串的一部分复制待新创建的字符串,达到"看起来修改"的效果。
Python不支持字符类型,单字符也是作为一个字符串使用的。


字符串的编码

Python3直接支持Unicode,可以表示世界上任何书面语言的字符,Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集。

  • 使用内置函数ord()可以把字符转换成对应的Unicode码;
  • 使用内置函数chr()可以把十进制数字转换成对应的字符。
>>> ord('A')
65
>>> ord('高')
39640
>>> chr(66)
'B'
>>> ord('瑞')
28103

引号创建字符串

我们可以通过单引号或双引号创建字符串。例如: a= ‘abc’ ; b=“sxt”
使用两种引号的好处是可以创建本身就包含引号的字符串,而不是使用转义字符。例如:

>>> a = "I'm a teacher!"
>>> print(a)
I'm a teacher!
>>> b = 'my_name is "TOM"'
>>> print(b)
my_name is "TOM"

连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如:

>>> resume = "'name="ring"'
company="sxt"  age=18
lover="Tom"
>>> print(resume)
name="ring"
company="sxt"  age=18
lover="Tom"

空字符串和len()函数

Python允许字符串的存在,不包含任何字符且长度为0。例如:

>>> c="
>>> len(c)
0

len()用于计算字符串含有多少字符。例如:

>>> d='abc的朋友'
>>> len(d)
6

转义字符

我们可以使用"+特殊字符",实现某些难以用字符表示的效果。比如:换行等。常见的转义字符有这些:

转义字符描述
(在行尾时)续行符
|反斜杠符号
单引号
*双引号
\b退格(Backspace)
\n换行
\t横向制表符
\r回车

【操作】
测试转义字符的使用

>>> a ='I\nlove\nU'
>>> a
'I\nlove\nU'
>>> print(a)
I
love
U
>>> print('aaabb\cccddd')
aaabbccccddd

【操作】使用原始字符串输出的技巧

>>> c='c:\aa\bb.mp4'
>>> c
'c:\x07a\x08b.mp4'
>>> c
'\\c:\\aa\\bb.mp4'
>>> c=r'c:\aa\bb.mp4'
>>> c
'c:\\aa\\bb.mp4'

字符串拼接

1.可以使用+将多个字符串拼接起来。例如:‘aa’ + ‘bb’ ==> ‘aabb’。
(1)如果+两边都是字符串,则拼接。
(2)如果+两边都是数字,则加法运算。
(3)如果+两边类型不同,则抛出异常。
2.可以将多个字面字符串直接放到一起实现拼接。例如:‘aa’ ‘bb’ ==> ‘aabb’
【操作】
字符串拼接操作

>>> a = 'sxt' +'gaoqi'
>>> a
'sxtgaoqi'
>>> b = 'sxt''gaoqi'
>>> b
'sxtgaoqi'

字符串复制

使用*可以实现字符串复制。
【操作】字符串复制操作

>>> a ='Sxt'*3
>>> a
'SxtSxtSxt'

不换行打印

我们前面调用print时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行符。我们可以自己通过参数end= “任意字符串”。实现末尾添加任何内容:
建立源文件mypy_06.py:

print("sxt",end=' ')
print("sxt",end='###')
print("sxt")

运行结果:
sxt sxt##sxt


##从控制台读取字符串
我们可以使用input()从控制台读取键盘输入的内容:

>>> myname = input("请输入名字")
请输入名字:ring
>>> nyname
'ring'

str()实现数字转型字符串

str()可以帮助我们将其数据类型转换为字符串。例如:

str(5.20) ==> '5.20'
str(3.14e2) ==>'314.0'
str(True) ==>'True'

当我们调用print()函数时,解释器自动调用str()将非字符串的对象转成了字符串。我们在面向对象章节中详细讲解这部分。


使用[]提取字符

字符串的本质就是字符序列,我们可以在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。
正向搜索:
最左侧第一个字符,偏移量是0,第二个偏移量是1,以此类推。直到len(str)-1为止。
反向搜索:
最右侧第一个字符,偏移量是-1,倒数第二个偏移量-2,以此类推,直到-len(str)为止。
【操作】使用[]提取字符串中的字符

>>> a ='qwertyuiop'
>>> a
'qwertyuiop'
>>> a[0]
'q'
>>> a[3]
'r'
>>> a[10-1]
'p'
>>> a[-1]
'z'
>>>a[-10]
'q'
>>> a[-20]
Traceback(most recent call last):
 File"<pyshell#91>",line1,in <module>
 a[-20]
 IndexError:string.index out of range

replace()实现字符替换

字符串是"不可改变"的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变字符串。我们尝试改变字符串中的某个字符,发现报错了:

>>> a ='qwertyuiop'
>>> a
'qwertyuiop'
>>> a[3] = '高'
Traceback (most recent call last):
  File "<pyshell#94>",line1,in<module>
  a[3] = '高'
  TypeError:'str' object does not support item assignment

字符串不可改变,但是我们确实有时候需要替换某些字符。这时,只能通过创建的字符串来实现。

>>> a = 'qwertyuiop'
>>> a
'qwertyuiop'
>>> a.replace('e','高')
'qw高rtyuiop'

整个过程中,实际我们是创建了新的字符串对象,并指向了变量a,而不是修改来以前的字符串。内存图如下:
在这里插入图片描述


字符串切片slice操作

切片silce操作可以让我们快速的提取字符串,标准格式为:
[起始偏移量start:终止偏移量 end:步长step]
典型操作(三个量为正数的情况)如下:

操作和说明示例结果
[:] 提取整个字符串“abcdef” [:]“abcdef”
[start]从start索引开始到结尾“abcdef” [2:]“cdef”
[:end]从头开始知道end -1“abcdef” [:2]“ab”
[start:end]从start到end-1“abcdef” [2:4]“cd”
[start🔚step]从start提取到end-1,步长是step“abcdef” [1:5:2]“bd”

其他操作(三个量为负数)的情况:

示例说明结果
“asdfghjkl” [-3:]倒数三个“jkl”
“asdfghjkl”[-8:-3]倒数第八个到倒数第三个(包头不包尾)“sdfgh”
“asdfghjkl”[::-1]步长为负,从右到左反向提取“lkjhgfdsa”

切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于"长度-1"会被当成-1,例如:

>>> "abcdefg"[3:50]
'defg'

我们发现正常输出了结果,没有报错。
【操作】

  • 将"to be or not to be"字符串倒序输出
  • 将"sxtsxtsxtsxtsxt"字符串中所有的s输出

split()分割和join()合并

split()可以基于指定分隔符将字符串分割成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:

>>> a = "to be not to be"
>>> a.split()
['to','be','or','not','to','be']
>>> a.split('be')
['to','or not to','']

join()的作用和split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:

>>> a =['sxt,sxt100','sxt200']
>>> '*'.join(a)
'sxt*sxt100*sxt200'

拼接字符串要点:
使用字符串拼接符+,会生成新的字符对象,因此不推荐使用+来拼接字符串。推荐使用join函数,因为join函数在拼接字符串之前计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。
【操作】测试+拼接符和join(),不同的效率

import time

time01 = time.time()   #起始时刻
a = " "
for i in range(10000000):
    a += "sxt"
time02 = time.time()  #终止时刻

print("运算时间:"+str(time02-time01))


time03 = time.time()  #起始时刻
li = []
for i in range(10000000):
li = []
for i in range(10000000) :
    LI.append("sxt")

a = " ".join(li)

time04 = time.time()  #终止时刻

print("运算时间:"+str(time04-time03))

字符串驻留机制和字符串比较

**字符串驻留:**仅保存一份相同切不可变字符串的方法,不同的值被存放在字符串驻留池中。
Python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制。

>>> a = "abd_33"
>>> b = "abd_33"
>>> a is b
>True
>>> c = "dd#"
>>> d = "dd#"
>>> c is d
Flase
>>> str1 = "aa"
>>> str2 = "bb"
>>> str1 +str2 is "aabb"
True

字符串比较和同一性

我们可以直接使用++,!=对字符进行比较,是否含有相同的字符。
我们使用is /not is,判断两个对象是否同一个对象。比较的是对象的地址,即id(obj1)是否和id(obj2)相等。


成员操作符

in/not in 关键字,判断某个字符(子字符串)是否存在于字符串中。


字符串常用方法汇总:
常用查找方法:
我们以一段文本作为测试:
a = “我是tom,今年20岁,我在西安上班。我的朋友是LiMing,他22岁了,我是一个编程教育普及者,希望影响6000万学习编程的中国人。我的朋友现在也开始学习编程,希望他以后能够超越我”

方法和使用示例说明结果
len(a)字符串长度96
a.startswith(‘我是Tom’)以指定字符串开头True
a.endswith(‘过我’)以指定字符串结尾True
a.find(‘高’)第一次出现指定字符串的位置2
a.rifind(‘高’)最后一次出现指定字符串的位置29
a.count(“编程”)指定字符串出现了几次3
a.isalnum()所有字符全是字母或数字False

去除首尾信息

我们可以通过strip()去除字符串首尾指定信息。通过lstrip()去除字符串左边指定信息,rstrip()去除字符串右边指定信息。
【操作】去除字符串首尾信息

>>> "*s*x*t*" .strip("*")
's*x*t*'
>>> "*s*x*t*" .rstrip("*")
'*s*x*t'
>>> "sxt" .strip()
'sxt'

大小写转换

编程中关于字符串大小写转换的情况,经常遇到。我们将相关方法汇总到这里。为了方便学习,先设定一个测试变量:
a = “gaoqi love programming, love SXT”

示例说明结果
a.capitalize()产生新的字符串,首字母大写‘Gao love prrogramming, love SXT’
a.title()产生新的字符串,每个单词都首字母大写‘Gaoqi Love Programming, Love SXT’
a.upper()产生新的字符串,所有字符全转成大写GAOQI LOVE PROGRAMMING, LOVE SXT
a.lower()产生新的字符串,所有字母全转成小写‘gaoqi love programming, love sxt’
a.swapcase()产生新的,所有字母大小写转换‘GAOQI LOVWPROGRAMMING, LOVE sxt’

格式排版

center()、ljust()、rjust这三个函数用于对字符串实现排版。示例如下:

>>> a="SXT"
>>> a.center(10,"*")
'***SXT****'
>>> a.center(10)
' SXT '
>>> a.ljust(10,"*")
'SXT*******'

其他方法
1.isalnum() 是否为字母或数字
2.isalpha() 检测字符串是否只由字母组成(含汉字)。
3.isdigit() 检测字符串是否只由数字组成。
4.isspace() 检测是否为空白符。

>>> "sxt100".isalnum()
True
>>> "sxt帅哥.isalpha"
True
>>> "234.3".isdigit()
False
>>> "23423".isdigit()
True
>>> "aB".issupper()
False
>>> "A".isupper()
True
>>> "\t\n".isspace()
True

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/146569.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[多图,秒懂]如何训练一个“万亿大模型”?

1. 背景近几年&#xff0c;随着“大模型”概念的提出&#xff0c;深度学习模型越来越大&#xff0c;如何训练这些大模型成为一个亟待解决的工程问题。最初的视觉模型只有几百兆的参数量&#xff0c;而现在的语言模型中&#xff0c;动则百亿&#xff0c;千亿的参数量&#xff0c…

[golang工作日记] for range 踩坑

1、for range指针赋值 Ops的数据保存在两个表中&#xff0c;一个是ops_tab&#xff0c;另一个是staff_tab&#xff0c;其中ops_tab的staff_id是staff_tab的外键&#xff0c;两个表都有staff_id字段。 type OpsDetail struct {OpsId stringStaffId stringOps *model.Ops…

Node.js安装配置

目录1. 下载node2. 安装3. 检查是否安装成功4. 配置缓存路径5. 实现一个demo1. 下载node 官方地址https://nodejs.org/en/下载长期支持版本 2. 安装 一路next node一起安装npm 这个地方不要勾选 安装成功 3. 检查是否安装成功 cmd运行下面命令 # 查看node的版本 node -v # …

【博客571】“时序敏感应用“ 如何prometheus自定义上报时间戳

“时序敏感应用” 如何prometheus自定义上报时间戳 1、场景 在物理网络监控中&#xff0c;对于流量趋势是极其敏感的&#xff0c;物理网络监控流量的点通常是秒级别甚至毫秒级别&#xff0c;此时这些时许点通过各种上报上传到监控系统中&#xff0c;由于网络波动&#xff0c;可…

Kubernetes v1.24.2高可用部署

sskubeasz 1、Kubeasy简介 kubeasz 致力于提供快速部署高可用k8s集群的工具, 同时也努力成为k8s实践、使用的参考书&#xff1b;基于二进制方式部署和利用ansible-playbook实现自动化&#xff1b;既提供一键安装脚本, 也可以根据安装指南分步执行安装各个组件。 kubeasz 从每…

【lc刷题 day12】堆/栈/队列

BM42 用两个栈实现队列 easy import java.util.Stack;public class Solution {Stack<Integer> stack1 new Stack<Integer>();Stack<Integer> stack2 new Stack<Integer>();public void push(int node) {stack1.push(node);}public int pop() {if(st…

随便聊聊浪潮开务数据库

今天这个话题挺随意&#xff0c;我们来聊聊浪潮开务数据库&#xff0c;原因主要是我的微信朋友圈被这个数据库刷屏了。当然我对这款号称多模数据库的非开源数据库也很感兴趣&#xff0c;也有很多疑问&#xff0c;希望各位专家能帮忙答疑解惑&#xff0c;揭开这款即将发布的 Kai…

机器学习--多层感知机、卷积神经网络、循环神经网络

目录 一、多层感知机 二、卷积神经网络 三、循环神经网络 总结 一、多层感知机 手工提取特征&#xff08;用人的知识进行&#xff09; --> 神经网络来提取特征。 神经网络&#xff08;可能更懂机器学习&#xff09;来提取 可能对后面的线性或softmax回归可能会更好一…

【UE4 第一人称射击游戏】23-添加子弹伤害

上一篇&#xff1a;https://blog.csdn.net/ChaoChao66666/article/details/128589063?spm1001.2014.3001.5501本篇效果&#xff1a;步骤&#xff1a;创建一个蓝图类&#xff08;父类为Character&#xff09;&#xff0c;命名为“SimpleAI”双击打开“SimpleAI”&#xff0c;点…

非对称加密实战(一):JDK生成keystore获取公钥私钥及代码验证【附源码】

目录使用说明非对称加密生成keystore文件公钥私钥互相解密获取fd-alias.keystore中的公钥私钥使用生成公钥私钥进行解密源码地址使用说明 非对称加密 非对称加密算法主要有&#xff1a;RSA、Elgamal、背包算法、Rabin、D-H、ECC&#xff08;椭圆曲线加密算法&#xff09;。下…

TensorRT学习笔记--基于FCN-ResNet101推理引擎实现语义分割

目录 前言 1--Pytorch模型转换为Onnx模型 2--Onnx模型可视化及测试 2-1--可视化Onnx模型 2-2--测试Onnx模型 3--Onnx模型转换为Tensor RT推理模型 4--基于Tensor RT使用推理引擎实现语义分割 前言 基于Tensor RT的模型转换流程&#xff1a;Pytorch → Onnx → Tensor RT…

通用vue组件化首页

一、首先先建立文件main.vue,构建主体 1.选择合适的模板element-plus,直接复制 2.编写相应的样式 <template><div class"main"><el-container class"main-content"><el-aside> aside </el-aside><el-container class&q…

2022年中职组网络安全竞赛D模块竞赛漏洞报告单总结

Windows加固 后门用户 漏洞发现过程 打开cmd使用net user 看到”hacker”用户,疑似存在后门用户 使用hacker/123456成功登录目标服务器,证明存在后门用户 漏洞加固过程 删除后门用户

HTML与CSS基础(一)—— HTML基础(web标准、开发工具、标签)

目标能够理解HTML的 基本语法 和标签的关系 能够使用 排版标签 实现网页中标题、段落等效果 能够使用 相对路径 选择不同目录下的文件 能够使用 媒体标签 在网页中显示图片、播放音频和视频 能够使用 链接标签 实现页面跳转功能一、基础认知目标&#xff1a;认识 网页组成 和 五…

【Linux】程序的翻译四个阶段(图示详解)

因为淋过雨&#xff0c;所以懂的为别人撑伞&#xff1b;因为迷茫过&#xff0c;所以懂得为别人指路。 我们都知道写好代码后&#xff0c;编译器会帮助我们把代码生成可执行程序&#xff0c;细加了解又会知道程序的生成又分为四步&#xff1a;预处理、编译、汇编、链接。那么这四…

JAVA语言基础语法——异常中的常见方法及抛出异常等练习

Throwable的成员方法定义在最顶级Throwable类中a.实例如下&#xff1a;e.printStackTrace(); 将异常的所有信息红色的字体打印在控制台&#xff0c;不会结束虚拟机&#xff0c;仅仅只是打印的操作。抛出处理throws注意&#xff1a;写在方法定义处&#xff0c;表示声明一个异常&…

DOM(三):鼠标、键盘事件对象

鼠标、键盘事件对象鼠标事件对象键盘事件对象鼠标事件对象 event对象代表事件的状态&#xff0c;和事件相关的一系列信息的集合。现阶段我们主要是用鼠标事件对象MouseEvent和键盘事件对象KeyboardEvent 例如&#xff1a; // 鼠标事件对象 MouseEventdocument.addEventListene…

Android正确的保活方案,不要掉进保活需求死循环陷进

在开始前&#xff0c;还是给大家简单介绍一下&#xff0c;以前出现过的一些黑科技&#xff1a; 大概在6年前Github中出现过一个叫MarsDaemon&#xff0c;这个库通过双进程守护的方式实现保活&#xff0c;一时间风头无两。好景不长&#xff0c;进入 Android 8.0时代之后&#x…

STM32系列单片机标准库移植FreeRTOS V10.4.6详解

文中所用到的资料下载地址 https://download.csdn.net/download/qq_20222919/87370679 最近看正点原子新录制了手把手教你学FreeRTOS的视频教程&#xff0c;看了一下教程发现视频里面讲的是使用HAL移植 FreeRTOS V10.4.6 版本&#xff0c;以前的标准库移植的是FreeRTOS V9.0 版…

关于PostgreSQL JIT Memory-Leak 问题 从 LLVM源码层面来分析

文章目录前言LLVM Types 在 JIT中的使用LLVM Types 设计导致的 PG JIT 内存问题分析解决&#xff1f;前言 之前介绍 PG 的 JIT 实现 时提到 为了性能开启JIT 之后有一个比较严重的内存泄漏问题。现象就是在一个backend 内持续跑大量的 sqllogic 随机复杂查询&#xff0c;能够看…