流程控制就是控制程序如何执行的方法,它适用于任何一门编程语言,其作用在于可以根据用户的需求决定程序执行的顺序。计算机在运行程序时有三种执行方法:第一种是顺序执行,自上而下顺序执行所有的语句,对应程序设计中的顺序结构;第二种是选择执行,程序中含有条件语句,根据条件语句的结果选择执行部分语句,对应程序设计中的选择结构;第三种是循环执行,在一定条件下反复执行某段程序,对应程序设计中的循环结构,其中被反复执行的语句为“循环体”,决定循环是否中止的判断条件为“循环条件”。
1. 选择语句
选择语句对应选择执行,选择语句包括三种:if语句,if…else语句和if…elif…else语句。这三种选择语句之间也可以相互嵌套。
1)if语句
if语句相当于“如果……就……”,基本语法格式为:
表达式可以为一个布尔值或者变量,也可以是比较表达式或者逻辑表达式,如果表达式的值为真(True),则执行下面的代码块;如果表达式的值为假(False),则跳过下面的代码块,执行代码块后面的语句。需要注意的是,当表达式的值为非零的数字或者非空的字符串时,if语句也会认为是条件成立。
2)if…else语句
if…else语句相当于“如果……就……,否则……”,基本语法格式为:
表达式可以为一个布尔值或者变量,也可以是比较表达式或者逻辑表达式。如果表达式的值为真(True),则执行代码块1,如果表达式的值为假(False),则执行代码块2。
if…else语句也可以简化为条件表达式,比如在输入年份时,如果想要把2022年以前的年份统一设置为2022年,则输入以下代码:
上述代码也可以简化为条件表达式:
3)if…elif…else语句
if…elif…else语句相当于“如果……则……,否则如果满足某种条件则……,不满足某种条件则……”,基本语法格式为:
表达式可以为一个布尔值或者变量,也可以是比较表达式或者逻辑表达式。如果表达式1的值为真(True),则执行代码块1,否则判断表达式2;如果表达式2的值为真(True)则执行代码块2;如果表达式2的值不为真,则继续向下判断表达式3……最后如果所有的表达式均不为真,则执行代码块n。
2. 循环语句
循环语句对应循环执行,循环语句包括两种:while语句和for语句。这两种循环语句之间也可以相互嵌套。
1)while循环语句
while循环语句通过设定条件语句来控制是否循环执行循环体代码块中的语句,只要条件语句为真,循环就会一直执行下去,直到条件语句不再为真为止。基本语法格式为:
2)for循环语句
for循环语句为重复一定次数的循环,适用于遍历或迭代对象中的元素。基本语法格式为:
其中迭代变量用于保存读取的值,对象就是要遍历或迭代的对象(字符串、列表和元组等任何有序序列对象),循环体代码块就是需要被循环执行的代码。例如,输入以下代码并运行:
运行结果如图3.45所示。
其中第一行为字符串strname的内容,接下来的各行为字符串strname的遍历结果。再输入以下代码并运行:
运行结果为:2/4/6/8/。
3. 跳转语句
跳转语句依托于循环语句,适用于从循环体中提前离开的情况,比如在while循环达到结束条件之前离开,或者在for循环完成之前离开。跳转语句包括两种:break语句和continue语句。
1)break语句
break语句可以完全中止当前循环,如果是循环嵌套,那么将跳出最内层的循环。break语句常与if选择语句配合使用,基本语法格式如下:
①while循环中的break:
其中的表达式2为跳出循环的条件,当满足条件时,从当前循环体跳离。
②for循环中的break:
其中的表达式为跳出循环的条件,当满足条件时,从当前循环体跳离。
2)continue语句
continue语句只能中止本轮次的循环,或者说跳过当前轮次循环体中剩余的语句,提前进入下一轮次的循环,而并不是从当前循环体中跳离;如果是循环嵌套,那么跳过的也只是最内层循环体当前轮次的剩余语句。continue也常与if选择语句配合使用,基本语法格式如下:
①while循环中的break:
其中的表达式2为跳过本轮次循环的条件,当满足条件时,中止本轮次的循环。
②for循环中的continue:
其中的表达式为跳过本轮次循环的条件,当满足条件时,中止本轮次的循环。
以上内容节选自《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。
针对数据分析或机器学习推荐两本入门级的图书:《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。这两本书的特色是在数据分析、机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。都有配套免费提供的源代码、数据文件和视频讲解,也有PPT、思维导图、习题等。
为什么说这两本书值得?首先说《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社),内容非常详实,包含了Python和机器学习,相当于一次获得了两本书。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。恒丰银行总行副行长郑现中,山东大学经济学院教学实验中心主任 副教授 韩振,德勤华永会计师事务所 华文伟 合伙人,首创证券深圳分公司机构业务部 樊磊 总经理 中国准精算师,山东省农村信用社联合社数据管理项目组 郝路安 总监等一众大牛联袂推荐。这本书在出版之前曾开发成9次系列课程,在恒丰银行全行范围类开展培训,490人跟随杨维忠老师上课学习(课程限报490人),培训完成后课程在知鸟平台上回放超过3万人次。很多银行员工通过这些学习一下子就学会了Python,并且用于工作中开展数据分析、机器学习、数据可视化等,这本书也被多家商业银行选做数字化人才培训教材,成为银行员工的一本网红书。
《Python数据科学应用从入门到精通》一书,旨在教会读者实现全流程的数据分析,并且相对《Python机器学习原理与算法实现》一书增加了很多概念性、科普性的内容,进一步降低了学习难度。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院刘一鸣副研究员、硕士生导师,得厚投资合伙人张伟民等一众大牛联袂推荐。书中全是干活,买这一本书相当于一下子得到了5本书(Python基础、数据清洗、特征工程、数据可视化、数据挖掘与建模),而且入门超级简单,不需要编程基础,也不需要过多数学推导,非常适用于零基础学生。全书内容共分13章。其中第1章为数据科学应用概述,第2章讲解Python的入门基础知识,第3章讲解数据清洗。第4~6章介绍特征工程,包括特征选择、特征处理、特征提取。第7章介绍数据可视化。第8~13章介绍6种数据挖掘与建模方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。从数据科学应用和Python的入门,再到数据清洗与特征工程,最终完成数据挖掘与建模或数据可视化,从而可以为读者提供“从拿到数据开始,一直到构建形成最终模型或可视化报告成果”的一站式、全流程指导。
两本书随书赠送的学习资料也很多,包括全部的源代码、PPT、思维导图,还有10小时以上的讲解视频,每一章后面还有练习题及参考答案,还有学习群,相对于只看网络上的视频,一方面更加系统、高效,另一方面照着书一步步操作学起来也事半功倍。全网热销中,当当、京东等平台搜索“Python机器学习 杨维忠”“Python数据科学 杨维忠”即可。
《Python机器学习原理与算法实现》(杨维忠、张甜著,2023年2月,清华大学出版社),适用于学习Python/机器学习
《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)适用于学习数据分析、数据科学、数据可视化等。
创作不易,恳请多多点赞,感谢您的支持!也期待大家多多关注我,让我共同学习数据分析知识。