1.行百里者半三十
不少学生或职场人士总面临这样一种窘境:数字化转型大背景、大趋势下,感觉非常有必要学习Python等分析工具,但在真正学习Python的各种语言规则时,往往体验不到知识的乐趣,翻看个别章节后即束之高阁。造成这种情况的根因在于没有结合本职研究或工作需求、没有以解决问题为目标和导向来开展学习。
在学习数字化技能知识方面,我自己愈发觉得不是“万事开头难”,也不是“行百里者半九十”,而更倾向于是一种类似“行百里者半三十”的概念。“开头并不难”,很多时候我们会感慨ChatGPT之神奇,感慨各种缤纷炫酷的可视化,会羡慕优秀同学或年轻同事们眼花缭乱的数字化技能,羡慕他们谈笑间流露出的各种高大上词汇,经常会有一些心动的时刻,下定决心也学一学Python、学一学机器学习,但是买了一些书回来、或买了一些视频以后却束之高阁或者只是翻翻前几页、看看前几分钟,然后就没有了真正的行动。“行百里者也不必半九十”,我的看法是,只要用心学习了前30%就成功了一大半,一方面对于相对全新的知识领域,有了前面的30%的基础,后面的就会越来越简单,另一方面,即使后面没有坚持下去,但也知道了遇到问题时应该去哪里找答案,书到用时也不必方恨少,缺什么补什么就可以。
2.学Python注意要点
根据我多年的教学经验,学Python注意要点有以及下几个方面:
(1)面向问题,学以致用
要结合具体的应用场景来学,不要光学语法,很枯燥也记不住,很容易就全忘了,有很多人买了好多专门学Python的书,里面全是语法,基本上就是看不进去、或者看了也白看,为什么?要以解决问题为导向,比如进行数据分析或数据可视化、或建模开展机器学习等,少儿编程很多都用Python了,为什么小孩们都能学的进去?因为学完了可以接着用于开发一个小游戏,回馈很快。从我周边朋友的经历来看,真正学进去的,基本上都是有数据分析需要的朋友们,因为工作中真的需要。所以我给大家推荐的学习场景入口是数据应用。数字化转型浪潮下,数据科学应用早已不再局限于概念普及和理念推广层面,而是真真切切地广泛应用在各类企事业单位的各个领域,从客户分层管理到目标客户选择,从客户满意度分析到客户流失预警,从信用风险防控到精准推荐……数据科学应用对于企业全要素生产率的边际提升起到了至关重要的作用。学了不会吃亏。
(2)操作百遍,其义自见
要边看书边操作,光看视频不行,光看书也不行,要一边看书一边拿着源代码和数据进行操作,很多时候虽然原理怎么都学不明白,但是会操作了,也会很有成就感,操作多了,对比下不同参数下的运行结果,可能原理也就自然学会了,或者再去看原理就容易理解了,起码知道怎么调整别人的代码了。
(3)增强自信,行动起来
一定一定要克服畏难心理,不要听到“编程”两字就直接吓退了,先安装好Python再说,很多人都说过“安装好Python是成功的一半”,确实是这样,等真正学起来,发现其实不太需要自己写代码,别人的代码拿过来自己调调就可以,编程没有想象的那么难,关键是“读懂、看懂”代码而不是让你自己一大段一大段的自己写代码。
3.Python学习书目推荐
针对Python数据分析或机器学习推荐两本入门级的图书:《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。这两本书的特色是在数据分析、机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。都有配套免费提供的源代码、数据文件和视频讲解,也有PPT、思维导图、习题等。
为什么说这两本书值得?首先说《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社),内容非常详实,包含了Python和机器学习,相当于一次获得了两本书。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。恒丰银行总行副行长郑现中,山东大学经济学院教学实验中心主任 副教授 韩振,德勤华永会计师事务所 华文伟 合伙人,首创证券深圳分公司机构业务部 樊磊 总经理 中国准精算师,山东省农村信用社联合社数据管理项目组 郝路安 总监等一众大牛联袂推荐。这本书在出版之前曾开发成9次系列课程,在恒丰银行全行范围类开展培训,490人跟随杨维忠老师上课学习(课程限报490人),培训完成后课程在知鸟平台上回放超过3万人次。很多银行员工通过这些学习一下子就学会了Python,并且用于工作中开展数据分析、机器学习、数据可视化等,这本书也被多家商业银行选做数字化人才培训教材,成为银行员工的一本网红书。
《Python数据科学应用从入门到精通》一书,旨在教会读者实现全流程的数据分析,并且相对《Python机器学习原理与算法实现》一书增加了很多概念性、科普性的内容,进一步降低了学习难度。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院刘一鸣副研究员、硕士生导师,得厚投资合伙人张伟民等一众大牛联袂推荐。书中全是干货,买这一本书相当于一下子得到了5本书(Python基础、数据清洗、特征工程、数据可视化、数据挖掘与建模),而且入门超级简单,不需要编程基础,也不需要过多数学推导,非常适用于零基础学生。全书内容共分13章。其中第1章为数据科学应用概述,第2章讲解Python的入门基础知识,第3章讲解数据清洗。第4~6章介绍特征工程,包括特征选择、特征处理、特征提取。第7章介绍数据可视化。第8~13章介绍6种数据挖掘与建模方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。从数据科学应用和Python的入门,再到数据清洗与特征工程,最终完成数据挖掘与建模或数据可视化,从而可以为读者提供“从拿到数据开始,一直到构建形成最终模型或可视化报告成果”的一站式、全流程指导。
两本书随书赠送的学习资料也很多,包括全部的源代码、PPT、思维导图,还有10小时以上的讲解视频,每一章后面还有练习题及参考答案,还有学习群,相对于只看网络上的视频,一方面更加系统、高效,另一方面照着书一步步操作学起来也事半功倍。全网热销中,当当、京东等平台搜索“Python机器学习 杨维忠”“Python数据科学 杨维忠”即可。
《Python机器学习原理与算法实现》(杨维忠、张甜著,2023年2月,清华大学出版社),适用于学习Python/机器学习
《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)适用于学习数据分析、数据科学、数据可视化等。
创作不易,恳请多多点赞,感谢您的支持!也期待大家多多关注我,让我共同学习数据分析知识。