我的机器学习学习之路

news2025/4/1 22:52:37

学习python的初衷

• hi,今天给朋友们分享一下我是怎么从0基础开始学习机器学习的。

• 我是2023年9月开始下定决心要学python的,目的有两个,一是为了提升自己的技能和价值,二是将所学的知识应用到工作中去,提升工作效率。

我的背景与书籍选择

• 我是上班族,2023年非全日制硕士研究生毕业。

• 我的导师是数学博士,在导师的推荐下买了周老师的《机器学习(西瓜书)》和李航老师的《统计学习方法》,这2本书主要讲机器学习的基础理论,对于我这种0基础的小白,完全看不懂,就连简单的代码都不懂,所以只能从基础的python开始学起。

python入门学习

• 于是在网上查了很多资料,买了第一本书《python编程从入门到实践》第三版,在看书的同时,在b站同步看视频,一边学一边用电脑敲代码,感觉挺有意思,兴趣越来越浓了,下班回家、周末,都会找时间学习。

• 这本书学到第11章,后面具体项目实例,没有学。

• 感觉挺简单的,就是学完容易忘,尤其对于我这种新手,不过没关系,后面的学习都会用到python,可以巩固。

python数据分析学习

• 第二本书学的《利用python进行数据分析》第三版,用python操作数据进行分组、合并等等。

• 第三本书学的《 Excel+Python》,用python读写excel等。

• 这2本书主要以看书为主,遇到不懂不会的知识点,就在网上找资料,博客里面有好多大佬讲的非常好,通俗易懂,看完基本都会了。

• 这段时间各大互联网公司陆续发布了大模型,开始用的文心一言,对于自学的人来讲,简直就是自学机器学习神器,不会的不懂的就问,再不懂还可以追问,直到明白为止。

• 2024年与文心一言互动2300多次。

• 学完这2本书,既巩固了python基础,又学习了用python来操作数据。

• 用这些学到的知识,针对日常中经常操作excel工作,做了几个自动化python小程序,可以简单实现办公自动化了。

机器学习理论学习

• 当有了一定的python和数据分析基础之后,再看《西瓜书》和《统计学习方法》,里面的代码至少能看的懂些了。

• 我大学学的工科,学过高数、概率论和线性代数,大学都没好好学,那会沉迷于dota,学这些影响我玩dota(中单影魔,白虎的箭,推塔的小y,憋辉耀的幽鬼,跑题了......)。

• 出来混,迟早是要还的,这2本书是最难的,里面有很多公式,完全看不懂,就在b站找了很多视频,有几个博主是完全按照这2本书内容讲的,讲的非常好,看完视频在看书,就简单很多了,也有的博主讲的某个算法,比大学老师讲的可能都好,《西瓜书》还有周老师给学生将的研究生课程视频。

• 我是边学习边记笔记,后面忘了就看笔记。

• 学到集成学习的时候又买了周老师的《集成学习》,这本书详细介绍集成学习知识。

• 《西瓜书》学到第12章、《统计学习方法》学到第16章,后面内容是马尔科夫链等概率模型,暂时就不学了,之后有需要再来学。

机器学习实战学习

• 当学完理论以后,就迫不及待的学习《Python机器学习基础教程》、《机器学习实战》,主要讲怎么用python库sklearn实现机器学习算法,有监督无监督学习算法、数据预处理、模型评估、调参数、管道等等,也会涉及到数据分析的知识。

• 这部分内容主要以看书+敲代码+豆包+deepseek为主。

• 之前用文心一言,后面发现豆包回答讲解会更好些,deepseek出来之后,深度思考的内容也很好。

• 既巩固了前面几本书的知识,又能手动实现了这些算法。

• 《Python机器学习基础教程》学完了,《机器学习实战》只学习了一部分(200多页),后面第二部分是深度神经网络的内容(有5-6百页吧),以后学习深度神经网络在学。

学习历程回顾

• 截止到2025年3月底,从2023年9月开始学习python基础到数据分析,再到机器学习,已经学习了一年半了,我感觉已经有能力利用python完成一些简单的办公自动化和建模工作了。

后续学习计划

• 后面计划暂时先不学习深度神经网络知识,接下来打算针对自己的工作内容做些自动化的小程序和模型,实战1-2年后再学吧。

 

切记,光学不练,没用的,所以一定要练习,实战。

 

对学习的看法

• 身边的人多次问我,现在大模型都能给出你想要的代码,还学习python有啥用?

• 虽然模型能给出代码,但是看不懂,又不懂理论,也没法结合问题去优化代码,有时候给出的代码也不一定是你想要的,有的时候代码也有可能是错误的,无论是文心一言,豆包,还是deepseek,都有错的,已经验证过好多次了,同一个问题三个模型给出的回答都是错的。

你的优势

• 也许过了五年、十年,你的工作因为你会编写代码,自己建模而没有被裁员,这就是你的优势。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2325247.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python数据可视化-第3章-图表辅助元素的定制

教材 本书为《Python数据可视化》一书的配套内容,本章为第3章-图表辅助元素的定制 本章主要介绍了图表辅助元素的定制,包括认识常用的辅助元素、设置坐标轴的标签、设置刻度范围和刻度标签、添加标题和图例、显示网格、添加参考线和参考区域、添加注释文…

springboot实现异步导入Excel的注意点

springboot实现异步导入Excel 需求前言异步导入面临的问题实现异步如何导入大Excel文件避免OOM?异步操作后,如何通知导入结果?如何加快导入效率?将导入结果通知给用户后,如何避免重复通知? 优化点完结撒花&…

Linux练习——有关硬盘、联网、软件包的管理

1、将你的虚拟机的网卡模式设置为nat模式,给虚拟机网卡配置三个主机位分别为100、200、168的ip地址 #使用nmtui打开文本图形界面配置网络 [rootrhcsa0306 ~]# nmtui #使用命令激活名为 ens160 的 NetworkManager 网络连接 [rootrhcsa0306 ~]# nmcli c up ens160 #通…

论文阅读:GS-Blur: A 3D Scene-Based Dataset for Realistic Image Deblurring

今天介绍一篇 2024 NeurIPS 的文章,是关于真实世界去模糊任务的数据集构建的工作,论文作者来自韩国首尔大学 Abstract 要训练去模糊网络,拥有一个包含成对模糊图像和清晰图像的合适数据集至关重要。现有的数据集收集模糊图像的方式主要有两…

Cocos Creator Shader入门实战(七):RGB不同算法效果的实现,及渲染技术、宏定义、属性参数的延伸配置

引擎:3.8.5 您好,我是鹤九日! 回顾 上篇文章,讲解了Cocos Shader如何通过setProperty动态设置材质的属性,以及设置属性时候的一些注意事项,比如: 一、CCEffect部分properties参数的设定后&…

算法学习记录:递归

递归算法的关键在于回复现场,dfs()函数返回值、结束条件、它的作用。 目录 1.综合练习 2. 二叉树的深搜 1.综合练习 39. 组合总和 - 力扣(LeetCode) 关键在画出的决策树当中,前面使用过的2、3,…

可发1区的超级创新思路(python\matlab实现):MPTS+Lconv+注意力集成机制的Transformer时间序列模型

首先声明,该模型为原创!原创!原创!且该思路还未有成果发表,感兴趣的小伙伴可以借鉴! 应用场景 该模型主要用于时间序列数据预测问题,包含功率预测、电池寿命预测、电机故障检测等等。 一、模型整体架构(本文以光伏功率预测为例) 本模型由多尺度特征提取模块(MPTS)…

三、分类模块,通用组件顶部导航栏Navbar

1.封装通用组件顶部导航栏Navbar 不同效果 Component export struct MkNavbar {Prop title: string Prop leftIcon: ResourceStr $r("app.media.ic_public_left")ProprightIcon: ResourceStr $r("app.media.ic_public_more")PropshowLeftIcon: boolean…

PHY——LAN8720A 寄存器读写 (二)

文章目录 PHY——LAN8720A 寄存器读写 (二)工程配置引脚初始化代码以太网初始化代码PHY 接口实现LAN8720 接口实现PHY 接口测试 PHY——LAN8720A 寄存器读写 (二) 工程配置 这里以野火电子的 F429 开发板为例,配置以太网外设 这里有一点需要注意原理图 RMII_TXD0…

Flutter_学习记录_AppBar中取消leading的占位展示

将leading设置为null将automaticallyImplyLeading设置为false 看看automaticallyImplyLeading的说明: Controls whether we should try to imply the leading widget if null. If true and [AppBar.leading] is null, automatically try to deduce what the leading…

未来派几何风格包装徽标品牌海报标牌logo设计无衬线英文字体安装包 Myfonts – Trakya Sans Font Family

Trakya Sans 是一种具有几何风格的现代无衬线字体。Futura、Avant Garde 等。它具有现代条纹,这是宽度和高度协调的结果,尤其是在小写字母中,以支持易读性。 非常适合广告和包装、编辑和出版、徽标、品牌和创意产业、海报和广告牌、小文本、寻…

C语言深度解析:从零到系统级开发的完整指南

一、C语言的核心特性与优势 1. 高效性与直接硬件控制 C语言通过编译为机器码的特性,成为系统级开发的首选语言。例如,Linux内核通过C语言直接操作内存和硬件寄存器,实现高效进程调度。 关键点: malloc/free直接管理内存&#…

ctfshow WEB web8

首先确定注入点,输入以下payload使SQL恒成立 ?id-1/**/or/**/true 再输入一下payload 使SQL恒不成立 ?id-1/**/or/**/false 由于SQL恒不成立, 数据库查询不到任何数据, 从而导致页面空显示 由以上返回结果可知,该页面存在SQL注入,注入点…

【Linux】U-Boot 加载并启动 Linux 系统程序

U-Boot 加载并启动 Linux 系统程序 零、介绍 最近在玩一些嵌入式的开发板,在引导操作系统时需要用到U-Boot,故此研究一下。 U-Boot(Universal Bootloader)是一款开源的通用引导加载程序,专为嵌入式系统设计&#xff…

jarvisoj API调用 [JSON格式变XXE]

http://web.jarvisoj.com:9882/ 题目要求:请设法获得目标机器 /home/ctf/flag.txt 中的flag值 抓包得到: POST /api/v1.0/try HTTP/1.1 Host: web.jarvisoj.com:9882 Content-Length: 36 Accept-Language: zh-CN,zh;q0.9 User-Agent: Mozilla/5.0 (W…

机器学习的一百个概念(4)下采样

前言 本文隶属于专栏《机器学习的一百个概念》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见[《机器学习的一百个概念》 ima 知识库 知识库广场搜索&…

NNI 适配 TensorRT10教程

引言 本文涉及两个框架及其版本分别为 NNI (Neural Network Intelligence) :3.0TensorRT:10.9.0.34 NNI 在文档 Speed Up Quantized Model with TensorRT里描述了如何使用 TensorRT 为NNI量化的模型实现加速,但是从NNI 的源代码https://gi…

多路径 TCP 调度的另一面

参考前面的文章 一个原教旨的多路径 TCP 和 MP-BBR 公平性推演,一直都破而不立,不能光说怎样不好,还得说说现状情况下,该如何是好。 如果 receiver 乱序重排的能力有限(拜 TCP 所赐),如果非要在多路径上传输 TCP&…

vcpkg安装指定版本的库

一.vcpkg安装 使用git将vcpkg源码克隆到本地制定目录(D:\vcpkg),并初始化 git clone https://github.com/microsoft/vcpkg.git cd vcpkg ./bootstrap-vcpkg.sh # Linux/macOS .\bootstrap-vcpkg.bat # Windows 如下图: 二.安…

【工具变量】上市公司供应链稳定性数据两个维度(2013-2023年)

供应链稳定性是指供应链在面对各种内外部因素的冲击和不确定性时,能够保持持续、顺畅运作的能力,而供应链稳定性指数是用于评估企业在其供应链管理中保持稳定性的一个重要指标。本分享数据参考钟涛(2022)、董浩和闫晴(…