目录
模块一 编程入门与进阶提高
模块二 科研数据可视化
模块三 信息检索与常用科研工具
模块四 科技论文写作与技巧
模块五 数据预处理与特征工程
模块六 多元线性回归
模块七 机器学习
模块八 深度学习
模块九 答疑讨论
更多推荐
在人工智能领域进行研究和深耕,将帮助您在茫茫职场的竞争人海中脱颖而出,登上未来科技巨变的最前沿,比他人更加敏锐、更加迅捷地抓住未来的动向!
【专家】:郁磊(副教授),主要从事Python/Matlab 编程、机器学习与数据挖掘、数据可视化和软件开发、生理系统建模与仿真、生物医学信号处理,具有丰富的科研经验,主编《MATLAB智能算法30个案例分析》、《MATLAB神经网络43个案例分析》相关著作。已发表多篇高水平的国际学术研究论文。
模块一 编程入门与进阶提高
Python编程入门
1、Python环境搭建( 下载、安装与版本选择)。
2、如何选择Python编辑器?(IDLE、Notepad++、PyCharm、Jupyter…)
3、Python基础(数据类型和变量、字符串和编码、list和tuple、条件判断、循环、函数的定义与调用等)
4、常见的错误与程序调试
5、第三方模块的安装与使用
6、文件读写(I/O)
7、实操练习
Python进阶与提高
1、Numpy模块库(Numpy的安装;ndarray类型属性与数组的创建;数组索引与切片;Numpy常用函数简介与使用)
2、Pandas模块库(DataFrame数据结构、表格的变换、排序、拼接、融合、分组操作等)
3、Matplotlib基本图形绘制(线形图、柱状图、饼图、气泡图、直方图、箱线图、散点图等)
4、图形样式的美化(颜色、线型、标记、字体等属性的修改)
5、图形的布局(多个子图绘制、规则与不规则布局绘制、向画布中任意位置添加坐标轴)
6、高级图形绘制(3D图、等高线图、棉棒图、哑铃图、漏斗图、树状图、华夫饼图等)
7、坐标轴高阶应用(共享绘图区域的坐标轴、坐标轴刻度样式设置、控制坐标轴的显示、移动坐标轴的位置)
8、实操练习
课后作业
根据给定的图像处理算法,编写相应的Python程序,实现图像的读取、处理和结果存储等功能
模块二 科研数据可视化
Seaborn图形绘制
1、Seaborn简介与安装
2、Seaborn基本图像的绘制(统计关系、分类数据、数据集分布等)
3、Seaborn风格与颜色管理
4、Seaborn多图的绘制
5、实操练习
Pyecharts图形绘制
1、Pyecahrts简介与安装
2、Pyecharts基础知识(快速绘制图表、认识图表类、配置项、渲染图表)
3、常用图表的绘制(折线图、饼图、圆环图、散点图、柱状图、漏斗图、桑基图等)
4、组合图表的绘制(并行多图、顺序多图、选项卡多图、时间线轮播多图等)
5、实操练习
课后作业
对给定的原始数据进行基本的统计分析,并以可视化的方式将分析结果予以呈现
模块三 信息检索与常用科研工具
信息检索与常用科研工具
1、如何无障碍地访问Google、YouTube等网站?(谷歌访问助手、VPN等)
2、如何查阅文献资料?怎样能够保证对最新论文的追踪?
3、Google Scholar、ResearchGate的使用方法
4、应该去哪些地方查找与论文配套的数据和代码?
5、文献管理工具的使用(Endnote、Zotero等)
6、当代码出现错误时,应该如何高效率解决?
7、实操练习
课后作业
检索自己的研究方向内,国内外做的最好的各五个团队,列出同行专家姓名、最相关的代表性论文10篇
模块四 科技论文写作与技巧
科技论文写作与技巧
1、科技论文结构解析(Title、Abstract、Keywords、Introduction、Materials & Methods、Results、Discussion、Conclusion、References)
2、如何高效率撰写专业论文?
3、SCI不同分区的论文差别在哪些地方?
4、从审稿人的角度看,SCI期刊论文需要具备哪些要素?(审稿人关注的点有哪些?如何回应审稿人提出的意见?)
5、如何提炼与挖掘创新点?(如果在算法层面上难以做出原创性的工作,如何结合自己的实际问题提炼与挖掘创新点?)
6、实操练习
课后作业
自拟一个选题(或根据给定的选题),搭建论文初步框架,并完成Introduction部分的撰写(包括对国内外相关文献的综述)
模块五 数据预处理与特征工程
数据预处理与特征工程
1、描述性统计分析(数据的频数分析:统计直方图;数据的集中趋势分析:算数平均值标准差;数据的分布可视化;数据的相关分析:相关系数)
2、Model-Centric AI与Data Centric AI的本质区别与联系
3、数据异常值、缺失值处理
4、数据离散化及编码处理
5、手动生成新特征
6、数据标准化与归一化(为什么需要标准化与归一化?)
7、实操练习
课后作业
对给定的原始数据进行预处理与特征工程处理,并以可视化的方式将处理结果予以呈现
模块六 多元线性回归
多元线性回归
1、多元线性回归模型(回归参数的估计、回归方程的系数)
2、岭回归模型(工作原理、岭参数k的选择、用岭回归选择变量)
3、LASSO模型(工作原理、特征选择、建模预测、超参数调节)
4、Elastic Net模型(工作原理、建模预测、超参数调节)
5、案例实践
6、实操练习
模块七 机器学习
前向型神经网络
1、BP神经网络的基本原理(人工神经网络的分类有哪些?BP神经网络的拓扑结构和训练过程是怎样的?什么是梯度下降法?)
2、BP神经网络的Python代码实现(怎样划分训练集和测试集?为什么需要归一化?归一化是必须的吗?什么是梯度爆炸与梯度消失?)
3、BP神经网络参数的优化(隐含层神经元个数、学习率、初始权值和阈值等如何设置?什么是交叉验证?)
4、值得研究的若干问题(欠拟合与过拟合、泛化性能评价指标的设计等)
5、案例演示一:近红外光谱汽油辛烷值预测(回归拟合)
6、案例演示二:MNIST手写数字识别(分类识别)
7、实操练习
支持向量机、决策树、随机森林、XGBoost和LightGBM
1、SVM的基本原理(SVM的本质是解决什么问题?SVM的四种典型结构是什么?核函数的作用是什么?什么是支持向量?)
2、SVM扩展知识(如何解决多分类问题?SVM除了建模型之外,还可以帮助我们做哪些事情?)
3、决策树的基本原理(微软小冰读心术的启示;什么是信息熵和信息增益?ID3算法和C4.5算法的区别与联系);决策树除了建模型之外,还可以帮我们做什么事情?
4、随机森林的基本原理(为什么需要随机森林算法?广义与狭义意义下的“随机森林”分别指的是什么?“随机”提现在哪些地方?随机森林的本质是什么?)怎样可视化、解读随机森林的结果?
5、Bagging与Boosting的区别与联系
6、AdaBoost vs. Gradient Boosting的工作原理
7、 常用的GBDT算法框架(XGBoost、LightGBM)
8、SVM、决策树、随机森林、XGBoost和LightGBM的Python代码实现
9、案例实践一:乳腺癌肿瘤诊断
10、案例实践二:混凝土强度预测
11、实操练习
群优化算法
1、遗传算法(Genetic Algorithm, GA)的基本原理(以遗传算法为代表的群优化算法的基本思想是什么?目前国内外的研究热点在哪些方面?)
2、遗传算法的Python代码实现
3、案例实践一:一元函数的寻优计算(极大值与极小值)
4、案例实践二:离散变量的寻优计算(基于遗传算法的特征变量筛选)
5、实操练习
变量降维 特征选择
1、变量降维与特征选择在概念上的区分
2、主成分分析(PCA)、偏最小二乘(PLS)的基本原理(PCA与PLS的区别与联系;PCA除了降维之外,还可以帮助我们做什么?)
3、常见的特征选择方法(优化搜索、Filter和Wrapper等;前向与后向选择法;区间法;无信息变量消除法;正则稀疏优化方法等)
4、案例实践:变量降维与特征选择的Python代码实现
5、实操练习
课后作业
以“数据为中心”为原则,对给定的数据集进行建模,建模方法统一用随机森林,着重对数据预处理、特征提取、数据增强等建模前步骤的分析,以及对建模结果的深入分析讨论与优化,撰写研究报告一份
模块八 深度学习
卷积神经网络
1、深度学习与传统机器学习的区别与联系(隐含层数越多越好吗?深度学习与传统机器学习的本质区别是什么?)
2、卷积神经网络的基本原理(什么是卷积核?CNN的典型拓扑结构是怎样的?CNN的权值共享机制是什么?CNN提取的特征是怎样的?)
3、LeNet、AlexNet、Vgg-16/19、GoogLeNet、ResNet 等经典深度神经网络的区别与联系
4、Pytorch深度学习框架简介、PyTorch的安装与环境配置
5、PyTorch常用工具包及API简介:张量Tensor的定义、属性、创建、运算、索引与切片、torchvision(transforms、datasets、model)、torch.nn、torch.optim、torch.utils(Dataset、DataLoader)
6、预训练模型(Alexnet、Vgg-16/19、GoogLeNet、ResNet 等)
7、案例讲解:
(1)CNN 预训练模型实现物体识别
(2)利用卷积神经网络抽取抽象特征
(3)自定义卷积神经网络拓扑结构
(4)1D CNN 模型解决回归拟合预测问题
8、实操练习
网络优化 调参技巧
1、网络拓扑结构优化
2、优化算法(梯度下降、随机梯度下降、小批量随机梯度下降、动量法、 Adam 等)
3、调参技巧(参数初始化、数据预处理、数据扩增、批量归一化、超参数优化、网络正则化等)
4、案例讲解:卷积神经网络模型优化
5、实操练习
迁移学习
1、迁移学习算法的基本原理(为什么需要迁移学习?为什么可以迁移学习?迁移学习的基本思想是什么?)
2、基于深度神经网络模型的迁移学习算法
3、案例讲解:猫狗大战(Dogs vs. Cats)
4、实操练习
循环神经网络 长短时记忆神经网络
1、循环神经网络(RNN)的基本原理
2、长短时记忆神经网络(LSTM)的基本原理
3、RNN与LSTM的区别与联系
4、案例讲解:
1)时间序列预测:新冠肺炎疫情预测
2)序列-序列分类:人体动作识别
5、实操练习
生成式对抗网络
1、生成式对抗网络 GAN(什么是对抗生成网络?为什么需要对抗生成网络?对抗生成网络可以帮我们做什么?GAN 给我们带来的启示)
2、GAN 的基本原理
3、案例讲解:GAN 的 Python 代码实现(向日葵花图像的自动生成)
4、实操练习
自编码器
1、自编码器的组成及基本工作原理
2、自编码器的变种(栈式自编码器、稀疏自编码器、去噪自编码器、卷积自编码器、掩码自编码器等)及其工作原理
3、案例讲解:基于自编码器的图像分类
4、实操练习
YOLO目标检测算法
1、什么是目标检测?目标检测与目标识别的区别与联系
2、YOLO 模型的工作原理
3、案例讲解:
(1)使用预训练模型实现图像、视频等实时目标检测
(2)训练自己的数据集:新冠疫情佩戴口罩识别
4、实操练习
课后作业
自拟选题(或根据给定的选题),利用深度学习方法建立模型,并对模型参数进行优化,撰写研究报告一份
模块九 答疑讨论
1、相关学习资料分享与拷贝(图书推荐、在线课程推荐等)
2、建立微信群,便于后期的讨论与答疑
3、答疑讨论
更多推荐
最新基于MATLAB 2023a的机器学习、深度学习应用_WangYan2022的博客-CSDN博客MATLAB 2023版的深度学习工具箱,提供了完整的工具链,使您能够在一个集成的环境中进行深度学习的建模、训练和部署。与Python相比,MATLAB的语法简洁、易于上手,无需繁琐的配置和安装,让您能够更快地实现深度学习的任务。https://blog.csdn.net/WangYan2022/article/details/131302362?spm=1001.2014.3001.5502PyTorch机器学习与深度学习技术方法与案例应用_WangYan2022的博客-CSDN博客更加系统地学习深度学习的基础理论知识及对应的Pytorch代码实现方法,掌握深度学习的基础知识,与经典机器学习算法的区别与联系,以及最新的迁移学习、循环神经网络、长短时记忆神经网络、时间卷积网络、对抗生成网络、Yolo目标检测算法、自编码器等算法的原理及其Pytorch编程实现方法。https://blog.csdn.net/WangYan2022/article/details/129661491?spm=1001.2014.3001.5502如何利用python机器学习解决空间模拟与时间预测问题及经典案例分析_WangYan2022的博客-CSDN博客了解机器学习的发展历史、计算原理、基本定义,熟悉机器学习方法的分类,常用机器学习方法,以及模型的评估与选择;熟悉数据预处理的流程,掌握python程序包的使用;理解机器学习在生态水文中的应用,掌握机器学习模型构建方法,学会构建机器学习模型用于地表参数的空间模拟与时间预测,并掌握生态水文过程分析。https://blog.csdn.net/WangYan2022/article/details/128861894?spm=1001.2014.3001.5502基于R语言、MATLAB、Python机器学习方法与案例分析_r语言 matlab_WangYan2022的博客-CSDN博客机器学习已经成为继理论、实验和数值计算之后的科研“第四范式”,是发现新规律,总结和分析实验结果的利器。_r语言 matlabhttps://blog.csdn.net/WangYan2022/article/details/126655566?spm=1001.2014.3001.5502基于MATLAB、Python科研数据可视化_python基于matlab_WangYan2022的博客-CSDN博客互联网的飞速发展伴随着海量信息的产生,而海量信息的背后对应的则是海量数据。如何从这些海量数据中获取有价值的信息来供人们学习和工作使用,这就不得不用到大数据挖掘和分析技术。数据可视化分析作为大数据技术的核心一环,其重要性不言而喻。_python基于matlabhttps://blog.csdn.net/WangYan2022/article/details/127053497?spm=1001.2014.3001.5502