💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
本人主要分享计算机核心技术:系统维护、数据库、网络安全、自动化运维、容器技术、云计算、人工智能、运维开发、算法结构、物联网、JAVA 、Python、PHP、C、C++等。
不同类型针对性训练,提升逻辑思维,剑指大厂,非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。
在这一系列的文章中,我会更新收集一些作为AI专业平时实际上课中讲到的、实践中遇到的、看博客刷到的……一些基础的 人工智能算法面试可能会考到的一些小细节、小问题,不仅仅面试受用,平时的课程考试与上机实操都有可能会对大家有所裨益。欢迎关注追更,有好的问题也可以评论或者私信,可以一起整理,加油!
在模型评估过程中,过拟合和欠拟合具体指什么现象?
过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现好,但是在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好。用模型在数据上的偏差和方差指标来表示就是。欠拟合时候,偏差和方差都比较大,而过拟合时,偏差较小但方差较大。
降低模型欠拟合的方法?
对于树形结构为什么不需要归一化?
决策树的学习过程本质上是选择合适的特征,分裂并构建树节点的过程;而分裂节点的标准是由树构建前后的信息增益,信息增益比以及基尼系数等指标决定的。这些指标与当前特征值的大小本身并无关系。
什么是数据不平衡,如何解决?
数据不平衡主要指的是在有监督机器学习任务中,样本标签值的分布不均匀。这将使得模型更倾向于将结果预测为样本标签分布较多的值,从而使得少数样本的预测性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。
解决方法:
1. 重新采样训练集
a. 欠采样 –减少丰富类的大小来平衡数据集
b. 过采样 – 增加稀有样本,通过使用重复,自举或合成少数类
2. 设计使用不平衡数据集的模型
a. 在代价函数中惩罚稀有类别的错误分类。
极大似然估计 是一种根据结果即 预测值来推测参数的一种普遍方法。提到极大似然是为了引出逻辑回归因为二项分布而得到的似然函数