23年校招DL/NLP/推荐系统/ML/算法基础面试必看300问及答案

news2024/9/24 9:27:20

2020年校招已经开始了,在疫情全球肆虐的背景下,全球就业情况异常艰难,加上美国对中国企业打压持续升级,对于马上开始秋招找工作的毕业生而言,更是难上加难。我们不能凭一己之力改变现状,但我们可以凭借自己的努力改变自己,想要找到心仪的工作,唯有提升自己的硬件实力。

互联网面试通常都是有套路的,特别是算法面试环节,对于算法相关基础的的考察。因此,推荐本资源,整理了300多道算法岗位相关的面试题目并给出了详细的答案,涉及算法基础知识、推荐系统、机器学习、深度学习、自然语言处理、数学基础知识、数据预处理等相关问题,由互联网一线资深的面试官整理,非常值得深入学习,温故而知新。

资源整理自网络,感谢作者细致整理和无私分享,源地址:https://github.com/sladesha/Reflection_Summary

300问题及最新答案下载地址:

微信公众号“深度学习与NLP”回复关键字“sfie20”获取下载地址。

基础概念

方差和偏差

o解释方差

o解释偏差

o模型训练为什么要引入偏差和方差?请理论论证

o什么情况下引发高方差

o如何解决高方差问题

o以上方法是否一定有效

o如何解决高偏差问题

o以上方法是否一定有效

o遇到过的机器学习中的偏差与方差问题

o就理论角度论证Bagging、Boosting的方差偏差问题

o遇到过的深度学习中的偏差与方差问题

o方差、偏差与模型的复杂度之间的关系

生成与判别模型

o什么叫生成模型

o什么叫判别模型

o什么时候会选择生成/判别模型

oCRF/朴素贝叶斯/EM/最大熵模型/马尔科夫随机场/混合高斯模型

o我的理解

先验概率和后验概率

o写出全概率公式&贝叶斯公式

o说说你怎么理解为什么有全概率公式&贝叶斯公式

o什么是先验概率

o什么是后验概率

o经典概率题

频率概率

o极大似然估计 - MLE

o最大后验估计 - MAP

o极大似然估计与最大后验概率的区别

o到底什么是似然什么是概率估计

AutoML

oAutoML问题构成

o特征工程选择思路

o模型相关的选择思路

o常见梯度处理思路

oAutoML参数选择所使用的方法

o讲讲贝叶斯优化如何在automl上应用

o以高斯过程为例,超参搜索的f的最优解求解acquisition function有哪些

o高斯过程回归手记

oAutoSklearn详解手记

oAutoML常规思路手记

数学

数据质量

o期望

o方差

o标准差

o协方差

o相关系数

最大公约数问题

o辗转相除法

o其他方法

牛顿法

o迭代公式推导

o实现它

概率密度分布

o均匀分布

o伯努利分布

o二项分布

o高斯分布

o拉普拉斯分布

o泊松分布

平面曲线的切线和法线

o平面曲线的切线

o平面曲线的法线

导数

o四则运算

o常见导数

o复合函数的运算法则

o莱布尼兹公式

微分中值定理

o费马定理

o拉格朗日中值定理

o柯西中值定理

泰勒公式

o泰勒公式

欧拉公式

o欧拉公式

矩阵

o范数

o特征值分解,特征向量

o正定性

概率论

o条件概率

o独立

o概率基础公式

o全概率

o贝叶斯

o切比雪夫不等式

o抽球

o纸牌问题

o棍子/绳子问题

o贝叶斯题

o选择时间问题

o0~1均匀分布的随机器如何变化成均值为0,方差为1的随机器

o抽红蓝球球

数据预处理

数据平衡

o为什么要对数据进行采样

o是否一定需要对原始数据进行采样平衡

o有哪些常见的采样方法

o能否避免采样

o你平时怎么用采样方法

异常点处理

o统计方法

o矩阵分解方法

o特征值和特征向量的本质是什么

o矩阵乘法的实际意义

o密度的离群点检测

o聚类的离群点检测

o如何处理异常点

缺失值处理

o是不是一定需要对缺失值处理

o直接填充方法有哪些

o模型插值方法有哪些?及方法的问题

o如何直接离散化

ohold位填充方法有哪些

o怎么理解分布补全

orandom方法使用前提

o总结

特征选择

o为什么要做特征选择

o从哪些方面可以做特征选择

o既然说了两个方向,分别介绍一些吧

特征提取

o为什么需要对数据进行变换

o归一化和标准化之间的关系

o连续特征常用方法

o离散特征常用方法

o文本特征

o画一个最简单的最快速能实现的框架

机器学习

聚类

o请问从EM角度理解kmeans

o为什么kmeans一定会收敛

okmeans初始点除了随机选取之外的方法

线性回归

o损失函数是啥

o最小二乘/梯度下降手推

o介绍一下岭回归

o什么时候使用岭回归

o什么时候用Lasso回归

逻辑回归

ologistic分布函数和密度函数,手绘大概的图像

oLR推导,基础5连问

o梯度下降如何并行化

oLR明明是分类模型为什么叫回归

o为什么LR可以用来做CTR预估

o满足什么样条件的数据用LR最好

oLR为什么使用sigmoid函数作为激活函数?其他函数不行吗

o利用几率odds的意义在哪

oSigmoid函数到底起了什么作用

oLR为什么要使用极大似然函数,交互熵作为损失函数?那为什么不选平方损失函数的呢

oLR中若标签为+1和-1,损失函数如何推导?

o如果有很多的特征高度相关或者说有一个特征重复了100遍,会造成怎样的影响

o为什么要避免共线性

oLR可以用核么?可以怎么用

oLR中的L1/L2正则项是啥

olr加l1还是l2好

o正则化是依据什么理论实现模型优化

oLR可以用来处理非线性问题么

o为什么LR需要归一化或者取对数

o为什么LR把特征离散化后效果更好?离散化的好处有哪些

o逻辑回归估计参数时的目标函数逻辑回归的值表示概率吗

oLR对比万物

oLR梯度下降方法

oLR的优缺点

o除了做分类,你还会用LR做什么

o你有用过sklearn中的lr么?你用的是哪个包

o看过源码么?为什么去看

o谈一下sklearn.linear_model.LogisticRegression中的penalty和solver的选择

o谈一下sklearn.linear_model.LogisticRegression中对多分类是怎么处理的

o我的总结

决策树

o常见决策树

o简述决策树构建过程

o详述信息熵计算方法及存在问题

o详述信息增益计算方法

o详述信息增益率计算方法

o解释Gini系数

oID3存在的问题

oC4.5相对于ID3的改进点

oCART的连续特征改进点

oCART分类树建立算法的具体流程

oCART回归树建立算法的具体流程

oCART输出结果的逻辑

oCART树算法的剪枝过程是怎么样的

o树形结构为何不需要归一化

o决策树的优缺点

贝叶斯

o解释一下朴素贝叶斯中考虑到的条件独立假设

o讲一讲你眼中的贝叶斯公式和朴素贝叶斯分类差别

o朴素贝叶斯中出现的常见模型有哪些

o出现估计概率值为 0 怎么处理

o朴素贝叶斯的优缺点

o朴素贝叶斯与 LR 区别

随机森林

o解释下随机森林

o随机森林用的是什么树

o随机森林的生成过程

o解释下随机森林节点的分裂策略

o随机森林的损失函数是什么

o为了防止随机森林过拟合可以怎么做

o随机森林特征选择的过程

o是否用过随机森林,有什么技巧

oRF的参数有哪些,如何调参

oRF的优缺点

集成学习

o介绍一下Boosting的思想

o最小二乘回归树的切分过程是怎么样的

o有哪些直接利用了Boosting思想的树模型

ogbdt和boostingtree的boosting分别体现在哪里

ogbdt的中的tree是什么tree?有什么特征

o常用回归问题的损失函数

o常用分类问题的损失函数

o什么是gbdt中的残差的负梯度

o如何用损失函数的负梯度实现gbdt

o拟合损失函数的负梯度为什么是可行的

o即便拟合负梯度是可行的,为什么不直接拟合残差?拟合负梯度好在哪里

oShrinkage收缩的作用

ofeature属性会被重复多次使用么

ogbdt如何进行正则化的

o为什么集成算法大多使用树类模型作为基学习器?或者说,为什么集成学习可以在树类模型上取得成功

ogbdt的优缺点

ogbdt和randomforest区别

oGBDT和LR的差异

oxgboost对比gbdt/boosting Tree有了哪些方向上的优化

oxgboost和gbdt的区别

oxgboost优化目标/损失函数改变成什么样

oxgboost如何使用MAE或MAPE作为目标函数

oxgboost如何寻找分裂节点的候选集

oxgboost如何处理缺失值

oxgboost在计算速度上有了哪些点上提升

oxgboost特征重要性是如何得到的

oxGBoost中如何对树进行剪枝

oxGBoost模型如果过拟合了怎么解决

oxgboost如何调参数

oXGboost缺点

oLightGBM对Xgboost的优化

oLightGBM亮点

FM/FFM

SVM

o简单介绍SVM

o什么叫最优超平面

o什么是支持向量

oSVM 和全部数据有关还是和局部数据有关

o加大训练数据量一定能提高SVM准确率吗

o如何解决多分类问题

o可以做回归吗,怎么做

oSVM 能解决哪些问题

o介绍一下你知道的不同的SVM分类器

o什么叫软间隔

oSVM 软间隔与硬间隔表达式

oSVM原问题和对偶问题的关系/解释原问题和对偶问题

o为什么要把原问题转换为对偶问题

o为什么求解对偶问题更加高效

oalpha系数有多少个

oKKT限制条件,KKT条件有哪些,完整描述

o引入拉格朗日的优化方法后的损失函数解释

o核函数的作用是啥

o核函数的种类和应用场景

o如何选择核函数

o常用核函数的定义

o核函数需要满足什么条件

o为什么在数据量大的情况下常常用lr代替核SVM

o高斯核可以升到多少维?为什么

oSVM和逻辑斯特回归对同一样本A进行训练,如果某类中增加一些数据点,那么原来的决策边界分别会怎么变化

o各种机器学习的应用场景分别是什么?例如,k近邻,贝叶斯,决策树,svm,逻辑斯蒂回归

oLinear SVM 和 LR 有什么异同

深度学习

dropout

batch_normalization

o你觉得bn过程是什么样的

o手写一下bn过程

o知道LN么?讲讲原理

bp过程

embedding

softmax

梯度消失/爆炸

残差网络

o介绍残差网络

o残差网络为什么能解决梯度消失的问题

o残差网络残差作用

o你平时有用过么?或者你在哪些地方遇到了

Attention

oAttention对比RNN和CNN,分别有哪点你觉得的优势

o写出Attention的公式

o解释你怎么理解Attention的公式的

oAttention模型怎么避免词袋模型的顺序问题的困境的

oAttention机制,里面的q,k,v分别代表什么

o为什么self-attention可以替代seq2seq

o维度与点积大小的关系是怎么样的,为什么使用维度的根号来放缩

自然语言处理

GloVe

oGolVe的损失函数

o解释GolVe的损失函数

o为什么GolVe会用的相对比W2V少

Word2Vec

o从隐藏层到输出的Softmax层的计算有哪些方法

o层次softmax流程

o负采样流程

oword2vec两种方法各自的优势

o怎么衡量学到的embedding的好坏

oword2vec和glove区别

o你觉得word2vec有哪些问题

CRF

o阐述CRF原理

o线性链条件随机场的公式是

oCRF与HMM区别

oBert+crf中的各部分作用详解

LDA

o详述LDA原理

oLDA中的主题矩阵如何计算

oLDA的共轭分布解释下

oPLSA和LDA的区别

o怎么确定LDA的topic个数

oLDA和Word2Vec区别?LDA和Doc2Vec区别

oLDA算法里面Dirichlet分布的两个参数alpha和beta怎样确定?trick?

LSTM

GRU

Bert:实现/使用的代码

oBert的双向体现在什么地方

oBert的是怎样预训练的

o在数据中随机选择 15% 的标记,其中80%被换位[mask],10%不变、10%随机替换其他单词,原因是什么

o为什么BERT有3个嵌入层,它们都是如何实现的

obert的损失函数

o手写一个multi-head attention

o长文本预测如何构造Tokens

o你用过什么模块?bert流程是怎么样的

o知道分词模块:FullTokenizer做了哪些事情么

oBert中如何获得词意和句意

o源码中Attention后实际的流程是如何的

o为什么要在Attention后使用残差结构

o平时用官方Bert包么?耗时怎么样

o你觉得BERT比普通LM的新颖点

oelmo、GPT、bert三者之间有什么区别

推荐

DIN:实现/使用的代码

o主要使用了什么机制

oactivation unit的作用

oDICE怎么设计的

oDICE使用的过程中,有什么需要注意的地方

DeepFM:实现/使用的代码

oDNN与DeepFM之间的区别

oWide&Deep与DeepFM之间的区别

o你在使用deepFM的时候是如何处理欠拟合和过拟合问题的

oDeepFM怎么优化的

o不定长文本数据如何输入deepFM

odeepfm的embedding初始化有什么值得注意的地方吗

Xavier初始化

He初始化

YoutubeNet:实现/使用的代码

o变长数据如何处理的

oinput是怎么构造的

o最后一次点击实际如何处理的

ooutput的是时候train和predict如何处理的

o如何进行负采样的

oitem向量在softmax的时候你们怎么选择的

oExample Age的理解

o什么叫做不对称的共同浏览(asymmetric co-watch)问题

o为什么不采取类似RNN的Sequence model

oYouTube如何避免百万量级的softmax问题的

oserving过程中,YouTube为什么不直接采用训练时的model进行预测,而是采用了一种最近邻搜索的方法

oYoutube的用户对新视频有偏好,那么在模型构建的过程中如何引入这个feature

o在处理测试集的时候,YouTube为什么不采用经典的随机留一法(random holdout),而是一定要把用户最近的一次观看行为作为测试集

o整个过程中有什么亮点?有哪些决定性的提升

Wide&Deep

MLR

Neural Network全家桶

XDeepFM:实现/使用的代码

o选用的原因,考虑使用的场景是什么

o什么叫显示隐式?什么叫元素级/向量级?什么叫做高阶/低阶特征交互

o简单介绍一下XDeepFm的思想

o和DCN比,有哪些核心的变化

o时间复杂度多少

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/355212.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第七讲---贪心(上课)

1.股票买卖 一、贪心 考虑一种方案,在每次上升的前一天购入股票,并在上升后的当天卖出的方案 if (w[i] > w[i - 1])res w[i] - w[i - 1];接下来证明该贪心思路得出的方案即是最优解。 (1)证明贪心解 ≥ 最优解: …

剑指 Offer 39. 数组中出现次数超过一半的数字

摘要 剑指 Offer 39. 数组中出现次数超过一半的数字 一、摩尔投票法 核心理念票数正负抵消 。此方法时间和空间复杂度分别为 O(N)和 O(1) ,为本题的最佳解法。 摩尔投票法:设输入数组 nums 的众数为 x ,数组长度为 n 。 若记 众数 的票数…

面试知识点准备与总结——(并发篇)

目录线程有哪些状态线程池的核心参数sleep和wait的区别lock 与 synchronized 的异同volatile能否保证线程安全悲观锁和乐观锁的区别Hashtable 与 ConcurrentHashMap 的区别ConcurrentHashMap1.7和1.8的区别ThreadLocal的理解ThreadLocalMap中的key为何要设置为弱引用线程有哪些…

【Java】线程的死锁和释放锁

线程死锁是线程同步的时候可能出现的一种问题 文章目录1. 线程的死锁1.1 基本介绍1.2 应用案例2. 释放锁2.1 下面的操作会释放锁2.2 下面的操作不会释放锁1. 线程的死锁 1.1 基本介绍 多个线程都占用了对方的锁资源,但不肯相让,导致了死锁,…

第46章 自定义静态与数据库动态授权依赖注入的定义实现

1 数据库动态授权表授权原理 2 准备工作 2.1 重构Program.cs using Framework.Infrastructure.Extensions; var builder WebApplication.CreateBuilder(args); //如果启动项中不存在“appsettings.json”文件,则通过.Net(Core)的内置方法自动新建“appsettings.…

作为初学者必须要了解的几种常用数据库!

现在已经存在了很多优秀的商业数据库,如甲骨文(Oracle)公司的 Oracle 数据库、IBM 公司的 DB2 数据库、微软公司的 SQL Server 数据库和 Access 数据库。同时,还有很多优秀的开源数据库,如 MySQL 数据库,Po…

Django框架之模型视图-使用 PostMan 对请求进行测试

使用 PostMan 对请求进行测试 PostMan 是一款功能强大的网页调试与发送网页 HTTP 请求的 Chrome 插件,可以直接去对我们写出来的路由和视图函数进行调试,作为后端程序员是必须要知道的一个工具。 安装方式1:去 Chrome 商店直接搜索 PostMan…

链表OJ(四)链表排序合集

目录 合并两个排序的链表 合并k个已排序的链表 单链表的排序 链表的奇偶重排 链表的奇偶重排扩展 合并两个排序的链表 描述 输入两个递增的链表,单个链表的长度为n,合并这两个链表并使新链表中的节点仍然是递增排序的。 数据范围: 0≤n≤…

Spark12: SparkSQL入门

一、SparkSQL Spark SQL和我们之前讲Hive的时候说的hive on spark是不一样的。hive on spark是表示把底层的mapreduce引擎替换为spark引擎。而Spark SQL是Spark自己实现的一套SQL处理引擎。Spark SQL是Spark中的一个模块,主要用于进行结构化数据的处理。它提供的最核…

Kubernetes入门级教程

Kubernetes入门级教程1. Introduction1.1 概述1.2 关键字介绍2. Cluster Install2.1 Big Data -- Postgres3. 基础知识3.1 Pod3.2 控制器3.3 通讯模式3.4 服务发现4. Command4.0 编辑文件4.1 在宿主机执行命令4.2 创建资源对象4.3 查询资源对象4.4 查询资源描述4.5 修改资源4.6…

Linux 交换分区与链接文件

目录 SWAP交换分区扩展 fdisk 创建分区 mkswap 将逻辑分区/主分区格式化为交换分区(make swap) swapon 交换分区挂载 swapoff 卸载交换分区 vim /etc/fstab 永久挂载 将文件设置为交换分区 链接文件 软链接 硬链接 SWAP交换分区扩展 交换分区…

量子力学奇妙之旅-双态系统(后)

专栏: 高质量文章导航-持续更新中 引子: 感慨:对于还原论,物质深层结构的物理定律如此的复杂,求解一个简单的双态系统已经如此困难,运用了大量的近视方法,在宇宙真理面前,我们只是虫子啊,我们固有的概念里面对逻辑自洽性,对事物发展的可预测性必然性,真实世界的有…

2023美赛F题讲解+数据领取

我们给大家准备了F题的数据,免费领取!在文末 国内生产总值(GDP)可以说是一个国家经济健康状况最著名和最常用的指标之--。它通常用于确定一个国家的购买力和获得贷款的机会,为各国提出提高GDP的政策和项目提供动力。GDP“衡量一个国家在给定时间段内生产…

docker中 gitlab 安装、配置和初始化

小笔记:gitlab配置文件 /etc/gitlab/gitlab.rb 配置项jcLee95 的CSDN博客:https://blog.csdn.net/qq_28550263?spm1001.2101.3001.5343 邮箱 :291148484163.com 本文地址:https://blog.csdn.net/qq_28550263/article/details/1…

运动款蓝牙耳机哪个品牌好、市面最火爆的运动耳机推荐

我们都知道运动最不可或缺的就是音乐了,它俩是天生的好搭档,所以凡是很经常运动的小伙伴一定会去单独选择一款超好用的运动耳机,来增强运动体验效果,那么市面上的运动耳机那么多,怎么选择一款好用的运动耳机呢&#xf…

MySql 函数

1、简述 函数 是指一段可以直接被另一段程序调用的程序或代码。 也就意味着,这一段程序或代码在MySQL中已经给我们提供了,我们要做的就是在合适的业务场景调用对应的函数完成对应的业务需求即可。 MySQL中的函数主要分为以下四类: 字符串函数…

【TypeScrip】TypeScrip的任意类型(Any 类型 和 unknown 顶级类型):

文章目录一、安转依赖:【1】nodejs 环境执行ts【2】使用ts-node二、Any 类型 和 unknown 顶级类型【1】没有强制限定哪种类型,随时切换类型都可以 我们可以对 any 进行任何操作,不需要检查类型【2】声明变量的时候没有指定任意类型默认为any【…

基于SSM框架的生活论坛系统的设计与实现

基于SSM框架的生活论坛系统的设计与实现 ✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景…

已解决ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘

已解决from radiomics import featureextractor导包,抛出ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘异常的正确解决方法,亲测有效!!! 文章目录报错问题报错翻译报错原因解决方法联系博…

centos7给已有分区进行扩容

1、背景 最近我在虚拟机上安装软件,发现磁盘空间不足,通过上网查找资料,发现可以通过如下方法进行磁盘扩容,此处进行记录一下。 2、实现扩容 1、虚拟机上添加一个新的硬盘 2、查看我们刚刚加入的硬盘 此处我们可以看到/dev/nvm…