NLP面经集结 | 达摩院、腾讯、微软、美团、百度

news2024/11/27 4:26:06

f7ac00801060a72ff6c467c1f0c0c8d8.jpeg

  作者 | Codle

  整理 | NewBeeNLP

面试锦囊之面经分享系列,持续更新中 e0aa8b6c09082fe64b1fa96b68d44754.png

赶紧后台回复"面试"加入讨论组交流吧 6f97a12b7bd3df3b4951a307f251da56.png

写在前面

本人情况:双非本末流985研二,爱奇艺NLP日常实习经历,无论文,投的都是 NLP 算法岗。

目前到手:微软、腾讯,应该是选微软了吧

阿里达摩院(挂)

一面(45分钟)

上来面试官介绍他们组情况,问我有什么想问的?我有点懵逼,这不是一般最后的环节吗。

  • 问研究生期间的研究方向;

  • 研究内容有提到 DSSM,询问是否知道现在对 DSSM 的改进模型,回答不知,现在更多做的生成模型,因此问题转到生成模型;

  • 询问对生成模型的了解,发展情况,询问项目中的难点,回答解码策略,谈到了 Beam Search 和 Random Sample 策略。

  • CNN 模型中池化层的作用,Max Pooling 是如何反向传递梯度的。

  • 机器学习中正则化做什么的?约束模型参数,防止过拟合。

  • 正则化有 L1 和 L2 正则化,区别是什么?扯了一下解空间什么的,这一部分参看《百面机器学习》中 【L1 正则化与稀疏性】部分的内容,基本就是我遇到的问题了,我没回答上。

  • 问深度学习,Transformer 模型架构说一下?按照图结构 balabala 说下。

  • Dropout 有什么作用?类似于 Bagging 。在 Transformer 模型中 dropout 主要用在哪里?dropout 在每个子层之间,设置为 0.1。看过源码吗?看过源码,看的哈佛实现的那一版本。(面试官应该也看过这个版本,说写的很好)

  • Transformer 用的 Layer Normalize 还是 Batch Normalize?Layer,有什么区别?...

  • 传统机器学习会哪些?决策树和 GBDT 区别说下。

  • Sigmoid 和 ReLU 区别,ReLU 解决了什么问题。

  • 怎么学统计机器学习的?看视频...

  • Python、C++、Java 哪个用的多一点?值传递和引用传递区别。

  • Python 垃圾回收了解吗?用过,细节不清楚。

  • 进程和线程区别

  • Linux 多个进程如何通信的?socket 和管道

  • 贪心和 DP 区别?

  • DP 的一般做法流程?

  • 开放问题,海量商家和海量语料,语料不平衡,语料对商家 group by 后按照时间排序,怎么解决。先扯了下哈希分桶,不平衡用归并排序。

结束,他觉得还 OK,问了下有啥改进的?他说问机器学习这部分可以多看看,因为一方面部门有发论文要求,另一部分可以看出一个人的求知欲。。。

二面(80 分钟)

面试官是个学术大佬,全程项目细节+前沿模型理论+项目落地实践,谈的多的主要包括有:

  • DSSM 语义匹配模型及其变种

  • 预训练模型:Transformer、BERT、UniLM 等等模型细节,区别,模型中的 Attention 使用、Mask 使用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/615769.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Ansible基础5——条件语句、循环语句、handlers、任务失败处理

文章目录 一、 循环语句1.1 单量循环1.2 多量循环1.3 老版本用法1.4 loopregister 二、条件判断2.1 根据变量状态判断2.2 根据变量是否存在判断2.3 根据事实判断2.4 多条件判断2.4.1 and用法2.4.2 or用法 2.5 循环判断2.6 根据上个任务结果判断 三、handlers处理程序四、任务失…

CDGA 认证:第十二章 元数据管理(重点章节)习题集解析

1. 以下内容不属于元数据综合解决方案功能需求点的是 ( ) A 历史信息 B 存储容量 C 运维要求 D 安全要求 【答案解析】DAMA-DMBOK2 P334 2. 关于 ISO/IEC 11179 元数据注册标准的说法正确的是:( ) A 该标准由 6 个部分组成 B 该标准用于定义元数据注册的框架 C 该标准包含…

Express+vue.js+nodejs银行排队取号系统

开发语言 node.js 框架:Express 前端:Vue.js 数据库:mysql 数据库工具:Navicat 开发软件:VScode 系统主要包括系统用户中心、显示管理、用户管理、排队管理、服务业务管理、用户评价管理、等候区管理等功能模块。 (a) 管理员&am…

00后求你善良,不要这么卷了...

前几天我们公司一下子也来了几个新人,这些年前人是真能熬啊,本来我们几个老油子都是每天稍微加会班就打算走了,这几个新人一直不走,搞得我们也不好走。 2023年春招结束了,最近内卷严重,各种跳槽裁员&#x…

Studio One6新生代DAW数字音频工作站

提到编曲软件,就不得不说这款水果编曲软件。它对新手和老手都比较友好,是一款较为经典的编曲软件。 这款软件提供了强大而全面的音符、音效编辑器,可以在其中插入各种乐器声音,如果内置乐器无法满足编曲需求,还可以外…

数据结构-递归

递归 概述 定义 计算机科学中,递归是一种解决计算问题的方法,其中解决方案取决于同一类问题的更小子集 In computer science, recursion is a method of solving a computational problem where the solution depends on solutions to smaller instan…

Web大前端时代之:HTML5+CSS3入门系列

Old: 联系源码:GitHub - dunitian/LoTHTML5: LoT家族的一员~HTML5系列 文档下载:https://github.com/dunitian/LoTDotNet/ 思维导图(不断更新): 图片:http://dnt.dkill.net/DNT/HTML5/index.jpg 源码&#…

超级全面的100个思维导图模板

思维导图是一款有效提升生活以及工作的效率工具。使用思维导图有非常多的好处。 思维导图可以用在我们生活的方方面面,以及各种各样的学科中。 接下来给大家分享不同的思维导图模板,希望可以帮助到大家。 一、读书笔记类 1、西游记 2、《战胜拖拉》读…

RabbitMQ - 简单案例

RabbitMQ - 简单案例 Hello worldWork Queues轮训分发消息消息应答自动应答手动消息应答的方法消息自动重新入队消息手动应答代码 RabbitMQ 持久化不公平分发 预取值分发 Hello world 我们将用 Java 编写两个程序。发送单个消息的生产者和接收消息并打印出来的消费者 在下图中…

Java实现Mqtt收发消息

Java实现Mqtt收发消息 文章目录 Java实现Mqtt收发消息windows mqtt 平台服务搭建mqtt 客户端工具:mqttbox整体代码结构mqtt基础参数配置类mqtt客户端连接mqtt接收的消息处理类对应的MqttService注解和MqttTopic注解 MqttGateway 发送消息指定topic接收处理方法 java…

基于Hive的数据应用实践总结

百分位数(percentile)计算 百分位数含义:统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列。如&#x…

如何实现Java类隔离加载

一 什么是类隔离技术 只要你 Java 代码写的足够多,就一定会出现这种情况:系统新引入了一个中间件的 jar 包,编译的时候一切正常,一运行就报错:java.lang.NoSuchMethodError,然后就哼哧哼哧的开始找解决方法…

弹性盒子中的flex

flex属性是flex-grow&#xff0c;flex-shrink和flex-basis的缩写 flex是用在盒子中的子组件的&#xff0c;充分体现了弹性盒子的弹性二字。 例如现在的情况是&#xff1a; <div class"container"><div class"item1">Item1</div><d…

微信小程序码生成,扫码携带参数进入指定页面

一、准备工作 &#xff08;1&#xff09;微信小程序后台获取小程序的appId和secret 小程序后台管理&#xff08;开发管理➡开发设置&#xff09; &#xff08;2&#xff09;扫码跳转的页面在app.json中已经注册 注册的路径与传过去的路径一致 &#xff08;3&#xff09;小程序…

同步模式之犹豫模式Balking

tip: 作为程序员一定学习编程之道&#xff0c;一定要对代码的编写有追求&#xff0c;不能实现就完事了。我们应该让自己写的代码更加优雅&#xff0c;即使这会费时费力。 文章目录 一、同步模式之犹豫模式Balking二、代码样例三、优缺点 一、同步模式之犹豫模式Balking 同步模…

挤出泡沫、脱虚向实,AI大模型正在回归价值投资?

商品推荐、交通管理、生成文章、代码编程、电影特效制作……自ChatGPT横空出世以来&#xff0c;AIGC浪潮席卷全球&#xff0c;上下游产业链也因此大放异彩。 市场行情的高景气直观反映在股价上&#xff0c;无论AI公司是否盈利&#xff0c;其股价多呈上升趋势。一些与AI概念有所…

测试:用例篇

上一章讲述的是测试的基本概念。在我们开始做了一段时间基础测试&#xff0c;熟悉了业务之后&#xff0c;往往会 分配来写测试用例&#xff0c;并且在日常测试中&#xff0c;有时也需要补充测试用例到现有的案例库中 在开始之前先讲讲测试中经典的测试方法&#xff1a;黑盒测试…

【dc-dc】DC-DC恒流电源 车灯方案的应用

1,信息来源&#xff1a;深圳市世微半导体有限公司 Augus 2,产品描述 AP5103 是一款效率高&#xff0c;稳定可靠的 LED 灯恒流驱动控制芯片&#xff0c;内置高精度比较器&#xff0c;固定关断时间控制电路&#xff0c;恒流驱动电路等&#xff0c;特别适合大功率 LED 恒流驱动。…

[Kotlin] 玩Android代码学习之-模块化+Retrofit+协程+viewModel的数据层封装

文章目录 1:前言玩Android APP 源码本贴的目的参考贴 2: kotlin下的模块化(捎带一嘴)3:Retrofit协程viewModel3.1基础网络层搭建lib_home:Bannerlib_common: BaseResp lib_common:RetrofitManagerlib_home: HomeApi 3.2基础网络层接口测试3.3 基础网络层优化-koin依赖注入框架…

观澜最快的旧改项目之一,鸿荣源观城项目一期。

项目&#xff1a;观湖街道观城第一期城市更新单元位置&#xff1a;4号地铁观澜地铁站0距离 规模&#xff1a;拆除范围用地面积706094㎡ 面积&#xff1a;私信咨询价格&#xff1a;3.x万/平 开发商&#xff1a;鸿荣源 合同方案&#xff1a;直接开发商签合同 目前进度&#…