阿里斑马智行 2025届秋招 NLP算法工程师

news2025/1/19 23:19:01

文章目录

  • 个人情况
  • 一面/技术面 1h
  • 二面/技术面 1h
  • 三面/HR面 20min

个人情况

先说一下个人情况:

  1. 学校情况:211本中9硕,本硕学校都一般,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
  2. 论文情况:1A(NeurIPS)+1B(ICDM)已录用,还有一篇A会(AAAI 2025)最近快出结果了,以及一篇数据挖掘A刊TOIS在投,四篇论文都是一作
  3. 实习情况:快手推荐算法日常实习 + 腾讯大模型暑期实习
  4. 奖学金情况:本科生国家奖学金、研究生国家奖学金,4次校级一等奖学金
  5. 其他:我的CSDN等平台有一点粉丝量,至于其他诸如数学建模还有蓝桥杯获奖,以及优秀毕业论文和优秀毕业生之类的,对求职也没太大作用

阿里今年秋招hc基本都只给转正,招人很少,形势不太好,大模型领域更是如此了,面了几家基本也都是走个过场,毕竟不是大模型科班出身,还是差了点

阿里这边只有斑马走完流程拿到了offer,阿里旗下一个做汽车科技的独角兽企业,目前等待开奖
在这里插入图片描述

一面/技术面 1h

  1. 自我介绍
  2. 介绍大模型实习
  3. 应用场景是什么,有什么意义
  4. 构造SFT数据的细节
  5. SFT的prompt模板
  6. 目前的方案有没有什么创新的地方
  7. 后续有没有什么改进,具体介绍一下
  8. 效果如何评估
  9. 大模型SFT过程中自己有没有什么总结出来的经验
  10. SFT过程中如何判断是否过拟合
  11. 硕士期间发表的paper,可以结合ppt来介绍一下
  12. 如何看待目前大语言模型都是decoder-only结构
  13. encoder-only和decoder-only的对比,纯理解场景哪个更优
  14. 描述一下典型的encoder-only如Bert的结构细节
  15. 多层堆叠时如何避免梯度消失和梯度爆炸
  16. DPO和PPO
  17. 代码题:lc75,颜色分类

二面/技术面 1h

  1. 自我介绍
  2. 询问转正情况
  3. 介绍大模型实习,具体负责了哪些板块
  4. 为什么没有公司内部的LLM
  5. 为什么非得用长文本而不用RAG
  6. 为什么不用GPT-4
  7. prompt优化这部分做了什么工作
  8. prompt优化这部分还了解哪些方法吗
  9. 如何判断当前使用的prompt就是最优的,无法进一步调整了
  10. 不做全量微调的原因(还能什么原因,没卡)
  11. SFT的资源描述,卡数,机器数
  12. SFT过程中如何判断是否过拟合
  13. 有没有系统学过机器学习课程,开始拷问八股
  14. 如何判断一个模型是否收敛,从多个角度回答
  15. 判断收敛需要用验证集吗
  16. 如何定量判断是否收敛
  17. 如何判断目前的收敛点是局部最优解还是全局最优解
  18. 测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起
  19. 主要使用什么语言(Python),有没有系统学过C++
  20. C++中STL中一些容器的底层实现原理
  21. pytorch中的计算图
  22. 最近看的一些开源代码和paper介绍,有没有学到什么东西
  23. 对第一份工作的预期,希望加入什么团队
  24. 反问:进来后可能会做的方向

三面/HR面 20min

  1. 自我介绍
  2. 询问高考成绩,成绩排名
  3. 保研学校抉择问题
  4. 硕士期间在专业方向上的产出介绍
  5. 大概介绍了下论文
  6. 介绍大模型实习
  7. 实习对自己的提升是什么
  8. 针对本次面试的岗位,你觉得自己有哪些优势
  9. 平时通过什么途径来学习新东西
  10. 周围人/自己如何评价自己,优缺点
  11. 职业规划
  12. 反问:后续流程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2243335.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

社交电商的优势及其与 AI 智能名片小程序、S2B2C 商城系统的融合发展

摘要:本文深入分析了社交电商相较于传统电商的优势,包括门槛低、易操作、更生活化和可团队化运作等特点。同时,探讨了 AI 智能名片小程序和 S2B2C 商城系统在社交电商发展中的作用,以及它们与社交电商融合所带来的新机遇和发展前景…

自动化运维-检测Linux服务器CPU、内存、负载、IO读写、机房带宽和服务器类型等信息脚本

前言:以上脚本为今年8月1号发布的,当时是没有任何问题,但现在脚本里网络速度测试py文件获取不了了,测速这块功能目前无法实现,后面我会抽时间来研究,大家如果有建议也可以分享下。 脚本内容: #…

3D Streaming 在线互动展示系统:NVIDIA RTX 4090 加速实时渲染行业数字化转型

随着科技的飞速发展,实时渲染正逐步成为游戏与实时交互领域的重要驱动力。与离线渲染不同,实时渲染需要极高的计算性能,对硬件设备尤其是GPU的性能要求极高。随着 RTX 4090 显卡的问世,其强大的算力和创新技术,为实时渲…

南京邮电大学《智能控制技术》课后作业

一、问题一 复现二输入单输出模糊控制系统,改动其中一到两个环节(隶属度设置、规则等),对比修改前后控制效果。 定义模糊 %Fuzzy Control for water tank clear all; close all;anewfis(fuzz_tank);%Fuzzy Inference System stru…

2.5D视觉——Aruco码定位检测

目录 1.什么是Aruco标记2.Aruco码解码说明2.1 Original ArUco2.2 预设的二维码字典2.3 大小Aruco二维码叠加 3.函数说明3.1 cv::aruco::detectMarkers3.2 cv::solvePnP 4.代码注解4.1 Landmark图说明4.2 算法源码注解 1.什么是Aruco标记 ArUco标记最初由S.Garrido-Jurado等人在…

栈Stack和队列Queue

目录 一、栈 (1)用数组实现 (2)用单链表实现 (3)用标注尾结点的单链表实现 (4)用双向链表实现 2、栈的实际应用 (1)改变元素的序列 (2&am…

Tailscale 自建 Derp 中转服务器

文章目录 为什么要建立 Derp 中转服务器?安装 Go 环境通过 Go 安装 Derp处理证书文件自签一个域名启动 DerpIPV6 的支持防止 Derp 被白嫖以上的操作命令合集自建 Headscale 添加 Derp参考 为什么要建立 Derp 中转服务器? Tailscale 使用的算法很有趣: 所…

RPC安全可靠的异常重试

当调用方调用服务提供方,由于网络抖动导致的请求失败,这个请求调用方希望执行成功。 调用方应该如何操作?catch异常再发起一次调用?显然不够优雅。这时可以考虑使用RPC框架的重试机制。 RPC框架的重试机制 RPC重试机制&#xff1…

AutoDL部署视觉大模型llama3.2-vision,从视频中寻找特定目标

注: windows11系统。示例为此项目:https://github.com/win4r/VideoFinder-Llama3.2-vision-Ollama 在当今的人工智能领域,深度学习模型的计算需求日益增长,特别是在处理复杂的视觉任务时,强大的算力往往是实现高效应用…

【大语言模型】ACL2024论文-16 基于地图制图的罗马尼亚自然语言推理语料库的新型课程学习方法

【大语言模型】ACL2024论文-16 基于地图制图的罗马尼亚自然语言推理语料库的新型课程学习方法 目录 文章目录 【大语言模型】ACL2024论文-16 基于地图制图的罗马尼亚自然语言推理语料库的新型课程学习方法目录摘要:研究背景:问题与挑战:如何解…

golang调用模组程序实现交互输入自动化,获取imei及iccid

应用场景:在openwrt下调用移远的测试程序,并实现输入自动话,获取imei rootOpenWrt:~# ql-api-test Test groups:0: ql_dsi1: ql_nw2: ql_sim3: ql_dev4: ql_voice5: ql_sms6: ql_adc7: ql_i2c8: …

【数据分享】2022年我国10米分辨率茶树种植分布栅格数据

小麦、玉米、水稻、茶树等各类农作物的种植分布数据在农业、环境、国土等很多专业都经常用到! 本次给大家分享的是我国2022年10米分辨率茶树种植分布栅格数据!数据格式为TIFF格式。数据坐标为GCS_WGS_1984。数据格式为TIFF格式。数据坐标为GCS_WGS_1984…

【弱监督视频异常检测】2024-ESWA-基于扩散的弱监督视频异常检测常态预训练

2024-ESWA-Diffusion-based normality pre-training for weakly supervised video anomaly detection 基于扩散的弱监督视频异常检测常态预训练摘要1. 引言2. 相关工作3. 方法论3.1. 使用扩散自动编码器进行常态学习3.2. 全局-局部特征编码器3.2.1 局部块3.2.2 全局块3.2.3 协同…

vue实现展示并下载后端返回的图片流

// 点击下载 downLoadCode() {const image new Image();image.setAttribute("crossOrigin", "anonymous");image.onload () > {const canvas document.createElement("canvas");canvas.width image.width;canvas.height image.height;c…

STL关联式容器之平衡二叉搜索树

平衡二叉搜索树 在STL关联式容器介绍-CSDN博客中对二叉搜索树做了简要的描述;但是因为没有对二叉搜索树对数的深度及插入后树的结构进行调整,二叉搜索树可能失去平衡,造成搜寻效率低落的情况。如下所示: 所谓树形平衡与否&#xf…

Django启用国际化支持(2)—实现界面内切换语言:activate()

文章目录 ⭐注意⭐1. 配置项目全局设置:启用国际化2. 编写视图函数3. 配置路由4. 界面演示5、扩展自动识别并切换到当前语言设置语言并保存到Session设置语言并保存到 Cookie ⭐注意⭐ 以下操作依赖于 Django 项目的国际化支持。如果你不清楚如何启用国际化功能&am…

Java基础——继承和多态

目录 一、继承 继承的定义: 继承的基本用法: 如何调用父类的方法? 二、多态 多态性的好处 多态中的强制类型转换: 包的命名规则——域名倒叙 一、继承 继承的定义: 继承是面向对象编程中的一种机制&#xff0c…

2024-11-17 -MATLAB三维绘图简单实例

1. x -1:0.05:1; y x; [X, Y] meshgrid(x, y); f (X, Y) (sin(pi * X) .* sin(pi * Y)) .^ 2.*sin(2.*X2.*Y); mesh(X, Y, f(X, Y)); % 调用函数f并传递X和Y xlabel(X-axis); ylabel(Y-axis); zlabel(Z-axis); title(Surface Plot of (sin(pi * X) .* sin(pi * Y)) .^ 2.*…

resnet50,clip,Faiss+Flask简易图文搜索服务

一、实现 文件夹目录结构&#xff1a; templates -----upload.html faiss_app.py 前端代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widt…

Flink监控checkpoint

Flink的web界面提供了一个选项卡来监控作业的检查点。这些统计信息在任务终止后也可用。有四个选项卡可以显示关于检查点的信息:概述(Overview)、历史(History)、摘要(Summary)和配置(Configuration)。下面依次来看这几个选项。 Overview Tab Overview选项卡列出了以…