拿到字节跳动奖学金,入职字节跳动做科研,他们经历了什么?

news2024/11/29 10:46:37

前不久,第三届字节跳动奖学金计划已经正式启动。

自 2021 年起,字节跳动奖学金计划已经完成了两届评选,共有 19 位优秀学子荣获每人 10 万元人民币的奖学金。

在奖学金支持下,他们获得了新的科研项目费用、学术交流机会,让自己的才华和努力有了更进一步的发挥空间。

现在,往届获奖者中,除了依然在攻读博士/硕士学位的同学之外,已有 2 位同学取得了教职,2 位同学正式入职国内一线互联网公司。在字节跳动,也有 3 位奖学金得主以正式或实习的身份开始了新的科研生涯。

任同学

  • 浙江大学 2022 届硕士毕业生
  • 首届字节跳动奖学金获奖者
  • 字节跳动火山语音团队算法科学家

“语音合成方面,从合成效果上看,字节跳动相关技术是国内第一梯队的。”

浙江大学毕业的任同学是第一届字节跳动奖学金获奖者之一。他长期研究语音合成等相关领域,是业界普遍使用的语音合成模型 FastSpeech 和 PortaSpeech 的第一作者,光 FastSpeech 和 FastSpeech 2 两篇论文的引用加起来高达 1400+。硕士期间,任同学以一作身份发表的顶会论文就超过了 10 篇。

2021 年,正在读研究生三年级的他因为优秀的科研成果获得了字节跳动奖学金,此后也一直成果频出。硕士毕业才一年的任同学在 Google Scholar 上的 h-index 就达到了 21,也就是说,有 21 篇论文被引用了至少 21 次。

今年年初,在字节跳动火山语音团队的邀约下,任同学正式入职,成为了一名算法科学家,负责语音合成相关的前沿研究工作。

“字节业务范围非常广,像我做的语音合成这类生成式 AI 技术在字节跳动会有很多应用前景。而且我们团队是科研部门,可以发论文,也可以落地实践,这对我非常有吸引力。”

他的确获得了很多落地机会。几个月前,任同学想做一个「音效生成」的技术,生成脚步声、开门声等各种效果,落地在影视、游戏、有声小说等场景。Leader 马上帮他找到了可能会有需求的业务部门,大家迅速明确意向,现在这些音效都已经可以用 AI 合成出来了。

来到字节跳动之后,任同学很认可团队的技术能力:“拿我熟悉的语音方面来说,从合成效果上看,字节跳动相关技术是国内第一梯队的;CV 做得也很好,我可以方便地调用 CV 团队的 SDK。因为有真实的应用场景、有充足的数据与算力支持,字节跳动的算法同学们都在努力追求最棒的效果。”

现在,任同学正在研究新的语音合成模型 PortaSpeech 2,逐步将它落地到火山引擎上;同时也在研究语音驱动人脸——简单来讲,就是语音已经合成好了,如何让数字人对上这段语音的口型。他相信,在字节跳动,这些 AI 技术的创新可以让语音合成获得更大的落地机会,让数字人服务不同行业。

刘同学

  • 上海交通大学博士生
  • 第二届字节跳动奖学金获得者
  • ByteDance Research 实习研究员

“从管理 GPU 集群到申请显示器,在字节做各种事情都很方便。”

上海交通大学博士生刘同学主要研究数据驱动的强化学习方向,2022 年,正在就读博士四年级的他靠着 8 篇 NeurIPS、ICML 等顶会的一作论文成为了字节跳动奖学金得主之一。

2022 年的奖学金评选仅仅过去半年,刘同学仍在为各种强化学习问题寻找新的、更有效的方案。他研究了最新前沿的生成扩散模型在决策任务中的应用投稿到了 NeurIPS;发表了一篇 ICLR 论文 《visual imitation with patch rewards》,让 AI 从视频中模仿学习,这也正是机器人领域的主要目标之一;此外,他还在尝试使用最新的语言模型构建德扑 AI 系统;同时借着奖学金的机会认识了不少跨领域的优秀同行,参加学术会议,和国际最前沿的学术研究者交流碰撞想法。

借助字节跳动奖学金评选的机会,刘同学结识了 ByteDance Research 的一位团队 Leader,就直接加入了团队,成为了一名实习研究员,研究用强化学习解决机器人复杂控制问题。

敏捷高效是刘同学入职字节后最深的感触。优质的研发工具链,让管理 GPU 集群、申请资源都变得非常方便。“不只是研发环境,哪怕是申请显示器、或者在飞书上反映任何方面的问题,都会得到很快的反馈。”

机器人团队让他感受到了浓浓的创新氛围:“虽然我的工作目前还是在模拟环境中进行机器人的强化学习研究,但是能感觉到字节跳动真的非常重视在真实环境中落地,我们办公区附近都摆着各种机器人产品,比如导航机器人、机械臂等等,因为很多同学需要在实机上进行算法调试。虽然机器人团队现在还不大。但我相信,在高效的团队工作下,我们的相关技术积累、迭代和产品应用指日可待。”

现在,刘同学正在研究在模拟环境中控制机器人移动物体的相关研究,“实习到 9 月应该就可以取得一些成果,让我们团队的机器人技术方案更加成熟。”

秦同学

  • 北京航空航天大学博士生
  • 第二届字节跳动奖学金获得者
  • 火山语音团队实习研究员

“字节的研究靠近实际落地,我们期待在将来的研究中获得更有影响力的成果。”

秦同学是北京航空航天大学的博士生,主要研究模型压缩和量化神经网络领域,是 2022 年字节跳动奖学金的十位获奖者者之一。

今年博士四年级的秦同学研究的一个重点方向是硬件友好深度学习。他的工作一方面是把体积巨大的神经网络极限压缩,这样在边缘硬件上也可以运行,在 CVPR 等顶会顶刊提出了 IR-Net 等二值量化方案,并在 ICML 2023 提出国际首个二值量化基准;另一方面,他持续探索低成本的量化方案,在 TPAMI 等顶刊顶会提出了无数据量化系列方法。

其实,在获得奖学金的一年前,秦同学就已经通过学术合作项目开始在字节跳动火山语音团队实习,开展智能语音算法相关的研究工作。

入职之前,虽然没有做过任何语音模型相关的工作,但并不耽误秦同学研究如何在真实的边缘硬件上让语音模型实现十数倍的压缩效果。2022 年,他以一作身份发表在 IJCAI 上的二值化神经网络 BiFSMN 的表现已经超过了行业其他公司的模型效果,前不久还在 TNNLS 上发表了更高性能的 BiFSMNv2。

现在,在字节跳动实习的同时,秦同学也在瑞士的 ETH Zürich 访学。有了字节奖学金支持,他也得以趁此机会前往不同国家参加国际学术交流会议,“前不久我去参加了阿卜杜拉国王科技大学(KAUST)举办的 Rising Stars AI 研讨会,见到了 LSTM 之父 Jurgen Schmidhuber,还认识了很多知名学者,我和他们一起交流量化方向的研究进展。也成为了德国学术交流中心(DAAD)的 AInet Fellow”

在字节学术合作项目中,秦同学可以获得学校导师与字节 Mentor 双方的指导。所产出的技术成果也可以落地在字节跳动的抖音、PICO 等业务上。现在,秦同学正在探索大模型背景下的硬件友好深度学习,“字节会更靠近工业界、靠近实际落地,我们期待在将来的研究中获得更有影响力的成果”。


2023 年,第三届字节跳动奖学金计划已于本月启动,计划支持 10 余位具有创新精神的科技人才,期待优秀的同学们积极报名,与字节跳动共同探索新奇。

我们相信,对优秀科研学子的支持与鼓励不仅能促进个人的创新创造、学术发展,更能通过个人的发展促进科技进步,探索人类认知前沿,让技术回馈社会,引领未来可持续发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/589998.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

高压放大器在驱动压电陶瓷进行铝板无损检测中的应用研究

想要达成在不损害或不影响被测对象使用性能及自身性质的前提下,对被测对象内部进行缺陷,结构,失效分析,就得用到无损检测(Non Destructive Testing)技术,最常用的无损检测方法有很多&#xff0c…

【网络安全知识】网络技术领域术语大全,强烈建议收藏!

自主访问控(DAC:Discretionary Access Control) 自主访问控制(DAC)是一个访问控制服务,其执行一个基于系统实体身份的安全政策和它们的授权来访问系统资源。 双附接集线器(DAC: Dual-attached Concentrator) 双附接集线器(DAC)是FDDI或CDDI集线器有能力接入到一个…

RK3568 AP6275S蓝牙驱动程序调度过程

1、前言 今年3月份调度了RK3568驱动程序&#xff0c;当时由于时间的问题&#xff0c;AP6275S蓝牙驱动程序没有调试成功。当时仔细检查的设备树的配置。 wireless_bluetooth: wireless-bluetooth {compatible "bluetooth-platdata";clocks <&rk809 1>;cl…

离散数学_十章-图 ( 4 ):图的表示和图的同构

&#x1f4f7;10.4 图的表示和图的同构 1. 图的表示1.1 邻接表1.1.1 简单图的邻接表1.1.2 有向图的邻接表 1.2 邻接矩阵❗在邻接表和邻接矩阵之间取舍1.3 关联矩阵 2. 图同构3. ⚡判断两个简单图是否同构 图的表示方式有很多种&#xff0c;选择最方便的表示有助于对图的处理~ …

Navicat 面向 PostgreSQL 查询超时的工具解决方案

文章目录 Navicat 面向 PostgreSQL 查询超时的工具解决方案查询超时的必要性应用场景 查询分析器 | Navicat Monitor在数据库级别设置为特定用户设置查询超时 结语 Navicat 面向 PostgreSQL 查询超时的工具解决方案 早前&#xff0c;我们发表过一篇《PostgreSQL 与 Navicat &am…

Datax ftp写入hive

这是一个巨大的坑&#xff0c;网上对这块的完整描述真的很少&#xff0c;新手真的会很迷茫&#xff01;&#xff01;&#xff01; 插件 选择插件 reader插件选择&#xff1a;ftpread write插件选择&#xff1a;hdfswrite 参数配置 reader参数 "parameter": {/…

干货|SpringCloud全家桶微服务初探

SpringCloud的从整体架构上看&#xff0c;相对来说是完整的、庞大的。它不仅仅是一个基础性架构工具&#xff0c;它为微服务架构提供了一个“全家桶”的套餐。每一个模块关注各自的职能&#xff0c;并且能够很好地配合与协作&#xff0c;能够帮助入门者快速搭建起一套微服务架构…

前后端联调跨域问题

文章目录 什么是同源策略如何判断是否同源&#xff1f;跨域资源共享(CORS)如何解决跨域问题 什么是同源策略 同源策略限制了从同一个源加载的文档或脚本如何与来自另一个源的资源进行交互。这是一个用于隔离潜在恶意文件的重要安全机制。 如何判断是否同源&#xff1f; 如果…

从中国人民大学与加拿大女王大学金融硕士的学员构成,了解金融行业都有哪些职位

金融行业最受欢迎的岗位莫过于券商、银行、基金公司、私募市场、体制内&#xff08;监管部门、交易所等&#xff09;、信托、大企业投资部、保险、管理咨询、资产管理。在当下如果要选择工作&#xff0c;想找就业率第一、薪酬排名第一的行业&#xff0c;那一定是金融工作。中国…

03 redis新类型bitmap/hyperloglgo/GEO

亿级系统中常见的四种统计 聚合统计 统计多个集合元素的聚合结果&#xff0c;就是前面讲解过的交差并等集合统计交并差集和聚合函数的应用 排序统计 抖音视频最新评论留言的场景&#xff0c;请你设计一个展现列表。考察你的数据结构和设计思路设计案例和回答思路以抖音vcr最…

3.java高级之GUI编程

1.gui (graphical user interface) awt sun公司最早的gui,不美观,不兼容各平台swing : awt升级2.顶层容器(只有一个)(其他的只能放这里)Jframe Jdialog对话框 Jwindow(x) //在main方法写fnew Jframe(); f.setSize(300,300); //设置大小f.setTitle("hello"); //设置…

java条件语句

文章目录 一、java条件语句1、Java 条件语句 - if...else2、Java switch case 语句 总结 一、java条件语句 1、Java 条件语句 - if…else Java 中的条件语句允许程序根据条件的不同执行不同的代码块。 一个 if 语句包含一个布尔表达式和一条或多条语句。 语法 if 语句的语法…

你真的了解kotlin中协程的suspendCoroutine原理吗?

文章目录 什么是协程suspendCoroutineUninterceptedOrReturnsuspendCoroutineUninterceptedOrReturn存在的问题suspendCoroutinesuspendCancellableCoroutine ​ 引言&#xff1a; 在Kotlin协程中&#xff0c;如何让一个suspned 函数挂起&#xff1f;如何让挂起协程恢复&#…

STM32G4 比较器COMPx(寄存器开发)

目录 1. 特性1.1 框图1.2 比较器输入信号SEL1.3 比较器滞回选择HYST1.4 比较器的输出1.5 LOCK机制 2. 编程2.1 初始化步骤2.2 举例 STM内部的比较器是模拟量的比较器&#xff0c;其与APB2时钟同步&#xff0c;在RCC时钟控制器中没有COMx时钟使能标志位&#xff0c;其时钟的使能…

前端自学要多久?自学前端一般多久可以找到差不多的工作?

好程序员今天给各位同学分享自学前端的高效率路径&#xff0c;最快4个月&#xff0c;平均6个月&#xff01; 一、html, CSS (1月) 1.基本语法, 2.做2-3个项目实战 3.刷面试题 二、JavaScript (1.5月) 1.基本语法 2.实际案例练习融合HTML, Css项目实战 3.刷题面试题 三、Vue/Rea…

Java 高级应用-多线程-(三)实现 Callable 接口与使用线程池创建线程

实现 Callable 接口 • 与使用 Runnable 相比&#xff0c; Callable 功能更强大些 – 相比 run()方法&#xff0c;可以有返回值 – 方法可以抛出异常 – 支持泛型的返回值&#xff08;需要借助 FutureTask 类&#xff0c;获取返回结果&#xff09; • Future 接口&#xff08;…

游戏研发项目管理

基于阶段模式进行游戏新产品研发过程&#xff0c;以及基于这种研发过程Leangoo 领歌提供的项目模板。 二、游戏产品开发流程 通常开发一款新游戏大体上会按照如下流程来进行&#xff1a; 1&#xff09; 概念阶段 – Concept 主策根据产品创意&#xff0c;确定游戏策划草案&a…

C++中的内存空间管理详解【C++】

文章目录 C/C内存分布C语言中动态内存管理方式&#xff1a;malloc/calloc/realloc/freeC内存管理方式new/delete操作内置类型new和delete操作自定义类型 operator new与operator delete函数重载operator new与operator deletenew和delete的实现原理内置类型自定义类型 定位new表…

使用tomcat可能遇到的问题

问题一&#xff1a;窗口一闪而过 如果双击startup.bat&#xff0c;启动tomcat&#xff0c;命令窗口一闪而过&#xff1b;或者用命令窗口执行startup.bat命令&#xff0c;未能启动tomcat&#xff0c;而是提示下面的文字&#xff1b; 说明可能是java的环境变量配置错误&#xf…

让ChatGPT谈谈科技发展

ChatGPT谈科技发展 讲讲科技发展的那些事儿谈谈ChatGPT对科技发展的影响谈谈你对ChatGPT的看法ChatGPT对科技发展的负面影响ChatGPT的存在是利是弊&#xff1f;关于全国科技者工作日 讲讲科技发展的那些事儿 谈谈ChatGPT对科技发展的影响 谈谈你对ChatGPT的看法 ChatGPT对科技发…