25届科大讯飞飞星计划 AI研究算法工程师 面经

news2024/12/27 13:11:36

目录

  • 一面/技术面 2024/08/15

📋 总结: 本来应该是在7月底面试的,但因为有事就拖到了现在,或许是飞星计划里最晚面试的一批?面试官很和蔼,问的问题不算难,总体体验还算不错。

一面/技术面 2024/08/15

  1. 深挖实习
  2. 深挖论文(论文的创新点?训练时模型和数据的规模?你在论文中的贡献?)
  3. LLM预训练数据通常是由哪些部分组成的?
  4. 你都了解过哪些预训练数据集?分别介绍一下
  5. 预训练数据的SOP是怎样的?请从零开始讲,包括采集,解析,质量过滤,敏感内容过滤,去重等
  6. 怎样对网页数据进行解析?有没有遇到过棘手的问题?又是如何解决的?
  7. 怎样对PDF文档进行过滤?
  8. 表格数据应当如何清洗?
  9. Python中列表和生成器的区别?
  10. 怎样快速统计一个文本文件中有多少行等于abc?
  11. 形状为(1,2,3)和(3,2,1)的张量进行相加,会发生什么?得到的结果是什么样的?
  12. 介绍一下Adam优化器的原理。
  13. 一个6B的模型保存到计算机中会占用多少空间?
  14. 训练途中保存一个checkpoint和直接训完保存的模型有什么区别?(当时没太听懂问题)
  15. LLM的词表是如何构建的?LLaMA如何做词表扩充?
  16. LLM为什么会出现复读机的现象?又该如何解决?
  17. 手撕代码:无(我也不知道为什么没有算法题,或许是因为专项计划?)

一面问题总体来说不算难,等二面面过后继续更新

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2048492.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL基础--逻辑存储结构,架构

逻辑存储结构 表空间(ibd 文件):一个 mysql 实例可以对应多个表空间,用于存储记录,索引等数据。 段:分为数据段,索引段,回滚段,InnoDB 是索引组织表,数据段就…

Unity引擎基础知识

目录 Unity基础知识概要 1. 创建工程 2. 工程目录介绍 3. Unity界面和五大面板 4. 游戏物体创建与操作 5. 场景和层管理 6. 组件系统 7. 脚本语言C# 8. 物理引擎和UI系统 学习资源推荐 Unity引擎中如何优化大型游戏项目的性能? Unity C#脚本语言的高级编…

修复 iPad 卡在准备更新或正在进行更新的问题

为什么iPad 更新卡住了?原因很难确定,因为 iPad 的许多故障和状况都可能导致 iPad 无法更新 iOS 和应用程序。此外,很难弄清楚这种情况持续了多长时间。但是,您不必太担心,因为这只是一个小案例,您可以阅读…

Java入门(上)

day01 - Java基础语法 1. 人机交互 1.1 什么是cmd? 就是在windows操作系统中,利用命令行的方式去操作计算机。 我们可以利用cmd命令去操作计算机,比如:打开文件,打开文件夹,创建文件夹等。 1.2 如何打…

单元训练13:串行接口的进阶应用

蓝桥杯,小蜜蜂,单元训练13:串行接口的进阶应用 /** Description:* Author: fdzhang* Email: zfdcqq.com* Date: 2024-08-17 15:41:34* LastEditTime: 2024-08-17 19:48:35* LastEditors: fdzhang*/ #include "stc15f2k60s2.h"#defi…

算法工程师第四十天(647. 回文子串 516.最长回文子序列 动态规划总结篇 )

参考文献 代码随想录 一、回文子串 给你一个字符串 s ,请你统计并返回这个字符串中 回文子串 的数目。 回文字符串 是正着读和倒过来读一样的字符串。 子字符串 是字符串中的由连续字符组成的一个序列。 示例 1: 输入:s "abc"…

MySQL 异步主从复制流程解析

前言: 首先MySQL主从复制方式有多种,包括 binlog、GTID等,这里基于 binlog 的形式,解析异步主从复制流程 首先通过下面命令查看全部 binlog 日志文件 show binary logs; binlog 日志文件如下: 然后查看其中一个文件…

ECMAScript6语法:默认参数和rest参数

1、默认参数 默认参数即在定义函数的参数列表中指定了默认值的参数。在 ES5 中,并没有提供在参数列表中指定参数默认值的语法,要想为函数的参数指定默认值,只能在函数体中实现,示例代码如下: function table(width, …

MBR10200FCT-ASEMI智能AI专用MBR10200FCT

编辑:ll MBR10200FCT-ASEMI智能AI专用MBR10200FCT 型号:MBR10200FCT 品牌:ASEMI 封装:TO-220F 批号:最新 最大平均正向电流(IF):10A 最大循环峰值反向电压(VRRM&a…

西安旅游系统--论文pf

TOC springboot383西安旅游系统--论文pf 第1章 绪论 1.1 课题背景 二十一世纪互联网的出现,改变了几千年以来人们的生活,不仅仅是生活物资的丰富,还有精神层次的丰富。在互联网诞生之前,地域位置往往是人们思想上不可跨域的鸿…

YOLOv8侦测任务更换主干网络成MobileNetV3

目录 1. 添加主干网络模块 ​编辑1.1 在init.py中添加模块名 1.2 主体代码中添加调用语句块 2. 配置yaml文件 3. 修改成功 1. 添加主干网络模块 1.1 在init.py中添加模块名 1.2 主体代码中添加调用语句块 2. 配置yaml文件 3. 修改成功 自己随便找一个程序跑一跑验证…

微电网控制器是什么?微电网中央控制器|微电网协调控制器|微电网控制系统图|Micon2505微网中央控制器方案介绍

微电网控制器是什么?微电网中央控制器|微电网协调控制器|微电网控制系统图|Micon2505微网中央控制器方案介绍及其在油田采油机场景中的应用。微电网控制器广泛应用于具备光伏,储能,V2G,充电桩,风电,柴油发电…

图解内存分配算法 -- 小内存分配算法

图解内存分配算法 – 小内存分配算法 文章目录 图解内存分配算法 -- 小内存分配算法1. 算法介绍2. 算法图解2.1 约定2.2 数据结构介绍2.3 初始化2.4 第一次 malloc 40字节2.5 第二次 malloc 18 字节2.6 第三次 malloc 20字节2.7 第四次 malloc 40字节2.8 第一次 free2.9 第二次…

LINUX服务器部署准备

文章目录 配置环境变量NODE下载解压安装 NGINX下载NGINX下载GCC并安装解压安装启动NGINX MAVEN下载解压安装配置环境 TOMCAT下载兼容版本解压安装开启远程访问 REDIS下载解压安装配置远程使用关闭保护模式 配置环境变量 vi /etc/profile source /etc/profile解压成功之后、运行…

安装IDEA2021.2.1(含安装包)及其扩展设置

一、下载 通过百度网盘分享的文件:ideaIU-2021.2.1.exe 链接:https://pan.baidu.com/s/1cCUHNm0dpWlfkxf5RCEgfw 提取码:v62e 二、安装 安装视频网址:Java基础概念-12-idea的概述和下载安装_哔哩哔哩_bilibili 三、idea中的第一…

Postman内置动态参数和自定义动态参数

业务场景 现在有两个接口,接口1:获取接口统一鉴权码token接口,接口2:创建标签接口,标签接口的创建依赖接口1返回的鉴权码,即需要获取access_token的值,替换ACCESS_TOKEN。且接口2中标签名不能和…

【计算机硬件内存】

内存插槽中间通常有个突起物将整个插槽稍微切分成为两个不等长的距离, 这样的设计可以让使用 者在安装内存时,不至于前后脚位安插错误,是一种防呆的设计喔。 前面提到CPU所使用的数据都是来自于内存(main memory)&…

Java流程控制04:while循环结构

教学视频链接:https://www.bilibili.com/video/BV12J41137hu?p38&vd_sourceb5775c3a4ea16a5306db9c7c1c1486b5https://www.bilibili.com/video/BV12J41137hu?p38&vd_sourceb5775c3a4ea16a5306db9c7c1c1486b5 在Java中,while 结构是一个…

【C语言】深入讲解指针(中)

文章目录 前言函数指针函数指针变量的创建函数指针变量的使用两段有趣的代码typedef 关键字 函数指针数组函数指针的使用最后 前言 上一章深入讲解指针(上)我们对字符指针、数组指针、指针和数组传参进行了讲解,本章将对函数指针进行讲解&am…

Java、python、php版的大学生家教预约服务系统的设计与实现(源码、调试、LW、开题、PPT)

💕💕作者:计算机源码社 💕💕个人简介:本人 八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流&…