2023阿里巴巴全球数学竞赛决赛中的LLM背景题解析(应用与计算数学部分第2题)...

news2024/11/26 3:35:50

早点关注我,精彩不错过!

最近闹得沸沸扬扬的姜萍事件果真又成了世界就是个草台班子的有力论据。无论真相如何,各自心怀鬼胎,自有策略的合作看起来就一定是一场场的闹剧。

无意作过多评论,也绝不妄下言论,就观察子弹怎么飞以及飞的过程就够耐人寻味了。

不过,这次事件倒是成功地吸引了我抽空重新关注阿里巴巴全球数学竞赛这一赛事。

可惜这比赛创办之时已不是读书人而是社会螺丝钉,早就没了当年的锐气和勇气去参与和拼搏一番,有的是成人世界的极致权衡的策略罢了。不过既然到这了,我不禁翻开了今年的初赛试题。嗯,确实和以往我熟悉的中等数学竞赛风格还是迥异的。既不是考察如平面几何的奇技淫巧,更不是数学游戏这般门槛极低的大众娱乐,而是看起来还挺严肃的大学数学学科内容。显然这些内容更接近比较小型初等的研究课题,因为这些内容是研究而不是游戏,也没有广泛竞争性,这也体现出这个比赛的独特之处。

索性又再搜索了下去年2023的决赛试题,官方分为了代数数论,集合拓扑,分析方程,应用与计算数学,组合概率5大模块。看来,以人类今天数学知识的厚度,已经默认一个个人类个体应该是难以再出欧拉高斯那样的神仙了,要出就只能期待AI了。看到这些细分领域,除了入门了一点代数、每天应用着计算数学和组合概率仅还算熟悉外,其他内容我已经要很费劲了。毕竟工业生产和理论证明之间,压根就互不依赖。

不过,看到应用与计算数学部分时,不禁眼中一惊,就是下面这题:

979baa33869cb10b99a398c0e3079dee.png

居然是以当今最热、货真价实的LLM中的RLHF算法为背景命题的!不愧是互联网公司办的数学竞赛,也算颇具特色了。不过,当我读完、做完以后,不禁也再度感叹,数学和算法,基本可以成为独立的两种能力,只是偶尔被同一个人所具备罢了。一个优秀的LLM的架构师或强化学习的算法研究员,可能压根没仔细思考过以上的证明问题,而引导其走向工业应用成功的能力中,工程能力,算法经验,项目管理,有一大堆东西排在数学证明前面,全都搞定了再来管数学也是不迟的。相反,一个传统的数学家可能也不了解算法的世界,其研究方向可能于工业界在大部分时候没什么用,偶尔的碰撞并不是那么容易发生。更何况,数学的逻辑证明,经常在工业领域被大家都这么用,效果一直不错,就圆过去了,这早就是司空见惯的实用主义逻辑。数学那点东西,实在ROI太低。

不过吧,拿着题,仔细看过想过,不写出来就牙痒痒,就好像有个事没做完,就没法释放大脑已经分配的计算资源来干别的事一样。于是我花了点时间,也查了些资料,给出我的解答:

b2053f1ebf077c594b518191aa2870f8.png

简单说两句吧。

0. 这种中等以上的数学和前者有明显区别,那就是没有太多人为设置的解题门槛,而是来源于理论和实际问题的困难,比较直接地摆着去解决,不是有答案的解谜猜谜,更像是探秘。像本题,论思维链条的长度,关联广度,对经验的要求,要远远低于一道平面几何题,但是其结论本身又都是有实际价值和意义的,证明的难度其实主要在理解题意的本质,按照定义的本质写出式子,整理一下基本就成了。

1.  强凸函数式指的比凸函数再多一个二次项的值,使得其不仅在切线上方,更高于一条抛物线。这个性质使得函数收敛更快,是神经网络优化中一类加速收敛算法中的核心技术。不过这里对解题帮助不大,凸函数定义正反推导一下就秒了。

2.  从解题而言这算是一个构造类问题。但是,从强化学习排序的角度,其实很容易想到这个构造方式。因为这个G函数本质上是一个单调的非线性映射成分,不要让线性项直接抵消掉,而这里的排序走的是打分+排序的逻辑,因此我们在优化L函数时,一定是sort后取得当下这些r值(连续情况下就是mu分布的样本)排序后来算的,显然这个序要和真实标的相同是前提,而且希望大家都排序的情况下,我打出来的L函数还要更大才好,以区分得最好。于是题意中的这些性质基本就不言自明了。其中最后的加和性质其实是对称序列构造的问题,结构很是巧妙,还有点像Reverse原理的意思。另外,这里的反证法其实看起来是用存在来解决一个任意全程的问题,因为前者的逻辑链条有时好推导,这其实是我们逻辑公理的问题吧,也正好符合了一部分一般思维规律,很自然。

不过吧,没想过这些问题,真不影响做LLM和强化学习。

3.  题目表述还挺有意思,不依赖于c,可不就是常函数嘛,只需要按定义写出原式子是一个泛函导数在c处的值的含义,剩下的直接就是拉格朗日乘子法的结论了。所以只要看懂了定义,写明白了,思维链条倒是不难。但看懂题意定义,基本就代表这部分数学,你得熟练掌握,但不是那种刷题的背诵。

好了,就说到这里,保持对数学、科学和技术的敬畏之心,常读常新,共勉!

附:2023阿里巴巴全球数学竞赛决赛试题地址

https://files.alicdn.com/tpsservice/d2a6b6ee90217712d3e3897b5f4427a1.pdf

8718c22b3a0026b297d98616dad28847.gif

我们是谁:

MatheMagician,中文“数学魔术师”,原指用数学设计魔术的魔术师和数学家。既取其用数学来变魔术的本义,也取像魔术一样玩数学的意思。文章内容涵盖互联网,计算机,统计,算法,NLP等前沿的数学及应用领域;也包括魔术思想,流程鉴赏等魔术内容;以及结合二者的数学魔术分享,还有一些思辨性的谈天说地的随笔。希望你能和我一起,既能感性思考又保持理性思维,享受人生乐趣。欢迎扫码关注和在文末或公众号留言与我交流!

f46ad87b704a61009b3a824ac986f263.gif

1da594f18e46944fc3a814f22a7832ea.png

55558a22906b8aa0e5af020e5fa6706e.jpeg

扫描二维码

关注更多精彩

CATO原理中的数学与魔术(十四)——流程设计思路与升华

魔术里的交代与暗交代(三)——暗交代是怎么做的?

牛顿运动定律的谜团(四)——牛顿定律的数学模型

魔术《4 Kings 折纸》的三重境界(四)——魔术效果的突破

视错觉与魔术(二)——橡皮筋的奇迹

c8b256f9e3bdee04b0fc805146dd3684.gif

点击阅读原文,往期精彩不错过!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1875898.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity之自定义Text组件默认属性值

内容将会持续更新,有错误的地方欢迎指正,谢谢! Unity之自定义Text组件默认属性值 TechX 坚持将创新的科技带给世界! 拥有更好的学习体验 —— 不断努力,不断进步,不断探索 TechX —— 心探索、心进取!…

硬件实用技巧:刚挠板pcb是什么

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/140060334 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV…

SQLServer 表值构造函数 (Transact-SQL)

在 SQL Server 中,表值构造函数(Table Value Constructor, TVC)是一种用于在单个语句中插入多行数据到表中的语法。它允许你以行内表值表达式(row-valued expression)的形式指定多行数据,并将这些数据作为一…

基于weixin小程序周边美食系统的设计

管理员账户功能包括:系统首页,个人中心,用户管理,美食店铺管理,菜品分类管理,标签管理,菜品信息管理,系统管理 微信端账号功能包括:系统首页,美食店铺&#x…

ROS2使用Python创建服务提供者、消费者

1.创建服务提供者 ros2 pkg create example_service_rclpy --build-type ament_python --dependencies rclpy example_interfaces --node-name service_server_02 service_server_02.py 代码 #!/usr/bin/env python3 import rclpy from rclpy.node import Node # 导入接口 …

办公软件WPS与Office的区别

临近计算机考试很多同学在纠结我是报wps好?还是ms office好?下面就来详细说说。 1、wps属于国内金山公司的办公软件,里面包含word、Excel和PPT。考试是2021年开始的! 2、MS(Microsoft 微软) office属于美…

web安全渗透测试十大常规项(一):web渗透测试之深入JAVA反序列化

渗透测试之PHP反序列化 1. Java反序列化1.1 FastJson反序列化链知识点1.2 FastJson反序列化链分析1.3.1 FastJson 1.2.24 利用链分析1.3.2 FastJson 1.2.25-1.2.47 CC链分析1.3.2.1、开启autoTypeSupport:1.2.25-1.2.411. Java反序列化 1.1 FastJson反序列化链知识点 1、为什…

线程池技术实现及参数工作流程原理

一.什么是线程池 线程池其实就是一种多线程处理形式,处理过程中可以将任务添加到队列中,然后在创建线程后自动启动这些任务。这里的线程就是我们前面学过的线程,这里的任务就是我们前面学过的实现了Runnable或Callable接口的实例对象。 为什么使用多线程…

【RT摩拳擦掌】RT云端测试之百度天工物接入构建(设备型)

【RT摩拳擦掌】RT云端测试之百度天工物接入构建(设备型) 一, 文档介绍二, 物接入IOT Hub物影子构建2.1 创建设备型项目2.2 创建物模型2.3 创建物影子 三, MQTT fx客户端连接云端3.1 MQTT fx配置3.2 MQTT fx订阅3.3 MQT…

修改docker中mongodb容器的时区

假设容器名称为mongodb,设置时区为上海时区的命令为: docker exec -it mongodb bash -c "ln -snf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime && echo Asia/Shanghai > /etc/timezone"验证时区更改: docker e…

Eigen中关于四元数的常用操作

四元数(Quaternion)是一种数学工具,广泛用于计算机图形学、机器人学和物理模拟中,特别适合处理三维旋转。Eigen库是一个高性能的C数学库,提供了丰富的线性代数功能,其中就包括对四元数的支持。 1. 为什么选…

element ui form 表单验证

表单验证方法 在el-form元素上总体设置校验规则rules&#xff0c;下面是官方案例 <el-form :model"ruleForm" :rules"rules" ref"ruleForm" label-width"100px" class"demo-ruleForm"><el-form-item label"…

基于Java游戏售卖网站详细设计和实现(源码+LW+调试文档+讲解等)

&#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者&#xff0c;博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌&#x1f497; &#x1f31f;文末获取源码数据库&#x1f31f; 感兴趣的可以先收藏起来&#xff0c;…

从零开始学Spring Boot系列-集成Spring Security实现用户认证与授权

在Web应用程序中&#xff0c;安全性是一个至关重要的方面。Spring Security是Spring框架的一个子项目&#xff0c;用于提供安全访问控制的功能。通过集成Spring Security&#xff0c;我们可以轻松实现用户认证、授权、加密、会话管理等安全功能。本篇文章将指导大家从零开始&am…

Qt Creator创建一个用户登录界面

目录 1 界面设计 2 代码 2.1 登录界面 2.2 注册界面 2.3 登陆后的界面 3 完整资源 这里主要记录了如何使用Qt Creator创建一个用户登录界面&#xff0c;能够实现用户的注册和登录功能&#xff0c;注册的用户信息存储在了一个文件之中&#xff0c;在登录时可以比对登录信息…

模型预测控制:线性MPC

模型预测控制&#xff1a;线性MPC 模型预测控制&#xff08;Model Predictive Control, MPC&#xff09;是一种广泛应用于工业过程控制和自动驾驶等领域的先进控制技术。MPC通过在线解决优化问题来计算控制输入&#xff0c;从而实现系统的最优控制。本文将介绍线性MPC的系统模…

C# 实现websocket双向通信

&#x1f388;个人主页&#xff1a;靓仔很忙i &#x1f4bb;B 站主页&#xff1a;&#x1f449;B站&#x1f448; &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 &#x1f917;收录专栏&#xff1a;C# &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff…

【地理库 Turf.js】

非常全面的地理库 &#xff0c; 这里枚举一些比较常用&#xff0c;重点的功能&#xff0c; 重点功能 提供地理相关的类&#xff1a;包括点&#xff0c;线&#xff0c;面等类。 测量功能&#xff1a;点到线段的距离&#xff0c;点和线的关系等。 判断功能&#xff1a; 点是否在…

Ubuntu系统打包ISO镜像文件

本文以ubuntu20.04系统为例 1.Systemback简介 Systemback 是一个开源的系统备份和恢复工具&#xff0c;它主要用于 Linux 操作系统。Systemback 可以帮助用户创建完整的系统备份&#xff0c;包括操作系统、应用程序、用户数据等&#xff0c;并且可以在需要时将系统恢复到备份的…

5G频段简介

5G频段 5G网络一共有29个频段&#xff0c;主要被分为两个频谱范围&#xff0c;其中6GHz以下的频段共有26个&#xff08;统称为Sub6GHz&#xff09;&#xff0c;毫米波频段有3个。目前国内主要使用的是Sub6GHz&#xff0c;包括n1/n3/n28/n41/n77/n78/n79共7个频段。具体介绍如下…