AI游戏设计的半年度复盘;大模型+智能音箱再起波澜;昇思大模型技术公开课第2期;出海注册经验分享;如何使用LoRA微调Llama 2 | ShowMeAI日报

news2025/1/11 13:59:45

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🔥 进步or毁灭:Nature 调研显示 1600+ 科学家对AI的割裂态度

国际顶级期刊 Nature 最近一项调研很有意思,全球 1600 多名科研人员对AI工具的态度非常「割裂」:部分认为AI对科研帮助颇多,另一部分人则充满深深的忧虑;部分人的日常工作已经离不开AI,有些则完全不使用。这其实也是社会公众对AI工具的观点缩影。

例如,AI带来的积极影响被广泛认可,比如更快地处理数据、加速海量计算能力、节约时间和经费;但是负面影响也让科研人员们警惕,比如导致了依赖模式识别而不是深刻理解、在数据中强化偏见或歧视、增加欺诈概率、研究无法重现等等。更多组的数据分析可以前往 ⋙ 阅读原文

🏆 PICO 2023 首届 XR 开发者挑战赛

https://www.picoxr.com/cn/2023picodevjam

PICO 2023 首届 XR 开发者大赛,是 PICO 公司举办的内容生态开发者大赛,通过比赛形式以促进 PICO MR/VR 内容生态繁荣,以及拉动更多开发者关注 MR/VR 领域。

本次比赛面向消费者&行业,提供了开发工具、指导、投资机会、面试直通、获奖激励等多方位的支持。以下是比赛关键时间节点,感兴趣可以前往主页了解更多信息:

  • 9月25日:系统开放报名

  • 10月2日:作品提报开启

  • 11月10日:作品提报截止

  • 11月13日-30日:评委评选

  • 12月5日:颁奖仪式

🧩 LLM for GamePlay:LLM 大模型驱动玩法设计的福与祸

这是一位AI游戏一线研发者的半年度总结,从技术应用的角度拆解了 LLM for gameplay 课题,是一篇非常真实朴素的行业实践分享,有很多金句和闪光的观点。

从最初的兴奋或无限遐想,到现在感受到的骨感现实,「屠龙刀并不一定合适所有的舞台」逐步成为行业新共识。以下是文章核心观点,推荐读一读原文,所有行业的发展都会经历这样U型转弯的过程:

  1. LLM 是万能的映射,而非万能的生成:LLM 并不能带来无限的游戏表现力,除文本外它依旧几乎完全依赖于资产开发本身

  2. LLM 尝试理解一切,但游戏无法包含一切:只有当游戏内状态的复杂度到一定规模,且能比较自然地转译 (encode) 成语义表达,LLM 的屠龙技才算是有用武之地

  3. LLM 正在努力变得万能,但游戏不一定需要万能:LLM 的映射能力也有侧重点,可量化的最优化问题也许其他AI技术会是更合理的选型

作者还分享了一个系统架构图,来讨论 LLM 如何用于构建角色和赋能场景:

  • Humanity:建模角色的人格、思维过程、情绪认知等脑内信息和过程

  • Speaker:建模角色的对话行为,也包括角色的心理活动、剧情旁白等文字表现

  • Evolver:角色对外界的行为决策及其具体执行 (action),和对应结果的结算 (resolving) ⋙ 阅读原文

👀 大模型有能力打穿「智能音箱/硬件」的市场壁垒么?

2023年上半年,国内智能音箱市场由小度、小米和天猫精灵三强鼎立,并先后宣布接入大模型。正当智能音箱又一轮激烈竞争来临之际,百度系却临阵换帅,景鲲辞职创业为这个「AGI产品必争之地」的战争再添变数。

为什么智能音箱是 AGI 产品路线图上的兵家必争之地?大模型能撑起来智能硬件这个巨大的想象空间么?我们距离智能印象打穿应用壁垒还有多长时间? 这篇文章给出了详细的解释和预判 ⋙ 阅读原文

👩‍💻 出海注册经验分享,搞定英国公司、Wise银行账号、苹果开发者和Stripe

这是一篇即刻上的经验分享贴,作者 @Junping1 全程在国内搞注册好了英国公司、Wise银行账号,Stripe和苹果开发者,并分享了非常详细的操作攻略。总体来说,操作成本不高、流程也不复杂,总共花费不到两千人民币,用时两三周。

扫码即可前往星球查看全部分享内容,以及操作建议帖的链接,也可以前往作者账号评论区互动 ⋙ 即刻@Junping1

📚 如何使用 LoRA 微调 Llama 2

这是一篇技术分享贴,讨论了使用LoRA 对大语言模型 Llama 2进行微调的过程,以及微调的好处。以下是文章要点,可以定位感兴趣的内容并前往阅读原文:

  1. 为什么微调:大语言模型微调后可以减少幻觉,使模型适应于特定的用例,并去除不希望的行为或者或添加希望的行为

  2. 微调与提示工程:微调比提示工程的成本更低,因为在硬件加速方面没有前期成本,还可以在微调过程中将更多数据适应到模型

  3. 大语言模型微调策略:已经提出了几种用于微调大语言模型的方法,其中之一就是 LoRA

  4. 使用LoRA微调大语言模型:LoRA 的工作原理是冻结语言模型的权重,并在变压器层中引入新的矩阵,从而减少了可训练参数的数量,并使得在较少的GPU计算下进行微调成为可能

  5. LoRA的好处:通过交换 LoRA 权重,可以使用同一模型进行不同的任务,从而减少了存储不同模型所需的存储空间;并且只有LoRA矩阵正在优化,因此能训练得更快 ⋙ 阅读原文

📋 通过 LLMs 实现需求的背后逻辑

这篇文章以「通过 LangChain 实现文档问答机器人」示例,清楚地说了使用 AI 构建一个应用背后的逻辑。不同于一般的实战教程分享,这篇内容对于我们思考和设计AI产品会非常有帮助。

当然作者并没有回避技术方向的信息,如果感兴趣可以跟随作者提供的链接前往了解更多代码、框架等内容。以下是文章的关键知识点,可以阅读全文查看作者更详细的解释:

  1. LangChain是基于大语言模型的应用框架,降低了开发成本,减少了单一模型对产品的风险

  2. 使用LangChain可以实现文档问答机器人,包括数据清洗、向量存储和LLMs的优化

  3. 向量是降低AI使用费用的工具,常用的向量数据库有Pincone、Redis、Chroma、PostgreSQL等

  4. 微调是让GPT模型更好理解特定领域内容的技术,需要大量训练文本,训练文本越多,微调的价格越高

  5. OpenAI的API更新新增了函数调用功能,让GPT根据用户问题匹配函数并准备入参,降低了应用构建的成本 ⋙ 阅读原文

📺 昇思 MindSpore技术公开课第二期,大模型专题即将开始

https://xihe.mindspore.cn/course/foundation-model-v2/introduction

昇思MindSpore技术公开课大模型专题第二期课程来了!自10月14日起,每双周六14:00-15:30在B站 @MindSpore官方 账号直播开课。本期课程紧跟「大模型」技术热点,并且手把手教你构建大模型,讲师团也非常强大。

这是课程安排,有感兴趣的话题,可以在官网报名,当然可以关注 ShowMeAI 社区通知,记得一起来听课:

  • [课前学习] MindSpore Transformers大模型套件:架构讲解与使用入门:介绍 MindSpore Transformers 大模型套件现状,讲解套件架构及高阶接口设计,走读工程架构模块代码,学习基本使用方式

  • ChatGLM:介绍技术公开课整体课程安排;ChatGLM模型结构,走读代码演示ChatGLM推理部署

  • 多模态遥感智能解译基础模型:介绍多模态遥感智能解译基础模型的原理、训推等相关技术,以及模型相关行业应用

  • ChatGLM2:介绍ChatGLM2模型结构,走读代码演示ChatGLM推理部署

  • 文本生成解码原理:介绍Beam search和采样的原理及代码实现

  • LLAMA:介绍LLAMA模型结构,走读代码演示推理部署,介绍Alpaca

  • LLAMA2:介绍LLAMA2模型结构,走读代码演示LLAMA2 chat部署

  • CPM:介绍CPM-Bee预训练、推理、微调及代码现场演示

  • 高效参数微调:介绍Lora、(P-Tuning)原理及代码实现

  • 量化:介绍低比特量化等相关模型量化技术

  • 框架LangChain模块解析:解析Models、Prompts、Memory、Chains、Agents、Indexes、Callbacks模块,及案例分析

  • LangChain对话机器人综合案例MindSpore Transformers本地模型与LangChain框架组合使用,通过LangChain框架管理向量库并基于向量库对MindSpore Transformers本地模型问答进行优化 ⋙ 了解更多

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1080915.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从零学算法54

54.给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。 螺旋遍历:从左上角开始,按照 向右、向下、向左、向上 的顺序 依次 提取元素,然后再进入内部一层重复相同的步骤,直到…

计算机竞赛python区块链实现 - proof of work工作量证明共识算法

文章目录 0 前言1 区块链基础1.1 比特币内部结构1.2 实现的区块链数据结构1.3 注意点1.4 区块链的核心-工作量证明算法1.4.1 拜占庭将军问题1.4.2 解决办法1.4.3 代码实现 2 快速实现一个区块链2.1 什么是区块链2.2 一个完整的快包含什么2.3 什么是挖矿2.4 工作量证明算法&…

计算机网络自顶向下实例

一名学生将便携机与学校的以太网交换机相连,下载一个Web页面 ①准备:DHCP、UDP、IP和以太网 学生启动便携机,然后用一根以太网电缆连接到学校的以太网交换机,交换机与学校的路由器相连。学校的路由器与一台ISP连接,以…

Java架构师高可用架构设计

目录 1 导学2 高可用到底是什么3 高可用架构的原则4 集群保障高可用5 限流保障高可用6 熔断降级保障高可用7 隔离保障高可用8 回滚保障高可用9 重试机制保障高可用10 备用系统11 辅助手段12 总结1 导学 在本章学习里面我们会先去学习耳熟能详的高可用到底是什么,然后呢去学习高…

src实战-两处nacos未授权访问

目录 一、hunter上搜索web.title”nacos”,查找中国境内的资产,定位到两个地址。 二、访问一下8086端口,界面很明显是nacos,直接抓包,创建用户。 三、登录网站,里面看到配置管理。 四、查看下redis.yml…

OSPF不同网络类型建立邻居实验

个人名片: 🐼作者简介:一名大二在校生,喜欢编程🎋 🐻‍❄️个人主页🥇:小新爱学习. 🐼个人WeChat:hmmwx53 🕊️系列专栏:&#x1f5bc…

欧科云链研究院:仰传统机构之“鼻息”,RWA的关键不在于Web3技术

前言 RWA与资产代币化正成为区块链与Web3技术在全球范围最受关注的用例之一。香港、新加坡等众多国家及地区都在积极推进相关实践及布局。欧科云链研究院从今年4月开始密切关注RWA发展,并在《》一文中率先提出“RWA将成为香港Web3最值得期待的应用方向”。 伴随着R…

2023版IDEA的下载、安装、配置、快捷键、模板、插件与使用

🎉 为什么会有这篇教程:熟悉 IDEA 并能灵活熟练使用 IDEA 能极大提高您的开发效率!!! 📍 本文教程基于当前 idea 的最新版本 2023.2.2。 📍 本文教程的所有操作图片均是实操测试截图或 gif 动态…

LSTM的预测算法 - 股票预测 天气预测 房价预测 计算机竞赛

0 简介 今天学长向大家介绍LSTM基础 基于LSTM的预测算法 - 股票预测 天气预测 房价预测 这是一个较为新颖的竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/postgraduate 1 基于 Ke…

中老年网红,下一个流量红海?丨小红书银发博主内容分析

有“中老年女性收割机”之称的短视频网红主播“秀才”,账号9月2日被封的消息一发出,便刷屏了各大社交平台的热榜。如果说“秀才”是行走的“中老年妇女收割机”,那么网红“一笑倾城”,则被称为“中老年男人心目中的易梦玲”。数据…

矩阵病态问题

病态(ill-conditioned)矩阵病态(ill-posed)方程 病态矩阵 矩阵的frobenius范数: 对每一个元素平方,求和再开平方 矩阵的条件数:矩阵的frobenius范数与该矩阵的逆的frobenius范数的乘积 对于同阶矩阵,矩阵的…

LayoutInflater.inflate的用法

LinearLayout ll findViewById(R.id.ll); LayoutInflater layoutInflater LayoutInflater.from(this); layoutInflater.inflate(R.layout.aa,ll); 把第一个参数的xml内容加到第二个参数viewgroup中。 如果第二个参数为null,就直接view xxxxxx.inflate();

Unity设计模式——模板模式

模板方法模式,定义一个操作中的算法的骨架,而将一些步骤延迟到子类中。模板方法使得 子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤。 Abstract Class 是抽象类,其实也就是一抽象模板,定义并实现了一个模版方法。这…

面试过不了?超全,高频接口测试面试题+答案,预判你的预判...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 面试题1&#xff…

Postgresql源码(115)LLVM JIT运行逻辑分析(上)

1 JIT入口开关 总入口:jit_enabled打开 且 生成计划成本超过jit_above_cost启动JIT。 计划成本超过jit_optimize_above_cost,执行PGJIT_OPT3使用O3对IR进行优化。计划成本超过jit_inline_above_cost,执行PGJIT_INLINE。jit_expressions开关如…

MES生产管理系统 MES系统

MES生产管理系统 MES系统 MES包括ERP及生产管理,主要有销售,采购,仓库,财务,设备管理,生产,报工,质量管理模块。适用于各行各业的生产情况。 1.销售模块(销售订单&…

证件照如何自己换底色?快速证件照换底色方法

提交证件照信息的时候,通常需要满足一些规定,比如某一种背景底色,当不符合要求的时候,我们该怎么更换证件照底色呢?其实可以使用证件照换背景(证件照换背景 证件照换颜色 照片换背景-压缩图)工具…

Android Studio git 取消本地 commit(未Push)

操作比较简单 1.选中项目然后依次选择:Git->Repository->Reset HEAD 2.然后再to Commit中输入HEAD^,表示退回到上一个版本。

c++中什么时候用double?

c中什么时候用double? 在C中,通常使用double数据类型来表示浮点数,特别是当需要更高的精度时。以下是一些情况下可以考虑使用double的示例: 1. **需要高精度的计算**:当您需要进行精确的浮点数计算时,double通常比flo…

CANoe从零学习第2期课程,全新上线!

课程内容的视频解读 CANoe编程宝典课程内容介绍 课程内容的视频解读,复制链接,打开抖音查看 :CANoe编程宝典课程内容介绍 - 抖音