我目前致力于操作系统相关的研发, 公司的目标是打造物联网时代的智能原生操作系统。如何实现操作系统的AI Native 呢?带着这样的疑问我参加了Qcon2023 北京站的大会。 与Qcon 2022 北京站不同的是, 身份变了, 上次是分享者, 这次是出品人, 出品的专题是——大模型时代的技术人成长。
在大模型时代, 技术人如何成长呢?划分为3个话题:
大模型时代的特点是什么?对个人提出了哪些新的要求?我们如何应对?
大模型时代新的开发范式是什么? 通过新的开发范式,我们可以发现哪些新的机会?并如何去把握这些新机会?
对我们已有的业务, 如何通过大模型为其赋能?在应用大模型相关技术的时候,我们又应该注意些什么呢?
三位分享的老师非常给力,三场演讲的效果在一定程度上达到了预期,因为现场还是出现了站票的同学。
大模型时代的个人成长
首先登台的是首都在线的吴锦晟老师,话题是大模型时代下的个人成长。
从国内大模型的发展开始, 重点谈到了大模型的核心能力——涌现
Translation 60B
Math 60B
In-context Learning 130B
Chain-of-thought reasoning 130B
Knowledge combination 530B
Emotion Perception 530B
进而讲到了应该了解的一些常见应用场景——
面对大模型,对我们的技术体系提出了新的要求,例如:
每个人都是独立的个体, 都应该根据自己的条件有着自己的思考。
如果时间充裕一些, 随着技术成长相关话题的展开, 我认为肯定可以给大家带来更多的帮助。
大模型时代的创业机会洞察
第二场分享对应着我们的第二个问题,但在会前我收到宜博老师的PPT时,我被惊到了,159页的讲稿对于我们的专场45分钟简直是不能完成的任务。感谢宜博老师的大幅裁剪,现场的版本是精简版定制播放。
分享中以大量的落地场景开始,让我们了解到大模型不再是坐而论道,除了chatGPT之外,基于大模型的应用已经在我们身边落地生花了。
大模型训练有三个要素:数据集数量,训练强度和参数,人与AI的协同模式同样有三种:embedding,copilot 和agent,但重要的还是开发范式的变化。
宜博老师深入浅出地讲解了大模型开发范式的6个层次,并以LLMFarm为例阐述了如何应用这一方式开发我们的AI App。
其中的第一性原理是:AI First 就是没有大模型就不成立的应用。
⼤模型时代创业:给⾼瞻远瞩的你三个建议
最后登台的是老朋友一乐,蓝莺IM在大模型火爆之前就已经是一款很不错的产品了,那么大模型又为这样一款IM产品赋能了什么呢?
一乐认真地分享了应用大模型中所遇到的挑战:⼤模型能⼒涌现需要⼤参数,以及胡编乱造的⼤模型⽆法解释,以及使用大模型服务的三种模式——PromptOnly,Embedding 和Fine-tune。重要的是,指出了大模型应用中的常见错误观点:
进而,一乐给出了三点建议:
建议⼀:有出海的勇⽓,也要有冷静的思考
建议⼆:AI First,也要 AI Right
建议三:看得远才⾛得远,⾛⼀步看三步
蓝莺IM 应用大模型的示例贯穿始终,包括让人眼前一亮的知识库联邦架构——
三场演讲,内容都是相当的充实,导致我只能被迫压缩互动环节,每一场分享都留下了些许的遗憾。
感谢各位老师的大力支持, 本专题所有讲稿PPT都是开放的, 感兴趣的朋友可以到Qcon2023 北京站的大会官网——大模型时代的技术人成长专题下载所有讲稿,有问题可以留言或者与老师们直接联系。
意犹未尽,青山不改,后会有期!
【关联阅读】
一文读懂“语言模型”
解读Toolformer
解读TaskMatrix.AI
知识图谱的5G追溯
图计算的学习与思考
AI系统中的偏差与偏见
老码农眼中的大模型(LLM)
LLM的工程实践思考
解读大模型的微调
解读ChatGPT中的RLHF
系统学习大模型的20篇论文