生成式AI与大语言模型,东软已经准备就绪

news2025/1/11 18:47:39

伴随着ChatGPT的火爆全球,数以百计的大语言模型也争先恐后地加入了这一战局,掀起了一场轰轰烈烈的“百模大战”。毋庸置疑的是,继方兴未艾的人工智能普及大潮之后,生成式AI与大语言模型正在全球开启新一轮生产力革新的科技浪潮。

在这场生成式AI的大潮中,东软集团也正式宣布成立东软魔形科技研究院,持续探索人工智能技术的创新与应用,推动实施大语言模型系统工程战略,全面迎接大模型时代的机遇与挑战。

生成式AI为什么会以如此惊人的速度火爆全球?它会给技术人员带来怎样的变化?东软集团在生成式AI领域又有着怎样的布局?刚刚成立的东软魔形科技研究院又肩负着怎样的使命?近日在东软解决方案论坛2023上,东软集团高级副总裁兼首席技术官、首席信息官陈锡民博士对以上问题给出了详细的解答。

5408e3322dc1bbd6bcacb4cb67519c6e.jpeg

生成式AI为什么如此火爆

陈锡民向趣味科技表示,生成式AI与大语言模型之所以,是因为它们可以做好以前许多人工智能技术做不好的事情,譬如对自然语言的理解,对文章的要点归纳,除此之外,其强大的生成能力也可以极大地提高用户的工作效率,让人们可以把有限的时间精力投入到更具有价值的地方去。

1、渗透力强:与元宇宙等其他技术相比,生成式AI可以更加普遍地渗入到人们的日常生活当中。它不仅仅依赖于特定的设备或装备,而是能够通过各种方式和渠道影响人们的生活。这种普遍性使其更加容易被人们接受,并在社会中产生更加广泛的影响。

2、解决关键技术问题:大语言模型解决了过去人工智能应用中的关键难题,即思维能力和生成能力。过去的人工智能更多地是决策式AI,只能做一些判断和识别,譬如图像识别和语音识别,但是缺乏更深层次的理解和生成能力。而大语言模型的出现填补了这一空白,使得生成式AI能够通过语言交互更加深入地理解用户意图,并产生相应的输出。

3、类似人类大脑中枢:大语言模型的运作方式与人类大脑中枢的运作方式有着一定的相似之处。它可以接受语言输入,理解并产生输出,这种输出可以是文本,也可以是进一步分解的行为、动作和其他指令。这使得大语言模型不仅仅是一个简单的工具,而是一个能够理解、思考和指导各种动作的智能系统。

4、裂变效应与无限可能:结合思维链的方式和提示工程的能力,大语言模型的能力可以被无限放大和嵌套。譬如一个AI可以生成两个子AI,分别执行不同的任务,并能够继续产生更多的子AI。这种裂变效应带来了巨大的想象空间,因为这意味着AI可以自我复制、自我监督、自我协同,实现任务的并行处理和高效完成。

“总的来说,生成式AI与大语言模型,对社会和技术带来了非常巨大的潜在影响。它们不仅仅是一个工具或者一个系统,而且还是一个能够思考、理解、指导和裂变的智能体。这种技术带来的变革可能会超越我们的想象,并给未来的生活和工作方式带来全新的定义和可能性。”陈锡民表示。

991a71c9a8a4305cbf6f8b1d1661272e.jpeg

大语言模型给技术人员带来的变化

由于新兴的生成式AI与大语言模型,与以往的传统人工智能技术是如此的不同,所以它们的快速普及,也给既有技术人员的岗位分工带来了巨大的震荡。

陈锡民指出,过去在IT行业,代码是否写得漂亮、算法研究是否深入,这些是人们评价一位技术人员能力高低的主要标准。然而随着生成式AI技术的发展,特别是大语言模型的出现,对技术人员的要求已经不仅仅是编程和算法研究的能力,而更重要的是如何与人工智能打交道,如何理解和驾驭知识,并将其活化为对人工智能的指导和应用。

这种对技术人员角色和能力要求的变化,实际上是一种从技术细节驾驭到知识驾驭的转变。技术人员需要更加深入地理解业务、理解知识,才能更好地利用生成式AI与大语言模型等技术为业务赋能。这种转变对技术人员的能力提出了更高的要求,需要他们具备更广泛的知识、更深入的业务理解以及更强大的创新思维。

对于企业来说,如何培养和吸引这种新型的技术人才,也成为了一项非常重要的课题。一方面,企业可以通过培训和内部转岗等方式,帮助现有的技术人员适应这种转变;另一方面,企业也需要从外部引进具有新知识结构和技术能力的人才,以推动自身的技术发展,更好地满足客户的需求。

对于这种新生的变化,技术人员自身也需要积极适应和快速学习。不仅需要提高自己的业务知识和理解能力,也需要学习新的技术和工具,譬如提示工程、微调技术等,以更好地驾驭生成式AI与大语言模型等新兴技术。

“总的来说,生成式AI与大语言模型等技术的发展,正在深刻改变IT行业的技术人员岗位分工和能力要求。而对于技术人员来说,这既是一个挑战,也是一个机遇。只有积极适应这种变化,不断提高自己的能力,才能在新的时代中立足。”陈锡民说道。

东软在生成式AI领域的布局

陈锡民向趣味科技透露,东软在生成式AI领域的布局具有非常清晰的目标和方向,将主要聚焦于行业大模型的构建和应用。由于通用大模型的训练成本非常高,所以东软选择利用开源模型为基础,结合行业数据和行业知识,来训练具备实际应用价值的专业大模型。

目前,东软正在围绕医疗、政府、汽车等三大重要的业务板块,构建生成式AI解决方案。其中,医疗领域的医生助手和问诊助手是两个典型的应用场景。医生助手可以自动生成医嘱和病历,提高医生的工作质量和效率;而问诊助手则可以帮助患者更准确地挂号和描述病情,提高医疗服务的效率和质量。这些应用场景都具有较高的落地可行性和应用价值。

值得注意的是,东软在构建行业大模型时,不仅考虑算法和模型的性能,也非常注重与社会责任和法律责任的结合。陈博士指出:“人工智能只是起到辅助作用的工具,最终的法律责任可能仍然由人来承担,因此我们要对产品更加谨慎。”这种注重社会责任和法律责任的做法,也有助于保障人工智能技术的安全和可持续发展。

值得一提的是,东软最近还面向医疗领域推出了多款AI+医疗行业应用,包括添翼医疗领域大模型、飞标医学影像标注平台4.0、基于WEB的虚拟内窥镜等。这是东软凭借深厚的技术积累、海量的数据资源、丰富的行业应用场景,在AI+医疗行业的创新实践,加速推动了东软“AI+领域应用”的人工智能生态图谱战略布局。

“虽然生成式AI与语言大模型在自然语言理解方面已经有了很大的进步,尤其是百亿、千亿参数规模以上的通用语言大模型。但是在医疗、法律等严谨行业中的应用,我们仍然需要非常谨慎。因为这些行业涉及人的生命、财产等核心利益,一旦出现错误,后果可能会非常严重。这就需要我们通过一系列的系统工程,确保大模型的输出质量和价值观的正确性,从而真正实现人工智能技术的安全和可持续发展。”陈锡民表示。

9c7dd9ce8e13b8a8c80164352eb0460f.jpeg

东软魔形科技研究院的使命

谈到最新成立的东软魔形科技研究院时,陈锡民表示,该研究院的诞生是以“智能化软件生产”和“软件智能化服务”为核心目标,并将启动和实施东软“大语言模型系统工程(LLM Systems Engineering,LLM-SE)”战略,围绕“专业性、一致性、可解释性、安全性”等企业级应用的核心特性需求,打造东软LLM-SE通用开发平台,面向医疗、人社、医保、政务、金融、媒体、人力资源及智能汽车等所有业务领域,构建东软LLM-SE+领域应用,完成典型场景落地部署及大规模推广,为东软AI大模型驱动的业务转型提供全面支撑。同时研究院还将积极打造外部合作生态 ,建设东软AI算力中心、AIGC相关技术的应用研究,构建东软完整的人工智能生态体系。

陈锡民指出,东软魔形科技研究院的成立肩负着多个重要使命,并且与东软集团作为行业软件领军企业的战略定位紧密相关:

1、跟踪与消化先进技术:当前大语言模型技术正处于快速发展和演进阶段。东软魔形科技研究院的首要使命是持续跟踪这些先进技术,并进行消化学习,确保东软始终保持在技术前沿。

2、探索行业应用场景与技术方案:作为行业软件厂商,东软需要深入探索大语言模型在各个领域的应用场景和相应的技术方案。特别是在东软关注的医疗等重点领域,由于数据的敏感性和保守性,需要自主研发符合行业需求的大模型。

3、商业化导向的研究:东软魔形科技研究院不仅致力于技术研发,而且还要确保研究成果能够商业化。这就需要研究出的模型在质量上可控,并且在部署成本和运行成本上都要合理,这样才能真正满足客户需求并实现商业化价值。

4、联合各业务单元共同研发:东软魔形科技研究院的特色在于它与各纵向业务单元紧密合作。各行业领域的专家和技术骨干带着课题进入研究院,共享算力、环境等资源,结合通用大模型的认知能力,共同进行相关课题的研发。

5、发挥模型孵化器作用:东软魔形科技研究院还起到了模型孵化器的作用。它负责对未来行业大模型的训练、实践验证及商业化全流程。一旦模型孵化成功,即可进行商业化销售,为东软带来实际的经济效益。

“综上所述,东软魔形科技研究院的定位是一个集先进技术跟踪、行业应用探索、商业化导向研发和模型孵化于一体的综合研究机构,它为东软在未来生成式AI与大语言模型领域的发展,提供了坚实的技术基础和源源不断的创新动力。”陈锡民说道。

20dd99224abd6335fcce4d8323a82fe6.jpeg

ba168f84c7a5e99ca32e748d6f6cc0f9.jpeg

60c8f90d845a6e0d392975f73ebcc3df.jpeg

dc0418ee499adfa086843c4aec3c64f4.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1240771.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PostgreSQL (Hologres) 日期生成

PostgreSQL 生成指定日期下一个月的日期 (在Hologres中,不支持递归查询) SELECTto_char(T, YYYYMMDD)::int4 AS date_int,date(T) AS date_str,date_part(year, T)::int4 AS year_int,date_part(month, T)::int4 AS month_int,date_part(da…

中职组网络安全B模块-渗透提权2

任务五:渗透提权2 任务环境说明: 仅能获取xxx的IP地址 用户名:test,密码:123456 访问服务器主机,找到主机中管理员名称,将管理员名称作为Flag值提交; Flag:doyoudoyoudo 访问服…

使用Pytorch从零开始构建DCGAN

在本文中,我们将深入研究生成建模的世界,并使用流行的 PyTorch 框架探索 DCGAN(生成对抗网络 (GAN) 的一种变体)的实现。具体来说,我们将使用 CelebA 数据集(名人面部图像的集合)来生成逼真的合…

微服务学习|初识Docker、使用Docker、自定义镜像、DockerCompose、Docker镜像仓库

初识Docker 项目部署的问题 大型项目组件较多,运行环境也较为复杂,部署时会碰到一些问题 依赖关系复杂,容易出现兼容性问题 开发、测试、生产环境有差异 Docker如何解决依赖的兼容问题的? 将应用的Libs (函数库)、Deps (依赖)配置与应用…

c语言:用迭代法解决递归问题

题目&#xff1a; 解释&#xff1a;题目的意思就是用迭代法的空间和时间复杂的太高了&#xff0c;需要我们减小空间与时间的复杂度&#xff0c;我就想到了迭代法&#xff0c;思路和代码如下&#xff1a; #include <stdio.h> //这里是递归法转迭代法 int main() {int x,i…

Spark---转换算子、行动算子、持久化算子

一、转换算子和行动算子 1、Transformations转换算子 1&#xff09;、概念 Transformations类算子是一类算子&#xff08;函数&#xff09;叫做转换算子&#xff0c;如map、flatMap、reduceByKey等。Transformations算子是延迟执行&#xff0c;也叫懒加载执行。 2)、Transf…

Leetcode——121 买卖股票的最佳时机

(超时。。。。。。&#xff09;除了暴力法我是真的。。。。。。 class Solution {public int maxProfit(int[] prices) {int len prices.length;int max0;for(int i0;i<len-1;i){for(int ji1;j<len;j){int income prices[j] - prices[i];if(income>max){maxincome;…

路由的控制与转发原理

场景1&#xff1a;路由器收到数据包后&#xff0c;会根据数据包的目标IP地址&#xff0c;计算出目标网段&#xff0c;再确定终端设备的具体位置。这个过程中&#xff0c;还需要计算出接口&#xff0c;或数据包下一跳的地址。最终会生成一条路由&#xff0c;即路径&#xff0c;存…

外部中断为什么会误触发?

今天在写外部中断的程序的时候&#xff0c;发现中断特别容易受到干扰&#xff0c;我把手放在对应的中断引脚上&#xff0c;中断就一直触发&#xff0c;没有停过。经过一天的学习&#xff0c;找到了几个解决方法&#xff0c;所以写了这篇笔记。如果你的中断也时不时会误触发&…

基于JavaWeb+SSM+Vue教学辅助微信小程序系统的设计和实现

基于JavaWebSSMVue教学辅助微信小程序系统的设计和实现 源码获取入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码获取入口 前言 1.1 概述 随着信息时代的快速发展&#xff0c;互联网的优势和普及&#xff0c;人们生活…

二、防火墙-安全策略

学习防火墙之前&#xff0c;对路由交换应要有一定的认识 1、安全策略基本概念2、匹配顺序3、缺省包过滤4、安全策略发展史4.1.基于ACL包过滤4.2.融合UTM安全策略4.3.一体化安全策略 5、Local区域安全策略5.1.针对OSPF协议配置Local区域安全策略5.2.其他协议 6、ASPF6.1.帮助FTP…

PCIE链路训练-状态跳转1

A&#xff1a;12ms超时&#xff0c;或者再任何lane上检测到Electrical Idle Exit&#xff1b; B&#xff1a; 1.发送“receiver detection”之后没有一个lane的接收逻辑被rx检测到 2.不满足条件c&#xff0c;比如两次detection出现差别&#xff1b; C&#xff1a;发送端在没…

文本分析:NLP 魔法!

一、说明 这是一个关于 NLP 和分类项目的博客。NLP 是自然语言处理&#xff0c;目前需求量很大。让我们了解如何利用 NLP。我们将通过编码来理解流程和概念。我将在本博客中介绍 BagOfWords 和 n-gram 以及朴素贝叶斯分类模型。这个博客的独特之处&#xff08;这使得它很长&…

竞赛选题 车道线检测(自动驾驶 机器视觉)

0 前言 无人驾驶技术是机器学习为主的一门前沿领域&#xff0c;在无人驾驶领域中机器学习的各种算法随处可见&#xff0c;今天学长给大家介绍无人驾驶技术中的车道线检测。 1 车道线检测 在无人驾驶领域每一个任务都是相当复杂&#xff0c;看上去无从下手。那么面对这样极其…

Oracle 的 Java SE、OpenJDK、Database 链接

1 访问主站 Oracle | Cloud Applications and Cloud Platform 2 开发者 2.1 OpenJDK (这里的不用登录&#xff0c;就可以下载) JDK Builds from Oracle 2.2 JavaSE (需要登录&#xff0c;才可以下载) Java Downloads | Oracle 2.3 DataBase (MySQL为例) MySQL :: MySQL Dow…

排序算法--快速排序

实现逻辑 ① 从数列中挑出一个元素&#xff0c;称为 “基准”&#xff08;pivot&#xff09;&#xff0c; ② 重新排序数列&#xff0c;所有元素比基准值小的摆放在基准前面&#xff0c;所有元素比基准值大的摆在基准的后面&#xff08;相同的数可以到任一边&#xff09;。在这…

DataFunSummit:2023年OLAP引擎架构峰会-核心PPT资料下载

一、峰会简介 OLAP技术是当前大数据领域的热门方向&#xff0c;该领域在各个行业都有广泛的使用场景&#xff0c;对OLAP引擎的功能有丰富多样的需求。同时&#xff0c;在性能、稳定性和成本方面&#xff0c;也有诸多挑战。目前&#xff0c;OLAP技术没有形成统一的事实标准&…

系统移植-交叉编译工具链

不同架构的机器码 与 汇编语言 都不可移植&#xff0c; 且二者一一对应 c语言中三种成分&#xff1a; 1.分号结尾的叫做语句 语句可以让CPU执行&#xff0c;可以进行预处理&#xff0c;编译等生成机器码 2.#开头的为预处理指令 不带分号 CPU无法执行 3.注释&#xff0c;…

AR道具特效制作工具

AR&#xff08;增强现实&#xff09;技术已经逐渐渗透到各个行业&#xff0c;为企业带来了全新的营销方式和用户体验。在这个背景下&#xff0c;美摄科技凭借其强大的技术实力和创新精神&#xff0c;推出了一款专为企业打造的美摄AR特效制作工具&#xff0c;旨在帮助企业轻松实…

Eclipse常用设置-乱码

在用Eclipse进行Java代码开发时&#xff0c;经常会遇到一些问题&#xff0c;记录下来&#xff0c;方便查看。 一、properties文件乱码 常用的配置文件properties里中文的乱码&#xff0c;不利于识别。 处理流程&#xff1a;Window -> Preferences -> General -> Ja…