【数智化人物展】华院计算董事长、创始人宣晓华:通用大模型只是起点,尚需结合专业知识方能解决行业核心问题...

news2024/11/25 0:24:06

a4142baf527c7d7d7e6c95847e4003d7.png

宣晓华

本文由华院计算董事长、创始人宣晓华投递并参与《2023中国企业数智化转型升级先锋人物》榜单/奖项评选。

c2bd5f31f15f9551d1cc93712e452df5.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


大模型的出现,正在开启着国内新一轮AI热潮。

某种程度上,真正在当下决定企业成败的,是能否尽早实现“技术+场景”的双轮驱动。

在很多人看来,OpenAI成功的关键因素之一,正是他们在GPT-3.5模型的基础上,找到了对话机器人这个交互形式简单,且能快速积累用户真实数据的超级场景,跑通了数据飞轮。

在国内,为尽早实现“双轮驱动”,企业们也是“八仙过海,各显神通”。既有百度、阿里巴巴等大厂借助自身成熟的场景生态跑通模型数据飞轮,也有王慧文、王小川等互联网大佬从零做起,一边炼大模型,一边找落地场景。

但与一众大模型浪潮的追逐者不同,华院计算一直在致力于算法技术和应用创新。

华院计算成立于2002年,是中国算法技术和应用的开拓者。在很长一段时间内,华院计算都在这个领域进行着“苦行僧”一般的修炼,推动数学应用与计算技术发展,聚焦认知智能技术、创新自研底层算法。

近两年来,华院计算在夯实底层技术的同时,为智能制造、数字治理、数字文旅、零售金融 等行业提供AI+行业解决方案、实现全面赋能。

ChatGPT让基于大数据、大算力的大模型爆火。

在我看来,GPT这类大模型之所以能有如此排山倒海之势,正是因为它具备了一定的认知能力,接触到了一些认知智能。

认知智能是以研究认知原理为目标的技术科学,让机器具备面向真实世界进行感知,理解、推理、规划、决策、情感等能力。

但大模型并不是实现认知智能的唯一路径。

大模型智能涌现有一个基础大前提,就是用海量数据“喂养”模型。但在产业落地过程中,很多场景并没有足够的数据可用。尤其在工业领域,涉及到制造工艺、专利科技相关的环节,数据量十分有限。

这就需要以行业know-how为驱动的小数据算法模型。

华院计算作为一家基于大数据技术的企业,我们也训练大型语言模型,但除此之外我们一直在探索真正实现认知智能的方式。

人类自身具备的两种学习方式启发了我们——人既能够通过大量经验、数据来学习,也能够以少量数据为基础,用推理的方式学习。前者是“数据驱动”,后者是“知识驱动”。

在大模型的浪潮下,人工智能早期推崇的符号计算看似正在被历史抛弃,其实不然。毕竟,大模型不是万能的,在产业落地中存在很大制约。

通用大模型,如闭源的ChatGPT、开源的LLaMA等,利用超大规模的数据进行训练。但真实业务场景中,例如在工业领域的表面质量缺陷检测场景中,由于有缺陷的图像数据很稀缺, 仅凭目前大模型的训练方法远不能解决实际问题。

因此,我认为未来AI企业的商业模式,是将大数据驱动的通用大模型和以知识驱动的面向垂直行业的小数据模型相融合,实现双轮驱动。

具体来看,就是将领域中的知识,专家经验,机理模型等与数据进行整合,建立系统化的模型,用于支持各种决策和问题解决, 以构建一个更完整、准确、可靠的决策和运行系统,从而帮助企业提高决策能力和效能。

过去二十年,华院计算做了大量算法领域的基础研究,十分注重小数据学习, 以及知识和数据融合的学习过程和算法,并试图让每一套算法的运行逻辑有更强的可解释性和鲁棒性。

时至今日,公司在二十余年的技术与产业探索中,摸索到了一条有效的企业运作模式。

目前,华院计算已经形成了“1+X”模式,实现技术与产业落地的双轮驱动。

拆分来看,“1”为算法实验室,包括斯梅尔数学和计算研究院和认知智能研究中心。在人工智能领域, 华院计算当前技术路径更加侧重知识与数据融合等新一代人工智能前沿技术研究和方法创新。

“X”则代表通用平台结合行业专家知识实现的落地应用。在多年的积淀下,算法实验室已经自研认知智能引擎通用平台,并形成五大通用技术能力,覆盖从底层算法模型到AI平台工具再到行业应用场景。

目前,华院计算重点关注“两个半”产业场景——

首先是以钢铁冶金行业为主的智能制造领域。宣晓华认为,钢铁、有⾊,稀土等工业⾏业是大数据模型和小数据模型相结合的很好落地场景。华院计算认知智能引擎有很大发挥空间。

例如过去两年,华院计算基于对工业生产场景的深入理解,秉承算法和应用场景相结合的技术路线,依托自身在智能算法领域的核心技术和创新优势,围绕整个特色产业链对配料、质量管控、能源管理、安全管理及智慧工厂等场景进行布局,帮助打造工业大脑和实现智能制造。通过AI算法来提高良率、减少损耗,从而帮助企业降低生产成本、提高产品质量。

例如,目前工业领域的表面检测,很多时候只通过大数据模型无法真正实现和解决这一问题,因为很多不同次品的图像数据非常少,此时就需要叠加小数据模型,才能实现。还有面对像产品质量预判等与工艺密切相关的问题,依靠大模型很难发挥作用,华院计算需要通过小数据模型基于提前预防和调整参数,减少次品率才能切实解决这一问题。

不仅如此,华院计算还针对钢铁,焦化行业开发了智能配料系统,利用基于小数据的算法,以成本和效益优先为指导进行资源配置。在数字治理领域

其次数字治理领域。华院计算聚焦用数字化和人工智能帮助基层政府高效发展经济, 实现乡村振兴。同时利用法律大数据和认知模型, 赋能基层干部更好快速解决老百姓的问题。剩下的“半个”场景,则是当下火热的AIGC及数字文旅应用。

与前两个场景不同的是,智能制造和数字治理更多是业务场景驱动的技术落地;而AIGC则是在技术成熟后,衍生出的新兴场景。目前,企业自研的生成式AI模型已具备人像驱动、情绪表达、文本生成以及基于领域型知识图谱的多轮对话等能力,实现了文本、语音到视频的自动输出。通过融合感知和认知智能技术,华院计算打造会交互、有个性的数字人,应用于文旅、文化教育等行业,可提供虚拟分身定制、智能视频生成、知识分享,虚拟直播等一站式解决方案。目前已与一些地方产业合作,共创城市文化IP,并开始落地。

此外,我们也在不断拓宽业务边界,如探索AI+生物医药领域。DeepMind开发的Alphafold已经在蛋白质预测领域有了里程碑式的成绩,但开发人类健康所需的药物浩如烟海,依然需要更多维度的人工智能技术来辅助开发者缩短新药研发周期。

跳出企业运作范畴来看,华院计算“1+X”的真正意义在于把算法和应用结合起来,帮助各行各业解决实际问题。

回望人工智能发展历史,在很长一段时间内,数学家都缺席人工智能的前沿领域,更多是计算机科学家主导研发方向。在宣晓华看来,计算机科学家更注重结果导向,创新算法并进行工程优化,而数学家追求对算法原理的本质理解和分析,将会使算法更具可解释性、优化得更简单可靠。当前,中国各个产业都进入了数字化、智能化转型升级的深水区,传统产业的细枝末节越发渴求先进技术的滋养。我们希望通过数据与知识双轮驱动,打造具有认知智能的底层引擎平台,聚焦不同垂直领域的场景、利用算法帮助行业解决实际问题。

·关于宣晓华

宣晓华先生,浙江大学数学硕士、美国加州大学伯克利分校数学博士,师从菲尔兹奖,沃尔夫奖得主、著名数学家斯梅尔教授,曾在美国加州惠普公司从事七年的建模/仿真的算法研究和大型软件开发。

宣晓华深耕数据技术、算法研究及人工智能应用近二十载,2002年创立华院计算技术(上海)股份有限公司,公司以算法研究和创新应用为核心:基于数学应用与计算技术发展,聚焦认知智能技术、创新自研底层算法;基于认知智能引擎平台的场景应用,为数字治理、智能制造、数字文旅、零售金融等行业提供AI+行业解决方案、实现全面赋能,从而推动行业智能化的转型和升级,让世界更智慧。为推动基础科学的发展,华院计算设立斯梅尔数学和计算研究院,邀请斯蒂芬·斯梅尔教授担任荣誉院长、宣晓华出任执行院长,携手包括加州大学伯克利分校、密西根大学、斯坦福大学、清华大学、复旦大学、上海交通大学等国内外众多高校和机构的顶尖学者共同参与,推动数学在计算领域的基础研究和发展。


以上由宣晓华投递申报的观点性文章,最终将会角逐由数据猿与上海大数据联盟联合推出的《2023中国企业数智化转型升级先锋人物》榜单/奖项

该榜单奖项最终将于11月14日以下活动中进行榜单的首发与奖项的颁发,欢迎报名莅临现场:

fa37da15961850d18115074edbf6b2bb.jpeg

7257ab11a94a0578779e36868c19998e.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1170131.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

22款奔驰S400L升级原厂 360全景影像 高清环绕的视野

您是否经历过这种场面呢? 停车位,狭窄障碍停车困难 避免盲区,倒车盲区危及生命安全 狭窄路段,无法判断是否安全通过 视角盲区,小孩站在视野盲区看不到 360度无缝3D全车可见,解决各个视角盲区&#xff…

开发一款直播弹幕游戏需要多少钱?

开发一款直播弹幕游戏需要多少钱?有好多朋友在咨询过弹幕游戏的开发价格后,都会比较吃惊,一款体量这么小的游戏为什么动辄就要几万块甚至十几万? 我来给你们说分析一下原因,这种游戏如果脱离开直播间,可以…

算法通关村第五关-黄金挑战LRU问题

大家好我是苏麟 , 今天聊聊LRU问题 , 相信学过操作系统的小伙伴并不陌生 . LRU问题 LRU的含义 LRU是Least Recently Used的缩写,即最近最少使用,是一种常用的页面置换算法,选择最近最久未使用的页面予以淘汰。 图解 : 如果再有其他元素就依…

ST表与RMQ(倍增表)

【概述】 RMQ : Range Maximum/minimum Query 这就是指区间最大或最小值(区间最值) ST表:Spars Table,一种可以解决 RMQ 的,基于倍增的数据结构,利用 ST 算法预处理打出的表,称为 ST 表。 …

EMC Unity存储系统如何查看SSD的使用寿命

为什么要写这个博客? 客户对老的EMC unity的存储系统要扩容,如何确定SSD磁盘是全新的还是拆机二手的?很多时候客户还有一个奇葩的要求,就是要和5年前的磁盘PN一致,甚至要求固件版本一致,最关键的还要求是全…

【LeetCode】每日一题 2023_11_4 数组中两个数的最大异或值

文章目录 刷题前唠嗑题目:数组中两个数的最大异或值题目描述代码与解题思路 结语 刷题前唠嗑 LeetCode? 启动!!! 题目:数组中两个数的最大异或值 题目链接:421. 数组中两个数的最大异或值 题目描述 代…

分享去视频/图片水印的工具(完结篇)

简介 视频去水印是在数字时代日益重要和频繁的需求之一。水印是一种保护版权和确认身份的常见手段,但在某些情况下,水印可能会对视频内容产生负面影响,因此需要去除。 首先,视频去水印可以改善视频观看体验。有些视频平台或个人会…

非常有用的工具箱IT-Tools

什么是 IT-Tools ? IT-Tools 汇集了 70 多种对开发人员和 IT 工作人员有用的工具。这个令人惊叹的工具的酷炫之处在于它不需要设置,不需要持久卷,您可以立即开始使用它。它包含大量工具,可生成密码、编辑 CSS 和 HTML 代码、文件格…

Blazor组件

Blazor组件 前言:博主文章仅用于学习、研究和交流目的,不足和错误之处在所难免,希望大家能够批评指出,博主核实后马上更改。 组件: Blazor 应用基于 Razor 组件,通常仅称为组件。 组件是 UI 的一个元素&…

自动驾驶算法(五):Informed RRT*算法讲解与代码实现(基于采样的路径规划) 与比较

目录 1 RRT*与Informed RRT* 2 Informed RRT*代码解析 3 完整代码 4 算法比较 1 RRT*与Informed RRT* 上篇博客我们介绍了RRT*算法:我们在找到一个路径以后我们还会反复的搜索。 Informed RRT*算法提出的动机(motivation)是能否增加渐近最优的速度呢?…

【腾讯云HAI域探秘】速通腾讯云HAI

速览HAI 产品简介 腾讯云高性能应用服务(Hyper Application lnventor,HA),是一款面向 Al、科学计算的 GPU 应用服务产品,为开发者量身打造的澎湃算力平台。无需复杂配置,便可享受即开即用的GPU云服务体验。在 HA] 中,…

3000 台 Apache ActiveMQ 服务器易受 RCE 攻击

超过三千个暴露在互联网上的 Apache ActiveMQ 服务器容易受到最近披露的关键远程代码执行 (RCE) 漏洞的影响。 Apache ActiveMQ 是一个可扩展的开源消息代理,可促进客户端和服务器之间的通信,支持 Java 和各种跨语言客户端以及许多协议,包括…

Sentinel热点参数限流动

什么是热点 限流是统计访问某个资源的所有请求,判断是否超过QPS阈值。而热点参数限流是分别统计参数值相同的请求,判断是否超过QPS阈值。 何为热点?热点即经常访问的数据。很多时候我们希望统计某个热点数据中访问频次最高的 Top K 数据&am…

关于Intel Press出版的《Bedyong BIOS》第2版的观后感

文章目录 此书的背景UEFI运行时DXE基础CPU架构协议PCI协议UEFI驱动的初始化串口DXE驱动示例 《Beyond BIOS》首先介绍一个简单的UEFI应用程序模块,用于展示UEFI应用程序的行为。作者为Waldo。该模块名为“InitializeHelloApplication”,它接受两个参数&a…

云栖大会,到底有些啥?

引言:10月31日至11月2日,2023云栖大会在杭州云栖小镇召开。小枣君去了现场,拍了一些照片,特来给大家做一个图文汇报。 云栖大会的前身,是2009年开始举办的地方网站峰会。2011年,这个峰会演变成阿里云开发者…

Linux的历史与环境

目录 Linux的背景介绍 Linux的时代背景-硅谷模式 计算机发展 UNIX发展历史 Linux诞生的偶然与必然 Linux开源 Linux发行版本 搭建Linux的环境 1.直接安装在物理机上 2.使用虚拟机软件 3.使用云服务器 (1)购买云服务器 (2&#x…

docker是干什么的

很多朋友刚接触docker,不知道docker做什么, 这里白眉大叔给大家普及一下 docker的知识以及docker和虚拟机的区别。 你可以这样认为,docker 就是 打包应用程序的工具。 怎么理解这个工具呢? 1-如何理解docker 这个打包工具&#x…

作为一个初学者,该如何入门大模型?

在生成式 AI 盛行的当下,你是否被这种技术所折服,例如输入一段简简单单的文字,转眼之间,一幅精美的图片,又或者是文笔流畅的文字就展现在你的面前。 相信很多人有这种想法,认为生成式 AI 深不可测&#xf…

选择适合你的办公桌:提高工作效率的关键

​在如今的数字时代,越来越多的人将办公桌移到家里或办公室。但是,如何选择适合你的办公桌可能是个挑战。不同的工作需要和工作空间大小会影响你的选择。下面是一些简单的建议,帮助你找到适合你的办公桌,提高工作效率。 首先&…

世微 平均电流型降压恒流驱动器 电动摩托车LED灯小钢炮驱动IC AP5218

1,来源:深圳市世微半导体有限公司 2,产品描述 AP5218 是一款 PWM工作模式, 高效率、外 围简单、内置功率管,适用于5V~100V输入的高 精度降压 LED 恒流驱动芯片。输出最大功率可达 15W,最大电流 1.5A。AP5…