宣晓华
本文由华院计算董事长、创始人宣晓华投递并参与《2023中国企业数智化转型升级先锋人物》榜单/奖项评选。
大数据产业创新服务媒体
——聚焦数据 · 改变商业
大模型的出现,正在开启着国内新一轮AI热潮。
某种程度上,真正在当下决定企业成败的,是能否尽早实现“技术+场景”的双轮驱动。
在很多人看来,OpenAI成功的关键因素之一,正是他们在GPT-3.5模型的基础上,找到了对话机器人这个交互形式简单,且能快速积累用户真实数据的超级场景,跑通了数据飞轮。
在国内,为尽早实现“双轮驱动”,企业们也是“八仙过海,各显神通”。既有百度、阿里巴巴等大厂借助自身成熟的场景生态跑通模型数据飞轮,也有王慧文、王小川等互联网大佬从零做起,一边炼大模型,一边找落地场景。
但与一众大模型浪潮的追逐者不同,华院计算一直在致力于算法技术和应用创新。
华院计算成立于2002年,是中国算法技术和应用的开拓者。在很长一段时间内,华院计算都在这个领域进行着“苦行僧”一般的修炼,推动数学应用与计算技术发展,聚焦认知智能技术、创新自研底层算法。
近两年来,华院计算在夯实底层技术的同时,为智能制造、数字治理、数字文旅、零售金融 等行业提供AI+行业解决方案、实现全面赋能。
ChatGPT让基于大数据、大算力的大模型爆火。
在我看来,GPT这类大模型之所以能有如此排山倒海之势,正是因为它具备了一定的认知能力,接触到了一些认知智能。
认知智能是以研究认知原理为目标的技术科学,让机器具备面向真实世界进行感知,理解、推理、规划、决策、情感等能力。
但大模型并不是实现认知智能的唯一路径。
大模型智能涌现有一个基础大前提,就是用海量数据“喂养”模型。但在产业落地过程中,很多场景并没有足够的数据可用。尤其在工业领域,涉及到制造工艺、专利科技相关的环节,数据量十分有限。
这就需要以行业know-how为驱动的小数据算法模型。
华院计算作为一家基于大数据技术的企业,我们也训练大型语言模型,但除此之外我们一直在探索真正实现认知智能的方式。
人类自身具备的两种学习方式启发了我们——人既能够通过大量经验、数据来学习,也能够以少量数据为基础,用推理的方式学习。前者是“数据驱动”,后者是“知识驱动”。
在大模型的浪潮下,人工智能早期推崇的符号计算看似正在被历史抛弃,其实不然。毕竟,大模型不是万能的,在产业落地中存在很大制约。
通用大模型,如闭源的ChatGPT、开源的LLaMA等,利用超大规模的数据进行训练。但真实业务场景中,例如在工业领域的表面质量缺陷检测场景中,由于有缺陷的图像数据很稀缺, 仅凭目前大模型的训练方法远不能解决实际问题。
因此,我认为未来AI企业的商业模式,是将大数据驱动的通用大模型和以知识驱动的面向垂直行业的小数据模型相融合,实现双轮驱动。
具体来看,就是将领域中的知识,专家经验,机理模型等与数据进行整合,建立系统化的模型,用于支持各种决策和问题解决, 以构建一个更完整、准确、可靠的决策和运行系统,从而帮助企业提高决策能力和效能。
过去二十年,华院计算做了大量算法领域的基础研究,十分注重小数据学习, 以及知识和数据融合的学习过程和算法,并试图让每一套算法的运行逻辑有更强的可解释性和鲁棒性。
时至今日,公司在二十余年的技术与产业探索中,摸索到了一条有效的企业运作模式。
目前,华院计算已经形成了“1+X”模式,实现技术与产业落地的双轮驱动。
拆分来看,“1”为算法实验室,包括斯梅尔数学和计算研究院和认知智能研究中心。在人工智能领域, 华院计算当前技术路径更加侧重知识与数据融合等新一代人工智能前沿技术研究和方法创新。
“X”则代表通用平台结合行业专家知识实现的落地应用。在多年的积淀下,算法实验室已经自研认知智能引擎通用平台,并形成五大通用技术能力,覆盖从底层算法模型到AI平台工具再到行业应用场景。
目前,华院计算重点关注“两个半”产业场景——
首先是以钢铁冶金行业为主的智能制造领域。宣晓华认为,钢铁、有⾊,稀土等工业⾏业是大数据模型和小数据模型相结合的很好落地场景。华院计算认知智能引擎有很大发挥空间。
例如过去两年,华院计算基于对工业生产场景的深入理解,秉承算法和应用场景相结合的技术路线,依托自身在智能算法领域的核心技术和创新优势,围绕整个特色产业链对配料、质量管控、能源管理、安全管理及智慧工厂等场景进行布局,帮助打造工业大脑和实现智能制造。通过AI算法来提高良率、减少损耗,从而帮助企业降低生产成本、提高产品质量。
例如,目前工业领域的表面检测,很多时候只通过大数据模型无法真正实现和解决这一问题,因为很多不同次品的图像数据非常少,此时就需要叠加小数据模型,才能实现。还有面对像产品质量预判等与工艺密切相关的问题,依靠大模型很难发挥作用,华院计算需要通过小数据模型基于提前预防和调整参数,减少次品率才能切实解决这一问题。
不仅如此,华院计算还针对钢铁,焦化行业开发了智能配料系统,利用基于小数据的算法,以成本和效益优先为指导进行资源配置。在数字治理领域
其次数字治理领域。华院计算聚焦用数字化和人工智能帮助基层政府高效发展经济, 实现乡村振兴。同时利用法律大数据和认知模型, 赋能基层干部更好快速解决老百姓的问题。剩下的“半个”场景,则是当下火热的AIGC及数字文旅应用。
与前两个场景不同的是,智能制造和数字治理更多是业务场景驱动的技术落地;而AIGC则是在技术成熟后,衍生出的新兴场景。目前,企业自研的生成式AI模型已具备人像驱动、情绪表达、文本生成以及基于领域型知识图谱的多轮对话等能力,实现了文本、语音到视频的自动输出。通过融合感知和认知智能技术,华院计算打造会交互、有个性的数字人,应用于文旅、文化教育等行业,可提供虚拟分身定制、智能视频生成、知识分享,虚拟直播等一站式解决方案。目前已与一些地方产业合作,共创城市文化IP,并开始落地。
此外,我们也在不断拓宽业务边界,如探索AI+生物医药领域。DeepMind开发的Alphafold已经在蛋白质预测领域有了里程碑式的成绩,但开发人类健康所需的药物浩如烟海,依然需要更多维度的人工智能技术来辅助开发者缩短新药研发周期。
跳出企业运作范畴来看,华院计算“1+X”的真正意义在于把算法和应用结合起来,帮助各行各业解决实际问题。
回望人工智能发展历史,在很长一段时间内,数学家都缺席人工智能的前沿领域,更多是计算机科学家主导研发方向。在宣晓华看来,计算机科学家更注重结果导向,创新算法并进行工程优化,而数学家追求对算法原理的本质理解和分析,将会使算法更具可解释性、优化得更简单可靠。当前,中国各个产业都进入了数字化、智能化转型升级的深水区,传统产业的细枝末节越发渴求先进技术的滋养。我们希望通过数据与知识双轮驱动,打造具有认知智能的底层引擎平台,聚焦不同垂直领域的场景、利用算法帮助行业解决实际问题。
·关于宣晓华
宣晓华先生,浙江大学数学硕士、美国加州大学伯克利分校数学博士,师从菲尔兹奖,沃尔夫奖得主、著名数学家斯梅尔教授,曾在美国加州惠普公司从事七年的建模/仿真的算法研究和大型软件开发。
宣晓华深耕数据技术、算法研究及人工智能应用近二十载,2002年创立华院计算技术(上海)股份有限公司,公司以算法研究和创新应用为核心:基于数学应用与计算技术发展,聚焦认知智能技术、创新自研底层算法;基于认知智能引擎平台的场景应用,为数字治理、智能制造、数字文旅、零售金融等行业提供AI+行业解决方案、实现全面赋能,从而推动行业智能化的转型和升级,让世界更智慧。为推动基础科学的发展,华院计算设立斯梅尔数学和计算研究院,邀请斯蒂芬·斯梅尔教授担任荣誉院长、宣晓华出任执行院长,携手包括加州大学伯克利分校、密西根大学、斯坦福大学、清华大学、复旦大学、上海交通大学等国内外众多高校和机构的顶尖学者共同参与,推动数学在计算领域的基础研究和发展。
★以上由宣晓华投递申报的观点性文章,最终将会角逐由数据猿与上海大数据联盟联合推出的《2023中国企业数智化转型升级先锋人物》榜单/奖项。
该榜单奖项最终将于11月14日以下活动中进行榜单的首发与奖项的颁发,欢迎报名莅临现场: