2023年的五月,称得上一句AI之夏。
大模型层出不穷、扎堆发布。
这一轮由大模型推动的AI热潮中, NLP(自然语言处理)技术与金融落地场景的结合备受期待。金融行业是数字化、智能化的先行者,也是大模型技术落地的最佳领域。如果将大模型的能力放在金融行业中去处理原有的任务,会对很多工作产生颠覆性的影响。
对科技企业来说,不仅要积极参与“训大模型”的技术竞赛,更重要的是,从场景出发,用最快速度完成大模型的业务落地、找到可行的产业逻辑。
这条“NLP+金融”的技术落地之路,度小满已经走了五年。作为源自百度的公司,度小满在NLP上的积累得天独厚。我们从度小满NLP开始,去看看NLP与金融的可能性,以及AI走向产业的应用落地是如何实现的。
大模型时代,
打开NLP+金融的想象力
大模型的到来,让NLP技术在金融领域的应用,打开了想象空间。
几乎所有金融单位都要处理大量文本、文档,NLP技术有潜力贯穿金融业务的所有环节:
1.读。超大规模的预训练生成式大模型,能够对金融业务场景中的数据信息和隐藏知识进行更高效的挖掘和理解,“多快好省”从文档文本数据中抽取出相应的信息,包括文档智能信息抽取、OCR、舆情分析、暴雷事件分析、报警、风控等,提高决策能力。
比如信贷辅助决策,基于强大的语义理解能力,读懂非结构化数据,包括财务报告自动化解析、数据智能挖掘、信贷流水材料智能处理、宏观行业分析、风险事件传导分析等。
在金融领域,征信报告是识别个人信用的最重要风控手段,小微企业融资难,一个主要原因是个人征信报告中存在大量非结构化数据,很难用传统的数据处理方式进行分析。度小满“智能化征信解读中台”,将NLP、图算法应用在征信报告的解读上,能够将报告解读出40万维的风险变量,将银行风控模型的风险区分度提升了26%。
2. 写。利用大模型的生成能力,自动化生成金融信息的抽取汇总、年报、行情预判、客户画像、营销方案等,成为金融从业人员的“全能助理”, 提升金融机构的效率。
3.说。基于自然语言的通用对话能力,更智能的任务式对话理解,打造全新的的智能客服、智能交互服务,例如 “超级金融顾问”,提供专业建议和方案辅助交流,快速高效低成本地响应用户需求,让金融更有温度。
从“智能”到“致用”
度小满的NLP之路
自然语言处理是人工智能皇冠上的明珠,但在大语言模型展露出强大的通用能力之前,如何用这颗“明珠”洞察金融数据,没有现成的路可走,全世界专注做NLP公司都比较少。2018年的时候,金融科技公司成立专门的NLP团队的更是鲜见,NLP在金融领域的应用落地也相对有限。
度小满则走出了一条独特的NLP之路。2018年创立之初,度小满就看到了“NLP+金融”的潜力,开始进行相应的产业布局。
首先是人才。人才是创新的源头。作为源自百度的公司,度小满在NLP技术上的人才储备可为得天独厚。度小满CTO许冬亮,2005年从清华大学计算机系人工智能实验室毕业后加入百度,三年多时间成长为百度搜索算法领域的领军人物,在自然语言处理、搜索算法及架构、知识图谱、LBS、智能营销及反欺诈等领域屡破难关。度小满技术委员会执行主席杨青,曾任百度主任架构师,有着丰富的技术应用实践经验。
有了人才作为技术创新的驱动力,度小满在NLP前沿领域持续探索,并不断斩获成果。
2021年,在微软举办的MS MARCO 比赛中的文档排序Document Ranking(文档排序)任务中,度小满的AI-NLP团队排名第一并刷新纪录。2022年,团队研发的轩辕 (XuanYuan) 预训练模型也在中文语言理解领域最具权威性的测评基准之一CLUE分类任务中排名第一。度小满AI-Lab在预训练模型、用户表示、序列建模等NLP任务相关算法也取得了突破性进展,相关论文被收入NLP顶会。
更重要的是,度小满的NLP之路并没有止步于学术赛场和实验室,而是积极走向产业,推动NLP技术与金融场景紧密结合,典型的就是信贷风控场景的征信报告解读。
2023年,由度小满建设的“智能化征信解读中台”工程,将大型语言模型 LLM、图算法应用在征信报告的解读上,荣获了 “吴文俊人工智能科学技术奖”,度小满也凭借该工程成为唯一入选的金融科技公司。
今年以来,大语言模型的爆发,让NLP这一技术路线成为科技公司和大众关注的焦点。
2023年2月,度小满成为百度文心一言首批生态合作伙伴,推动对话式语言模型技术在国内金融场景的落地应用。
大语言模型掀起的AI热潮还在持续,大众的关注焦点,也从“训大模型”,扩展到了“用大模型”的长线故事。
度小满作为一支超前布局、技术前沿性强、与金融产业接轨十分成熟的NLP力量,有望跑通大模型从技术到产业应用的落地之路。