它思科技CTO聂玮奇:消除“AI幻觉”,搭建高可靠对话云平台丨数据猿专访

news2025/1/18 21:02:38

a5601bf73a272f7832fe3763bef6de97.jpeg

bbbb544548e047030a5498995f1d8feb.png

6918f94c8ddbfc4d4e1dc6aff7d6b68a.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


近年来,大模型技术在全球范围内引起了广泛关注和应用热潮。

提到人工智能,很多人会想到它强大的运算能力和广泛的应用场景。如今,语言模型的发展如火如荼,但其中的“幻觉”问题却带来了诸多困扰。这一问题有哪些有效的应对策略?新的研究能为解决“幻觉”问题带来突破性进展吗?

在成都,有一家本土高新技术企业迅速崛起——成都它思科技有限公司(以下简称“它思科技”)。这家公司专注于高可靠对话云技术的研发,由一群清华大学的优秀校友组成的领导团队,致力于利用先进的大模型技术解决行业中的诸多难题。

它思科技的核心目标包括消除AI幻觉内容、解决数据稀缺问题、提高模型训练效率,并实现算力配置的国产化。这些目标不仅旨在提升技术能力,还致力于推动企业在人工智能领域的稳健发展。

近日,数据猿走访并采访了它思科技CTO聂玮奇,深入探讨了AI幻觉的概念以及公司在解决这一问题方面所采取的创新方法。通过这次采访,聂玮奇阐述了它思科技如何通过技术创新和团队合作,成功应对AI幻觉这一行业挑战。

解决“AI幻觉”问题,清华团队搭建高可靠对话平台

什么是AI幻觉?

“AI幻觉”是指人工智能在生成内容时出现的错误或不准确信息。通俗来说,我们在使用AI的时候,不知道哪句话是正确的,哪句话是瞎编的。采访中,聂玮奇解释说,常见的AI错误包括推理中断和逻辑偏差。推理中断是指,AI在推理过程中忘记了自己的论点,导致内容混乱。逻辑偏差则是指,AI的推理过程看似合理,但得出的结论却是错误的。

AI幻觉在行业内是一个重要的挑战。实际上,人类在记忆和处理信息时也会出现类似的问题。例如,当我们被要求回忆并详细描述今年发生了哪些事情时,人也可能会忘记一些细节,甚至记错。“这是因为人脑在处理信息时会进行压缩,并不是所有信息都能准确存储。类似地,AI模型在生成内容时也会因为数据压缩和抽象处理而出现不准确的情况。”

聂玮奇解释说:“我们希望AI模型能够在某些工作中替代人类,因此对模型的要求更高。如果要让AI模型替代人类的部分工作,必须解决其出现的幻觉问题。”

为了解决这一问题,它思科技专注研究高可靠对话云平台。它思科技即将发布的TasiChat人机对话产品,通过“检索增强生成”(RAG)和引用溯源技术,在大模型生成的内容中明确地标记出哪些部分的信息来自知识库中的文档,用户可以更好地评估生成内容的可信度和准确性,增强生成内容的可靠性。

具体来看,该平台依赖用户自己上传相关文件,通过大模型技术的应用,解决当前人工智能领域的AI幻觉问题。它思科技的平台允许用户上传各种类型的文件,如Pdf 文档、word 文档、excel表格、markdown 文档、txt文档等,并根据这些文件内容生成对话或其他文本输出。

“我们在产品中提供了参考来源功能,用户可以直接查看生成内容的出处。这在写论文等需要严谨引用的场景中尤为实用,因为用户可以轻松追溯到内容的原始来源。” 聂玮奇解释道。

据他介绍,解决AI幻觉问题并不能通过简单的算法调整来实现,而是需要通过改进算法和数据来源来缓解。例如,人类在撰写报告时,通常会参考外部数据来源,确保信息的准确性。同样,为了提升AI模型的可靠性,需要为模型提供可靠的数据来源,并进行严格的验证。

目前,公司正不断对产品进行迭代。尽管已经将大约50-60%的积累技术应用到产品中,但产品化的过程依然复杂,需要考虑使用场景、使用方法、用户习惯以及多端适配等多个因素,公司第一个版本已于去年3月启动。

据悉,目前公司的版本更新到1.1版本,并计划每两周发布一个新版本。据悉,目前公司大模型已经完成备案准备,已经提交国家网信办审核。在这段时间内,公司将继续进行内部测试和更新,目标是在11月正式上线运营。

高可靠性是件知易行难的“苦差事”

虽然高可靠性在AI领域被广泛提及,并成为行业共识,但真正投入资源和精力去实现高可靠性的企业却很少。这背后的原因主要集中在技术门槛和实际操作的复杂性上。

聂玮奇指出,解决AI幻觉问题是一个复杂且漫长的过程,可能需要数年的持续努力。尽管从业者们也在不断研究如何提高可靠性,但真正愿意投入资源去解决这些问题的企业却很少。这是因为实现高可靠性,不仅需要强大的技术能力和资金支持,还需要长期的投入和耐心。

据悉,目前它思科技是业内在解决幻觉问题上投入最多的企业。“高可靠性是一个知易行难的事情。”聂玮奇解释道,从理论上看,搭建一个简单的基于文档的大模型检索系统似乎很容易,只需要几分钟的时间写几行代码,就可以搭建一个看似运行良好的系统。然而,当尝试处理更复杂的任务,比如分析多个公司的财务报告之间的联系时,会发现系统无法提供更可靠的结果。

实际上,这背后的原因在于,各个环节都需要深入的工作。检索增强生成(RAG)技术虽然在理论上很简单,但实际操作起来却比较难。例如,模型需要从各种格式的文档中提取和理解信息,并在回答问题时高效地检索相关内容。这不仅需要强大的计算能力和高效的检索算法,还需要对各种文档格式进行预处理和转换。

此外,高可靠性的大模型开发需要大量的资金和人力资源。然而,这些投入在短期内可能看不到显著的回报,使得很多企业在投资时缺乏信心。市场对高可靠性模型的需求尚不明确,进一步增加了企业的投资风险。

总的来说,虽然高可靠性在AI领域的重要性毋庸置疑,但由于其技术复杂性和巨大的资源需求,很多企业选择避而不谈。

在技术复杂性中迎难而上,采用检索增强生成(RAG)技术

高可靠性技术的开发充满挑战,但其潜在价值和市场需求是不可忽视的。随着时间的推移,越来越多的重度用户,会逐渐认识到高可靠性的重要性。

它思科技的高可靠对话云平台,通过用户上传的各种文档,如PDF、DOC和TXT等格式,结合检索和生成两个步骤,提升了模型的可靠性。具体来看,用户上传的文档首先会被转换为模型可以理解的形式,随后模型在回答问题时,从大量文档中高效检索相关信息。

同时,平台采用了“检索增强生成”(RAG)技术,该技术能够根据知识库中的信息生成可靠的答案,降低了编造答案的可能性,从而降低了模型的幻觉。在这个过程中,需要企业一定量的标注数据对检索、生成等环节进行优化。

与同行相比,它思科技的独特之处在于其高可靠性解决方案的全面性和实用性。平台不仅提供参考来源功能,让用户可以直接查看生成内容的出处,还通过不断的迭代和改进,提升模型的性能和可靠性。

据了解,尽管它思科技于2024年才全面投入大模型的开发,但团队此前在技术积累上已有很多年时间。它思科技的总部位于清华大学附近,由清华团队孵化而成,自成立以来一直致力于语音识别和大模型的研究,依托清华大学语音与智能实验室(THU-SPMI)的深厚研究成果,它思科技拥有一流的语音与语言处理技术,涵盖人机对话系统、语音识别与理解、自然语言处理等多个前沿领域。自2017年起,团队成员开始转向大模型领域,并在这方面积累了丰富的经验,完成了诸多早期项目,在技术积累奠定了基础。

为什么要做高可靠性?

“我们认为确保信息的准确性至关重要,所以在成立之初就把解决幻觉问题当作头号问题,我们认为高可靠性的大模型是未来发展的重要方向。”如今,它思科技的云对话平台致力于解决三个问题:高可靠、高效益和国产化,尤其是高可靠性方面,从一开始就瞄准这一方向。尽管市场上有许多诱惑,但它思始终坚持在高可靠性技术上发力。

所有产品都值得用大模型重新做一遍,成都在我心中是国内城市前十

虽说做高可靠领域是件“苦差事”,但聂玮奇认为,做大模型是一件快乐的事情。他分享,在推出产品前,公司会去对大模型进行对话训练,在对话过程中,AI会触发很多很好玩的对话,团队在这个过程中也收获颇多。

实际上,成都本地涌现的大模型公司相比北上广要少一些,它思科技为什么会选择在成都发展呢?成都的独特环境对AI企业开展业务和研发活动有哪些影响?

在聂玮奇心中,成都是一个能够发展大模型公司的理想城市,并且在国内城市中排名前十。

聂玮奇笑着说:“我们这栋办公楼里,许多都是我们的客户。”一栋楼里都是潜在的客户和合作伙伴,这种紧密的产业链条使公司能够快速找到合作机会。在他看来,成都拥有良好的科技创新氛围。

目前,它思科技在成都的团队已经发展到20多人,成都是它思科技大模型研发的主要基地。虽然部分核心算法研发仍在北京进行,但公司新招聘的大部分人员都在成都开展工作。北京的团队主要负责核心技术的研究,而成都团队则专注于大模型的应用和优化。

相比北上广,成都的运营成本更低,无论是人力成本还是办公成本,成都都具备显著优势。“公司能够以较低的成本,吸引到高质量的人才,并为他们提供更好的生活和工作条件。我们发现,许多在北京、上海等一线城市工作的高端人才,愿意为更好的生活质量和较低的生活成本而选择来到成都。”据了解,它思科技的团队中,有很多是从外省来到成都的技术人才。

除此之外,算力也是吸引它思来到成都的原因。对于AI企业来说,算力是不可或缺的资源。成都的算力资源丰富,能够满足公司大规模模型训练和数据处理的需求,这一点对于依赖高性能计算的大模型公司尤为重要。

聂玮奇谈到,在政策方面,成都的政府政策对企业有不少的倾斜,几乎每一两周都会有新的政策出台,为企业的发展提供了丰富的资源和支持。政策红利也为在成都的发展的AI公司提供了坚实保障,也对企业的发展起到了积极的推动作用。

未来,它思科技计划是与更多本土的成都企业进行合作。“在我看来,所有的产品,都可以用大模型重新做一遍。”利用大模型技术为各类产品进行革新。未来,它思科技将深耕成都市场,利用大模型技术为各类产品进行革新。

文:梦芸 / 数据猿
责编:凝视深空 / 数据猿

ece26aa577004f60ec3d033250cecf34.jpeg

4e6fe7b6753055464d2f6a66b8549a87.png

d77aab33e72ca6b72b2904293ed47a17.png

4ef957764be98b631e49e7df9991d6db.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2214162.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SSM社区医院预约转诊管理系统JAVA|VUE|Springboot计算机毕业设计源代码+数据库+LW文档+开题报告+答辩稿+部署教+代码讲解

源代码数据库LW文档(1万字以上)开题报告答辩稿 部署教程代码讲解代码时间修改教程 一、开发工具、运行环境、开发技术 开发工具 1、操作系统:Window操作系统 2、开发工具:IntelliJ IDEA或者Eclipse 3、数据库存储&#xff1a…

SwiftUI 6.0(iOS 18)自定义容器值(Container Values)让容器布局渐入佳境(上)

概述 我们在之前多篇博文中已经介绍过 SwiftUI 6.0(iOS 18)新增的自定义容器布局机制。现在,如何利用它们对容器内容进行“探囊取物”和“聚沙成塔”,我们已然胸有成竹了。 然而,除了上述鬼工雷斧般的新技巧之外&…

STM32_实验1_建立新工程

1、使用STM32CubeIDE建立一个新工程 1.1选择时钟源为外部晶振时钟。 1.2选择调试方式为 serial wire(串行线)。 1.3配置时钟树. 1.4选择以 c 和 h 文件型式管理工程文件。 1.5生成 hex 可执行文件。(完成后点击锤子) 2.串口输出调…

鸿蒙进入“无人区”:该如何闯关?

按照华为方面的说法,“打造鸿蒙操作系统是三大战役,目前已经完成了底座和体验两大战役,第三大战役则是生态。”生态固然重要,但要让鸿蒙与当今世界主流操作系统抗衡,乃至成为新一代操作系统中的翘楚,其实还…

每个程序员都应该了解的硬件知识

作者:shizhaoyang 在追求高效代码的路上,我们不可避免地会遇到代码的性能瓶颈。为了了解、解释一段代码为什么低效,并尝试改进低效的代码,我们总是要了解硬件的工作原理。于是,我们可能会尝试搜索有关某个架构的介绍、一些优化指南或者阅读一些计算机科学的教科书(如:计…

卡码网KamaCoder 94. 城市间货物运输 I

题目来源:94. 城市间货物运输 I C题解1(来源代码随想录):Bellman_ford 本题是经典的带负权值的单源最短路问题,此时就轮到Bellman_ford登场了。Bellman_ford算法的核心思想是 对所有边进行松弛n-1次操作(…

【 ACM独立出版】第二届通信网络与机器学习国际学术会议(CNML 2024,10月25-27)

官方信息 会议官网:www.cn-ml.org The 2nd International Conference on Communication Networks and Machine Learningwww.cn-ml.org 时间地点:2024年10月25-27日 | 中国-河南-郑州 截稿时间:2024年10日19日 (多轮截稿&#x…

51单片机的晾衣架控制系统【proteus仿真+程序+报告+原理图+演示视频】

1、主要功能 该系统由AT89C51/STC89C52单片机LCD1602显示模块温湿度传感器光照传感器步进电机按键、LED、蜂鸣器等模块构成。适用于智能晾衣架等相似项目。 可实现功能: 1、LCD1602实时显示温湿度、光照强度和手动/自动信息 2、温湿度传感器DHT11采集温湿度信息 3、光照传感…

【数据结构与算法初阶】顺序表(上)

什么语言实现不重要,理解了思路就行,本篇使用C语言实现 一.顺序表含义(重要) 首先,顺序表属于线性表中的一中,线性表可以用多种方式实现,顺序表只是其中的一种 --------- 线性表是啥呢,通俗的说&#xff0…

lego-loam imageProjection.cpp源码注释(一)

一、主函数 int main(int argc, char** argv){ros::init(argc, argv, "lego_loam");ImageProjection IP;ROS_INFO("\033[1;32m---->\033[0m Image Projection Started.");ros::spin();return 0; }主函数很简单,常规ros初始化ros::init&…

程序员35岁丢了工作,应该怎么活?

35岁对很多程序员来说是个敏感的年龄段。在这个阶段,许多程序员已经有了丰富的工作经验和较高的薪水,但同时也面临着职场上不可忽视的年龄压力。尤其在一些技术密集型的公司,35岁之后的程序员可能被认为“年纪大了”,不再是招聘市…

【C语言】动态内存管理及相关笔试题

文章目录 一、为什么有动态内存分配二、malloc和free1.malloc函数的使用2.free函数的使用 三、calloc和realloc1.calloc函数的使用2.realloc函数的使用 四、常见动态内存分配的错误五、动态内存经典笔试题题1题2题3 六、总结C/C中程序内存区域划分 一、为什么有动态内存分配 我…

Struct Streaming

spark进行实时数据流计算时有两个工具 Spark Streaming:编写rdd代码处理数据流,可以解决非结构化的流式数据 Structured Streaming:编写df代码处理数据流,可以解决结构化和半结构化的流式数据 实时计算 实时计算,通常也称为“实时流计算”、“流式计算” 流数据处…

面腾讯后台开发,二面挂掉了,,,

随着各厂秋招的开启,收到面试邀请的同学也越来越多。在当年和我一起找实习的同学里面,有实力较强的同学收到了腾讯后台开发的校招面试邀请。但面试不止是实力的竞争,也有很重要的运气的因素。 虽然我的同学在腾讯后台开发的二面中挂掉了&…

Mybatis中的映射文件编写原则

先来回顾一下,在Java项目中如何使用Mybatis执行SQL语句: 添加依赖:在项目中添加 MyBatis 和数据库驱动的依赖。配置 MyBatis:创建 MyBatis 的配置文件,配置数据源和 Mapper 映射。创建 POJO 类:定义与数据…

拒绝飞单,微信监控轻松搞定!

微信作为广泛使用的社交工具,其安全性和监控问题受到了广泛关注。对于企业来说,确保客户资源的安全和防止员工“飞单”是重要的管理挑战。以下是一些有效的方法和工具,可以帮助企业提高微信的安全性,防止飞单,从而保护…

LLM - 配置 ModelScope SWIFT 测试 Qwen2-VL 模型推理(Infer) 教程 (1)

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142827217 免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。 SWIFT …

QT文件操作【记事本】

mainwindow.h核心函数 QFileDialog::getOpenFileName()QFileDialog::getSaveFileName() #ifndef MAINWINDOW_H #define MAINWINDOW_H#include <QMainWindow> #include<QFileDialog> #include<QMessageBox> #include<QDebug> #include<QFile> #…

Apache Kafka的生态

Kafka 生态系统 微信公众号&#xff1a;阿俊的学习记录空间 小红书&#xff1a;ArnoZhang wordpress&#xff1a;arnozhang1994 博客园&#xff1a;arnozhang CSDN&#xff1a;ArnoZhang1994 以下是与 Kafka 集成的工具列表&#xff0c;涵盖了不同领域的工具和扩展。这些…

Jmeter如何进行多服务器远程测试?

&#x1f345; 点击文末小卡片 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 JMeter是Apache软件基金会的开源项目&#xff0c;主要来做功能和性能测试&#xff0c;用Java编写。 我们一般都会用JMeter在本地进行测试&#xff0c;但是受到单…