知乎版ChatGPT「知海图AI」加入国产大模型乱斗,称效果与GPT-4持平

news2024/9/17 9:13:36

        “2023知乎发现大会”上,知乎创始人、董事长兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎与面壁智能联合发布“知海图AI”中文大模型。

        周源据介绍,知乎与面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。目前,知乎和面壁智能合作自研的“知海图AI”中文大模型已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测。


“知海图AI”借力知乎语言数据库优势,称与GPT-4效果持平

        在知乎创始人、董事长兼 CEO 周源看来,AI 时代的生产力要素可以分为三层,从上到下依次是应用场景、专有数据、基础模型。“知海图AI”具备必须的生产力要素基因。

        基础模型方面,在知乎与面壁智能合作自研的“知海图AI”中文大模型面世之前,面壁智能已在 2020 年底发布了首个中文大语言模型 CPM-1,之后又陆续发布了 CPM-2、CPM-3 和 CPM-Ant 等模型。在应用场景在上,以问答形式为主,知乎搭建了专业、多元、有价值的“讨论场”。专有数据方面,知乎的运营模式决定了其积累了大量高质量的内容、关系和知识图谱,在当前国内互联网高质量内容匮乏的情况下,知乎的优势得天独厚,的确具备构建一个大模型的数据量。

        目前,知乎和面壁智能合作自研的“知海图AI”中文大模型,已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测。

        在知乎这个场景里面,答主的回答千奇百怪、非常开放,甚至会出现观点跟提问没有关系的情况。这对整个大模型很有挑战。知乎称,“知海图AI”利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户,给大家直观清晰的回答。

        面壁智能联合创始人、CTO 曾国洋表示,“在这个场景(知乎凌乱的问答区)下抽了40个提问去做评测。评测以后,发现跟GPT-4在这方面基本持平,我们稍微差一些,但还是蛮不错的。

国产大模型开启乱斗,资源禀赋各不相同

        人工智能激战正酣,当前各个大厂、创业企业开启乱斗,根据统计,目前国内至少有 15 个大大小小的 AI 大模型正在研发,当然各家资源禀赋各不相同。

国内已经宣布AI大模型项目的企业/机构

        阿里系AI大模型“通义”系列,特点在于“借力阿里超强的中间件优势,构建完整生态”,“通义”系列大模型将深入到电商、设计、医疗、法律、金融等行业,服务超过200个场景。阿里通义大模型打造了国内首个AI统一底座,根据研报梳理,阿里大模型相关受益标的主要包括:恒生电子、千方科技、石基信息、众信旅游、卫宁健康、金桥信息、亚康股份、神州数码、易点天下、丝路视觉等。

        腾讯系的混元AI大模型于2022年12月推出,是目前国内首个低成本、可落地的NLP万亿大模型,且登顶自然语言理解任务榜单CLUE。腾讯的数据、人才和硬件储备是布局AIGC领域的三大优势:数据方面,腾讯现有产品或带来多样化、真实度高的数据和应用场景;此外硬件方面腾讯拥有高性能网络平台、成熟的太极机器学习平台,为模型训练提供坚实基础。在生态链方面,腾讯系持股或与腾讯有重要合作标的,其中互联网传媒领域的有:世纪华通、完美世界、三七互娱、巨人网络、掌趣科技、电魂网络等;版权领域的有:华策影视、新媒股份、博纳影业、中文在线、平治信息;计算机领域的有:金山办公、泛微网络、四维图新、博思软件、长亮科技、超图软件等。

        华为系的盘古大模型,首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。盘古NLP大模型的可以赋能智能营销领域,比如,盘古NLP大模型可以通过文本匹配、意图识别等关键技术更好地服务销售环节,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统,帮助服务人员快速提升业务水平。对于华为盘古大模型生态链,在算力环节主要关注的是给华为做AI芯片服务的整机厂商,主要有神州数码、拓维信息、四川长虹、同方股份、广电运通、紫光股份等。

        百度系的“文心千帆”大模型平台,不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链。未来,文心千帆还会支持第三方的开源大模型。从平台定位上看,文心千帆为一站式企业级大模型平台,平台作为文心大模型服务的唯一入口,为B端企业用户,提供数据管理、自动化模型定制微调以及推理服务云端部署一站式大模型定制服务,并提供文心一言企业级推理云服务。从应用场景上看,文心千帆可应用于智能对话、智能输入法等通用场景以及电销领域商品介绍、推广文章等特定场景。根据研报梳理,目前百度AI生态链主要受益标的包括三六零、科大讯飞、拓尔思、万兴科技、格灵深瞳、云从科技、淳中科技、海康威视、大华股份等。

        目前,BAT 其中两家 AI 大模型已经进入试用阶段,压力给到其他厂商研发团队。在这场军备竞赛中,不乏有赶这场“AI 淘金热”的队伍,也有想“给淘金者卖水”的组织,训练 AI 大模型需要大量的计算资源和数据进行训练,这时候各家大厂/初创团队便要凭本事吃饭,这些平台将在竞争中重新审视系统性、结构工整的知识类内容,这有利于我国科技和生产力的发展,所以大模型竞争越多越好,最终由用户来做选择。


大厂拿所掌握数据投喂AI模型,引发数据安全担忧

形势一片火热,不乏理中客。

        互联网分析师张京科指出,如今由ChatGPT所引领的大模型浪潮,是科技领域的一次跨时代进步,但也存在巨大的用户隐私安全风险。

        ChatGPT于2022年11月发布后,其母公司OpenAI估值已涨至290亿美元,上线两个月后,用户数量达到1亿。伴随“尝鲜”热潮而来的是潜在安全风险的讨论。ChatGPT是一个生成式预训练变换模型,该模型前期的训练过程是基于人类反馈的监督学习和强化学习,在与用户大量的交互过程中聊天模型本身会将用户“喂”给它的数据作为训练数据,从而不断“进化”。

        “如今,互联网公司正在尝试用自己掌握的大数据投喂AI模型,很多时候厂商会以格式条款的协议获得用户各种隐私信息的授权,面对这些APP签订的协议,用户几乎没有选择的余地。各大互联网巨头源源不断地以用户信息投喂献祭,很多用户也不介意类似的隐私安全风险。”

        张京科指出,这意味着用户所有的隐私、喜好、聊天、关系链,甚至密码等等,未来有可能因为一个小小的安全漏洞或者运营事故,而大白于天下。为此,应制定更严格的用户大数据使用标准等措施提前进行预防。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/433036.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AUTOSAR存储服务之FEE换页策略介绍

概述 如下图是AUTOSAR Memory Stack的架构图,对于Memory Stack的介绍请参考AUTOSAR MemoryStack详细介绍_钢琴上的汽车软件的博客-CSDN博客 随着现在MCU携带的内置flash空间越来越大,从成本节省以及方便使用等方面考虑,在产品设计和开发过程中常用Flash EEPROM Emulation技…

CTFHub | eval执行

0x00 前言 CTFHub 专注网络安全、信息安全、白帽子技术的在线学习,实训平台。提供优质的赛事及学习服务,拥有完善的题目环境及配套 writeup ,降低 CTF 学习入门门槛,快速帮助选手成长,跟随主流比赛潮流。 0x01 题目描述…

手推广告论文(二)Wide Deep 推荐系统算法Wide Deep Learning for Recommender Systems

Wide & Deep Learning for Recommender Systems 论文地址https://arxiv.org/pdf/1606.07792.pdf 摘要 广义线性模型结合非线性特征转换,在处理具有大规模稀疏输入的回归和分类问题中已被广泛应用。通过一系列交叉积特征转换来记忆特征交互既有效又具有解释性…

【分布式事务 本地部署Seata服务】分布式事务框架Seata本地部署详细讲解

前言 这篇文章我会从0到1详细搭建分布式事务框架seata的使用,那么我们首先要先了解一下什么是分布式事务? 本篇文章是本地启动seata服务并且注册到nacos中,在SpringCloud中整合seata框架请转移下方连接 点我跳转SpringCloud整合seata教程&…

VMware ESXi 8.0U1 Unlocker OEM BIOS 集成网卡驱动和 NVMe 驱动 (集成驱动版)

发布 ESXi 8.0U1 集成驱动版,在个人电脑上运行企业级工作负载 请访问原文链接:https://sysin.org/blog/vmware-esxi-8-u1-sysin/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org 2023-04-18, VMware vSp…

【真北直播笔记】董越:简明DevOps学习地图

缘起 真北敏捷社区的宗旨是:求知、连接。求知就是学习,家里没矿的话,学习是一个人最重要的动力之源。连接就是把人拉在一起,我们相信人与人的互动会带来美好的变化。今天的直播是把大家拉在一起学习,就是求知、连接。 …

【万人推荐】黑客成长技术清单

最近两天,在reddit安全板块和Twitter上有个GitHub项目很火,叫“Awesome Hacking”。 “Awesome Hacking”在reddit上有超过四百个赞,但管理员后来认为不适合该板块(Awesome类项目没有新的内容),给了“rejec…

十大排序算法之插入排序、希尔排序、选择排序

个人主页:平行线也会相交 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 平行线也会相交 原创 收录于专栏【数据结构初阶(C实现)】 本篇主要讲解八大排序算法中的三种排序,分别是:插入排序、希尔排…

家用洗地机有什么优缺点?实用的洗地机分享

随着科技的不断发展,家庭清洁设备也在不断更新换代。现在市场上最常见的家用清洁设备包括洗地机、扫地机器人和吸尘器。这些设备各有优缺点,但在清洁效果、清洁范围和清洁方式等方面存在差异。洗地机是一种专业的清洁设备,它能够深度清洁地面…

SpringCloud之Gateway组件简介

网关的理解 网关类似于海关或者大门,出入都需要经过这个网关。别人不经过这个网关,永远也看不到里面的东西。可以在网关进行条件过滤,比如大门只有对应的钥匙才能入内。网关和大门一样,永远暴露在最外面 不使用网关 前端需要记住每…

Javascript进阶专题总结(函数、异步编程、设计模式)

函数式编程什么时候用 编程方法:函数式(js),面向对象(java,c),命令式 函数式(工具式操作) 优点:JavaScript种函数是一等公民,便于拆分组合可扩展性好,方便tree-shaking 缺点&…

【Linux系统】系统安全及应用二

开关安全控制一、开个安全控制1.1调整BIOS引导设置1.2GRUB限制1.3终端安全控制二、系统弱口令检查2.1安装JR工具三、网络端口扫描3.1NMAP端口扫描3.2NETSTAT,SS查看端口信息一、开个安全控制 1.1调整BIOS引导设置 将第一引导设备设为当前系统所在硬盘禁止从其他设…

1-时间复杂度分析

时间复杂度 ①what: 指执行当前算法所消耗的时间 ②简介结论: 时间复杂度由多项式T(n)中最高阶的项来决定,系数的影响忽略即可 例子: 操作数量T(n) 时间复杂度O(f(n)) 常数,比如 100000(即&#xff1…

ChatGPT将批量文档翻译成中文的方法

文档翻译成中文软件是指在处理文档时,自动将文档中的内容翻译成中文的软件。这些软件通常采用自然语言处理技术,通过对待翻译文本的分词、词义分析、语法分析等多种技术处理,实现对文本中的单词、短语、句子等级别的翻译。 文档翻译成中文软件…

CSDN,有幸遇见 ——我的三周年创作纪念日

一生二,二生三,三生万物 三年,与 CSDN 的相遇相识相知—— 前两年都没写,一是没纪念的概念,二是纪念日这天每年总是清明节。 还有就是不知道有勋章(( Meet 遇见 那年,我六年级&a…

JVM 垃圾回收详解之垃圾收集算法+垃圾收集器

标记-清除算法 该算法分为“标记”和“清除”阶段:首先标记出所有不需要回收的对象,在标记完成后统一回收掉所有没有被标记的对象。 它是最基础的收集算法,后续的算法都是对其不足进行改进得到。 这种垃圾收集算法会带来两个明显的问题&…

Node.js—path模块

目录 1、什么是path模块2、path.resolve 拼接规范的绝对路径 常用3、path.sep 获取操作系统的路径分隔符4、 path.parse 解析路径并返回对象5、path.basename 获取路径的基础名称6、path.dirname 获取路径的目录名7、path.extname 获得路径的扩展名8、 path.join()路径拼接 1、…

Linux高性能服务器编程|阅读笔记:第2章 - IP协议详解

简介 Hello! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~ ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计算机专业,获得过国家奖学金,有幸在竞赛中拿过一些国奖、省奖…已保研 学习经验:扎实基础 + 多做笔…

超越ChatGPT:AgentGPT正在将自主AI带到浏览器中

你好,欢迎来到人工智能领域的新时代!今天我们介绍AgentGPT,这是一款最前沿的基于浏览器的平台,旨在革新人工智能的自主性。这项开创性的技术让你能够在舒适的网络浏览器中创建、配置和部署定制化的人工智能代理,以实现…

又涨了?2023全国程序员薪资最新统计(文末附招聘岗位)

大家好,金三银四招聘季还在进行中。刚好最近看到一份 2022 国内程序员薪酬报告,感觉挺有意思的,跟大家分享一下。 在科技迅速发展的时代,各行业对程序员的需求持续增长,程序员作科技市场的“重要基石”,薪…