浅谈国产大模型的过去、现在以及未来

news2024/10/1 4:01:49

随着时间推移,AI与大模型正在肉眼可见的降温。

怎样去衡量一款AI产品是否成功?

这个问题如果放在两年前,很多人给出的答案会集中在AI的狭义领域,AlphaGo、Siri、Google Assistant,或是用于解锁手机的图像识别技术,能够在某个特定的领域完成特定的任务。

但从2023年开始,也就是ChatGPT火了之后,人们对AI的看法发生了一些转变,学习、适应、推理的自主决策的能力,不免让人产生AGI会成为现实的错觉。

所以我们能看到,在ChatGPT发布后的不到两年里,国内就上线了数百个大模型,里面既有互联网大公司,也有各种垂类公司,还有一批跑在风口上的初创企业。

毫无疑问,AI大模型的研发需要投入大量的资金和人才,这也导致了绝大部分初创公司的估值被严重透支,他们在短期内获得了大量融资,后续却无法持续烧钱维持迭代和商业落地,随着投资人信心下降,不免有一些机构选择清仓或撤资。

大浪淘沙,伴随无休止的套壳和再生的游戏,当下市面上能够接触到的模型主要分为两类。一是基础通用大模型,比如文心一言、通义千问、元宝这类大厂产品,它们应用场景广泛,功能包括但不限于文本生成、语言理解、问答系统、摘要提取、机器翻译等。某种程度上,它们可以作为下游任务的基础模型,通过微调或迁移学习,适应不同的应用场景和需求。

其次是行业专用,各类细分赛道的产出,像金山的政务大模型,多家公司的医疗、金融等大模型,应用场景主要集中在各自的专业领域内。例如,医疗大模型可以应用于电子病历分析、疾病预测、药物研发等多个环节;金融大模型则可以应用于风险评估、投资策略制定、客户画像构建等多个方面。

如果仅从数字上看,国产大模型在技术上的确成长很快,根据SuperCLUE的评测结果,国内绝大部分闭源模型已超过GPT-3.5Turbo。但事实上,这样的比较意义并不大,大模型虽然多,技术代差也在缩小,但商业化、差异化但效果并不明显,以至于大多数投资人回归到观望的态度。

前段时间圈子里比较热的几个话题,Kimi母公司月之暗面在2C业务之外,官宣了Kimi企业级API的正式发布,比通用模型有更高等级的数据安全保障和并发速率;智谱AI发布“Z计划”,开始、转型投资人的身份。

纵观五虎里剩下的百川智能、零一万物、MiniMax三家公司,推出的产品也很难打出真正的差异化,C端主要提升听说读写技能,产业端则作为私有数据平台和简化复杂需求的工具。一股劲儿地都在钻技术,较量百万,顶多千万级的日活,但市场一直缺乏能够承载AI的杀手级应用。

这样一来,逐渐聚焦于一个关键议题:尽管我们不断追求更大的数据量、更强的计算能力以及更复杂的模型训练,以期构建出更加智能的大模型,但这一过程中往往忽视了一个至关重要的前提:这些高级模型的有效运用与推进,离不开专业人员的深度参与和专业方法的精准实施。

当我们试图将这些大模型直接应用于具体场景,如新闻资讯平台或金融领域时,面临的挑战便显现出来。比如在面对如抖音、快手等已高度优化用户画像的平台时,大模型似乎并未能带来显著的变革性影响。这并非因为大模型本身不具备潜力,而是其在实际应用中的定制化与精准化需求远未被充分满足。

进一步来讲,如果将大模型应用于传统制造业或低门槛工作领域,同样面临严峻挑战。

过去人们以为,通过大模型的指导,即便是非专业人士也能轻松胜任高技能要求的岗位。然而,现实却远非如此。社会的工作分工与评价体系依然根深蒂固,强调经验积累与行业专业性。这意味着,仅凭大模型的短期培训,很难让一个普通人迅速跨越行业门槛,达到专业水准。

一个无法忽视的问题是,不同企业、不同业务应当如何设定合理且科学的增长标准,以及在缺乏直接参照对象时,如何衡量并规划业务的未来增长。

在观察当前市场上的AI大模型产品时,起初,这些技术可能凭借其新颖性和创新性吸引了大量关注,但随着技术的成熟和市场的饱和,增长动力逐渐减弱。

事实上,许多高估值的产品往往是在某个小众领域进行了深度挖掘和创新。这些问题极具普遍性,横跨了不同企业和业务领域,例如,拼多多通过重塑电商体验,为消费者带来了全新的购物感受;京东则凭借其强大的物流体系,构建了难以复制的供应链壁垒。

对于当前的大模型技术而言,发展方向应当更加注重用户体验和市场需求的结合。当这些技术被嵌入到如WPS这样的办公软件,或是美团这样的服务平台中时,核心问题在于,如何让AI技术更好地服务于用户需求,而不是仅仅停留在表面或浅层次的分析上。

举个例子,用户让AI软件猜测自己想吃什么,它们的确会通过语义分析来理解用户的意图,并给出一些建议或推荐。然而,这些推荐往往停留在较为宽泛的层面,没有真正深入到用户的个性化需求中。

换句话说,因为当前的AI技术还难以完全理解用户的复杂情感和具体需求,只能基于已有的数据和模型进行大致的预测和推荐;另一方面,让AI猜测人的已有目的,这件事本身就很浪费时间和技术资源。

再以翻译为例,假设我们已经能够将翻译精度提升到99%,而市场上的需求仅需要95.6%的准确度。这时,再花费大量资源去将精度从99%提升至99.5%,是否真的有意义?尤其是当这种提升对于大多数用户来说,并无显著差别时。

这里的核心问题是,从商业角度来审视技术的ROI(投资回报率)和ROE(净资产收益率)。在一个技术概念成为风口时,往往过分强调技术的先进性,而忽略了其在实际应用中的价值和可持续性。真正的挑战在于,如何将技术转化为实际的生产力,解决用户的真实需求,而不是简单地堆砌技术。

然而,能看到的却是大量公司在盲目跟风,试图通过增加数据量、提升算力等手段来打造所谓的“大模型”。但这种做法往往忽略了客户成功(CSM)的重要性,如何确保技术能够真正满足客户需求,为客户创造价值?

更为严重的是,许多公司并没有清晰的业务规划和阶段性目标,像无头苍蝇一样四处乱撞,结果往往是资源浪费和失败。大模型公司应该更加聚焦于实际场景的应用和落地,而不是仅仅停留在技术层面的自嗨,这样的认知应该早已共识,只不过问题尚未解决,市场也难有突破性的故事。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

👉1.大模型入门学习思维导图👈

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。

对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。

在这里插入图片描述
在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2065888.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

根据json字符串 自动生成 实体类 Model Entity .NET

①访问json2csharp的在线工具:http://json2csharp.com/ ②复制json字符串,粘贴到左边,按下面Convert按钮 ③右边就是 生成的 实体类 ,直接复制到 .cs文件内就能使用 ④或者点击 Zip As File 按钮,直接生成 N个.cs文…

编写 prometheus exporter监控 mysql group replication

用 prometheus 监控 mysql,之前用 mysqld_exporter 收集mysql 的监控指标,发现并没有 mysql 组复制状态的指标。只能自己收集了,编写脚本收集指标推送到 pushgateway,这个办法更简单但是扩缩容不是很方便。下面用 python 编写的一…

C++类模板初阶

目录 1. 泛型编程 概念: 2.函数模板 2.1函数摸版概念: 2.2函数模板格式 2.3函数模板的原理 2.4 函数模板的实例化 2.5 模板参数的匹配原则 3.类模板 3.1 类模板的定义格式 3.2类模板实现示例 3.3类模板的实例化 1. 泛型编程 概念&#xff1…

Baumer工业相机堡盟工业相机如何通过BGAPI SDK设置相机本身的数据保存(CustomData)功能(Python)

Baumer工业相机堡盟工业相机如何通过BGAPI SDK设置相机本身的数据保存(CustomData)功能(Python) Baumer工业相机Baumer工业相机的数据保存(CustomData)功能的技术背景CameraExplorer如何使用数据保存&#…

医院用过期药要赔偿多少?

法律规定,经营者提供商品或者服务有欺诈行为的,需要加倍赔偿,赔偿为消费者所购买商品的价款或者接受服务的费用的三倍。(金额不足五百元的,为五百元。但是如果商家明知道是过期的,还是要卖,是可…

中秋节超市生鲜最全陈列指南

中秋节将至,超市提前布局中秋陈列,打好秋季营销第一战,中秋节期间,从小分类上说:结球类、调味类、豆类、精品蔬菜、茄果类的蔬菜销售需求比较旺盛的。 从蔬菜的单品上来数据分析得出结果是如下单品在节日期间销售上排…

使用docker-compose 搭建es集群

首先需要安装docker,这里就略过了 在第一台机器上创建 docker-compose.yml 文件内容如下: services:es:image: docker.elastic.co/elasticsearch/elasticsearch:7.16.2container_name: esenvironment:- bootstrap.memory_locktrue- xpack.security.ena…

精准定位:数字化营销的策略基石

在当今数字化时代,营销环境发生了巨大变化。精准定位已成为数字化营销的关键策略基石,对于企业实现高效营销、提升市场竞争力至关重要。 一、精准定位的重要性 1. 提高营销效率:通过精准定位目标客户群体,企业能够将有限的营销资…

【数据集】部分SAR舰船数据集,用于目标检测

SAR舰船目标检测数据集 1、SSDD 原文:https://sci-hub.se/10.1109/BIGSARDATA.2017.8124934 下载连接:https://github.com/TianwenZhang0825/Official-SSDD/blob/main/README.md 数据介绍: 数量:1160 来源:RadarSat-…

Golang | Leetcode Golang题解之第357题统计各位数字都不同的数字个数

题目&#xff1a; 题解&#xff1a; func countNumbersWithUniqueDigits(n int) int {if n 0 {return 1}if n 1 {return 10}ans, cur : 10, 9for i : 0; i < n-1; i {cur * 9 - ians cur}return ans }

大小端字节序存储介绍

我们知道整形在内存中的存储方式了&#xff0c;但是在VS编译器里发现好像顺序不一样&#xff0c;类如&#xff1a; 这里就涉及到大小端字节序存储了。 什么是大端小端 大端存储模式&#xff1a;是指数据的低位保存在内存的高地址中&#xff0c;数据的高位&#xff0c;保存在内…

《黑神话:悟空》的AI技术解析:游戏智能的新境界

2024 年 8 月的第三周&#xff0c;哪哪都是悟空的声音&#xff0c;让我一度想起当年国足打进世界杯&#xff0c;学校不上课组织看球的场景。 从我个人情感而言&#xff0c;《黑神话&#xff1a;悟空》带来的震撼&#xff0c;惊喜和冲击不亚于当年国足在世界杯赛场上跟巴西踢球。…

海康VisionMaster使用学习笔记16-使用通信切换方案

使用通信切换方案 在VisionMaster中&#xff0c;用户可以使用通信功能来进行方案的切换&#xff0c;该使用方式能提升生产现场的自动化程度&#xff0c;便于VisionMaster与其他设备进行协同操作。 本文介绍VisionMaster中使用通信切换方案的基本操作步骤。以VisionMaster 4.2…

一家餐饮店的流量之路:以“铁哥饭店”为例,探索私域流量增长的深度策略

摘要&#xff1a;本文深入剖析了位于五线城市的小型餐厅“铁哥饭店”在面临流量增长困境时的具体挑战&#xff0c;并通过详细分析其原因&#xff0c;结合当前互联网营销的最新趋势与工具&#xff0c;如“21链动模式”、“AI智能名片”及“S2B2C商城小程序”&#xff0c;提出了一…

收银系统源码-【满额立减】功能介绍

连锁店收银系统源码—多商户平台入驻商城已上线-CSDN博客文章浏览阅读1k次。零售行业连锁店收银管理系统多商户入驻本地生活即时零售平台商城https://blog.csdn.net/V15850290240/article/details/141310629 详细介绍请查看上方文章↑↑↑ 详细介绍请查看上方文章↑↑↑ 详细…

汽车冷却液温度传感器的作用与检测方法

汽车冷却系统中的关键部件之一是冷却液温度传感器&#xff0c;它的位置通常在发动机的缸体或水泵附近&#xff0c;与冷却液直接接触。该传感器的作用是监测发动机冷却液的温度&#xff0c;它采用负温度系数热敏电阻&#xff0c;这种电阻随温度升高而降低。当冷却液温度达到预定…

【信创】全面揭秘Linux操作系统中的DNS解析流程 _ 统信 _ 麒麟 _ 方德

原文链接&#xff1a;【信创】全面揭秘Linux操作系统中的DNS解析流程 | 统信 | 麒麟 | 方德 Hello&#xff0c;大家好啊&#xff01;今天给大家带来一篇关于Linux操作系统上DNS解析的第一篇文章。DNS&#xff08;Domain Name System&#xff0c;域名系统&#xff09;是互联网的…

容器篇(JavaSE - 单列集合)(持续更新迭代)

作者&#xff1a;研J小政 课堂&#xff1a;wclass &#xff08;有什么弊端请私信我&#xff0c;目前参考众多资料精华整理过程过中&#xff09; 章节&#xff1a;单列集合&#xff01; 进度&#xff1a;持续更新迭代&#xff01; 录课状态&#xff1a;待录 参考文献 有意…

GLM-4开源发布:实力赶超Llama3,多模态能力媲美GPT4V,MaaS平台全面升级

最新版本大模型&#xff0c;6 分钱 100 万 Token。 今天上午&#xff0c;在 AI 开放日上&#xff0c;备受关注的大模型公司智谱 AI 公布了一系列行业落地数字&#xff1a; 根据最新的统计数据&#xff0c;智谱 AI 大模型开放平台目前已经获得 30 万注册用户&#xff0c;日均调用…

GPT4的代码生成能力能不能取代一个月薪5000水平的码农?

GPT-4 的代码生成能力确实非常强大&#xff0c;但它是否能取代一个月薪 5000 元水平的码农&#xff0c;还要看具体情况。以下是几个关键点&#xff1a; 代码质量和复杂性&#xff1a;GPT-4 &#xff08;升级教程&#xff09;可以生成很多常见的代码片段和解决方案&#xff0c;…