掀桌子、降价、免费...之后,国内大模型应用进入高速时代

news2025/1/18 9:01:16

图片

  • 5月15日,字节跳动打响大模型市场价格战第一枪;
  • 5月21日阿里云更狠,价格降了97%,比字节还便宜37.5%
  • 同日,百度更为激进,直接宣布其两款主力模型ENIRE Speed和ENIRE Lite全面免费;
  • 5月22号,讯飞不甘示弱,宣布讯飞星火API能力正式免费开放,而且是永久免费。
  • 23日,智谱大模型开放平台 BatchAPI 免费体验活动开启。

其实早在5月6日,杭州深度搜索(DeepSeek)率先把旗下的大模型DeepSeek-V2 每百万tokens的输入价格降低至1元(0.001元/千tokens),这款模型能力对标GPT-4 ,但价格只有GPT-4的1%。不寻常的2024年5月,将被写入历史。这一波波澜壮阔的操作,让大模型使用的成本大大降低,甚至没有成本,自然会吸引更多的企业和个人使用大模型,将国内大模型应用带入高速发展的时代。

5 月 15 日,字节跳动掀桌子、出王炸——首次向外界“推销”自研的AI 大模型豆包“全家桶”,覆盖通用模型、角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文生图、Function Call、向量化模型等,并跨过模型效果、推理成本、落地难度这三道最为关键的门槛。

图片

图片

豆包大模型“全家桶”

模型效果对 AI 落地最为关键,只有大使用量才能打磨出好模型——据火山引擎官方数据,经过一年时间的迭代,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,日均处理 1200 亿 Tokens 文本,生成 3000 万张图片。豆包平台月度活跃用户达到2600万,已有超过 800 万个智能体被创建恐怖的是,豆包上线仅三个月就完成用户量逆袭,见下图**。**

图片

数据来源:QuestMobile 统计

豆包大模型(原名:云雀)早于 2023 年就在字节内部完成了上线,并基于豆包大模型打造了 AI对话助手“豆包”、AI 应用开发平台“扣子”、互动娱乐应用“猫箱”,以及星绘、即梦等 AI 创作工具,**并把大模型接入抖音、番茄小说、飞书、剪映等字节跳动旗下 50 余个业务,**用以提升效率和优化产品体验。

降低推理成本是大模型快进到“价值创造阶段”的一个关键因素。例如,腾讯混元大模型采用混合专家模型 (MoE)结构,自研 Angel 机器学习平台,训练速度达到主流框架的 2.6 倍,推理成本相比业界主流框架下降 70%。为什么能做到这点?因为豆包采用分布式推理还有混合调度,并发挥各种各样的异构算力,进而把模型推理的成本降到很低。

当火山引擎宣布豆包主力模型(小于等于 32K)推理输入价格仅为 0.0008 元/千 Tokens (比deepSeek便宜了20%)时,从而掀起了一场价格战、免费大战。按这个价格,8 块钱可以买到豆包模型的 1000万 Tokens,大约 1600 万个汉字——**其正以“价格屠夫”的姿态打穿大模型市场,这一举动无疑向整个行业扔下了一枚重磅炸弹,**被外界戏称“打响大模型市场价格战第一枪”。

图片

图片

5月21日,阿里云在武汉AI智领者峰会上宣布,旗下9款通义商业化及开源系列模型大幅降价。其中,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400。同时,Qwen-Long输出价格也直降90%至0.002元/千tokens。

图片

另外,在权威基准OpenCompass上性能追平GPT-4-turbo的Qwen-max,API输入价格从0.12/千tokens降至0.04元/千tokens,降幅67%。在开源模型方面,Qwen1.5-72B的API输入价格从0.02元/千tokens降至0.005元/千tokens,降幅75%;API输出价格从0.02元/千tokens降至0.01元/千tokens,降幅50%。

同日(5月21日),百度文心大模型则采取了更为激进的策略,直接宣布其两款主力模型ENIRE Speed和ENIRE Lite全面免费,即刻生效。这两款大模型于今年3月发布,支持8K和128K的上下文长度,具有强大的语言处理能力和推理性能。

在这里插入图片描述

ERNIE Speed模型通用能力优异,非常适合作为基座模型进行精调,以便更好地处理特定场景的问题。而ERNIE Lite则是轻量级大语言模型,在保证模型效果的同时,也兼顾了推理性能,非常适合在低算力AI加速卡上进行推理使用,为开发者提供了更多的灵活性和选择空间。

5月22日,以标题“全面赋能、永久免费”,讯飞星火API能力正式免费开放,携手生态开发者加快大模型赋能刚需场景。

图片

讯飞星火Lite API永久免费开放!

讯飞星火Pro/Max API低至0.21元/万tokens!

在讯飞星火,1token相当于1.5个中文汉字,因此2.1元就足够调用“讯飞星火3.5 Max”生成一部余华《活着》的内容量。焕新的价格体系将帮助开发者降低调用成本,驱动产品创新验证,解决真实世界的刚需。

23日,智谱大模型开放平台 bigmodel.cn(BatchAPI) 免费体验活动开启,持续到6月5日,平台所有通过 Batch API 的请求均免费。

在这里插入图片描述

后续各个LLM大厂还有什么操作,我们拭目以待。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1720028.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Windows10专业版系统安装Hyper-V虚拟机软件

Windows10专业版系统安装Hyper-V虚拟机软件 适用于在Windows10专业版系统安装Hyper-v虚拟机软件。 1. 安装准备 1.1 安装平台 Windows 10 1.2. 软件信息 软件名称软件版本安装路径windowswindows 10 专业版Hyper-vHyper-v 2. Hyper-v搭建 2.1打开cmd软件 2.2打开控制面…

【PostgreSQL17新特性之-explain命令新增选项】

EXPLAIN是一个用于显示语句执行计划的命令,可用于显示以下语句类型之一的执行计划: - SELECT - INSERT - UPDATE - DELETE - VALUES - EXECUTE - DECLARE - CREATE TABLE AS - CREATE MATERIALIZED VIEWPostgreSQL17-beta1版本近日发布了,新…

使用Prompt,轻松实现你的第一个全栈项目

前言 还有程序员没有应用过大模型技术吗?是工具也可以!如果你还未使用过大模型技术,那么我劝你尽早行动,它会成为你开发的一大神器。如果你对大模型感兴趣,同时想使用大模型技术来开发产品,我接下来这个实…

Ubuntu24.04 LTS安装中文输入法

前言 最近,windows玩没了,一怒之下决定换一个操作系统,当然就是最新的Ubuntu24.04 LTS.,其中魔法和咒语(汉语)是inux遇到的第一大难关,我权限不够教不了魔法,但我可以教你咒语(๑•…

JVM优化之垃圾收集器

JVM优化之垃圾收集器 Serial收集器Parallel Scavenge收集器ParNew收集器 如果说垃圾收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。 没有最好的垃圾收集器,只有根据具体应用场景选择适合自己的垃圾收集器。 Serial收集器 #使用方…

GPU学习(1)

一、为什么要GPU 我们先看一个基本的神经网络计算 YF(x)AxB 这就是一次乘法一次加法 ,也叫FMA,(fused multiply-add) 如果矩阵乘,就是上面的那个式子扩展一下,所以又用了这张老图 比如你要多执行好几个yAxB,可能比较简…

C++11中的新特性(2)

C11 1 可变参数模板2 emplace_back函数3 lambda表达式3.1 捕捉列表的作用3.2 lambda表达式底层原理 4 包装器5 bind函数的使用 1 可变参数模板 在C11之前,模板利用class关键字定义了几个参数,那么我们在编译推演中,我们就必须传入对应的参数…

在鲲鹏服务器上安装nginx

华为鲲鹏服务器采用华为自研cpu ARMv8架构,提供 Windows 和多个Linux 系统 常使用 CentOS 7.6 64bit with ARM Nginx 和 Apache 一样都是一种 Web 服务器。是基于 REST 架构风格,以统一资源描述符URI 或者统一资源定位符URL 作为沟通依据,通过 HTTP 协议…

【算法】模拟算法——Z字形变换(medium)

题解:模拟算法——Z字形变换(medium) 目录 1.题目2.题解3.参考代码4.总结 1.题目 题目链接:LINK 2.题解 利用模拟,来解决问题。 首先创建出一个O(numRows*n)的数组来,并按照题目要求把每个字符按顺序填进去。 这里以numRows…

操作系统6_输入输出系统

操作系统6_输入输出系统 文章目录 操作系统6_输入输出系统1. I/O功能、模型接口2. I/O设备及控制器2.1 I/O设备2.2 设备与控制器接口2.3 设备控制器2.4 通道3. 中断及处理4. 设备驱动程序4.1 驱动程序的功能和特点4.2 驱动程序的处理过程4.3 设备控制方式4.3.1 程序I/O方式4.3.…

微信小程序-页面配置

一、页面配置文件的作用 小程序中,每个页面都有自己的.json配置文件,用来对当前页面的窗口外观、页面效果等进行配置 二、页面配置和全局配置的关系 小程序中,app.json中的window节点,可以全局配置小程序中每个页面的窗口表现 …

MySQL(十一) 用户管理

1.用户 1.1 用户信息 MySQL中的用户,都存储在系统数据库mysql的user表中 mysql> select host,user,authentication_string from user; --------------------------------------------------------------------- | host | user | authentication…

浏览器提示413 Request Entity Too Large

1 问题 2 解决 2.1 后端java配置 2.2 Nginx配置

7个卖出信号出现,昂首资本立即盈利收场

在上篇文章中,我们和各位投资者讨论了如果使用匕首交易策略进行交易,但是如果只买进不卖出,是不是还是盈利不了?Anzo Capital昂首资本认为只有低买高卖才能盈利赚钱,只要发现盈利信号就要立即卖出盈利收场!…

【解决】Tree prefab at index 8 is missing.

开发平台:Unity 2020 版本以上   问题描述 翻译:树预制体集合中第8位预制体丢失。   解决方法:修复丢失树资产 关联 Unity Terrier 组件使用,前往 树绘制工作区,检查 “树资产” 引用是否丢失?删除或重…

力扣257. 二叉树的所有路径

思路&#xff1a;题目需要记录从根节点开始走的路径&#xff0c;无疑选用前序遍历&#xff0c;用一个数组paths 记录走过的节点信息&#xff0c;遇到叶子节点就用另一个list记录下路径&#xff0c;回溯时删掉paths尾节点即可 class Solution {public List<String> binar…

使用el-tab,el-tab-pane循环使用循环后不显示下划线问题

在vue项目中使用element-UI el-tab里的el-tab-pane是循环出来的&#xff0c;但是循环出来后选中tab不显示下划线了 文章目录 问题问题展示效果问题代码问题原因 解决方案解决后效果解决方案1代码 解决方案2代码 问题 问题展示效果 问题代码 <el-tabs v-model"activeNa…

SQL—DQL之执行顺序(基础)

一、引言 1、编写顺序 2、执行顺序 介绍&#xff1a; DQL语句&#xff08;数据查询语句&#xff09; 1、首先先执行的是 FROM &#xff0c;通过 FROM 来决定我要查询的是哪一张表的数据。 2、紧接着通过 WHERE 来指定查询的条件。 3、第三步就是通过 GROUP BY 以及 HAVING 来…

Jvm(二)新生代和老年代与GC回收

目录 新生代和老年代 新生代 MinorGC 老年代&#xff08;Old Generation&#xff09; MajorGC Minor GC、Major GC 和 Full GC 三个GC具体区别和使用场景 JVM GC及内存调优的参数 调优建议 前言-与正文无关 ​ 生活远不止眼前的苦劳与奔波&#xff0c;它还充满了无…

php反序列化学习(2)

1、魔术方法触发规则&#xff1a; 魔术方法触发的前提是&#xff1a;魔法方法所在类&#xff08;或对象&#xff09;被调用 分析代码&#xff0c;_wakeup()的触发条件是进行反序列化&#xff0c;_tostrinng()触发的条件是把对象当成字符串调用&#xff0c;但是魔术方法触发的前…