2024年8月——大模型更新汇总

news2024/9/22 5:28:08

让我们来看一下8月份有哪些大模型更新,涵盖了多个领域,包括语言模型、视觉模型以及数学模型等。以下是本次更新的主要亮点:

  • 1、 智谱系列升级:

 a、GLM-4-Flash:免费供应,提供快速响应的对话体验。

 b、GLM-4-Long:超长上下文模型,支持高达1百万tokens的上下文,成本为1元/百万tokens。

 c、GLM-4-Plus:旗舰版模型,性能升级,成本降至50元/百万tokens。

 d、GLM-4V-Plus:升级版视觉多模态模型,上下文扩展至8K,成本降至10元/百万tokens。

 e、Cogview3-Plus:文生图模型升级,成本降低40%,支持更多种分辨率,生成一张图的成本为6分。

点评:智谱全系都做了功能升级以及成本降低。其中GLM4V-PLUS,本身拥有不俗的性能,成本大幅下降,同时上下文达到了8K,实用性大幅增强,目前识别一张手机图片的成本大约1分钱,非常实用。并且智谱还拥有视频生成模型,可能是国内最全面的大模型公司。

 2、通义千问系列升级:

  •   Qwen2-Math:专门为数学场景优化的模型,数学能力超越多个顶流模型,如GPT4o,Claude3.5 Sonnet, DeepSeek Coder。目前免费供应。

  •   Qwen2-VL:最新的视觉大模型,支持视频识别,性能指标对标GPT4o和Claude3.5 Sonnet,具有32K的上下文处理能力,成本为20元/百万tokens。

点评:Qwen2-Math登顶当前最强数学模型,面对数学问题时是一个可选模型。Qwen2-VL测试指标相当高,32K的上下文使得泛用性更强,输入成本比GPT4o略高,但输出成本低3倍,是一个国产替代的选择。

 3、DeepSeek系列升级:

 发布最新的缓存命中技术,有效降低成本至0.1元/百万tokens,适用于文件读取和固定提示词。

点评:由于token消耗大部分是在系统提示词中,妥善使用确实可以极大降低成本,同时还能保证较高的输出质量。

 4、MiniMax系列升级:

  •     abab6.5s:成本降至1元/百万tokens,具有254K的上下文处理能力,以及极高的token处理速度。

 5、腾讯混元系列升级:

 发布多模态模型hunyuan-vision,具有4K的上下文,成本为18元/百万tokens。

 6、Openai系列升级:

  •   gpt-4o-2024-08-06:综合成本降低40%,输入成本为18元/百万tokens,输出成本为72元/百万tokens,最大输出tokens升级至16K。支持结构型输出(Structured Output)

点评:GPT4o降价后,价格竞争力又上来了,甚至比不少国产模型都便宜。与此同时,升级了16K的输出上限,并且支持结构型输出,性能也在同步升级。

 7、Gemini系列升级:

  •    gemini-flash:输入成本0.5元/百万tokens,输出成本2元/百万tokens。
  •    gemini-pro:输入成本25元/百万tokens,输出成本76元/百万tokens。

点评:谷歌的Gemini本身就是实力强劲的多模态模型,成本大幅优化后,保持了其综合竞争力。

用户可以在智匠AI(MindCraft AI)上体验最新更新的模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2100168.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux--网络指令UDP,TCPwindows连接服务器

网络指令 ping命令 用来检测网络连通性的。 比如ping 百度的官网 ping www.bai.com 这个指令执行后默认是不会停下来的,我们可以加入 -c 数字选项,表示要ping几次 比如ping两次 ping -c2 www.bai.com netstat 查看所有的网络连接活动 netstat…

《云原生安全攻防》-- K8s攻击案例:高权限Service Account接管集群

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 在本节课程中…

提高编程效率的秘密武器:探索高效开发工具

💓 博客主页:倔强的石头的CSDN主页 📝Gitee主页:倔强的石头的gitee主页 ⏩ 文章专栏:《热点时事》 期待您的关注 目录 引言 一、工具介绍 Visual Studio Code (VS Code) Docker GitHub 二、效率对比 三、未来趋…

详细解说一下Python中的递归和基例

大家好,感谢阅读胡萝卜不甜的文章,谢谢你的关注和点赞。好戏马上开始 考点: 递归函数是一种在函数定义中调用自身的函数。递归函数通常包含两个主要部分:递归部分和基例(也称为递归终止条件)。 递归部分&am…

给你的头像加个口罩网站html源码

源码介绍 给你的头像加个口罩网站html源码,html网页源码,直接打开即可使用,也可以上传到网站。 效果预览 源码获取 给你的头像加个口罩网站html源码

【亚马逊运营经验帖】跨境选品9大实操策略,小白必看!

一个新手卖家要想在亚马逊这个庞大的平台上分得一杯羹,不深入了解一些选品的技巧恐怕是不行的。七分靠选品,三分靠运营。可见选品的成功与否对于一个 listing 能否快速爆单至关重要,这篇文章是从帮助小白的角度去分析选品的一些基本思路。 1…

科研论文必须要了解的25个学术网站

各位同学大家好,我是Toby老师,今天介绍一下科研论文必须要了解的25个学术网站。下述论文网站收藏内容有差异,大家可以检索比较。 1.SCI SCI(Science Citation Index)是一个学术引文数据库,收录了全球多个学…

《PCI Express体系结构导读》随记 —— 第II篇 第7章 PCIe总线的数据链路层与物理层(5)

接前一篇文章:《PCI Express体系结构导读》随记 —— 第II篇 第7章 PCIe总线的数据链路层与物理层(4) 7.1 数据链路层的组成结构 7.1.1 数据链路层的状态 数据链路层需要通过物理层监控PCIe链路的状态,并维护数据链路层的“控制与…

鸿蒙开发画廊效果

鸿蒙开发画廊效果: 画廊这种效果确实不错,看起来高端大气。在Android那边已经有不少案例了,但是鸿蒙这边还是很少。今天来分享一个。 先看下效果图: 没法弄gif,就是左右可以看到前一张,下一张。 也可以看我b站完整的…

C# 编译程序引用C++DLL托管动态链接库实例

构建 C# 程序引用CDLL托管动态链接库 前言1、统一框架版本2、统一编译平台3、C 托管动态链接库的优点3.1、C 托管动态链接库引用方便简单3.2、C 托管动态链接库加快了程序构建和重复利用3.3、C 托管动态链接库源代码更加安全 4、构建与 C# 程序进行互操作的C.DLL动态链接库的三…

UTB定位技术能不能精准定位

在当今科技日新月异的时代,定位技术以其广泛的应用场景和不断提升的精度,成为了多个领域的核心支撑。其中,UTB定位技术以其高精度、低延迟和高抗干扰性等特点,在众多定位技术中脱颖而出,成为精准定位领域的佼佼者。那么…

ContentProvider 数据供给方

作用 ContentProvider使用数据库模型的基本表格来提供需要共享的数据 表格每一行表示一条记录(都包含"_ID"字段),每一列表示该类型的数据 URI 作用 资源的唯一标识符——提供数据位置 组成 scheme: 一般 "content:/"…

病理AI重点方向:普通HE与免疫组化之间的关系|文献速递·24-09-03

小罗碎碎念 本期推文主题:免疫组化 这一期的推文很有意思,看完第一篇文献就知道了——兽医写的与免疫组化相关的内容——普渡大学兽医学院比较病理学系。 最近一直在了解免疫组化与HE之间的关系,在阅读文献的时候,无意间看到了第…

HashMap底层逻辑理解(数组+链表+红黑树)

jdk1.7底层是由数组链表实现jdk1.8底层是由数组链表红黑树实现 以下都是数组链表红黑树对应的描述&#xff1a; public static void main(String[] args) {HashMap<String, String> map new HashMap<>();map.put("Aa", "Value1");map.put(&…

捷邻系统小程序的设计

管理员账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;用户管理&#xff0c;商品分类管理&#xff0c;商品信息管理&#xff0c;促销产品管理&#xff0c;订单管理&#xff0c;系统管理 微信端账号功能包括&#xff1a;系统首页&#xff0c;商品信息&#…

如何处理海量数据

目录 1.海量数据简介 海量数据的产生 海量数据的处理 2.利用位图解决 题目一 题目二 题目三 题目一变形 3.利用布隆过滤器解决 题目一 4.哈希切割解决 题目一 题目二 5.海量数据处理总结 1.海量数据简介 海量数据的产生 随着互联网的迅速发展&#xff0c;互联…

堆排、快速排序、归并排序等总结

十大经典排序算法大梳理 (动图代码)&#xff08;动态图参考&#xff09; 排序算法平均时间复杂度最差时间复杂度空间复杂度数据对象稳定性冒泡排序O(n2)O(n2)O(1)稳定选择排序O(n2)O(n2)O(1)数组不稳定、链表稳定插入排序O(n2)O(n2)O(1)稳定快速排序O(n*log2n)O(n2)O(log2n)不…

文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《省间中长期市场连续运营下考虑耦合安全约束的电力交易联合优化出清模型》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

Docker笔记-Docker容器使用

Docker笔记-Docker容器使用 1、Docker 客户端 docker 客户端非常简单&#xff0c;我们可以直接输入 docker 命令来查看到 Docker 客户端的所有命令选项。 $ docker可以通过命令 docker command --help 更深入的了解指定的 Docker 命令使用方法。 例如我们要查看 docker sta…

用vs附加运行的软件并打断点

需求&#xff1a;给一个代码文件A的第n行打断点。 前提&#xff1a;目标软件已经build完成。并且生成了对应的pdb文件P。 0 将要打断点的代码&#xff0c;所在生成的pdb文件放到exe相同目录下。 1 运行程序。 2 打开vs&#xff0c;并打开文件A。并在n行打上断点。&#xff…