AI大模型日报#0625:OpenAI停止不支持国家API、大模型「考上」一本、苹果上新视觉模型4M-21

news2024/10/5 21:21:10

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE-4.0-8K-latest)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:今日AI大模型领域迎来多重重要更新。小红书技术团队在2024年取得显著研究成果,多篇大模型论文在国际顶会上发表,并将举办线上直播分享会,深入探讨大模型的新机遇与挑战。同时,在河南高考测试中,大模型豆包和文心4.0超越一本线,展现了在文科领域的优异表现,但仍需在理科和深层次理解上加强。另一方面,OpenAI决定停止不支持国家的API服务,引发部分开发者担忧,但国内已有如Qwen2、DeepSeek V2等开源大模型作为替代,SiliconCloud更是提供了一站式大模型API平台,助力国内开发者降低AI应用开发门槛。此外,飞书因其高效协同等特点,成为大模型创业公司的首选协作工具。在算法层面,昆仑万维与南洋理工大学抢发的Q*算法百倍提升了7B模型推理能力,打破OpenAI封锁。最后,苹果联合洛桑联邦理工学院推出的新视觉模型4M-21,支持21种模态,为多模态多任务学习开辟新方向。这些进展共同推动了AI大模型领域的快速发展与创新。

标题: 小红书2024大模型论文分享,多位顶会作者详解论文!


摘要: 要点提炼: 小红书技术团队在2024年大模型前沿研究中取得显著成果,多篇论文在国际顶会上发表。6月27日,小红书将举办线上直播分享会,探讨大模型的新机遇、挑战、评测方法和应用场景。此次分享将涵盖早停自洽性方法、细粒度自洽性方法、文本评测的BatchEval和PEEM方法,以及利用负样本促进大模型推理能力的蒸馏和基于大语言模型的笔记内容表征推荐系统。直播将在多个平台同步播出,观众可通过扫描二维码加入直播交流群,获取直播链接和论文合集,与论文作者直接交流。
网址: 小红书2024大模型论文分享,多位顶会作者详解论文! - 智源社区
 
标题: 当大模型开始「考上」一本
 


摘要: 在2024年河南高考中,大模型豆包和文心4.0超越一本线,但不及GPT-4o。九个顶尖大模型参与高考测试,以河南考卷和分数线为标准。结果显示,大模型在文科表现优异,理科则不尽如人意。GPT-4o以最高分562分领先,豆包和文心4.0也稳超一本线。具体科目中,大模型在英语表现最佳,而在数理学科则明显较差。在语文写作方面,大模型展现出超越学生平均水平的写作能力,逻辑清晰,旁征博引,但仍缺乏人类思考的深度。此次测试不仅展示了大模型在知识掌握和逻辑推理上的进步,也暴露了其在创新思维和深层次理解上的不足。
网址: 当大模型开始「考上」一本 | 极客公园
 
标题: 突发!OpenAI停止不支持国家API,7月9日开始执行

摘要: OpenAI于6月25日凌晨通知部分开发者,将禁止来自不支持地区的API流量,导致一些合规使用者被误封。同时,OpenAI收购远程桌面协作平台Multi,引发安全担忧。Multi类似Windows自带远程桌面,但面向macOS,支持多人共享和类ChatGPT功能。有网友担心结合ChatGPT后,Multi可能被用于非法控制和搜集信息。Multi联合创始人表示期待与OpenAI共同打造更好功能。
网址: 突发!OpenAI停止不支持国家API,7月9日开始执行|谷歌|multi|openai_网易订阅
 
标题: OpenAI停服,国产大模型免费用!开发者Token自由实现了
 


摘要: OpenAI终止对中国提供API服务,限制国内开发者访问高水平大模型。但随着开源大模型的发展,国内开发者有了如Qwen2、DeepSeek V2等替代选项。硅基流动推出了一站式大模型API平台SiliconCloud,为国内开发者提供免费顶尖开源大模型,降低AI应用开发门槛与成本。SiliconCloud响应速度快,价格亲民,受到开发者好评。该平台通过性能优化,实现大模型吞吐最高10倍加速。开发者可专注实现产品想法,不用担心算力成本。SiliconCloud已成为国内开发者“掘金”的必备工具。
网址: OpenAI停服,国产大模型免费用!开发者Token自由实现了 | 机器之心
 
标题: 飞书,为何成为国内大模型独角兽们的共同选择?
 


摘要: 过去一年多,中国科技领域的“大模型”赛道热度疯狂,融资热潮,头部创业公司估值飙升。在业务层面,新兴创业公司与互联网巨头围绕大模型能力、价格及市场份额展开激烈竞争,商业路线碰撞激烈,有公司专注toC市场,有公司转向toB市场,还有公司与互联网巨头合作。尽管竞争激烈,大模型创业公司却一致选择飞书作为协作工具,这可能是因为创始团队年轻,习惯飞书的使用体验。大模型行业面临多重挑战,包括快速迭代、团队协作、商业化等,而飞书以其迅速迭代、高效协同、产品灵活开放等特点,成为大模型公司的首选,助力企业提升效率、创新发展。
网址: 飞书,为何成为国内大模型独角兽们的共同选择? | 机器之心
 
标题: 昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力
 


摘要: 机器之心AIxiv专栏促进了全球学术交流。OpenAI的Q*项目被视作探索AGI的重大尝试,细节未公开。昆仑万维与南洋理工大学开发了Q*算法,显著提升模型推理能力,降低计算资源需求。该算法通过全盘规划复杂推理任务,提升模型性能,在多个数据集上超越现有模型。研究证明,Q*能让小模型达到大模型推理能力,打破OpenAI封锁,为AI应用带来新可能。昆仑万维将继续深入研究,提升国产模型能力。
网址: 昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力 | 机器之心
 
标题: 太全了!苹果上新视觉模型4M-21,搞定21种模态
 


摘要: 科技新闻资讯:洛桑联邦理工学院(EPFL)和苹果的研究者联合推出了一个创新的任意到任意模态单一模型——4M-21。该模型在数十种高度多样化的模态上训练,通过协同大规模多模态数据集和文本语料库,实现了跨模态检索、可控生成和强大的开箱即用性能。相较于现有最佳模型,4M-21将支持的模态数量从7种增加到21种,且不会损害性能,这标志着单个视觉模型首次能以任意到任意方式解决数十个不同任务。此外,该研究还引入了更细粒度和更可控的多模态生成能力,支持对更多结构化数据的处理,如人体姿态、SAM实例等。通过使用特定于模态的离散分词器,该研究成功在不同模态上训练了单个统一模型,将模型大小扩展至3B参数,数据集扩展至0.5B样本。该研究成果不仅扩展了现有模型的功能,还为多模态多任务学习开辟了新的方向。
网址: 太全了!苹果上新视觉模型4M-21,搞定21种模态 | 机器之心
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1861794.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

打电话时可以变声的软件有吗?变声器免费的直接说话的那种,直播要用!

在直播盛行的当下,变声器成为许多主播增加趣味性和神秘感的重要工具。对于想要在直播中尝试不同声音效果的用户来说,寻找一款既方便又免费的变声器软件显得尤为重要。本文将详细介绍11款可以直接说话的免费变声器软件,助你在直播中大展身手。…

【内网穿透】FRP 跨平台内网穿透 支持windows linux x86_64 arm64 端口范围映射

AI提供的资料: FRP(Fast Reverse Proxy)是一个专为内网穿透设计的高性能反向代理程序。以下是一些关于FRP的详细资料,帮助您更好地理解和使用这一工具: 核心特点: 内网穿透:能够将位于内网的…

光伏开发有没有难点?如何解决?

随着全球对可再生能源的日益重视,光伏技术作为其中的佼佼者,已成为实现能源转型的关键手段。然而,光伏开发并非一帆风顺,其过程中也面临着诸多难点和挑战。本文将对这些难点进行探讨,并提出相应的解决策略。 一、光伏开…

Linux内核开发-编写一个proc文件

0.前言 上一章(点击返回上一章)完成了一个内核模块的编写,实现了在内核运行时的动态加载和卸载。 在模块的开发调测过程中或者模块运行过程中,可能需要打印内核模块的变量的值或者想要动态开关模块的运行日志打印,那么…

[word] Word如何删除所有的空行? #职场发展#学习方法

Word如何删除所有的空行? 很多网友从网页复制文字粘贴到word文档后发现段落之间有空行,如果文字不多,手动删除这些空行也没有多少工作量,但是如果文字的字数达到成千上万,一个个手动删除这些空行还是很繁琐的。那么&a…

礼让,不是一昧地退让,而是表达我们的素养、品德

礼 / 让,发心是文明相处,互助互让,是君子之交

鸿蒙北向开发 ubuntu20.04 gn + ninja环境傻瓜式搭建闭坑指南

ninja跟gn都是比较时髦的东西,由歪果仁维护,如果走下载源码并编译这种流程的话需要走github跟google官网下载,国内的用网环境相信各位傻瓜都知道,github跟google这几年基本是属于连不上的状态,好在你看的鸿蒙项目跟国内的一些软件大厂已经帮你爬过梯子了,ninja工具跟gn工具已经…

【应用开发一】LED开发

文章目录 1应用层控制外设的两种方式2 sysfs和/sys关系3 LED控制方式3.1 基本情况3.2 LED属性文件介绍3.3 命令行属性测试3.4 led程序3.5 开发板上测试 1应用层控制外设的两种方式 使用设备文件控制 在Linux系统下,一切皆是文件。应用层控制底层硬件同样也是通过文…

堆的实现详解

目录 1. 堆的概念和特点2. 堆的实现2.1 堆向下调整算法2.2堆的创建2.3 建堆时间复杂度2.4 堆的插入2.5 堆的删除2.6 堆的代码实现2.6.1 结构体2.6.2 初始化2.6.3 销毁2.6.4 插入2.6.5 删除2.6.6 获取堆顶2.6.7 判空2.6.8 个数2.6.9 向上调整2.6.10 向下调整3. 堆的实现测试测试…

SQL连接与筛选:解析left join on和where的区别及典型案例分析

文章目录 前言一、left join on和where条件的定义和作用left join on条件where条件 二、left join on和where条件的区别原理不同left join原理:where原理: 应用场景不同执行顺序不同(作用阶段不同)结果集不同 三、实际案例理解lef…

深入JVM:详解JIT即时编译器

文章目录 深入JVM:详解JIT即时编译器一、序言二、基础概念1、何为JIT即时编译2、热点代码 三、HotSpot内置的即时编译器1、C1编译器2、C2编译器3、分层编译3.1 协作流程 四、常见JIT优化技术1、方法内联2、逃逸分析(1)同步锁消除(…

高考填报志愿,找准自己的真兴趣来选择专业

又是一年一度的高考填报志愿的时间了,毕业生们要根据自己的分数,在很短的时间内确定自己的专业。专业千万条,兴趣第一条。专业的选择很大程度上决定着大学的学习生活是否顺利,甚至决定着以后的职业生涯。在纷繁复杂的专业中&#…

全球首个数字人开源了

DUIX(Dialogue User Interface System)是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字…

【AI落地应用实战】如何高效检索与阅读论文——302.AI学术论文工具评测

一、引言 作为一名学术领域的探索者,我们都知道,检索和阅读论文是我们获取知识、启发思考、验证假设的基石,也是日常学习中必不可少的基本功之一。然而在浩瀚的学术海洋中,如何快速、准确地找到我们需要的论文,就像是…

git提交新仓库代码,提示无权限,但用户名已修改

目录 1 用户名无权限 2 删除用户凭据 2.1 打开控制面板 2.2 找到“凭据管理器” 2.3 删除git历史 3 npm工具库添加git仓库指引 1 用户名无权限 之前因为时间的原因,js-tool-big-box工具库没有提交到github上去,今天想着往上提交一下,但…

python03——文件操作(new)

“变量”open(‘文件路径’,‘模式’) //注意加引号 “变量”.write( ) //write函数是写的是字符串,如果你写的东西不是字符串,要写成write(str(。。)) “变量”.read…

【Containerd】Containerd接入Harbor仓库

说明 在日常使用容器时,安全方便起见一般都会使用到私有仓库,一般都是采用 harbor 作为私有仓库,docker 对接 harbor 仓库非常简单,那么 containerd 如何对接 harbor 呢? 在内网使用 harbor 根据个人习惯&#xff0c…

快速上手golang(持续更新)

由于项目需要,我不得不快速掌握go语言来帮助我进行项目的开发。时间紧迫到我来不及去了解语言的特性就直接项目上手了。我决定就先熟悉一个主流的go框架和go语言的一些日常用法,之后就得滑着这只破船摇摇晃晃上路了。 1 基础命令 就说几个用的多的&…

QT拖放事件之八:通过全局剪切板中的接口QClipboard::mimeData()来获取MIME类型数据

1、演示效果 首先向剪切板写入数据,然后点击paste按钮进行从全局剪切板中 获取 MIME数据。。。 2、核心代码 void Widget::on_pasteBtn_clicked() {const QClipboard* clipBoard = QGuiApplication::clipboard()

理解和处理不同类型的上下文的新型的语言模型ReALM

在人类的日常交流中,模糊的代词如“他们”或“那个”常常出现,它们的意义通常依赖于上下文才能明确。这种上下文的理解对于对话助手来说至关重要,因为它们旨在提供一种自然的交流体验。然而,现有的对话助手在处理这类模糊引用时往…