AI Weekly『11月4-10日』: Anthropic发布Claude 3.5 Haiku,腾讯开源混元-Large模型!

news2024/11/25 20:38:11

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

关于AI Weekly

马化腾谈及AI时说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。”

AI Weekly回来了!

AI Weekly”是AI领域的前沿资讯周报,每周与你相约,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。

省流版摘要

  1. Anthropic发布Claude 3.5 Haiku:2024年11月4日,Anthropic推出Claude 3.5 Haiku模型,其API支持多平台调用,但定价较其他AI模型更高,每百万tokens输入1美元,输出5美元。

  2. 昆仑万维升级天工AI搜索功能:天工AI提升了在金融、科研及文档分析方面的能力,支持深入的政策查询、财报对比和超长文本解析。

  3. 腾讯推出混元-Large模型:腾讯发布了拥有3890亿参数的混合专家模型混元-Large,现已在Hugging Face开源,性能与扩展能力大幅提升。

  4. 苹果Siri升级屏幕读取与内容摘要功能:苹果开发者文档显示,Siri新增屏幕内容读取和文档摘要,并将在未来支持直接与ChatGPT集成的功能。

  5. 快手“可灵AI”应用上线苹果App Store:快手推出“可灵AI”App,支持视频与图片生成,用户可通过灵感值创作作品,并享会员去水印特权。

  6. 谷歌发布Google Vids视频编辑工具:Google Vids面向Workspace用户推出,集成Gemini大模型,支持脚本生成、分镜头制作和视频拼接。

  7. 英伟达洽谈投资马斯克的xAI公司:英伟达正与xAI进行投资谈判,xAI已部署大语言模型Grok,增长迅速,吸引大量关注。

  8. Perplexity AI进行5亿美元融资,估值达90亿美元:AI搜索公司Perplexity融资即将完成,由IVP领投,贝索斯和英伟达已参与投资

1. Anthropic发布Claude 3.5 Haiku模型

2024年11月4日,Anthropic宣布推出Claude 3.5 Haiku模型,开发者可通过官方API、Amazon Bedrock和Google Cloud的Vertex AI进行调用。该模型在多项AI基准测试中表现出色,超越了前代模型Claude 3 Opus

然而,Claude 3.5 Haiku的定价引发了开发者的关注:每百万个输入tokens收费1美元,输出tokens收费5美元。相比之下,OpenAI的GPT-4o mini模型每百万个输入tokens收费0.15美元,输出tokens收费0.6美元;谷歌的Gemini 1.5 Flash模型在提示词小于12.8万个tokens时,每百万个输入tokens收费0.075美元,输出tokens收费0.3美元。因此,Claude 3.5 Haiku的定价分别是GPT-4o mini的6.7倍和8.3倍。

Anthropic表示,未来将为Claude 3.5 Haiku增加图像输入功能。此外,开发者可通过提示词缓存节省最多90%的成本,或使用Message Batches API节省50%的成本。

2. 天工AI升级高级搜索功能,强化金融、科研和文档分析

昆仑万维于11月5日发布天工AI的高级搜索功能,重点提升了其在金融投资、科研学术及文档阅读分析方面的能力。新版天工AI不仅可以智能拆解复杂问题,并通过逐步推理与路径规划提供准确回答,还支持深入的金融政策查询、财报分析和公司对比,帮助用户快速获取关键数据。

在科研方面,天工AI构建了一个涵盖两亿多篇学术论文的数据库,支持用户溯源查看并分析论文内容。同时,新版天工AI在文档阅读上支持对超长文本的智能解析,提供多种形式的深度解读,帮助用户高效理解复杂资料。

3. 腾讯发布业界最大开源MoE模型“混元-Large”

腾讯近日发布了“混元-Large”大模型,这是目前基于Transformer架构的最大开源混合专家(MoE)模型,拥有3890亿总参数和520亿激活参数。混元-Large提供多个版本,包括预训练模型、指令微调模型和FP8量化的指令微调模型,现已在Hugging Face平台上开源,并附有详细的技术报告与操作手册。

混元-Large在技术上具有显著优势:采用高质量合成数据进行训练,能够更好地处理长文本输入,支持高达256K的文本序列,并具备KV缓存压缩、专家特定学习率缩放等创新功能,显著减少内存占用并提高推理吞吐量。在CommonsenseQA等多项基准测试中表现优异,展示了强大的泛化和实用能力。

4. 苹果Siri迎来重大升级:支持屏幕读取与内容摘要

苹果公司本周发布了新的开发者文档,旨在帮助开发者充分利用Siri和Apple Intelligence的功能,以查看和处理屏幕内容。这意味着,Siri将具备更深入的上下文理解能力,用户可以直接询问Siri关于当前浏览的网页或特定照片中对象的问题。

此外,Siri还将能够在用户请求时总结文档和电子邮件内容,并协助完成文本输入。这些功能的引入将显著提升Siri的实用性和交互体验。在最新的iOS 18.2开发者测试版中,Siri已开始支持与ChatGPT的集成,允许用户在获得许可的情况下,将PDF、文本文件或图像转发给ChatGPT进行处理。新的API表明,苹果希望进一步简化这一过程,使用户无需通过Siri转发文档即可直接提问。

据悉,这些新功能预计将在2025年随iOS 18.4更新正式推出。

5. 快手“可灵AI”发布iOS应用,支持生成视频与图片

快手公司近期在苹果App Store上线了独立的“可灵AI”应用,进一步拓展其在移动端的AI内容创作布局。目前,“可灵AI”已形成多平台产品矩阵,包括网页版、App、小程序以及海外版本。

“可灵AI”基于快手自主研发的“可灵大模型”和“可图大模型”,为用户提供视频与图片的生成和编辑功能。用户可通过应用内的“AI视频”和“AI图片”模块,浏览其他用户的AI创作,并进行自主创作。

生成内容需消耗灵感值,用户每天登录可免费获得一定数量的灵感值,用于视频和图片的生成。当灵感值耗尽后,用户可选择通过会员服务获取更多灵感值。成为会员后,用户还可享受高清画质、去除水印等特权,会员费为每月66元。

6. 谷歌推出AI视频编辑工具Google Vids

谷歌于11月7日宣布正式面向Google Workspace用户推出Google Vids应用。该应用集成了Gemini大模型,帮助用户创建幻灯片、编写视频脚本,并从Shutterstock获取素材,还可为视频制作分镜头脚本。

用户只需输入提示词,Gemini即可生成初步故事板。选择样式和风格后,Gemini将自动拼接视频草稿,包括推荐的场景、文本、脚本和背景音乐。此外,用户可从多种模板开始创作,添加动画、过渡和效果,使用无版权内容库,或直接从Google Drive和Google Photos导入媒体。

7. 英伟达与马斯克洽谈对xAI的潜在投资

据《纽约邮报》报道,芯片巨头英伟达正与埃隆·马斯克就其人工智能公司xAI的潜在投资进行谈判。xAI开发的大语言模型Grok已部署在社交媒体平台X上,尽管推出时间晚于OpenAI的ChatGPT,但其增长和发展速度不容小觑。

英伟达首席执行官黄仁勋对xAI表示支持。他在10月份的采访中提到,xAI团队仅用19天就建立了一个拥有10万个H200 Blackwell GPU的超级计算机集群。黄仁勋表示,这样的项目通常需要四年时间才能完成,称赞马斯克在工程、建设和资源调配方面的独特理解。

此前,《华尔街日报》报道称,xAI正与投资者商谈筹集数十亿美元,估值约为400亿美元。《The Information》也指出,xAI正讨论以约450亿美元的估值筹集50亿美元资金。

8. Perplexity AI正在进行5亿美元融资,估值即将突破90亿美元

Perplexity AI,作为一家AI搜索初创公司,近期正积极筹集5亿美元资金,预计融资完成后公司估值将达到90亿美元。 本轮融资由Institutional Venture Partners(IVP)领投,IVP还计划派遣高层加入Perplexity的董事会。 值得注意的是,今年1月,Perplexity的估值约为5.2亿美元,短短数月内估值增长了三倍,反映出其在市场中的快速发展和潜力。 此外,Perplexity还获得了亚马逊创始人杰夫·贝索斯和芯片设计公司英伟达的投资支持。


精选推荐


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2237787.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

贪心算法day3(最长递增序列问题)

目录 1.最长递增三元子序列 2.最长连续递增序列 1.最长递增三元子序列 题目链接:. - 力扣(LeetCode) 思路:我们只需要设置两个数进行比较就好。设a为nums[0],b 为一个无穷大的数,只要有比a小的数字就赋值…

vue实现图片无限滚动播放

本人vue新手菜鸡,文章为自己在项目中遇到问题的记录,如有不足还请大佬指正 文章目录 实现效果代码展示总结 因为刚接触vue,本想着看看能不能用一些element的组件实现图片的轮播效果,尝试使用过element-UI里的走马灯Carouse&#x…

[ 内网渗透实战篇-2 ] 父域子域架构的搭建与安装域环境判断域控定位组策略域森林架构配置信任关系

🍬 博主介绍 👨‍🎓 博主介绍:大家好,我是 _PowerShell ,很高兴认识大家~ ✨主攻领域:【渗透领域】【数据通信】 【通讯安全】 【web安全】【面试分析】 🎉点赞➕评论➕收藏 养成习…

Follow软件的使用入门教程

开篇 看到很多兄弟还不知道怎么用这个当下爆火的浏览器!在这里简单给需要入门的小伙伴一些建议: 介绍 简单解释一下,RSS 意思是简易信息聚合,用户可以通过 RSS 阅读器或聚合工具自主订阅并浏览各个平台的内容源,不用…

esp32学习:用虫洞ESP32开发板,快速实现无线图传

我们的虫洞ESP32-S3-EYE开发板,能够完美运行esp who AI代码,所以实现无线图传那是非常容易的,我们先看看esp who代码库中examples目录: 里面有比较多的web例程,在这些例程下,稍作修改,就可以快速…

最新三维视觉下的扩散模型综述——Diffusion Models in 3D Vision: A Survey

目录 摘要 一、引言 二、扩散模型简介 A.扩散模型的介绍 B.扩散模型的数学基础 C.扩散模型的变体 D.三维视觉中的生成过程 三、三维视觉基础 A.三维表示 B.三维视觉中的深度学习方法 C.3D视觉中的挑战 四、三维扩散生成任务 A.无条件生成 B.图像到三维 C.文本到…

JavaSE:运算符 (学习笔记)

目录 一,算术运算符 【1】 共同点: 【2】 不同点: 二,关系运算符 三,逻辑运算符 2,&和&&的区别和联系 { |和||的区别和联系 }---两题类似 四,赋值运算符 五,拓展…

strtok函数详解

strtok函数 strtok 函数是一个字符串分割函数,用于将字符串分割成一系列的标记。这个函数通过一组分隔符字符来确定标记的边界,每次调用都会返回字符串中的下一个标记,并且将原始字符串中的分隔符替换为空字符‘\0’,从而实际上是…

题目练习之二叉树那些事儿(续集)

♥♥♥~~~~~~欢迎光临知星小度博客空间~~~~~~♥♥♥ ♥♥♥零星地变得优秀~也能拼凑出星河~♥♥♥ ♥♥♥我们一起努力成为更好的自己~♥♥♥ ♥♥♥如果这一篇博客对你有帮助~别忘了点赞分享哦~♥♥♥ ♥♥♥如果有什么问题可以评论区留言或者私信我哦~♥♥♥ ✨✨✨✨✨✨个人…

【入门篇】确定字符串是否包含唯一字符——多语言版本

题目跳转:确定字符串是否包含唯一字符 题目解析 这个问题要求我们判断一个字符串中的字符是否唯一(忽略字母的大小写),并输出相应的结果。如果字符串中所有的字符都是唯一的,输出 YES;否则,输…

ConcurrentModificationException:检测到并发修改完美解决方法

🚦 ConcurrentModificationException:检测到并发修改完美解决方法 💡 🚦 ConcurrentModificationException:检测到并发修改完美解决方法 💡摘要1. 什么是ConcurrentModificationException?&…

并查集 How many tables(hdu 1213) How many answers are wrong(hdu 3038)

目录 前言 并查集 并查集的初始化 并查集的合并 并查集合并的优化,路径压缩 How many tables(hdu 1213) 问题描述 输入 输出 问题分析 代码 带权并查集 How many answers are wrong(hdu 3038) 问题描述 输入 输出 问题分析 代码 前言 感觉并查集总共有两个应…

JavaScript day01 笔记

一、引入方式 JavaScript 程序不能独立运行&#xff0c;它需要被嵌入 HTML 中&#xff0c;然后浏览器才能执行 JavaScript 代码。通过 script 标签将 JavaScript 代码引入到 HTML 中 1️⃣内部 通过 script 标签包裹 JavaScript 代码&#xff08;一般就写在</script>的…

Notepad++ 最新官网中文版在线下载 附文本编辑器安装与基础使用教程

Notepad &#xff08;记事本&#xff09;是一个简单的文本编辑器&#xff0c;预装在所有版本的 Microsoft Windows 操作系统中。它的主要功能是创建、编辑和存储纯文本文件&#xff0c;通常以 .txt 格式保存。Notepad 的设计旨在提供一个轻量级的文本处理工具&#xff0c;适合快…

使用C语言进行信号处理:从理论到实践的全面指南

1. 引言 在现代操作系统中&#xff0c;信号是一种进程间通信机制&#xff0c;它允许操作系统或其他进程向一个进程发送消息。信号可以用来通知进程发生了一些重要事件&#xff0c;如用户请求终止进程、硬件异常、定时器超时等。掌握信号处理技术对于开发健壮、高效的系统程序至…

大数据入门-什么是HBase

目录 一、概念 二、架构 1.Client 2.Zookeeper 3.HMaster 4.HRegionServer 三、特性 1.数据存储庞大 2.支持随机读写 3.轻松融入生态 4.数据强一致性 5.性能足够高效 四、适用场景 五、其他事宜 1.权益备注 2.支持博主 大数据入门系列文章 这里简单介绍的HBas…

【笔记】自动驾驶预测与决策规划_Part6_不确定性感知的决策过程

文章目录 0. 前言1. 部分观测的马尔可夫决策过程1.1 POMDP的思想以及与MDP的联系1.1.1 MDP的过程回顾1.1.2 POMDP定义1.1.3 与MDP的联系及区别POMDP 视角MDP 视角决策次数对最优解的影响 1.2 POMDP的3种常规解法1.2.1 连续状态的“Belief MDP”方法1. 信念状态的定义2. Belief …

Vue2中使用firefox的pdfjs进行文件文件流预览

文章目录 1.使用场景2. 使用方式1. npm 包下载,[点击查看](https://www.npmjs.com/package/pdfjs-dist)2. 官网下载1. 放到public文件夹下面2. 官网下载地址[点我,进入官网](https://github.com/mozilla/pdf.js/tags?afterv3.3.122) 3. 代码演示4. 图片预览5. 如果遇到跨域或者…

MFC图形函数学习06——画椭圆弧线函数

绘制椭圆弧线函数是MFC基本绘图函数&#xff0c;这个函数需要的参数比较多&#xff0c;共四对坐标点。前两对坐标点确定椭圆的位置与大小&#xff0c;后两对坐标确定椭圆弧线的起点与终点。 一、绘制椭圆弧线函数 原型&#xff1a;BOOL Arc(int x1,int y1,int x2,int y2…

新版 idea 编写 idea 插件时,启动出现 ClassNotFound

IntelliJ IDEA 2024.1.6 (Ultimate Edition) Build #IU-241.19072.14, built on August 8, 2024 Licensed to Sophia Tout Subscription is active until June 29, 2025. For educational use only. Runtime version: 17.0.111-b1207.30 amd64 Kotlin: 241.19072.14-IJ 新版本…