- B站:啥都会一点的研究生
- 公众号:啥都会一点的研究生
最近AI圈又发生了啥?
快手视频生成大模型“可灵”开放邀测,效果对标 Sora
在OpenAl文生视频大模型Sora发布后,国内企业争相入局,快手视频生成大模型可灵大模型官网目前已正式上线。相较此前各家放出的视频大模型以展示视频为主,本次亮相的可灵大模型不但效果对标Sora,且已在快手旗下的快影App开放邀测体验
https://36kr.com/p/2807897979434629
阿里云开源推出通义千问 Qwen2 大模型,上下文窗口最高达 128K
阿里云通义千问宣布 Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级。目前,已在Hugging Face和Modelscope上同步开源 Qwen2 大模型。更新包括:5个尺寸的预训练和指令微调模型,训练数据中增加了27种语言相关的高质量数据,代码和数学能力显著提升,增大了上下文长度支持,最高达到128Ktokens(Qwen2-72B-Instruct)
https://qwenlm.github.io/zh/blog/qwen2/
字节推出Seed-TTS文本到语音模型,可生成媲美人类的语音
字节最新提出了名为 Seed-TTS 的技术,这是一系列大规模自回归文本转语音 (TTS) 模型,能够生成几乎与人类语音无法区分的语音。Seed-TTS 是语音生成的基础模型,在语音上下文学习方面表现出色,在说话人相似性和自然度方面的表现与客观和主观评估中的真实人类语音相匹配
https://arxiv.org/abs/2406.02430
复旦大学发布“伏羲”2.0气象大模型
伏羲系列气象大模型 2.0(简称“伏羲"2.0)发布,以“伏羲"2.0 为核心的智能气象创新生态联盟成立。相较于去年推出的 1.0 系列,“伏羲”2.0 的中期天气预报大模型和次季节大模型,面向新能源、航空运输等行业取得进展
https://www.ithome.com/0/773/027.htm
黄仁勋:下一波AI的浪潮是物理AI,机器人时代已经到来
黄仁勋在台湾大学综合体育馆发表主题为“开启产业革命的全新时代”的现场演讲。在演讲中,黄仁勋强调了机器人和AI在未来发展中的重要性:“机器人时代已经到来。有朝一日,移动的物体都将实现自主运行。我们正致力于通过推进英伟达机器人堆栈的发展,来加速生成式物理AI”。有两种特别值得关注的高产量机器人产品:自动驾驶汽车或具备高度自主能力的汽车,以及人形机器人
https://www.thepaper.cn/newsDetail_forward_27617619
英伟达超越苹果成为第二大市值公司
上周三英伟达股价再创新高,股市估值达到 3 万亿美元,超过苹果公司成为全球第二大最有价值公司。此前,英伟达发布了一系列重大消息
2024 年迄今为止,Nvidia 的股价已经飙升了 147%,其顶级处理器供不应求,因为各大科技公司都在竞相发展人工智能计算能力,并在新兴技术领域占据主导地位
https://www.bbc.com/news/articles/c6ppqd3j621o
OpenAl 和谷歌 DeepMind 员工联名发声:高级人工智能风险巨大,亟需加强监
OpenAl 和谷歌 DeepMind 的数名前任和现任员工近日联名发布公开信,对高级人工智能的潜在风险以及当前缺乏对人工智能科技公司的监管表示担忧。该公开信指出,人工智能的发展可能会带来一系列的风险,例如加剧现有社会的不平等、助长操控和虚假信息传播,以及失控的自主人工智能系统可能导致人类灭绝等
https://www.ithome.com/0/773/153.htm
新架构 Mamba2 发布
新一代序列建模架构Mamba-2正式发布,并已入选ICML 2024。通过提出结构化状态空间二元性(SSD)理论框架,成功将Transformer和状态空间模型(SSM)两大主流序列建模架构统一。Mamba-2在状态空间扩大8倍的同时,训练速度提升了50%。此外,3B参数规模的Mamba-2在3008 tokens训练中超越了同等规模的Mamba-1和Transformer,显示出在需要更大状态容量的任务上的显著改进
https://www.qbitai.com/2024/06/149893.html
英伟达数字孪生地球“Earth-2"亮相,2 公里精确预测天气信息!
在台北电脑展 2024 主题演讲上,黄仁勋介绍了英伟达 Earth-2 数字孪生地球,该“地球”主要用于天气观测,基于英伟达 CorrDiff 生成式 AI 模型技术,号称融合了人工智能、物理模拟和观测数据,够从今天的数据来预测未来世界的影响
https://www.ithome.com/0/772/607.htm
英伟达公布新一代Rubin GPU和Vera CPU,预计2026年推出
黄仁勋称英伟达打算每年都升级AI加速器/AI芯片,去年发布的Blackwell芯片现在开始投产,2025年将推出Blackwell Ultra,而下一代 AI芯片架构平台名为Rubin,采用HBM4芯片,预计将于2026年推出。同时,还宣布推出推理模型微服务NVIDIA NIM,以部署在云、数据中心或工作站上,并且开发者能够轻松地为Copilot、ChatGPT等构建生成式 AI应用。黄仁勋强调,未来全球AI产业规模将高达100万亿美金,比之前IT时代的3万亿美元高出33万倍以上,具有强大的市场前景
https://www.tmtpost.com/7113078.html
斯坦福团队 Llama3-V 被曝抄袭面壁智能的大模型
斯坦福AI团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果–模型结构和代码几乎一模一样。斯坦福的这项研究叫做Lama3-V,宣称只需要500美元就能训出一个SOTA多模态大模型,比GPT-4V、Gemini Ultra、Claude Opus都强。然而,一位网友发现,Llama3-V的模型结构和代码与出自清华系明星创业公司面壁智能的MiniCPM-Llama3-V 2.5几乎一模一样,只是变量名有所变化
https://mp.weixin.qq.com/s/mG9L6mr21eS9g8vNBRfZLw
微软发布首个大气AI基础模型Aurora
微软研究团队开发了首个大气 AI基础模型 Aurora,基于超过一百万小时的各种天气和气候数据进行训练。在不到一分钟的时间内,Aurora 就可以生成5天的全球空气污染预测和 10 天的高分辨率天气预报,其表现优于最先进的传统模拟工具和最好的专业深度学习模型
https://www.microsoft.com/en-us/research/blog/introducing-aurora-the-first-large-scale-foundation-model-of-the-atmosphere/
DuckDuckGo Al Chat 发布,可免费匿名使用 GPT 等大模型
专注于保护用户隐私的搜索引擎 DuckDuckGo,周四官宣向用户免费开放 DuckDuckGo AI Chat,这是一个可以选择匿名访问 OpenAl GPT 3.5 Turbo、Anthropic’s Claude 3 Haiku、Meta Llama3、Mixtral 8x7B 的生成式 A1 聊天机器人。官方也宣称计划在未来增加可访问聊天机器人模型的数量
https://www.ithome.com/0/773/909.htm
AMD 为人工智能数据中心制定新的芯片架构战略
AMD 首席执行官在 Computex 上介绍了新的 AI 处理器,其中包括 MI325X 加速器,该产品将于 2024 年第四季度上市
-
宣布将于 2024 年第四季度发布 MI325X 加速器并概述未来两年开发 AI 芯片的计划
-
推出 MI350 系列,预计 2025 年上市,与目前的 MI300 系列相比,推理性能有望提高 35 倍
-
将于 2026 年推出基于神秘的 "Next "架构的 MI400 系列
随着 AMD 和 Nvidia 转向年度发布周期,为满足人工智能半导体飞速增长的需求,竞争正日趋白热化
https://www.reuters.com/technology/amd-launches-new-ai-chips-take-leader-nvidia-2024-06-03/