AI大模型日报#0606:智谱AI开源GLM-4-9B、Pika再融5.8亿

news2024/7/6 18:17:36

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-Large)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:智谱AI近日发布了新一代开源语言模型GLM-4-9B,以其强大的推理性能、多模态处理能力及对多种语言的支持受到关注。该模型使用FP8技术提升训练效率,并在中文对齐、指令遵从等方面有显著进步。与此同时,Stability AI推出名为Stable Audio Open的音频生成模型,能生成长达47秒的高质量音频,为音乐制作和声音设计领域带来新工具,尽管其在逼真声音生成等方面仍存局限。 在AI创业方面,李沐携其大模型成果Higgs-Llama-3-70B回归B站,该模型专为复杂场景角色扮演设计,在多项基准测试中表现突出。此外,斯坦福华人博士创立的Pika宣布再融5.8亿,其自研的AI视频生成模型受到市场青睐,体现了AI视频生成赛道的投资与技术热度。 在学术研究领域,牛津大学与谷歌研究院联合开发的“CLIP as RNN”技术入选CVPR,该技术无需训练即可分割图像中的无数概念,为图像分割带来革命性进展。另一方面,马毅教授团队的CRATE-α模型通过数学推导设计每一层,提升了Transformer架构的可解释性和性能,展示了其可扩展性。 在AI应用层面,Paige开放全球最大病理学和肿瘤学AI模型使用权,阿里巴巴与世卫组织合作推广AI癌症筛查,腾讯则利用AI技术破解甲骨文之谜,推出了相关的平台和小程序,彰显了AI在多个领域的广泛应用潜力。

标题: GLM-4-9B 开源,探索模型极限
摘要: 智谱AI发布了新一代开源语言模型GLM-4-9B,该模型在预训练中使用了FP8技术,训练效率提升3.5倍,数据量是前代模型的3倍以上。GLM-4-9B具备更强的推理性能、更长的上下文处理能力、多语言、多模态和All Tools等功能。模型包括基础版本、对话版本、超长上下文版本和多模态版本。GLM-4-9B在中文对齐能力、指令遵从、工程代码等方面有显著提升,支持26种语言,并能处理长达1M tokens的文本。此外,模型还具备强大的函数调用和多模态处理能力,可智能调用外部工具和处理图像输入。
网址: GLM-4-9B 开源,探索模型极限|调用|模态|glm|预训练|上下文_网易订阅
 
标题: Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成
 


摘要: 科技记者报道: Stability AI 推出名为 Stable Audio Open 的开放模型,该模型可生成高质量音频数据。与商业版 Stable Audio 不同,Stable Audio Open 能通过文本提示生成长达47秒的音频。它擅长制作鼓点、乐器片段、环境音等,适合音乐制作和声音设计。用户可根据自定义音频数据对模型进行微调。该模型基于Transformer架构,由自编码器、文本嵌入和扩散模型组成。训练数据来自FreeSound和Free Music Archive,确保无版权问题。尽管Stable Audio Open 1.0在音频生成方面表现出色,但存在局限性,如无法生成逼真声音、对非英语描述支持有限、音乐风格多样性不足等。此外,该模型并非开源,且不能用于商业用途。
网址: Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成 | 机器之心
 
标题: 李沐老师回归B站!带着大模型创业成果填坑来了
 


摘要: 科技记者简讯: 李沐,AI领域知名学者,宣布回归B站并带来其大模型创业成果——Higgs-Llama-3-70B。该模型专为复杂场景角色扮演设计,基于Llama 3打造,并进行了完整的SFT、RLHF训练。在角色扮演任务和通用领域指令遵循、推理方面表现出色。Higgs-Llama-3-70B在MMLU-Pro和Arena-hard基准测试中展现了优于其他模型的能力,包括Claude3和Gemini。尽管与GPT-4o仍有差距,但团队强调并未针对性刷榜,并计划发布更多Higgs系列模型。李沐的创业公司Boson AI致力于利用AI技术为企业赋能,开发Agent以扮演多种角色,如游戏角色、语言教师等。团队成员包括李沐、Alex Smola等资深AI专家。公司已获得知名技术创业者投资,未来将进一步探索角色扮演性能、训练后的处理流程等策略。
网址: 李沐老师回归B站!带着大模型创业成果填坑来了 | 量子位
 
标题: 郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型
 


摘要: 科技记者报道: Pika,一家由斯坦福华人博士创立的AI视频生成初创公司,近日宣布完成新一轮8000万美元融资,估值达到4.7亿美元。投资者包括Spark Capital(领投)、Lightspeed和Greycrof等知名机构。Pika自研AI视频生成基础模型,产品1.0去年底发布,半年内团队从4人扩张至13人,并上线了多项新功能。AI视频生成赛道今年迎来技术与投资的双重爆发,Pika等初创公司正快速扩张,利用OpenAI和谷歌视频工具尚未公开的机会窗口。
网址: 郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型 | 量子位
 
标题: CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
 


摘要: 科技记者报道: 在图像分割领域,牛津大学和谷歌研究院的联合团队开发了一种名为“CLIP as RNN”(CaR)的新技术,该技术允许无需额外训练即可有效分割图像中的无数概念。这项成果已被CVPR 2024接收,并开源了代码。CaR技术解决了开放词汇量图像分割的几个关键问题,包括无需训练数据、保留预训练视觉-语言模型的广泛词汇空间以及对非图像中概念的文本查询处理。该技术通过迭代过程逐步优化,提高了分割质量,并通过循环调用CLIP模型,实现了高质量的开放词汇分割。
网址: CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院 | 量子位
 
标题: 首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
 


摘要: Transformer架构在AI领域取得了显著成就,但其设计缺乏严格的数学解释。马毅教授团队发布的CRATE模型通过数学推导设计每一层,提供可解释性。最近,加州大学研究团队提出CRATE-α,探索不同规模CRATE在视觉任务中的性能,并通过策略性修改提高可扩展性。CRATE-α在ImageNet分类任务上表现优于传统CRATE,且可解释性得到提升。研究还展示了CRATE-α的可扩展性,以及在资源有限情况下通过精心设计的预训练和微调策略扩展模型的有效性。项目链接:https://rayjryang.github.io/CRATE-alpha/。论文链接:https://arxiv.org/pdf/2405.20299。
网址: 首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升|马毅|研究人员_新浪新闻
 
标题: 全球最大病理学和肿瘤学多模态模型开放使用权;阿里达摩院与世卫组织推广AI癌症筛查;腾讯发布甲骨文AI协同平台:可映射到现代汉字
 


摘要: AI for Science企业动态速览: - Paige推出针对药物开发的AI服务,提供全球最大病理学和肿瘤学AI模型使用权。 - 阿里巴巴与世卫组织合作,推广达摩院AI癌症筛查技术。 - 谷歌与日本签署太阳能供电协议,为数据中心供电。 - Atropos Health完成3300万美元融资,进军药物研发。 - 中国气象局发布AI气象预报大模型示范计划。 - 腾讯用AI破解甲骨文之谜,推出“殷契文渊”平台和“了不起的甲骨文”小程序。
网址: 全球最大病理学和肿瘤学多模态模型开放使用权;阿里达摩院与世卫组织推广AI癌症筛查;腾讯发布甲骨文AI协同平台:可映射到现代汉字 - 智源社区
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1795159.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机网络学习实践:配置主机通过DHCP获取IP并通过域名访问web服务器

计算机网络学习实践:配置主机通过DHCP获取IP并通过域名访问web服务器 点一点就能配置,不需要输入命令 1.实验准备 实验环境:思科的模拟器 实验设备: 3个服务器,1个二层交换机(不是三层的)&a…

使用C++实现YOLO图像分类:从环境搭建到性能评估的完整指南

⭐️我叫忆_恒心,一名喜欢书写博客的研究生👨‍🎓。 如果觉得本文能帮到您,麻烦点个赞👍呗! 近期会不断在专栏里进行更新讲解博客~~~ 有什么问题的小伙伴 欢迎留言提问欧,喜欢的小伙伴给个三连支…

问你为什么选择Kafka,你会怎么回答?

可靠的含义在百度百科的解释是:可以信赖、可以相信、可靠的朋友。那Kafka究竟是不是一个可靠的朋友呢?既然全世界绝大部分高可用系统都有Kafka的支持,Kafka必定有其过人之处,跟着我来分析分析。 另外多提一嘴Kafka在GitHub目前已…

HTTP-一

一、超文本传输 1. 文本传输 > 字符串(能在utf8/gbk等码表上找到合法字符) 2. 超文本传输 > 不仅仅是字符串,还可以携带一些图片,特殊得格式 HTML 3. 富文本 word http0.9 -> http1.0 -> http1.1 -> http2.0 -> http3.0 http1.0是主流版本 2.0 和…

任务3.7 开发名片管理系统

本实战项目以Java语言为基础,精心打造了一个功能全面的名片管理系统。系统采用面向对象的设计原则,通过Card类来封装每张名片的详细信息,如姓名、单位、职位和联系电话等,并提供了标准的访问器和修改器方法以确保数据的安全访问。…

course-nlp——8-translation-transformer

本文参考自https://github.com/fastai/course-nlp。 注意力机制和 Transformer Nvidia AI 研究员 Chip Huyen 写了一篇很棒的文章《Top 8 trends from ICLR 2019》,其中的趋势之一是 RNN 正在失去研究人员的青睐。 这是有原因的,RNN 可能很麻烦&#…

2938. 区分黑球与白球

题目 桌子上有 n 个球,每个球的颜色不是黑色,就是白色。 给你一个长度为 n 、下标从 0 开始的二进制字符串 s,其中 1 和 0 分别代表黑色和白色的球。 在每一步中,你可以选择两个相邻的球并交换它们。 返回「将所有黑色球都移到…

网工内推 | 网络运维工程师,H3CIE认证优先,13薪,享股票期权

01 畅读 🔷招聘岗位:高级网络运维工程师 🔷职责描述: 1.负责线上业务网络技术运维工作,保障并优化线上网络质量; 2.规划并构建公司线上业务网络架构; 3.规划线上业务网络质量评估与监控体系&…

信号:干扰类别及特征提取

目录 第一部分:干扰类别 1.压制干扰 1.1噪声调幅瞄准式干扰(单音干扰) 1.2噪声调频阻塞式干扰(宽带噪声干扰) 1.3噪声调频扫频式干扰(线性调频) 2.欺骗干扰 2.1距离欺骗干扰(幅度调制干扰&#xff0…

关于main函数参数列表的那些事

写在最前面: 本篇博客所写代码,全部都依赖于Linux环境。 在开始之前,我们先问自己几个问题: main函数可以传参吗?如果main函数可以传参,最多可以传几个参数。main函数传递的参数具体作用是什么? 一.是否…

java小游戏-坦克大战1.0

文章目录 游戏界面样式游戏需求分析设计类过程1:初始化界面过程2:用面向对象思想设置功能过程3:调用类实例化对象过程4:联合调试 项目代码下载: CSDN_java小游戏-坦克大战1.0 来源:该游戏来自尚学堂~&…

神了,Suno创作的《不期待》三个版本,你最喜欢哪一个?

Suno AI 最近尝试了下 Suno AI 的v3.5模型,有点惊艳 做了三首版本的AI歌曲,词是我写的,其他全都交给Suno了,欢迎大家来听听 B站链接 Youtube链接

源码文章上传无忧,论坛小程序支持

前言 在数字化时代,知识的分享与传播显得愈发重要。为了满足广大创作者和求知者的需求,我们推出了全新的论坛小程序,不仅支持文章、源码、链接等多样化内容的上传,还实现了付费观看功能,为创作者们提供了一个展示才华…

flask 之JWT认证实现

目录 1、JWT 1.1、JWT概述 1.2、token的生成 1.3、token校验 1.4、flask项目中实现JWT认证 1、JWT 1.1、JWT概述 JWT(JSON Web Token)是一种用于身份验证和授权的开放标准。它由三部分组成,分别是头部、负载和签名。 头部&#xff0…

第三方软件测试机构与CMA、CNAS资质

第三方软件测试机构 随着信息技术的快速发展,软件在各个领域的应用越来越广泛,软件的质量和安全性成为人们关注的焦点。为了确保软件的质量和安全性,第三方软件测试机构和CMA、CNAS资质成为了重要的保障。 第三方软件测试机构是独立于软件开…

python调用excel的demo

在本地安装Pycharm之后,新建工程,在main.py中键入如下代码,即可实现Python调用excel: import pandas as pd sheet pd.read_excel(test.xlsx) data sheet.loc[0].values print("读取指定行的数据:\n{0}".format(data)) 第一次编…

如何将 MySQL 数据库共享给他人?

文章目录 共享所有数据库给他人1. 连接到 MySQL 数据库2. 选择要使用的数据库3. 修改连接所需的 host4. 刷新权限 共享部分数据库给他人1. 创建用户2. 授权3. 刷新权限 结语 🎉欢迎来到Java学习路线专栏~探索Java中的静态变量与实例变量 ☆* o(≧▽≦)o *☆嗨~我是I…

JVMの静、动态绑定异常捕获JIT即时编译

在说明静态绑定和动态绑定之前,我们首先要了解在字节码指令的层面,JVM是如何调用方法的: 例如我有以下的代码,很简单就是在main方法中调用了另一个静态方法: public class MethodTest {public static void main(Strin…

git clone 文件名中文、有冒号等问题 fatal: repository ‘***/r/鏍″洯鏅烘収椋熷爞/.git/‘ not found

记录一个git问题,比较有意思,也比较难找。 背景 首先把代码拉下来,发现给我报错。 怀疑 刚开始以为是仓库地址变了,但是发现仓库地址并没有变过。 交流 然后寻找解决方案。因为同事也遇到过,同事交了我一招&…

数据结构第三篇【链表的相关知识点一及在线OJ习题】

数据结构第三篇【链表的相关知识点一及在线OJ习题】 链表链表的实现链表OJ习题顺序表和链表的区别和联系 本文章主要讲解关于链表的相关知识,喜欢的可以三连喔 😀😃😄😄😊😊🙃&#…