AI大模型日报#0830:智谱AI推出多款升级模型、阿里开源多模态Qwen2-VL

news2024/11/14 21:47:37

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE-4.0-8K-latest)、“智谱AI”(glm-4-0520)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:智谱AI在KDD 2024上展示了其全新大模型GLM-4-Plus,该模型在多任务上逼近甚至超越GPT-4o,并推出了支持中英双语的对话机器人等功能,巩固了中国在全球大模型领域的领先地位。而阿里发布的开源多模态模型Qwen2-VL则支持实时视频对话,并在多项指标上超越了GPT-4o。此外,阿里通义推出了一键生成PPT的新产品,提升工作效率的同时也提醒用户警惕AI生成的错误。然而,在行业发展的同时,Runway突然删除HuggingFace库并停止维护,引发业内关注。 另一方面,米哈游创始人蔡浩宇的新AI公司Anuttacon曝光,旨在用AI为游戏玩家创造新体验,吸引了多位技术大牛加入。在AI技术应用上,人大北邮上海AI Lab等提出了让AI更懂物理世界的多模态分割新方法Ref-AVS,谷歌也升级了其Gemini AI平台,推出全新AI定制助手Gems,图像生成模型Imagen 3也支持生成人物图像,标志着个性化AI体验的转变。

标题: 一手实测结果出炉!智谱「超大杯」模型全家桶亮相KDD,部分任务超越GPT-4o
 


摘要: 智谱AI发布全新大模型GLM-4-Plus,在多任务上逼近甚至超越GPT-4o,同时推出视频通话功能。在KDD 2024上,智谱AI展示了支持中英双语的对话机器人ChatGLM和基础模型的重大升级。新模型在语言理解、指令遵循等方面性能全面提升,达到国际领先水平。此外,智谱还发布了文生图模型CogView-3-Plus和图像/视频理解模型GLM-4V-Plus,后者是国内首个通用视频理解模型API。智谱清言也升级为首个可以通过文本、音频、视频和图像多模态互动的AI助手,开放给部分用户。这些进展巩固了中国在全球大模型领域的领先地位。
网址: 一手实测结果出炉!智谱「超大杯」模型全家桶亮相KDD,部分任务超越GPT-4o | 机器之心
 
标题: 6小时视频,一键转成PPT,赵晓卉们再也不用发疯了
摘要: 阿里通义推出最新PPT产品,主打一键生成功能,包括音视频转PPT,可大幅提高工作效率。同时,该产品还支持一句话生成PPT和上传文档生成PPT。与Kimi的PPT助手相比,通义PPT模板较少但设计排版高级,内容准确性高,不过生成速度稍慢,且存在内容错误和配图问题。因此,在使用AI生成PPT时,需要警惕其错误,将其视为提高效率的工具而非完全依赖。
网址: 6小时视频,一键转成PPT,赵晓卉们再也不用发疯了 | 机器之心
 

标题: Runway突然删除HuggingFace库!网友:真跑(Run)路(Way)了


摘要: Runway突然删除在HuggingFace上的所有内容,并声明不再维护,引发网友热议。其之前的项目如Stable Diffusion v1.5也无法访问。此事在Reddit、Twitter上引起关注,网友猜测原因并分享替代资源。截至发文,官方未给出解释。欢迎读者留言讨论。
网址: Runway突然删除HuggingFace库!网友:真跑(Run)路(Way)了 | 机器之心
 
标题: 米哈游蔡浩宇新AI公司曝光,挖Llama 3科学家坐镇大模型
 


摘要: 米哈游创始人蔡浩宇的新AI公司Anuttacon曝光,该公司旨在用AI为游戏玩家创造新体验。Anuttacon与米哈游关联紧密,注册地点相同,且招聘地点与蔡浩宇领英账号标注地点一致。新公司吸引了微软图形学大佬童欣等技术大牛加入,团队包括大模型研究负责人和互联网基础设施老将。蔡浩宇认为AI将改变游戏行业格局,Anuttacon或成为行业前0.0001%的精英团队。米哈游则可能负责打造“人人都可以制作游戏的平台”,服务于剩余的99%。
网址: 米哈游蔡浩宇新AI公司曝光,挖Llama 3科学家坐镇大模型 | 量子位
 
标题: 让AI更懂物理世界!人大北邮上海AI Lab等提出多模态分割新方法
 


摘要: 要点提炼: 人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出了一种名为Ref-AVS的多模态分割新方法,该方法整合文本、音频和视觉模态,让AI更懂真实物理世界。相关论文已入选ECCV2024,数据集和代码已开源。Ref-AVS通过构建包含多样指代表达式的数据集Ref-AVS Bench,并设计端到端框架高效处理多模态线索,实现了对动态视听场景中对象的精准分割。该方法在定量和定性实验中均表现出色,具有可泛化性和准确性。
网址: 让AI更懂物理世界!人大北邮上海AI Lab等提出多模态分割新方法 | 量子位
 
标题: 超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话
 


摘要: 阿里发布了新的开源多模态模型Qwen2-VL,该模型在图像和视频理解任务上取得了SOTA,并且在多项指标上超越了GPT-4o等闭源模型。Qwen2-VL支持实时视频对话,并能操纵手机和机械臂。该模型有三个版本,其中2B和7B版本可免费商用,而72B版本通过API提供。Qwen2-VL的创新之处包括对原生动态分辨率的全面支持以及多模态旋转位置嵌入,这些创新提升了模型的多模态处理和推理能力。
网址: 超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话 | 量子位
 
标题: Imagen 3支持人物生成,人人可用!谷歌Gemini AI重大升级来了
摘要: 谷歌升级了Gemini AI平台,并推出全新AI定制助手Gems,面向150多个国家。同时,其图像生成模型Imagen 3也支持生成人物图像,并向公众开放。Imagen 3可以根据文本提示创建高质量图像,并采取了安全措施以避免生成不准确或具有误导性的内容。此外,Gems助手可以为企业和商业用户提供定制化的AI解决方案,标志着个性化AI体验的转变。这一新功能可能对多个行业产生深远影响,同时也引发了关于数据隐私、工作替代和潜在滥用的问题。
网址: Imagen 3支持人物生成,人人可用!谷歌Gemini AI重大升级来了|ai|gemini|imagen|人物生成|微软|语音助手功能|谷歌_手机网易网
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2089944.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue前端开发必备工具——json-server模拟后端服务器

文章目录 1、简介2、安装3、快速使用(1)创建JSON文件:(2) 启动json-server(3) 使用API(4) 以其它端口号启动(5) 启动多个API 当我们用Vue开发前端时,如果想调用后端接口,又没有真实的后端接口服务器怎么办?答案是:可以…

数据结构(邓俊辉)学习笔记】串 05——KMP算法:理解next[]表

文章目录 1.快速移动2.避免回溯3.通配哨兵 1.快速移动 在接下来这节,就让我们从严格的意义上来理解 next 表的具体含义及其原理。 我们已经切实地看到, KMP 算法的优化效果首先体现在它可以使模式串得以快速地后移,而不是如蛮力算法那样只…

jmeter连接mysql数据库以及常规用法

1、在jmeter中新建一个测试计划,在测试计划界面中点击浏览,选择连接mysql数据库的jar包 如果没有jar包可以去网上下载,也可以通过如下链接进行下载 链接: https://pan.baidu.com/s/1BI6f19KSzXGlkSOwbnequw 提取码: gn8e 2、然后创建线程组&a…

CentOS7安装docker小记

首先你得需要有一个虚拟机,我的配置如图: 安装docker的工具 sudo yum install -y yum-utils device-mapper-persistent-data lvm2 指定阿里云的仓库 sudo yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.re…

生信机器学习入门3 - Scikit-Learn训练机器学习分类感知器

1. 在线读取iris数据集 import os import pandas as pd# 下载 try:s https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.dataprint(From URL:, s)df pd.read_csv(s,headerNone,encodingutf-8)except HTTPError:s iris.data# 读取.data文件,…

使用python导出Excel表格中的lua配置

背景:游戏开发中, 策划使用Excel配置游戏中的参数数据,写一个工具用于导出这些配置 工具选择使用 python来开发,这样Windows、macOS、Linux平台都可以使用,而且有丰富的第三方模块。 本机先安装python,我…

nvidia-cuda-tensorrt-cudnn下载网站

tensorrt:https://developer.nvidia.com/tensorrt/download cudnn:https://developer.nvidia.com/rdp/cudnn-archive cuda:https://developer.nvidia.com/cuda-toolkit-archive

Python编码系列—Python微服务架构:构建可扩展的云原生应用

🌟🌟 欢迎来到我的技术小筑,一个专为技术探索者打造的交流空间。在这里,我们不仅分享代码的智慧,还探讨技术的深度与广度。无论您是资深开发者还是技术新手,这里都有一片属于您的天空。让我们在知识的海洋中…

积极讨论取真经 自力更生辟新径 攻克难题会有时

你是如何克服编程学习中的挫折感的? 编程学习之路上,挫折感就像一道道难以逾越的高墙,让许多人望而却步。然而,真正的编程高手都曾在这条路上跌倒过、迷茫过,却最终找到了突破的方法。你是如何在Bug的迷宫中找到出口的…

火绒补充

目录 为什补充? 用户界面优化: 性能提升: 启发式检测和行为分析: 恶意网址拦截: 系统修复功能: 网络安全防护: 云查杀引擎: 漏洞修复和补丁管理: 隐私保护&…

C++类和对象(5)——运算符重载(以日期类为例)

运算符重载的作用 假设我们此时实现了日期类的运算符重载,我们就可以 实现如图的很多功能,完成日期计算器的底层代码。 运算符重载关键字 运算符重载的关键字是operator。 比如你想重载‘’运算符,那么语法格式就是 返回类型 operator …

Linux驱动开发基础(sr04超声波模块)

所学来自百问网 目录 1. SR04 超声波简介 2. 硬件设计 3. 软件设计 4. 示例代码 4.1 驱动代码 4.1.1 轮询模式 4.1.2 中断模式 4.3 应用程序 4.4 Makefile 4.5 实验效果 1. SR04 超声波简介 超声波测距模块是利用超声波来测距。模块先发送超声波,然后接…

大数据技术概述

4v特点 volume(体量大) velocity(处理速度快) variety(数据类型多) value(价值密度低) 核心设计理念 并行化 规模经济 虚拟化 分布式系统满足需求 系统架构 大数据处理流程 采集…

找论文的方法:如何找到本领域研究方向所需要的论文进行泛读和精读?

1、参考其他研究者给出的该领域的reading lists: 例如,在异配图神经网络领域: Awesome Resource on Graph Neural Networks With Heterophily:https://github.com/alexfanjn/Graph-Neural-Networks-With-Heterophily 在图对抗攻…

快速掌握GPTEngineer:用AI创建网页应用的实用教程

今天来聊聊一个非常有趣的工具——GPTEngineer。这是一个基于AI的网页开发平台,特别适合那些不熟悉编程但又想快速创建网页应用的人。如果你想用简单的文本描述来生成一个网站或者应用,GPTEngineer可能就是你需要的。我们一步步看看如何使用它。 1. 了解…

Guava Cache实现原理及最佳实践

本文内容包括Guava Cache的使用、核心机制的讲解、核心源代码的分析以及最佳实践的说明。 概要 Guava Cache是一款非常优秀本地缓存,使用起来非常灵活,功能也十分强大。Guava Cache说简单点就是一个支持LRU的ConcurrentHashMap,并提供了基于…

Java面试宝典-java基础08

Java面试宝典-java基础08 71、BIO、NIO、AIO有哪些应用场景72、简述一下BIO的编程流程73、NIO的三大核心部分是什么?74、NIO中buffer的四大属性是什么?75、对比一下BIO和NIO?76、FileChannel是做什么的?77、简述一下Selector选择器…

51单片机-矩阵键盘(基于LC602)

时间&#xff1a;2024.8.30 作者&#xff1a;Whappy 目的&#xff1a;手撕51&#xff08;第二遍&#xff09; 代码&#xff1a; main.c #include <REGX52.H> #include "LCD1602.h" #include "Delay.h" #include "MatrixKey.h"unsigned…

【Canvas与艺术】录王昌龄诗《从军行之四》

【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>出塞青海长云暗雪山</title><style type"text/css&quo…

opencv实战项目十六:kmeans图像颜色聚类:

文章目录 前言K-means介绍效果 前言 在数字化时代&#xff0c;图像处理技术已成为计算机视觉领域的重要组成部分。其中&#xff0c;图像颜色聚类作为一项关键技术在众多应用场景中发挥着重要作用&#xff0c;如图像分割、物体识别、色彩调整等。K-means算法作为一种经典的聚类…