AI又进化了

news2024/9/29 5:46:30
  • B站:啥都会一点的研究生
  • 公众号:啥都会一点的研究生

一直想做但没做的板块,整理一段时间内AI领域的前沿动态(符合大多粉丝研究领域/感兴趣方向),了解了解外面世界发展成啥样了,一起看看吧~

谷歌Chrome推出“Help me write”的AI功能

谷歌最近在其Chrome浏览器中推出了一个名为“Help me write”的实验性AI功能。这个由Gemma提供支持的功能旨在帮助用户根据网页内容编写或完善文本,专注于为短格式内容提供写作建议,例如填写数字调查和评论,以及起草在线销售商品的描述

该工具可以理解网页的上下文,并将相关信息引入其建议中,例如在产品页面上突出显示的关键功能,用于商品评论。用户可以在任何网站的文本字段上右键单击以使用该功能

在这里插入图片描述

https://blog.google/products/chrome/google-chrome-ai-help-me-write/

LongRoPE:将LLM上下文窗口扩展到超过200万个token

微软提出了LongRoPE,将预训练大型语言模型(LLMs)的上下文窗口扩展到惊人的2048k tokens

由于高微调成本、长文本的稀缺性以及新标记位置引入的灾难性数值,目前的扩展上下文窗口受到了约128k个token的限制,LongRoPE克服了这些问题

对LLaMA2和Mistral在各种任务上的实验表明,扩展模型保留了原始架构,并进行了轻微的位置嵌入修改和优化

在这里插入图片描述

https://twitter.com/_akhaliq/status/1760499638056910955

Stable Diffusion 3打造更强的文生图模型

Stability.AI在早期预告中宣布了Stable Diffusion 3。一款文生图模型,在多主题提示、图像质量和拼写能力方面表现出了更高的性能

由于其卓越的能力,这款下一代图像工具在AI社区中引起广泛关注。宣称提供更好的文本生成,强大的提示遵循能力以及对提示泄漏的抵抗力,确保生成的图像与请求的提示相匹配

在这里插入图片描述

https://blog.google/products/google-one/google-one-gemini-ai-gmail-docs-sheets

AnyGPT:迈向通用人工智能的重要一步

上海团队通过研发 AnyGPT 实现了AI能力上的突破。AnyGPT 几乎可以理解和生成任何模式的数据,包括文本、语音、图像和音乐。利用创新的离散表示方法,使单一的底层语言模型架构能够流畅地处理多种模式的输入和输出

在这里插入图片描述

https://arxiv.org/pdf/2402.12226.pdf

Google 发布了第一个开源LLM

谷歌开源了 Gemma,这是一个全新的先进语言模型系列,有 2B 和 7B 两种参数规格。尽管 Gemma 模型非常轻便,可以在笔记本电脑和台式机上运行,但它采用了与谷歌庞大的专有 Gemini 模型相同的技术并实现了卓越的性能,在许多关键的自然语言处理基准测试中,7B Gemma 模型的性能超过了 13B LLaMA 模型

此外,谷歌还发布了 “负责任的生成式人工智能工具包”,以帮助开发人员构建安全的应用程序。其中包括基于谷歌经验的稳健安全分类、调试模型行为和实施最佳部署实践的工具。Gemma 可在谷歌云、Kaggle、Colab 和其他一些平台上使用,并提供免费积分等激励措施

在这里插入图片描述

https://blog.google/technology/developers/gemma-open-models

Meta 发布 Aria 录音,助力智能语音识别

Meta 发布了通过 Aria 智能眼镜捕捉到的双人对话多模式数据集。该数据集包含 7 个麦克风的音频、视频、运动传感器和标注。一名参与者戴着眼镜自发地与另一名贡献者交谈

该数据集旨在推动语音识别、扬声器 ID 和增强现实界面翻译等领域的研究。它的音频、视觉和运动信号共同提供了丰富的自然对话捕捉,有助于训练人工智能模型,可以实现闭合字幕和实时语言翻译

在这里插入图片描述

https://the-decoder.com/metas-aria-smart-glasses-dataset-helps-shape-the-future-of-ai-conversations/

Adobe 发布新AI助手帮助用户浏览文档

Adobe 在其 Acrobat 软件中推出了一项AI助手功能,帮助用户浏览文档,可以总结内容、回答问题并生成格式化的概述。该聊天机器人旨在节省处理长文件和复杂信息的时间

此外,Adobe 还专门成立了一个 50 人的人工智能研究团队,名为 CAVA(音频、视频和动画协同创作),专注于推进生成式视频、动画和音频创作工具的发展。该研究小组将探索将 Adobe 现有的创意工具与文本视频生成等技术相结合

在这里插入图片描述

https://www.theverge.com/2024/2/20/24077217/adobe-acrobat-generative-ai-assistant-chatbot-pdf-document

Groq 的新型AI芯片为助力LLM,性能优于 ChatGPT

Groq 开发了一种特殊的人工智能硬件,称为有史以来第一个语言处理单元(LPU),旨在提高目前通常在 GPU 上工作的人工智能模型的处理能力。这些 LPU 每秒可处理多达 500 个token,远远优于每秒只能处理 30 至 50 个token的 Gemini Pro 和 ChatGPT-3.5

在这里插入图片描述

该公司将基于 LPU 的人工智能芯片命名为 “GroqChip”,采用了一种 “张量流架构”,复杂性低于传统 GPU,可实现更低的延迟和更高的吞吐量。使得该芯片成为体育直播或游戏等实时人工智能应用的理想选择

https://the-decoder.com/groqs-ai-chip-turbocharges-llms-and-generates-text-in-near-real-time/

谷歌开源人工智能文件类型识别器 Magika

谷歌开源了其人工智能驱动的文件类型识别系统Magika,以帮助准确检测二进制和文本文件类型。Magika采用了一个定制的、高度优化的深度学习模型,即使在CPU上运行,也能在几毫秒内实现精确的文件识别

得益于其人工智能模型和大型训练数据集,Magika 的性能比其他现有工具高出约 20%。它在文本文件(包括其他工具难以处理的代码文件和配置文件)上的性能提升更大

在这里插入图片描述

在内部,Magika 被大规模用于将 Gmail、Drive 和安全浏览文件路由到适当的安全和内容策略扫描程序,从而帮助提高谷歌用户的安全性

https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html

NVIDIA的新数据集提高了LLMs数学能力

英伟达发布了开源数学指令调整数据集 OpenMathInstruct-1,该数据集包含 180 万个问题-解决方案对。OpenMathInstruct-1 是一个高质量的合成数据集,比以前的数据集大 4 倍,而且不使用 GPT-4,通过使用 Mixtral 模型合成 GSM8K 和 MATH(两种流行的数学推理基准)的代码解释器解决方案而构建

https://arxiv.org/abs/2402.10176

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1485580.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网关kong记录接口处理请求和响应插件 tcp-log-with-body的安装

tcp-log-with-body 介绍 Kong的tcp-log-with-body插件是一个高效的工具,它能够转发Kong处理的请求和响应。这个插件非常适用于需要详细记录API请求和响应信息的情景,尤其是在调试和排查问题时。 软件环境说明 kong version 2.1.4 - 2.8.3 [可用亲测]C…

8、Redis-Jedis、Lettuce和一个Demo

目录 一、Jedis 二、Lettuce 三、一个Demo Java集成Redis主要有3个方案:Jedis、Lettuce和Redisson。 其中,Jedis、Lettuce侧重于单例Redis,而Redisson侧重于分布式服务。 项目资源在文末 一、Jedis 1、创建SpringBoot项目 2、引入依赖 …

【PDF技巧】网上下载的pdf文件怎么才能编辑

不知道大家有没有遇到过网上下载的PDF文件不能编辑的情况,今天我们来详细了解一下导致无法编辑的原因即解决方法有哪些。 第一种原因:PDF文件中的内容是否是图片,如果确认是图片文件,那么我们想要编辑,就可以先使用PD…

《Improving Calibration for Long-Tailed Recognition》阅读笔记

论文标题 《Improving Calibration for Long-Tailed Recognition》 改进长尾识别的校准工作 作者 Zhisheng Zhong、 Jiequan Cui、Shu Liu 和 Jiaya Jia 香港中文大学和 SmartMore 初读 摘要 深度神经网络在训练数据集类别极度不平衡时可能会表现不佳。最近&#xff0c…

高中数学:函数的单调性

一、概念 二、单调区间的表示方法 注意 1、两个不相连的部分,单调性相同,则两个单调区间用逗号隔开,不能用∪号连接。 2、单调区间端点都用开区间表示,最安全。 三、常见题型 1、普通简单函数单调性判断 解题思路:画…

VueCli的安装与卸载

文章目录 一.Node安装包的报读网盘提取码二、Vue脚手架Cli三、Vue-CLI使用步骤(自定义安装)1.转换路径并创建项目2.创建步骤的解释(保姆级)3.等待vue项目自己创建好(保姆级) 四、通过npm对vue的安装与卸载 一.Node安装包的报读网盘提取码 下面的链接为地址: Node的百度网盘提取…

【操作系统(Operator System)】

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、概念 二、结构示意图 三、尝试理解操作系统 系统调用和库函数概念 承上启下 总结 前言 世上有两种耀眼的光芒,一种是正在升起的太阳&#xff…

每日下载超1000万次,这个前端工具太有用了!

今天来分享一个前端必备的工具,其每天在 npm 上的下载量高达 1000 万次,几乎每个前端项目都在用,它就是 PostCSS。这款工具已经成为前端开发领域中不可或缺的一部分,之所以如此受欢迎,不仅是因为它能够帮助开发者自动化…

双周回顾#007 - 前端与后端

前端的问题不是难,而是它面对最终用户。只要用户的喜好和口味发生变化,前端就必须跟上。 这导致前端不得不快速变化,因为用户的口味正在越来越快地改变。 后端不需要面对最终用户,需要解决的都是一些经典的计算机科学问题&#…

智能的花火,照亮一座5G钢铁工厂的时代之舞

“东风夜放花千树。更吹落,星如雨。凤箫声动,玉壶光转,一夜鱼龙舞”,辛弃疾在《青玉案》中描绘的“打铁花”,是刚刚过去的春节假期中,全国各地都在上演的中式浪漫。 当铁水被击打向高空,犹如千万…

苍穹外卖学习 Day10 Day11 Day12

前言 用于记录苍穹外卖Day10、Day11、Day12的学习 Day10 订单状态定时处理 来电提醒 客户催单 订单状态定时处理 Spring Task Spring Task是一个任务调度工具,可以按照约定的时间自动执行某个代码逻辑(定时自动执行某段Java代码) cron表…

[GXYCTF2019]BabyUpload1 -- 题目分析与详解

目录 一、题目分析 1、判断题目类型: 2、上传不同类型的文件进行测试: 二、题目详解 1、写出.htaccess文件: 2、.htaccess 文件配合 .jpg 上传: 3、利用 中国蚁剑/中国菜刀 获取flag: 一、题目分析 1、判断题目…

亚马逊云科技实时 AI 编程助手 Amazon CodeWhisperer,开发快人一步

​ 亚马逊云科技:https://mic.anruicloud.com/url/1024 ​ Amazon CodeWhisperer 是一款 AI 编码配套应用程序,可在 IDE 中生成 整行代码和完整的函数代码建议,以帮助您更快地完成更多工作。在本系列 文章中,我们将为您详细介绍 A…

Cloud+Consul

Cloud整合Zookeeper代替Eureka-CSDN博客 Consul简介 Consul是一套开源的分布式服务发现和配置管理系统 What is Consul? | Consul | HashiCorp DeveloperConsul is a service networking solution that delivers service discovery, service mesh, and network security ca…

#WEB前端(CCS选择器)

1.实验&#xff1a;CCS选择器 2.IDE&#xff1a;VSCODE 3.记录&#xff1a; 子代选择器、后代选择器、相邻兄弟选择器、类选择器、伪元素选择器&#xff08;鼠标悬停&#xff09;、ID选择器、调用选择器&#xff08;全选&#xff09; 4.代码&#xff1a; <!DOCTYPE html…

2024龙年特别篇 -- 魔法指针 之 指针变量

目录 ​编辑 字符指针变量 字符指针 字符数组 关于字符数组的试题 数组指针变量 数组指针 利用指针数组打印数组 打印二维数组 数组作为形参 当形参为指针时&#xff08;指针数组&#xff09; 函数指针变量 利用函数实现加法输出的多种方式 字符指针变量 字符指针 char …

超详细红黑树的模拟实现

前言 有人说设计出AVL树的的人是个大牛&#xff0c;那写红黑树&#xff08;RBTree&#xff09;的人就是天才&#xff01; 上一篇文章&#xff0c;我们已经学习了AVL树&#xff0c;牛牛个人认为AVL树已经够优秀了&#xff0c;那让我们一起探究一下&#xff0c;为什么红黑树比AV…

【C语言】InfiniBand 驱动mlx4_ib_init和mlx4_ib_cleanup

一、中文讲解 这两个函数是Linux内核模块中对于Mellanox InfiniBand 驱动程序初始化和清理的函数。 mlx4_ib_init()函数是模块初始化函数&#xff0c;使用__init宏标注&#xff0c;表示该函数只在模块加载时运行一次。 函数执行的步骤如下&#xff1a; 1. 通过alloc_ordered_w…

sklearn.preprocessing.RobustScaler(解释和原理,分位数,四分位差)

提示&#xff1a;sklearn.preprocessing.RobustScaler&#xff08;解释和原理&#xff0c;分位数&#xff0c;四分位差&#xff09; 文章目录 [TOC](文章目录) 一、RobustScaler 是什么&#xff1f;二、代码1.代码2.输出结果 总结 提示&#xff1a;以下是本篇文章正文内容&…

计算机网络|Socket

文章目录 Socket并发socket Socket Socket是一种工作在TCP/IP协议栈上的API。 端口用于区分不同应用&#xff0c;IP地址用于区分不同主机。 以下是某一个服务器的socket代码。 其中with是python中的一个语法糖&#xff0c;代表当代码块离开with时&#xff0c;自动对s进行销毁…