GoogleAI大动作:发布Gemma 2,开启新篇章

news2024/11/17 19:30:50

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

人工智能有潜力解决一些最紧迫的人类问题,但前提是每个人都能使用这些工具。因此,今年早些时候,Google推出了Gemma,这是一个轻量级、最先进的开源模型家族,基于与Gemini模型相同的研究和技术开发。Google还扩展了Gemma家族,推出了CodeGemma、RecurrentGemma和PaliGemma,每个模型都针对不同的AI任务提供独特功能,并通过与Hugging Face、NVIDIA和Ollama等合作伙伴的集成,便于用户访问。

现在,Google正式向全球的研究人员和开发者发布了Gemma 2。Gemma 2有9亿(9B)和27亿(27B)参数两种型号,性能更高,推理效率更优,并且在安全性方面有显著提升。事实上,27B型号在性能上可以与体积是其两倍以上的模型竞争,达到了仅在去年12月专有模型才可能实现的性能。而且,这些性能现在只需一台NVIDIA H100 Tensor Core GPU或TPU主机即可实现,显著降低了部署成本。

高效性能开源模型新标准

Gemma 2基于重新设计的架构,专为卓越的性能和推理效率而设计。其特点包括:

  • 超强性能:27B的Gemma 2在其体积类别中提供了最佳性能,甚至可以与体积是其两倍以上的模型竞争。9B的Gemma 2模型也在其体积类别中表现领先,超越了Llama 3 8B和其他同类开源模型。详细的性能分析可参见技术报告。
  • 无与伦比的效率和成本节约:27B的Gemma 2模型设计为在单个Google Cloud TPU主机、NVIDIA A100 80GB Tensor Core GPU或NVIDIA H100 Tensor Core GPU上全精度高效运行,在保持高性能的同时显著降低成本,使AI部署更加经济实惠。
  • 跨硬件的极速推理:Gemma 2优化为在从强大的游戏笔记本电脑和高端台式机到云端设置的各种硬件上以惊人的速度运行。可以在Google AI Studio中全精度体验Gemma 2,通过Gemma.cpp在CPU上解锁本地性能,或在家用电脑上通过Hugging Face Transformers使用NVIDIA RTX或GeForce RTX体验。

专为开发者和研究人员设计

Gemma 2不仅更强大,还更容易集成到工作流程中:

  • 开源且可访问:与原始的Gemma模型一样,Gemma 2在商业友好的Gemma许可证下提供,允许开发者和研究人员分享和商业化他们的创新。
  • 广泛的框架兼容性:Gemma 2与主要AI框架兼容,如Hugging Face Transformers、JAX、PyTorch和TensorFlow,通过原生Keras 3.0、vLLM、Gemma.cpp、Llama.cpp和Ollama使用。此外,Gemma还优化了NVIDIA TensorRT-LLM,以在NVIDIA加速基础设施上运行或作为NVIDIA NIM推理微服务,未来还将针对NVIDIA的NeMo进行优化。开发者可以使用Keras和Hugging Face进行微调,未来还会支持更多参数高效微调选项。
  • 轻松部署:从下个月开始,Google Cloud客户可以在Vertex AI上轻松部署和管理Gemma 2。

探索新的Gemma Cookbook,这是一系列实用示例和指南,帮助用户构建自己的应用程序并针对特定任务微调Gemma 2模型。了解如何轻松使用Gemma完成常见任务,如检索增强生成。

负责任的AI开发

Google致力于为开发者和研究人员提供负责任地构建和部署AI所需的资源,包括通过其负责任生成AI工具包。最近开源的LLM Comparator帮助开发者和研究人员深入评估语言模型。从今天起,用户可以使用配套的Python库运行模型和数据的对比评估,并在应用中可视化结果。此外,Google正在积极开源其文本水印技术SynthID,以供Gemma模型使用。

在训练Gemma 2时,Google遵循了严格的内部安全流程,筛选预训练数据并对其进行严格测试和评估,以识别和减轻潜在的偏见和风险。Google还在一系列公共基准测试上公布了结果,涉及安全性和表示性危害的相关问题。

使用Gemma构建的项目

首次推出Gemma时,下载量超过了1000万,并催生了无数令人鼓舞的项目。例如,Navarasa利用Gemma创建了一个根植于印度语言多样性的模型。

现在,Gemma 2将帮助开发者启动更具雄心的项目,在AI创作中解锁新的性能和潜力。Google将继续探索新的架构,并开发专门的Gemma变体,以应对更多AI任务和挑战。这包括即将推出的2.6B参数Gemma 2模型,旨在进一步缩小轻量级可访问性和强大性能之间的差距。关于即将发布的更多信息,请参见技术报告。

入门指南

Gemma 2现已在Google AI Studio(https://aistudio.google.com/app/prompts/new_chat?model=gemma-2-27b-it)中提供,用户可以在没有硬件要求的情况下测试其27B的全部性能。用户还可以从Kaggle和Hugging Face Models(https://huggingface.co/google/gemma-2-9b)下载Gemma 2的模型权重,Vertex AI Model Garden也将很快上线。

为支持研究和开发,Gemma 2也可通过Kaggle免费获得,或通过Colab笔记本的免费层使用。首次使用Google Cloud的客户可能有资格获得300美元的积分。学术研究人员可以申请Gemma 2学术研究计划,以获得Google Cloud积分,加速他们使用Gemma 2的研究。申请现已开放,截止日期为8月9日。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1884407.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

window上部署sql server改动端口、和sqlserver的一些还原、批量插入存储过程的命令

1.端口的查看和启动 --windows上安装上sql server数据库后,搜索界面搜索sql,会出现配置管理器,点击进入 --进入后再次选择配置管理器 2. sqlserver数据库还原图形化 sqlserver还原数据库时会使数据库进入一个restore的还原状态,…

20240701在飞凌的OK3588-C开发板的Android12系统下使用i2cdetect确认I2C总线

console:/ # i2cdetect -y -r 0 console:/ # i2cdetect -l console:/ # i2cdetect -F 0 20240701在飞凌的OK3588-C开发板的Android12系统下使用i2cdetect确认I2C总线 2024/7/1 11:30 在CAM1、CAM2挂载OV13850。 在CAM3、CAM4和CAM5挂载OV5645了。 console:/ # i2 i2cdetect i2…

超声波气象站的科技创新

在现代科技的快速发展下,气象监测设备也在不断革新,其中超声波气象站以其独特的优势,成为了气象监测领域的新宠。这款体积小巧、重量轻盈的气象站,凭借其高精度、高稳定性和长寿命,为气象数据的采集提供了强有力的支持…

JMeter--定时执行的方法

原文网址:JMeter--定时执行的方法_IT利刃出鞘的博客-CSDN博客 简介 本文介绍JMeter如何使用定时器定时执行测试任务。 Java技术星球:way2j.com 方法 第一步:新建定时器 右键测试任务> Add > Timer> Constant Timer 如下图所示…

Android平台崩溃和 ANR 问题进行符号化解析、解析崩溃日志的内存地址

使用Android Logcat Stacktrace Utility | Android Logcat | 1.2.3 1.设置so库路径 2.打开Stacktrace Utility工具 3.在Original粘贴报错内存地址 4.点击Resolve Stacktraces,就会解析出内存地址 如果是红色,解析失败了,缺少原生so库,可以在第一步添加so库文件再次尝试…

2-22 基于matlab的NSGA-2求解多目标柔性车间调度算法

基于matlab的NSGA-2求解多目标柔性车间调度算法,计算最大完工时间、计算总延期时长、计算调度方案的总能耗、计算设备总负荷。输出四项结果,多次运行可寻找最佳的调度计划。程序已调通,可直接运行。 2-22 NSGA-2求解多目标柔性车间调度算法 - 小红书 (xi…

python sklearn机械学习模型-分类

🌈所属专栏:【机械学习】✨作者主页: Mr.Zwq✔️个人简介:一个正在努力学技术的Python领域创作者,擅长爬虫,逆向,全栈方向,专注基础和实战分享,欢迎咨询! 您…

常用的限流算法有哪些?你听说过几种?

限流,就是指限制流量请求的频次。 在高并发情况下,它是一种保护系统的策略,避免了在流量高峰时系统崩溃,造成系统的不可用。 常见的限流算法有: 计数器限流算法滑动窗口限流算法漏桶限流算法令牌桶限流算法 1. 计数器…

LeetCode题练习与总结:二叉树的前序遍历--144

一、题目描述 给你二叉树的根节点 root ,返回它节点值的 前序 遍历。 示例 1: 输入:root [1,null,2,3] 输出:[1,2,3]示例 2: 输入:root [] 输出:[]示例 3: 输入:roo…

ARM功耗管理软件之DVFSAVS

安全之安全(security)博客目录导读 思考:功耗管理软件栈及示例?WFI&WFE?时钟&电源树?DVFS&AVS? 目录 一、ARM功耗管理软件之DVFS 二、ARM功耗管理软件之AVS 一、ARM功耗管理软件之DVFS 有一个实现特定…

招生报名系统教培招生小程序

招生报名系统:轻松实现教培招生新高度 🚀 招生报名系统,开启智慧教育新时代 在当今数字化快速发展的时代,教育行业也迎来了变革的浪潮。招生报名系统作为这一变革的先锋,为教育机构提供了全新的招生渠道和管理方式。通…

jmeter-beanshell学习1-vars使用获取变量和设置变量

最近又开始了用jmeter做自动化,不管怎么实现,都逃离不了用beanshell,最后把所有校验都放在了beanshell判断,效果还不错。 首先jmeter有很多beanshell相关的元件,取样器、前置处理器、后置处理器、断言,暂时…

传输距离3000M|低延迟|48K采样音频传输模块-SA356大功率发射模块

无线音频应用中,远距离音频传输在许多领域具有广泛的应用需求,例如大型会议系统、公共广播、户外活动和音乐演出等。为了满足这些需求,音频传输模块需要具备一些关键特性,包括长距离传输能力、高音质、低延迟、稳定性以及抗干扰能…

UE5 动画蓝图

文章目录 一、State Machines二、Blend Spaces三、Aim Offset四、Montage 初步介绍 Unreal Engine 5 Tutorial - Animation Blueprint Part 1: State Machines (youtube.com) Unreal Engine 5 Tutorial - Animation Blueprint Part 2: Blend Spaces (youtube.com) Unreal Engi…

RK3568平台(USB篇)TYPE-C接口与PD协议

一.TYPE-C接口简介 type-c 插座: type-c 插头: type-c 线缆: type-c 接口定义之插座: type-c 硬件原理图: VBUS:供电引脚,用于传输电源电压,一般为5V或12V。 GND:地引…

类与对象(3)

1.首先我们先介绍一下 赋值重载 我们来举个例子来实现一下 赋值重载也叫赋值拷贝 void operator(const Date& d){//赋值拷贝 是拷贝给一个已经赋值好的对象 也叫赋值重载cout << "赋值重载" << endl;year d.year;month d.month;day d.day;} 如果…

Linux 高级编程——线程控制

线程控制&#xff1a;互斥与同步 概念&#xff1a; 互斥 》在多线程中对临界资源的排他性访问。 互斥机制 》互斥锁 》保证临界资源的 访问控制。 pthread_mutex_t mutex; 互斥锁类型 互斥锁变量 内核对象 框架&#xff1a; 定义互斥锁 》初始化锁 》加…

uniapp中如何进行微信小程序的分包

思路&#xff1a;在uniapp中对微信小程序进行分包&#xff0c;和原生微信小程序进行分包的操作基本上没区别&#xff0c;主要就是在pages.json中进行配置。 如图&#xff0c;我新增了一个包diver-page 此时需要在pages.json中的subPackages数组中新增一项 root代表这个包的根…

“论单元测试方法及应用”精选范文,软考高级论文,系统架构设计师论文

论文真题 1、概要叙述你参与管理和开发的软件项目,以吸你所担的主要工作。 2、结给你参与管理和开发的软件项目&#xff0c;简要叙述单元测试中静态测试和动态测试方法的基本内容。 3、结给你惨与管理和研发的软件项目,体阐述在玩测试过程中,如何确定白盒测试的覆盖标准,及如…

Sourcecodester Fantastic Blog CMS v1.0 SQL 注入漏洞(CVE-2022-28512)

前言 CVE-2022-28512 是一个存在于 Sourcecodester Fantastic Blog CMS v1.0 中的 SQL 注入漏洞。攻击者可以通过 "/fantasticblog/single.php" 中的 id 参数注入恶意 SQL 查询&#xff0c;从而获得对数据库的未经授权的访问和控制。 漏洞详细信息 漏洞描述: 该漏…