每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
在六月,Google推出了全新的Gemma 2,这款顶级的开源模型拥有270亿(27B)和90亿(9B)参数。自发布以来,27B模型迅速成为LMSYS Chatbot Arena排行榜上的高分选手,甚至在真实对话中超越了许多比它大两倍的流行模型。
但Gemma不仅仅是为了性能。它的基础是负责任的AI,优先考虑安全性和可访问性。为了支持这一承诺,Google隆重宣布三个新的Gemma 2系列成员:
- Gemma 2 2B (https://huggingface.co/collections/google/gemma-2-2b-release-66a20f3796a2ff2a7c76f98f)——全新的2亿参数(2B)版本,内置安全改进,兼具强大的性能和高效性。
- ShieldGemma (https://huggingface.co/collections/google/shieldgemma-release-66a20efe3c10ef2bd5808c79)——一组基于Gemma 2的安全内容分类模型,用于过滤AI模型的输入和输出,保护用户安全。
- Gemma Scope (https://huggingface.co/collections/google/gemma-scope-release-66a4271f6f0b4d4a9d5e04e2)——一个新的模型可解释性工具,提供对模型内部工作原理的无与伦比的洞察。
有了这些新增功能,研究人员和开发人员现在可以创建更安全的客户体验,深入了解模型,并自信地在设备上负责任地部署强大的AI,开启创新的新可能性。
Gemma 2 2B: 下一代性能体验,现已上线
Google很高兴介绍备受期待的Gemma 2家族新成员——Gemma 2 2B模型。这个轻量级模型通过从更大模型中学习,产生了出色的效果。实际上,Gemma 2 2B在Chatbot Arena上超越了所有GPT-3.5模型,展示了其卓越的对话AI能力。
图表:LMSYS Chatbot Arena排行榜得分
LMSYS Chatbot Arena排行榜得分捕捉于2024年7月30日。Gemma 2 2B得分正负10。
Gemma 2 2B提供了:
- 卓越性能:在其尺寸范围内提供顶级性能,超过同类其他开源模型。
- 灵活且具成本效益的部署:能够在各种硬件上高效运行——从边缘设备和笔记本电脑到使用Vertex AI和Google Kubernetes Engine(GKE)的强大云部署。为了进一步提高速度,它通过NVIDIA TensorRT-LLM库进行了优化,并作为NVIDIA NIM提供。这种优化针对数据中心、云、本地工作站、PC和边缘设备的各种部署,使用NVIDIA RTX、NVIDIA GeForce RTX GPU或NVIDIA Jetson模块进行边缘AI。此外,Gemma 2 2B与Keras、JAX、Hugging Face、NVIDIA NeMo、Ollama、Gemma.cpp以及即将推出的MediaPipe无缝集成,简化了开发过程。
- 开放且可访问:根据对研究和商业应用友好的Gemma条款提供。其体积小到足以在Google Colab的免费T4 GPU层上运行,使实验和开发变得前所未有的容易。
从今天起,可以从Kaggle、Hugging Face、Vertex AI Model Garden下载Gemma 2的模型权重,也可以在Google AI Studio中体验其功能。
ShieldGemma:用最先进的安全分类器保护用户
为了确保开放模型能够负责任地部署,确保AI输出具有吸引力、安全和包容性,开发者和研究人员需要付出大量努力。为了帮助开发者实现这一目标,Google推出了ShieldGemma,这是一系列最先进的安全分类器,旨在检测和减轻AI模型输入和输出中的有害内容。ShieldGemma特别针对四个关键领域的危害:
- 仇恨言论
- 骚扰
- 性露骨内容
- 危险内容
这些开放分类器补充了现有的负责任AI工具包中的安全分类器套件,其中包括使用有限数据点构建特定政策分类器的方法,以及通过API提供的现有Google Cloud现成分类器。
ShieldGemma能够帮助开发更安全、更优质的AI应用:
- SOTA性能:基于Gemma 2构建,ShieldGemma是业界领先的安全分类器。
- 灵活尺寸:ShieldGemma提供各种模型尺寸以满足不同需求。2B模型适合在线分类任务,而9B和27B版本则为离线应用提供更高性能,适用于对延迟要求不高的场景。所有尺寸都利用NVIDIA的速度优化,在各种硬件上实现高效性能。
- 开放和协作:ShieldGemma的开放性质鼓励透明度和AI社区的协作,有助于未来的机器学习行业安全标准。
“随着AI的不断成熟,整个行业将需要投资于开发高性能的安全评估器。很高兴看到Google做出了这一投资,并期待他们继续参与我们的AI安全工作组。”~ ML Commons执行董事Rebecca Weiss
Gemma Scope:用开放稀疏自编码器揭示AI决策
Gemma Scope为研究人员和开发人员提供了前所未有的透明度,让他们能够深入了解Gemma 2模型的决策过程。像一个强大的显微镜,Gemma Scope使用稀疏自编码器(SAEs)放大模型内的特定点,使其内部工作原理更加可解释。
这些SAEs是专门的神经网络,帮助解读Gemma 2处理的密集复杂信息,将其扩展为更易于分析和理解的形式。通过研究这些扩展视图,研究人员可以获得宝贵的见解,了解Gemma 2如何识别模式、处理信息并最终做出预测。通过Gemma Scope,Google旨在帮助AI研究社区发现如何构建更可理解、负责和可靠的AI系统。
Gemma Scope的突破性特点:
- 开放SAEs:400多个免费提供的SAEs,覆盖Gemma 2 2B和9B的所有层。
- 互动演示:无需编写代码即可在Neuronpedia上探索SAE功能并分析模型行为。
- 易于使用的资源库:提供与SAEs和Gemma 2接口的代码和示例。
了解更多关于Gemma Scope的信息,请访问Google DeepMind博客、技术报告和开发者文档。
构建在负责任AI基础上的未来
这些发布代表了Google持续为AI社区提供开发安全和有益AI所需的工具和资源的承诺。相信开放访问、透明度和协作是开发安全和有益AI的关键。
立即开始体验:
- 下载Gemma 2 2B或在NVIDIA NIM或Google AI Studio中试用其功能。https://www.kaggle.com/models/google/gemma-2
- 探索ShieldGemma并构建更安全的AI应用。 https://ai.google.dev/gemma/docs/shieldgemma
- 在Neuronpedia上试用Gemma Scope,揭示Gemma 2的内部工作原理。 https://www.neuronpedia.org/gemma-scope