谷歌开源单个 GPU 可运行的Gemma 3 模型,27B 超越 671B 参数的 DeepSeek

news2025/4/7 21:14:25

自从 DeepSeek 把训练成本打下来之后,各个模型厂家现在不再堆参数进行模型的能力对比。而是转向了训练成本优化方面,且还要保证模型能力不减反增的效果。包括使用较少的模型参数,降低 GPU 使用数量,降低模型内存占用等等技术手段。这里可以查看 DeepSeek 开源周发布的优化策略。

谷歌正式发布了全新一代 AI 模型 Gemma 3!这可不是简单的升级,而是用了 Gemini 2.0 同款技术打造的 最先进、最便携、最负责任的开放模型!啥意思?简单说,就是性能更强、体积更小、更安全!更重要的是,它能在各种设备上 飞速运行,从你的手机、笔记本到专业工作站,都能轻松驾驭!Gemma 3 有多种尺寸(1B、4B、12B 和 27B),可以根据特定的硬件和性能需求选择最佳模型。

Gemma 3 是多模态的!40 亿、120 亿和 270 亿个参数模型可以处理图像和文本,而 1B 版本只能处理文本。对于 1B 版本,输入上下文窗口长度已从 Gemma 2 的 8k 增加到32k ,对于其他所有版本,则增加到 128k。与其他 VLM(视觉语言模型)一样,Gemma 3 会根据用户输入生成文本,这些文本可能由文本组成,也可能由图像组成。

与 Gemma2 相比,虽然模型参数没有增加,但是上下文长度增加到了 128K,而且还是一个多模态的模型,不仅识别文本,还支持图片与视频内容的交互。更是支持了 140 种语言能力,简直不要太强大。

Gemma 3 性能特点?

  1. 性能怪兽,单卡 GPU 就能起飞! Gemma 3 在 LMArena 排行榜上直接超越了 Llama3、DeepSeek 等一众大佬!这意味着在单个 GPU 或 TPU 上,就能创建丝滑流畅的 AI 体验!
  2. 140 种语言精通,走遍全球都不怕! 别再担心语言障碍!Gemma 3 开箱即用支持超过 35 种语言,预训练更是覆盖 140 多种语言!
  3. 文能识图写诗,武能函数调用! 轻松搞定图片、文本、短视频分析,开启交互式智能新纪元!函数调用也安排上了,自动执行任务、构建智能 Agent,不在话下!
  4. 海量信息轻松应对! 128k Token 上下文窗口,再复杂的任务,再多的信息,都能 hold 住!
  5. 官方量化版本,性能加速! 体积更小,计算更快,精度还不变!简直是为移动端量身定制!

一张图告诉你 Gemma 3 有多强:

看到了吗?Gemma 3 (27B) 在众多 AI 模型中脱颖而出!而且只需要一个 GPU,而其他模型可能需要多达 32 个!不仅如此,27B 参数的模型竟然超过了 671B 参数的 DeepSeek V3 模型,简直不要太好用。这么小参数量的模型,完全可以跑在自己电脑上面了。普通电脑配置也能跑大模型了。

Gemma3 性能在最优点

安全第一,谷歌这次玩真的!

谷歌深知开放模型需要谨慎的风控!Gemma 3 经历了严格的安全评估,包括数据管理、安全微调和基准评估。即使是增强的 STEM 性能也经过了特定评估,以确保滥用风险较低。

ShieldGemma 2:为图像应用保驾护航!

除了 Gemma 3,谷歌还推出了 ShieldGemma 2!这是一个基于 Gemma 3 构建的强大图像安全检查器,能够识别“危险内容、色情和暴力”!而且它是开源的,开发者可以根据需求进行定制!

Gemma 3 评估

在 LMSys Chatbot Arena 上,Gemma 3 27B IT 的 Elo 分数为1339,跻身前 10 个最佳模型之列,包括领先的封闭模型。Elo 与 o1-preview 相当,并且高于其他非思考开放模型。与表中的其他 LLM 一样,Gemma 3 仅处理文本输入即可获得此分数。

Gemma 3 已通过 MMLU-Pro(27B:67.5)、LiveCodeBench(27B:29.7)和 Bird-SQL(27B:54.4)等基准测试进行评估,与封闭式 Gemini 模型相比,其性能更具竞争力。GPQA Diamond(27B:42.4)和 MATH(27B:69.0)等测试凸显了其推理和数学技能,而 FACTS Grounding(27B:74.9)和 MMMU(27B:64.9)则展示了强大的事实准确性和多模态能力。然而,它在 SimpleQA(27B:10.0)的基本事实方面落后。与 Gemini 1.5 模型相比,Gemma 3 通常很接近,有时甚至更好,证明了其作为可访问、高性能选项的价值。

无缝集成,即刻上手!

Gemma 3 和 ShieldGemma 2 可以轻松集成到你现有的工作流程中!支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch 等等!

#使用管道进行推理
import torch
from transformers import pipeline
pipe = pipeline(
    "image-text-to-text",
    model="google/gemma-3-4b-it", # "google/gemma-3-12b-it", "google/gemma-3-27b-it" 
    device="cuda",
    torch_dtype=torch.bfloat16)
messages = [{ "role": "user",
        "content": [
            {"type": "image", "url": "candy.JPG"},
            {"type": "text", "text": "What animal is on the candy?"}]}]
output = pipe(text=messages, max_new_tokens=200)
print(output[0]["generated_text"][-1]["content"])

糖果上是什么动物?
让我们分析一下图片中的糖果吧!糖果上的动物是一只乌龟。
你可以清楚地看到龟壳和乌龟的头和腿印在表面上。

使用 Transformer 进行推理

Transformer集成有两个新的模型类:


Gemma3ForConditionalGeneration:适用于4B、12B和27B视觉语言模型。

Gemma3ForCausalLM:对于 1B 纯文本模型

import torch
from transformers import AutoProcessor, Gemma3ForConditionalGeneration
ckpt = "google/gemma-3-4b-it"
model = Gemma3ForConditionalGeneration.from_pretrained(
    ckpt, device_map="auto", torch_dtype=torch.bfloat16,)
processor = AutoProcessor.from_pretrained(ckpt)
messages = [{"role": "user",
        "content": [
            {"type": "image", "url": "password.jpg"},
            {"type": "text", "text": "What is the password?"}]}]
inputs = processor.apply_chat_template(
    messages, add_generation_prompt=True, tokenize=True,
    return_dict=True, return_tensors="pt"
).to(model.device)
input_len = inputs["input_ids"].shape[-1]
generation = model.generate(**inputs, max_new_tokens=100, do_sample=False)
generation = generation[0][input_len:]
decoded = processor.decode(generation, skip_special_tokens=True)
print(decoded)

密码是什么?
根据图片,密码是aaeu

在线体验

Gemma 3 不仅可以使用代码进行执行,或者使用 ollama进行本地部署,若不想占用本地资源,也可以在线使用。可以直接在 hugging face 上面使用,当然也可以使用 Google studio 上面使用。

Gemmaverse 生态,无限可能!

谷歌还鼓励社区基于 Gemma 构建各种应用和工具,形成一个庞大的 Gemmaverse 生态! AI Singapore 的 SEA-LION v3 打破语言障碍,促进了东南亚地区的交流;INSAIT 的 BgGPT 是首个保加利亚语大型语言模型;Nexa AI 的 OmniAudio 展示了设备内置 AI 的潜力!

Gemma 3 的发布,标志着 AI 技术民主化的又一里程碑!它将强大的 AI 能力带到了每个人的指尖,让开发者能够创造出更多创新应用,改变我们的生活!不仅参数少,模型小,还可以在单个 GPU 上面运行,普通电脑也可以直接跑大模型了,而 DeepSeek 系列的模型需要 32 个 GPU,不是普通玩家玩的模型。

huggingface.co/blog/gemma3
blog.google/technology/developers/gemma-3/


头条号:人工智能研究所
v号:启示AI科技

 动画详解transformer  在线教程 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2329412.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++_类和对象(下)

【本节目标】 再谈构造函数Static成员友元内部类匿名对象拷贝对象时的一些编译器优化再次理解封装 1. 再谈构造函数 1.1 构造函数体赋值 在创建对象时,编译器通过调用构造函数,给对象中各个成员变量一个合适的初始值。 class Date { public:Date(in…

Docker设置代理

目录 前言创建代理文件重载守护进程并重启Docker检查代理验证 前言 拉取flowable/flowable-ui失败,用DaoCloud源也没拉下来,不知道是不是没同步。索性想用代理拉镜像。在此记录一下。 创建代理文件 创建docker代理配置 sudo mkdir -p /etc/systemd/s…

一键自动备份:数据安全的双重保障

随着数字化时代的到来,数据已成为企业和个人不可或缺的核心资产。在享受数据带来的便捷与高效的同时,数据丢失的风险也随之增加。因此,备份文件的重要性不言而喻。本文将深入探讨备份文件的重要性,并介绍两种实用的自动备份方法&a…

HeidiSQL:多数据库管理工具

HeidiSQL 是一款广受欢迎的免费开源数据库管理工具,专为数据库管理员及开发者设计。无论您是刚接触数据库领域的新手,还是需要同时处理多种数据库系统的专业开发者,该工具都能凭借其直观的界面和强大的功能,助您轻松完成数据管理任…

医药档案区块链系统

1. 医生用户模块​​ ​​目标用户​​:医护人员 ​​核心功能​​: ​​检索档案​​:通过关键词或筛选条件快速定位患者健康档案。​​请求授权​​:向个人用户发起档案访问权限申请,需经对方确认。​​查看档案​…

蓝桥云客--浓缩咖啡液

4.浓缩咖啡液【算法赛】 - 蓝桥云课 问题描述 蓝桥杯备赛选手小蓝最近刷题刷到犯困,决定靠咖啡续命。他手上有 N 种浓缩咖啡液,浓度分别是 A1​%, A2​%, …, AN​%,每种存货都是无限的。为了提神又不炸脑,小蓝需要按比例混合这…

SQLark(百灵连接):一款面向信创应用开发者的数据库开发和管理工具

SQLark(百灵连接)是一款面向信创应用开发者的数据库开发和管理工具,用于快速查询、创建和管理不同类型的数据库系统。 目前可以支持达梦数据库、Oracle 以及 MySQL。 SQL 智能编辑器 基于语法语义解析实现代码补全能力,为你提供…

计算机视觉——为什么 mAP 是目标检测的黄金标准

概述 在目标检测领域,有一个指标被广泛认为是衡量模型性能的“黄金标准”,它就是 mAP(Mean Average Precision,平均精确率均值)。如果你曾经接触过目标检测模型(如 YOLO、Faster R-CNN 或 SSD)…

Frame Of Reference压缩算法

文章目录 1_概述2_算法基本步骤3_过程优化4_优势以及局限5_模拟实现6_总结 1_概述 Frame of Reference(FoR)压缩算法 是一种用于压缩数值数据的算法,特别是在处理大规模数据集时,利用数据的局部性和重复性来减少存储和传输的开销…

esp32cam 开发板搭载ov3660摄像头在arduino中调用kimi进行图像识别

首先呢,最近搞一个项目,需要一个摄像头拍摄图片 就买了个ov3660开发板,用的esp32S芯片 淘宝商家给的教程是arduino的,所以先用arduino跑起来 arduino配置esp32-cam开发环境 - 简书1、安装arduino https://www.arduino.cc/en/Main/Software?setlang=cn 2、配置esp32 打开…

二十种中药果实识别分类系统,Python/resnet18/pytorch

二十种中药果实识别分类系统,Python/resnet18/pytorch 基于pytorch训练, resnet18网络,可用于训练其他分类问题,也可自己重新训练 20类中药材具体包括:(1) 补骨脂,(2) 草豆蔻,(3) 川楝子,(4) 地肤子&…

如何实现两个视频融合EasyCVR平台的数据同步?详细步骤指南

有用户咨询,现场需要数据库同步,如何将两个EasyCVR平台的数据进行同步呢? 这篇文章我们将详细介绍如何通过简单的接口调用,高效完成两个平台的数据同步操作。 1)获取token 使用Postman调用登录接口,获取…

WindowsPE文件格式入门05.PE加载器LoadPE

https://bpsend.net/thread-316-1-1.html LoadPE - pe 加载器 壳的前身 如果想访问一个程序运行起来的内存,一种方法就是跨进程读写内存,但是跨进程读写内存需要来回调用api,不如直接访问地址来得方便,那么如果我们需要直接访问地址,该怎么做呢?.需要把dll注进程,注进去的代码…

使用Cusor 生成 Figma UI 设计稿

一、开发环境 系统:MacOS 软件版本: Figma(网页或APP版) 注:最好是app版,网页版figma 没有选项 import from manifest app下载地址:Figma Downloads | Web Design App for Desktops & …

Golang的文件同步与备份

Golang的文件同步与备份 一、Golang介绍 也称为Go语言,是谷歌开发的一种编程语言,具有高效的并发编程能力和出色的内存管理。由于其快速的编译速度和强大的标准库,Golang在网络应用、云平台和大数据等领域得到了广泛应用。 二、文件同步与备份…

如何用人工智能大模型,进行作业批改?

今天我们学习人工智能大模型如何进行作业批改。手把手学习视频请访问https://edu.csdn.net/learn/40402/666452 第一步,进入讯飞星火。打开google浏览器,输入百度地址后,搜索”讯飞星火”,在搜索的结果中,点第一个讯飞…

MATLAB之数据分析图系列 三

三维堆叠柱状图 Bar3StackPlot.m文件 clc; clear; close all; %三维堆叠柱状图 %% 数据准备 % 读取数据 load data.mat % 初始化 dataset X; s 0.4; % 柱子宽度 n size(dataset,3); % 堆叠组数%% 图片尺寸设置(单位:厘米) figureUnits c…

python爬虫:DrissionPage实战教程

如果本文章看不懂可以看看上一篇文章,加强自己的基础:爬虫自动化工具:DrissionPage-CSDN博客 案例解析: 前提:我们以ChromiumPage为主,写代码工具使用Pycharm(python环境3.9-3.10) …

一、STM32简介

一、实验器材介绍 二、STM32简介 1.STM32 名词解释 STM32是ST公司基于ARM Cortex-M内核开发的32位微控制器。 ST,指ST公司(意法半导体);M,MicroController 微控制器(MCU,MicroController Unit 微控制器单元/单片机&…

[ctfshow web入门] web2

前置知识 js是可以写在网页中,用于控制网页行为,例如现在表现出无法使用F12,常见用法校验前台登录时输入的邮箱格式是否正确 ‌view-source‌协议是一种早期就存在的协议,基本上所有主流浏览器都支持这一协议,因此用户…