【全网首发】上周申请的谷歌Gemini 1.5 Pro已通过!百万token的Gemini 1.5 Pro开箱测试(一)

news2025/1/18 18:49:31

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024谷歌一起变强。

一些结论

  1. 谷歌已开始陆续发放Gemini 1.5 Pro的体验权限,我是上周提交的waitlist申请,于昨天通过。

  2. Gemini 1.5 Pro是谷歌最新发布的一款Gemini系列模型,采用MoE架构,上下文窗口高达100万个tokens(对比目前GPT-4 Turbo的上下文窗口长度为128K,即12.8万个tokens),支持跨模态理解、分析和推理,即支持对图片和视频的分析。

  3. 逻辑推理测试结果:ChatGPT4.0 > 文心一言4.0 ≈ Gemini Ultra > Gemini 1.5 Pro

  4. 超长上下文测试结果:Gemini 1.5 Pro效果惊艳,测试对象是一本27万token的PDF电子书,Gemini 1.5 Pro均能正确的回答我提出的总结及查找、解释的问题。

上周申请的谷歌Gemini 1.5 Pro已通过!

我是Gemini 1.5发布第一天提交的waitlist申请,于昨天通过,等待时长大约1周。通过申请会收到一封主题为“It’s your turn to try Gemini 1.5 Pro”的邮件,点击“Try it now in Google AI Studio”即可在Google AI Studio体验Gemini 1.5 Pro模型。注意,目前是免费使用,那还要啥自行车,冲起来!

详细情况以及申请链接可以看我这篇文章: 重磅更新!谷歌发布Gemini 1.5 Pro!多模态,1000K上下文!附Waitlist链接!

谷歌Gemini系列模型介绍

谷歌的Gemini系列是谷歌最强大的多模态LLM模型,在图像、音频、视频和文本理解方面表现出优秀的能力。这一系列包括三个不同规模的模型:

Gemini 1.5 Pro

Gemini 1.5 Pro是谷歌最新发布的一款Gemini系列模型,采用MoE架构,上下文窗口高达100万个tokens(对比目前GPT-4 Turbo的上下文窗口长度为128K,即12.8万个tokens),支持跨模态理解、分析和推理,即支持对图片和视频的分析。

目前Gemini 1.5 Pro才刚刚发布,仅支持先申请waitlist,通过后可在Google AI Studio免费体验使用。

Gemini Ultra

Gemini Ultra:作为最大、功能最强大的类别,根据网上信息它的参数规模达到了1.56万亿,仅次于目前最先进的GPT-4(1.76万亿),在32个学术基准测试中的30个上刷新了SOTA(业内最佳)水平,甚至在MMLU测试集中超越了人类专家的得分12。

Gemini Ultra模型目前仅供Gemini Advanced付费会员使用。Gemini Advanced是谷歌推出的对标ChatGPT Plus的收费会员项目,费用为$20/月,附加2T的谷歌云盘空间,总体来看还是很香的!更重要的是,目前可以免费白嫖2个月的Gemini Advanced会员,详情请看我这篇文章: 来自谷歌的新年礼物!速来免费领取2个月谷歌Gemini Advanced会员!价值280元!对标ChatGPT Plus!

Gemini Pro

Gemini Pro:优化用于高级推理、规划和理解等任务,是一个强大的中等规模模型。

目前免费的Gemini用户即可使用这款模型,对标的是ChatGPT-3.5。并且谷歌免费提供Gemini Pro的API给用户使用,“AI信息Gap”公众号对话功能搭载的就是这款模型。

Gemini Nano

Gemini Nano:最高效的设备端任务模型。适用于移动设备,已经可以在诸如Pixel 8 Pro等设备上本地和离线运行,将人工智能的力量带到手机用户手中。

Gemini 1.5 Pro的优势

Gemini 1.5 Pro的核心功能包括:

  • 基于先进架构:Gemini 1.5 Pro采用了最新的Transformer和专家混合(MoE)架构,通过将网络分割成多个小型的“专家”网络来提高处理效率和精确度。这种架构使得模型能够根据输入类型自动选择最相关的专家路径,从而实现更高的运算效率和更准确的数据处理。

  • 扩展的上下文窗口:Gemini 1.5 Pro的上下文窗口容量显著增加,能够处理高达1百万个tokens,极大地扩展了模型处理和理解大规模数据集的能力。这一特性使得Gemini 1.5 Pro在分析、分类和总结复杂信息方面具有显著优势。

  • 高度复杂的信息处理能力:得益于其扩展的上下文窗口,Gemini 1.5 Pro能够无缝处理、分析和总结大量的文本、代码、视频和音频数据,包括但不限于长篇文档、大规模代码库和长时间的多媒体内容。

  • 跨模态理解和推理:Gemini 1.5 Pro在不同模态之间展现了高度复杂的理解和推理能力,能够准确分析视频内容、解析大量代码,并在多种数据类型中识别细节和模式。

Gemini 1.5 Pro初步测评

Gemini 1.5 Pro申请通过后,在Google AI Studio可以切换模型,切换到Gemini 1.5 Pro后,上方的图片Image和视频Video插入选项就自动开启,意味着可以插入图片和视频让Gemini 1.5 Pro进行分析。

逻辑推理测试

先来一道逻辑测试的经典题目,该题目ChatGPT4.0和文心一言4.0均回答正确,通过测试。

提示词:小明从A班调去了B班,结果A和B两个班的平均分都比上升了,请问这是为什么?

Gemini 1.5 Pro的回答:

小明从A班调去B班后,A、B两班的平均分都上升,可能的原因有以下几种:

  1. 小明的成绩高于两班的平均分:
    • 当小明离开A班时,A班失去了一个高分成员,导致平均分下降。而B班加入了小明这个高分成员,平均分就上升了。

  2. 小明在B班的学习环境更适合他:
    • 小明可能在B班的学习氛围、教学方式等方面更适应,学习效率提高,成绩进步,进而拉高了B班的平均分。同时,A班缺少了小明,平均分也可能略微下降。

  3. 其他因素:
    • 除了小明的影响,其他因素也可能导致两班平均分变化,例如:
      • 两班的教学质量同时提高。

      • 两班学生整体学习态度更加积极。

      • 考试难度变化等。

需要注意的是,以上只是几种可能性,具体原因需要结合实际情况进行分析。

Gemini Ultra的回答:

小明从A班调去B班后,A和B两个班的平均分都上升了,可能有以下几个原因:

1. 小明的成绩在A班偏低,在B班偏高。

  • 这种情况可能是由于A班的整体水平较高,导致小明的成绩在A班排名靠后,而B班的整体水平相对较低,小明的成绩在B班排名靠前。

  • 也有可能是由于小明在A班没有得到足够的重视和帮助,导致成绩不理想,而到了B班后,得到了老师和同学的更多关注和帮助,成绩有所提高。

2. 小明的调动改变了两个班的学生构成,导致了平均分的变化。

  • 由于小明的调动,A班少了一个成绩较低的学生,B班多了一个成绩较高的学生,这会导致两个班的平均分都发生变化。

  • 此外,小明的调动也可能对其他学生的学习产生影响,例如,小明的离开可能导致A班的学生更加努力学习,而小明的到来可能激励B班的学生更加积极学习,从而导致两个班的平均分都上升。

3. 其他因素。

  • 例如,两个班的考试难度不同,或者两个班的老师教学水平不同,也可能导致平均分的变化。

具体是哪种原因导致了两个班的平均分上升,需要进一步分析数据才能确定。

以下是一些可以帮助分析的数据:

  • 小明在A班和B班的成绩

  • A班和B班所有学生的成绩

  • A班和B班的考试难度

  • A班和B班老师的教学水平

通过分析这些数据,可以判断小明的调动对两个班平均分的影响程度,以及导致平均分变化的原因。

总结

推理能力:ChatGPT4.0 > 文心一言4.0 ≈ Gemini Ultra > Gemini 1.5 Pro

Gemini Ultra的回答基本正确,但存在一定程度的幻觉,我个人感觉还是因为对中文题目的理解程度不够好导致的审题问题,但确实也指出了正确的答案。Gemini 1.5 Pro的回答错误,产生了幻觉。

超长上下文信息查询测试

接下来测试Gemini 1.5 Pro的核心特点,100万窗口上下文。首先我上传了一本开源的《Algorithms》算法教材,作者是Jeff Erickson教授。可以看到,这本书的总token数为27万多,已经远超了GPT-4的上下文(128K)和Claude的上下文窗口长度(20万)。

总结

提示词:中文总结这本书的内容

Gemini 1.5 Pro的回答:

细节查询

提示词:请根据我上传的PDF,查找出关于Edmonds and Karp’s Algorithms - Fattest Augmenting Paths的介绍,详细解释和分析这个算法及其时间复杂度。用中文回复。

Gemini 1.5 Pro的回答:

提示词:如何用动态规划DP来找出一棵树上的largest independent set,详细写出算法的每一步,以及分析其时间复杂度。用中文回复。

Gemini 1.5 Pro的回答:

总结

初步测试来看,Gemini 1.5 Pro效果惊艳,不愧是号称百万token的上下文窗口,这在全世界范围内来看,也是最大的上下文了。测试对象是一本27万token的PDF电子书,Gemini 1.5 Pro均能正确的回答我提出的总结及查找、解释的问题。


精选推荐

  1. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  2. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  3. 字节开发的Coze进阶使用:用免费的GPT4打造一个专属的新闻播报机器人!附教程及提示词Prompt

  4. 盘点那些免费的AI对话工具(国内篇):国内TOP3 AI聊天机器人产品介绍

  5. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(一)

  6. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(二)

  7. 人工智能时代的领跑者:你必须了解的全球三大AI聊天机器人!

  8. 抖音出的AI工具火了!自动生成抖音文案,一键脚本数字人成片!

  9. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!

  10. 腾讯AI虽迟但到:腾讯文档AI开启公测!附申请地址及详细教程!


都读到这里了,点个赞鼓励一下吧😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1470128.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【接口加密】接口加密的未来发展与应用场景

目录 3.1 接口加密与区块链技术的结合 3.1.1 区块链技术的安全特性与优势 3.1.2 接口加密在区块链中的应用案例 3.2 接口加密与物联网安全 3.2.1 物联网安全的挑战与需求 3.2.2 接口加密在物联网领域的实际应用 3.3 接口加密在金融与电子商务领域的应用 随着信息技术的不…

【初始RabbitMQ】延迟队列的实现

延迟队列概念 延迟队列中的元素是希望在指定时间到了之后或之前取出和处理消息,并且队列内部是有序的。简单来说,延时队列就是用来存放需要在指定时间被处理的元素的队列 延迟队列使用场景 延迟队列经常使用的场景有以下几点: 订单在十分…

Spring Boot 笔记 025 主界面

1.1 路由搭建 1.1.1 安装vue router npm install vue-router4 1.1.2 在src/router/index.js中创建路由器,并导出 import { createRouter, createWebHistory } from vue-router//导入组件 import LoginVue from /views/Login.vue import LayoutVue from /views/La…

设计模式学习笔记 - 面向对象 - 8.实践:贫血模型和充血模型的原理及实践

1.Web开发常用的贫血MVC架构违背OOP吗? 前面我们依据讲过了面向对象四大特性、接口和抽象类、面向对象和面向过程编程风格,基于接口而非实现编程和多用组合少用继承设计思想。接下来,通过实战来学习如何将这些理论应用到实际的开发中。 大部…

Redis实现滑动窗口限流

常见限流算法 固定窗口算法 在固定的时间窗口下进行计数,达到阈值就拒绝请求。固定窗口如果在窗口开始就打满阈值,窗口后半部分进入的请求都会拒绝。 滑动窗口算法 在固定窗口的基础上,窗口会随着时间向前推移,可以在时间内平滑控…

对象池模板

概述 对象池的引入也是嵌入式开发的常用方法,也是内存预分配的一种,主要是用来隐藏全局对象的跟踪,通常预内存分配是通过数组来实现。 CMake配置 cmake_minimum_required(VERSION 3.5.1)project(objpool)add_executable(objpool objpool.cp…

2024“薪”风口、学习鸿蒙开发就业钱景如何?

随着华为的鸿蒙系统从诞生之初就备受关注,对于那些对鸿蒙开发感兴趣并希望在这一领域寻找职业发展的人来说,这是一个非常重要的问题。 那么,2024年学鸿蒙开发的就业前景如何呢? 一、彻底摆脱“安卓套壳”! HarmonyO…

JVM垃圾收集器【如何找到垃圾、清除垃圾的算法、垃圾回收器】

JVM垃圾收集器 GC基本原理垃圾回收什么是垃圾?如何找到这个垃圾?1)引用计数法(Reference Counting)2)根可达算法(GCRoots Tracing)3)回收过程4)对象引用 清除垃圾的算法…

Excel的中高级用法

单元格格式,根据数值的正负分配不同的颜色和↑ ↓ 根据数值正负分配颜色 2-7 [蓝色]#,##0;[红色]-#,##0 分配颜色的基础上,根据正负加↑和↓ 2↑-7↓ 其实就是在上面颜色的代码基础上加个 向上的符号↑,或向下的符号↓ [蓝色]#,##0↑;[红色…

AI时代显卡如何选择,B100、H200、L40S、A100、H100、V100 含架构技术和性能对比

AI时代显卡如何选择,B100、H200、L40S、A100、H100、V100 含架构技术和性能对比。 英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑。 近期,AIGC领域呈现出一片繁荣景象&a…

wcf 简单实践 数据绑定 数据校验

1.概要 1.1 说明 数据校验&#xff0c;如果数据不合适&#xff0c;有提示。 1.2 要点 class User : IDataErrorInfothis.DataContext user;<Window.Resources><Setter Property"ToolTip" Value"{Binding RelativeSource{RelativeSource Self},Pat…

vue3个人网站电子宠物

预览 具体代码 Attack.gif Attacked.gif Static.gif Walk.gif <template><div class"pet-container" ref"petContainer"><p class"pet-msg">{{ pet.msg }}</p><img ref"petRef" click"debounce(attc…

platform(驱动层+应用层)实现终端和中断开关点灯

设备树文件添加 myplatform{compatible"hqyj,myplatform";interrupt-parent<&gpiof>;interrupts<8 0>,<7 0>,<9 0>;led1-gpio<&gpioe 10 0>;led2-gpio<&gpiof 10 0>;led3-gpio<&gpioe 8 0>;reg<0x123…

什么是抖音视频下载软件|视频批量下载|爬虫工具

抖音视频抓取软件是一款方便用户获取抖音平台上视频内容的工具。它具备以下主要功能&#xff1a; 批量视频提取&#xff1a;用户可以输入关键词&#xff0c;软件将自动搜索抖音平台上与关键词相关的视频&#xff0c;并将它们列出供用户选择和下载。用户可以随时停止搜索和下载过…

测试C#使用PuppeteerSharp将网页生成PDF文件

微信公众号“DotNet开发跳槽”、“dotNET跨平台”、“DotNet”发布了几篇将网页生成图片或pdf文件的文章&#xff08;参考文献2-5&#xff09;&#xff0c;其中介绍了使用puppeteer-sharp、Select.HtmlToPdf、iTextSharp等多种方式实现html转图片或pdf&#xff0c;正好最近有类…

2024年危险化学品经营单位主要负责人证考试题库及危险化学品经营单位主要负责人试题解析

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 2024年危险化学品经营单位主要负责人证考试题库及危险化学品经营单位主要负责人试题解析是安全生产模拟考试一点通结合&#xff08;安监局&#xff09;特种作业人员操作证考试大纲和&#xff08;质检局&#xff09;特…

Linux之部署前后端分离项目

Nginx配置安装 1.安装依赖 我们这里安装的依赖是有4个的 [rootlocalhost opt]# yum -y install gcc zlib zlib-devel pcre-devel openssl openssl-devel 2.上传解压安装包 [rootlocalhost opt]# tar -xvf nginx-1.13.7.tar.gz -C /usr/local/java/3.安装Nginx &#xff0…

接口测试实战--自动化测试流程

一、项目前期准备 常见项目软件架构: springMvc:tomcat里运行war包(在webapps目录下) springboot:java -jar xx.jar -xms(**) 运行参数 springCloud:k8s部署,使用kubectl create -f xx.yaml 接口自动化测试介入需越早越好,只要api定义好就可以编写自动化脚本; 某个…

域名系统与IP地址分配

域名 域名的概述 域名是一个逻辑的概念&#xff0c;它不反映主机的物理地点 域名结构 由于数字形式的IP地址难以记忆和理解&#xff0c;为此人们采用英文符号来表示IP地址&#xff0c;这就产生了域名&#xff0c;域名长度不超过255各字符&#xff0c;每一层域名长度不超过6…

C语言中的函数设计与调用优化

大家好&#xff0c;今天给大家介绍C语言中的函数设计与调用优化&#xff0c;文章末尾附有分享大家一个资料包&#xff0c;差不多150多G。里面学习内容、面经、项目都比较新也比较全&#xff01;可进群免费领取。 一、引言 在C语言中&#xff0c;函数是代码组织的基本单元&…