Google大模型Bard更名Gemini,现在实力如何?(VS gpt系列)

news2024/11/19 3:50:12

名人说:一花独放不是春,百花齐放花满园。——《增广贤文》
作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)

目录

      • 一、简要介绍
        • 1、Gemini是什么?
        • 2、主要特点
        • 3、Gemini的版本
        • 4、应用潜力
        • 5、使用方法
      • 二、分类问题测试
        • 1、基础问答(5个)
        • 2、数学题解答(5个)
        • 3、逻辑推理(5个)
        • 4、创造性写作(3个)
        • 5、代码编写(3个)
        • 6、对话理解与情感交流(2个)
        • 7、翻译任务(1个)
        • 8、策略规划(1个)
      • 三、测试结果(仅代表个人观点)

★观前提示以下内容仅为测试内容,不代表未来新版本如何。

在本篇博客中,我们将一起探讨Google AI模型——Gemini。Gemini标志着Google在人工智能领域的一大飞跃,不仅因为它的先进技术,也因为它在多任务语言理解(MMLU)测试中首次超越了人类专家。这一成就显示了Gemini在知识获取和问题解决能力上的卓越性能,最初名称为Bard,最近赋名为了Gemini,那么它究竟如何,本篇内容将采用与上篇gpt3.5相同的问题来进行测试,最后会在测试感受出说一下对比gpt3.5它能力的强弱。

一、简要介绍

1、Gemini是什么?

在这里插入图片描述

Gemini 是 Google 开发的最新一代大型人工智能模型,代表了 Google 在人工智能领域的最新进展。它是一个跨部门协作的成果,由 Google 研究部的同事从头开始构建,具有多模态能力,能够处理、理解、操作并结合不同类型的信息,包括文本、代码、音频、图像和视频。Gemini 被设计为迄今为止 Google 最灵活的模型,旨在处理各种复杂的任务和挑战。

2、主要特点
  • 多模态能力:Gemini 能够无缝集成并处理文本、图像、音频和视频等多种类型的信息。
  • 超越人类专家的性能:在多个领域的测试中,特别是大规模多任务语言理解(MMLU)和小学数学推理(GSM8K)的测试中,Gemini Ultra 的性能超越了现有的最先进模型,包括GPT-4,甚至在某些领域超越了人类专家。
  • 高度灵活:Gemini 设计用于适应从大型数据中心到移动设备等不同的运行环境,支持各种规模的应用部署。
3、Gemini的版本
  • Gemini Ultra:针对最复杂任务的最强大版本,性能在多个学术基准上超过了GPT-4。
    例如官方公布的对比数据,在文本上:

在这里插入图片描述

在多模式上:

在这里插入图片描述

  • Gemini Pro:适合日常使用的版本,已集成到 Google 的 Bard 聊天机器人中,提升了其高级推理、规划和理解的能力。
  • Gemini Nano:设计用于嵌入移动设备,如谷歌Pixel手机,使大模型能够成为日常生活中的小助手。
4、应用潜力

由于其多模态处理能力,Gemini 可以在多种应用场景中大放异彩,包括自然语言处理(文本生成、文本摘要、翻译等)、高质量代码生成(支持 Python、Java、C++ 和 Go 等编程语言),以及处理超出编码范围的复杂问题,如涉及复杂数学和理论计算机科学的竞争性编程问题。

5、使用方法

官网注册使用即可:Gemini官网

在这里插入图片描述

了解了以上内容之后,咱们一起去测试体验一下:

二、分类问题测试

测试采用多类问题提问,以检验其多方面的功能。

1、基础问答(5个)
  • Q1: 澳大利亚的首都是哪座城市?(✔)
    在这里插入图片描述

  • Q2: 地球与太阳之间的距离是多少?(✔)

在这里插入图片描述

  • Q3: 水的沸点是多少度?(✔)
    在这里插入图片描述

  • Q4: 比萨斜塔在哪个国家?(✔)

在这里插入图片描述

  • Q5: 世界上最长的河流是哪一条?(✔)
    在这里插入图片描述

从回答来看,5个问题均正确✔,相比gpt3.5更加完善和全面。

2、数学题解答(5个)
  • Q1:小明有12个苹果,他想平均分给他的3个朋友(12个苹果分给3个人),请问每个朋友可以得到几个苹果?(小学难度 ✔)

在这里插入图片描述

  • Q2:已知直角三角形的一条直角边长为5cm,另一条直角边长为12cm,求斜边的长度。(初中难度 ✔)
    在这里插入图片描述
    在这里插入图片描述

结果算对了,但是中间则怎么突然冒出英文解释了?san值狂掉…

  • Q3:若一个二次函数表达式为 f ( x ) = a x 2 + b x + c ( a ≠ 0 ) f(x) = ax^2 + bx + c (a≠0) f(x)=ax2+bx+c(a=0),已知f(1)=0,f(2)=3,且f(x)图像经过点(3,10),请求出a、b、c的具体值。(初中难度 ✔)

在这里插入图片描述

  • Q4:在平面直角坐标系中,曲线C的方程为 y = x 3 − 6 x 2 + 9 x + 10 y = x^3 - 6x^2 + 9x + 10 y=x36x2+9x+10,求曲线C过原点处的切线方程。(高中难度 ✔)

在这里插入图片描述

这题虽然解对了,但是与gpt3.5一样用到了一些高等数学的知识,这里要注意甄别。

  • Q5:计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。(大学基础难度 ✔)

在这里插入图片描述

gpt3.5在大学基础难度的题出了错,而Gemini此处求解正确。

3、逻辑推理(5个)
  • Q1: 如果所有猫都喜欢吃鱼,而Tom是一只猫,那么Tom会喜欢吃鱼吗?(✔)
    在这里插入图片描述

一般的判断答案应该是喜欢,但是它的回答不无道理,因此也可看作对的。

  • Q2: 假设A>B且B>C,请问A是否一定大于C?(✔)
    在这里插入图片描述

一般的判断答案应该是A大于C,但是它的回答考虑范围更广,因此也是对的。

  • Q3: 你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?(✔)

在这里插入图片描述

gpt3.5在这里出现了计算错误。

  • Q4: 有一个没有刻度的长方形的塑料盒子,没有盖子,它的容积是1升。请问如果只能使用这个盒子称量依次,能够准确地量出多少升的水?(半✔半✖)

在这里插入图片描述

正确答案:如果只能使用这个盒子称量一次,能够正确地量出 0.5 升的水。也能量出 1/6 升,将长方形盒子倾斜,水位到达盒子的上一边及底下的边线即可。

  • Q5: 72、36、24、18、( )(✖)
    在这里插入图片描述

正确答案:14.4

4、创造性写作(3个)
  • Q1: 请续写一个故事开头:“在一个寒冷的冬夜,小镇图书馆的灯突然熄灭了……”
    在这里插入图片描述

写的偏对话式的故事,不过也算有头有尾。

  • Q2: 编写一首关于秋天落叶的五言律诗。
    在这里插入图片描述

相比于gpt3.5,此处出现了语意理解错误以及常识性错误。

  • Q3: 写一个关于人工智能与人关系的短篇小说。
    在这里插入图片描述

前后逻辑性还不错,但是小说的情节过于简单流水化,不具有创新性。

5、代码编写(3个)
  • Q1: 用Python编写一个函数,用于判断一个数是否为质数。

在这里插入图片描述

Gemini所写代码如下:

def is_prime(n):
    """
    判断一个数是否为质数

    Args:
      n: 要判断的数

    Returns:
      True 如果n是质数,False 如果不是
    """

    if n <= 1:
        return False

    if n % 2 == 0 and n != 2:
        return False

    for i in range(3, int(n ** 0.5) + 1, 2):
        if n % i == 0:
            return False

    return True

print(is_prime(13))  # True
print(is_prime(15))  # False

在这里插入图片描述

  • Q2: 用Python编写一个程序,检查一个字符串是否为回文(正读反读都一样的词)。
    在这里插入图片描述

Gemini所写代码如下:

def is_palindrome(s):
    """
    检查一个字符串是否为回文

    Args:
      s: 要检查的字符串

    Returns:
      True 如果s是回文,False 如果不是
    """

    s = s.lower()  # 将字符串转换为小写
    s = "".join(ch for ch in s if ch.isalnum())  # 删除非字母数字字符

    return s == s[::-1]  # 将字符串反转并与原字符串比较


print(is_palindrome("racecar"))  # True
print(is_palindrome("madam"))  # True
print(is_palindrome("hello"))  # False

在这里插入图片描述

测试了下,成功运行并得到正确反馈。

  • Q3: 用Python编写一个程序,实现二叉树的深度优先搜索(DFS),并返回所有节点的遍历顺序。
    在这里插入图片描述
def dfs(root):
    """
    实现二叉树的深度优先搜索

    Args:
      root: 二叉树的根节点

    Returns:
      所有节点的遍历顺序
    """
    if root is None:
        return []
    result = []
    # 递归访问左子树
    result += dfs(root.left)
    # 访问根节点
    result.append(root.val)
    # 递归访问右子树
    result += dfs(root.right)
    return result
class TreeNode:
  def __init__(self, val):
    self.val = val
    self.left = None
    self.right = None

root = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)
root.left.left = TreeNode(4)
root.left.right = TreeNode(5)

print(dfs(root))  # [4, 2, 5, 1, 3]

在这里插入图片描述

6、对话理解与情感交流(2个)
  • Q1: 我今天心情不好,能给我讲个笑话吗?
    在这里插入图片描述

这个笑话,且别说,get到笑点了

  • Q2: 你能帮我分析一下最近压力大的原因,并提供缓解压力的方法吗?

在这里插入图片描述

给的方法不错,几个建议挺有道理,分解任务,学会说“不”,寻求帮助。

7、翻译任务(1个)
  • Q: 将这段文字翻译成英语:“张骞(Zhang Qian)是中国第一个伟大的探险家。他不畏艰险,克服重重困难,两次出使西域,开通了中国同西亚和欧洲的通商关系,将中国的丝和丝织品运往西亚和欧洲,开拓了历史上著名的“丝绸之路”。同时,他又将西域的风土人情、地理文化以及特有物种等介绍到中原,极大地开阔了人们的视野。
    正如历史学家所指出的那样,如果没有张骞出使西域,就不可能有丝绸之路的开辟,也就不会有汉朝同西域或欧洲的文化交流。”(六级翻译原题

在这里插入图片描述

翻译着…怎么还拓展了???

  • Q: 再将这段英语翻译成中文

在这里插入图片描述

整体可以看出,翻译效果是不错,但是语意理解上跟gpt模型还是有一定差距的。

8、策略规划(1个)
  • Q: 假设你是某初创公司的CEO,公司在市场扩张过程中遇到了资金短缺问题,你将如何制定一份详尽的战略计划,既保证业务持续增长又能吸引新的投资者?

在这里插入图片描述

这计划还不错,但是跟gpt3.5一样的通病在于流水账,很多描述上偏流水化,没有像人一样在交流时的创造性和灵活性。

本次测评就到这里,接下来总结一下感受。

三、测试结果(仅代表个人观点)

根据之前使用3.5和4的感受,Gemini整体实力大概在gpt3.5 - 4之间的水平,小部分能力确实超过了4,但综合实力gpt4目前更强一些。至于官方公布的实力对比,可能是付费版本,或预览版本之间的比较,笔者对此尚存疑惑,不在此表态,欢迎大家评论谈一下你们的观点。

不过从gpt3.5到今天的Gemini,给我一个感受就是,铁打的流水(机器人)很长一段时间内不可能完全替代有创造性的人。相比于担心AI发展太快,不如精进技术,做AI的引领者!

关于测试暂时测试这些,很感谢你能看到这里,如有相关疑问,还请下方评论留言。
Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
如果对大家有帮助的话,希望大家能多多点赞+关注!这样我的动力会更足!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1478847.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Pytorch深度学习开发实践学习】【AlexNet】经典算法复现-Pytorch实现AlexNet神经网络(1)model.py

算法简介 AlexNet是人工智能深度学习在CV领域的开山之作&#xff0c;是最先把深度卷积神经网络应用于图像分类领域的研究成果&#xff0c;对后面的诸多研究起到了巨大的引领作用&#xff0c;因此有必要学习这个算法并能够实现它。 主要的创新点在于&#xff1a; 首次使用GPU…

PyTorch-Ignite的介绍与快速上手

PyTorch-Ignite 是一个用于 PyTorch 的高级库&#xff0c;旨在帮助开发者更快、更简洁地编写可复用的代码来进行深度学习实验。它由 PyTorch 社区开发&#xff0c;提供了一套灵活的抽象&#xff0c;用于构建和管理训练和验证循环&#xff0c;而无需牺牲 PyTorch 的灵活性和强大…

四、《任务列表案例》后端程序实现和测试

本章概要 准备工作功能实现前后联调 4.1 准备工作 数据库脚本 CREATE TABLE schedule (id INT NOT NULL AUTO_INCREMENT,title VARCHAR(255) NOT NULL,completed BOOLEAN NOT NULL,PRIMARY KEY (id) );INSERT INTO schedule (title, completed) VALUES(学习java, true),(学…

电力运维是做什么的?电力行业智能运维工作内容?

电力行业智能运维工作内容具体涉及哪些关键任务&#xff1f;实施智能运维过程中&#xff0c;如何利用现代信息技术、人工智能和大数据分析来提升电力系统的运行效率与维护响应速度?在电力行业中引入智能运维后&#xff0c;对于预防性维护、故障诊断、设备寿命预测以及成本控制…

react native中如何实现tab切换页面以及页面可以左右滑动效果

react native中如何实现tab切换页面以及页面可以左右滑动效果 效果示例图主体代码 效果示例图 主体代码 import React, {useRef, useState} from react; import {View,ScrollView,Text,StyleSheet,Dimensions,Animated, } from react-native; import {pxToPd} from ../../comm…

Linux系统——LAMP架构

目录 一、LAMP架构组成 1.LAMP定义 2.各组件的主要作用 3.CGI和FastCGI 3.1CGI 3.3CGI和FastCGI比较 4.PHP 4.1PHP简介 4.2PHP的Opcode语言 4.3PHP设置 二、LAMP架构实现 1.编译安装Apache httpd服务 2.编译安装Mysql 3.编译安装PHP 4.安装论坛 5.搭建博客 W…

力扣区间题:合并区间、插入区间

我们可以将区间按照左端点升序排列&#xff0c;然后遍历区间进行合并操作。 我们先将第一个区间加入答案&#xff0c;然后依次考虑之后的每个区间&#xff1a; 如果答案数组中最后一个区间的右端点小于当前考虑区间的左端点&#xff0c;说明两个区间不会重合&#xff0c;因此…

当大语言模型遇到AI绘画-google gemma与stable diffusion webui融合方法-矿卡40hx的AI一体机

你有想过建一台主机&#xff0c;又能AI聊天又能AI绘画&#xff0c;还可以直接把聊天内容直接画出来的机器吗&#xff1f; 当Google最新的大语言模型Gemma碰到stable diffusion webui会怎么样&#xff1f; 首先我们安装stable diffusion webui(automatic1111开源项目&#xff…

【基于ChatGPT大模型】GIS应用、数据清洗、统计分析、论文助手、项目基金助手、科研绘图、AI绘图

以ChatGPT、LLaMA、Gemini、DALLE、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮&#xff0c;可以面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算法学习、论文检索、写作、翻译、润色、文献辅助…

Google Genie:创意互动环境

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

渗透测试靶场环境搭建

1.DVWA靶场 DVWA&#xff08;Damn Vulnerable Web Application&#xff09;是一个用来进行安全脆弱性鉴定的PHP/MySQL Web应用&#xff0c;包含了OWASP TOP10的所有攻击漏洞的练习环境&#xff0c;旨在为安全专业人员测试自己的专业技能和工具提供合法的环境&#xff0c;同时…

完美解决git 执行git push origin master指令 报错command not found

问题描述 报错信息为&#xff1a;在提交项目时的操作&#xff1a;找不到命令行 解决方案 &#xff08;1&#xff09;可以通过如下命令进行代码合并【注&#xff1a;pullfetchmerge】 git pull --rebase origin master&#xff08;2&#xff09;再执行语句&#xff1a; git p…

Linux(CentOS)学习

一、认识Linux 1、如何修改Linux时区 2、配置固定IP 3、重启网络服务 3、小技巧快捷键 4、环境变量设置 5、Linux文件的上传和下载 6、压缩和解压 二、基础命令 1、目录命令 (1、)查看目录内容&#xff08;ls&#xff09; 1、ls //查看当前目录内容 2、- a //显示隐藏内容 3…

Spatom——利用图神经网络进行蛋白质-蛋白质结合位点预测的新工具

介绍一个蛋白质-蛋白质结合位点预测的新工具——Spatom&#xff0c;这是一个图神经网络框架。其发布在brief in bioinformatics上面。 Paper and tool links 文章&#xff0c;网页工具和github链接如下 paper link: Spatom: a graph neural network for structure-based prot…

lv20 QT事件

1 事件模型 2 事件处理 virtual void keyPressEvent(QKeyEvent *event) virtual void keyReleaseEvent(QKeyEvent *event) virtual void mouseDoubleClickEvent(QMouseEvent *event) virtual void mouseMoveEvent(QMouseEvent *event) virtual void mousePressEvent(QMou…

【Android12】Monkey压力测试源码执行流程分析

Monkey压力测试源码执行流程分析 Monkey是Android提供的用于应用程序自动化测试、压力测试的测试工具。 其源码路径(Android12)位于 /development/cmds/monkey/部署形式为Java Binary # development/cmds/monkey/Android.bp // Copyright 2008 The Android Open Source Proj…

《PyTorch深度学习实践》第九讲多分类问题

一、 1、softmax的输入不需要再做非线性变换&#xff0c;也就是说softmax之前不再需要激活函数。softmax两个作用&#xff0c;如果在进行softmax前的input有负数&#xff0c;通过指数变换&#xff0c;得到正数。所有类的概率求和为1。 2、y的标签编码方式是one-hot。one-hot是…

java爬取深圳新房备案价

Java爬取深圳新房备案价 这是我做好效果,一共分3个页面 1、列表;2、统计;3、房源表 列表 价格分析页面 房源页面 一、如何爬取 第一步:获取深圳新房备案价 链接是:http://zjj.sz.gov.cn/ris/bol/szfdc/index.aspx 第二步:通过楼盘名查询获取明细 链接:http://z…

就业班 2401--2.27 Linux Day6--管道和重定向

管道与重定向 只有在开水里&#xff0c;茶叶才能展开生命浓郁的香气. 一、重定向 标准输入、标准正确输出、标准错误输出 进程在运行的过程中根据需要会打开多个文件&#xff0c;每打开一个文件会有一个数字标识。这个标识叫文件描述符。 进程使用文件描述符来管理打开的文件…

Android PDFView 提示401 pom

背景 在开发安卓app&#xff0c;使用PDF组件来解析URL地址 &#xff0c;从github找到一个开源组件 AndroidPdfViewer 遇到一个大坑&#xff0c;一直提示下载依赖401 pom 打开控制台链接弹出需要登录jitpack 原因分析&#xff1a; 这个组件项目依赖库链接到了需要鉴权的…