OceanGPT:面向海洋科学的大型语言模型初探

news2024/9/21 20:28:15

9fe9d8e0339ad9e2eecbb1442743ae3e.gif

海洋覆盖了约 71% 的地球表面,对全球的气候调节、天气模式、生物多样性以及人类的经济发展都扮演着至关重要的角色。海洋科学专注于研究海洋的自然特性、其变化规律以及与海洋资源开发和利用相关的理论、方法与应用。

本文介绍一个为海洋领域打造的大型语言模型——OceanGPT。如图 1 所示,该模型可处理海洋科学的问答和内容生成任务。此外,本文还尝试验证大模型模拟操控水下机器人,探索大模型驱动的水下具身智能的实现。OceanGPT 提供预训练模型的开源下载。

a0667542c628b5b45aebd1becf01f40b.png

论文标题:

OceanGPT: A Large Language Model for Ocean Science Tasks

论文链接:

https://arxiv.org/abs/2310.02031

项目主页:

https://www.zjukg.org/project/OceanGPT

模型下载:

https://huggingface.co/zjunlp/oceangpt-7b

7a3248b832fb1cf92a93a24e208ff41d.png

▲ 图1 OceanGPT海洋科学问答能力

3664a3bc6b4a5f31e54d6884e17a4767.png

OceanGPT训练

1.1 海洋领域预训练

为了训练 OceanGPT,本文构建了专门针对海洋领域的的预训练语料。首先,从开放获取的论文文献中收集文档作为原始语料库,并使用工具将文献文件的内容转化为纯文本。为确保数据的质量,对收集的数据集进行进一步使用正则表达式过滤掉了图表、标题、页眉、页脚、页码、URL 和引用。此外,还过滤了多余的空格、换行符和其他非文本字符。

处理后的文档涵盖了海洋科学的各个领域,如海洋物理学、海洋化学、海洋生物学、地质学、水文学等。此外采用了基于哈希的方法对数据进行去重,这有助于在预训练期间降低过拟合的风险,提高其泛化能力。

1.2 基于多智能体协同的指令数据生成与微调

在指令微调阶段,为了能够解决海洋领域数据难获取的问题,本文设计了一个全新的基于多智能体协同配合的指令数据生成与处理框架—DoInstruct,其能够自动化地收集和生成大量海洋领域指令数据。如图 2 所示,DoInstruct 的海洋数据生成框架依托于大模型多智能体的协作来自动化地生成大量海洋科学指令数据。

f49a5c610f42b75bb5af9e8a11c6eeda.png

▲ 图2 海洋指令构建的算法框架

具体来说,每个海洋智能体会扮演对应海洋专家角色,比如扮演海洋生物、海洋气象等子领域的专家。整个框架分为两部分,一部分利用演化算法来不断迭代增加海洋种子数据的知识丰富度,另一部分则训练单独的智能体专门负责从海洋科学文献中抽取数据来提升知识专业度。最后,与海洋科学相关的人工规则被作为提示来确保智能体生成指令数据的质量。

e80e4ecdaa876b30e63d9df57bfaae2f.png

OceanGPT评测

2.1 构建海洋领域大模型评测基准-OceanBench

本文构建了一个海洋领域评测基准数据集,它可以系统性地评估大语言模型在海洋领域的性能。如图 3 所示,经过自动化评估和人工评估,本文发现 OceanGPT 在 15 个海洋科学任务上表现出相对较好的性能。

21641b949ac00b8971b19a72c86f9087.png

11623c621396e5bd0dcdd2628d97c510.png

▲ 图3 OceanBench实验效果对比

2.2 深入分析海洋大模型的能力 

51da8d52a82f9f9df8579a443a66b117.png

▲ 图4 OceanGPT在海洋科学问答场景的效果

对于海洋科学问答场景,OceanGPT 在知识丰富度和专业度中展示出更好的效果。具体而言,OceanGPT 在描述如海洋放射性核素防护等研究内容时展现出相对更高的领域知识专长,其文本内容不仅结构清晰、组织有序,而且全面覆盖了放射性核素研究的各个方面,比如从实验设计到数据分析,再到风险评估和处置指南等。

1b3f2f23947f88b024303c52012a452c.png

▲ 图5 OceanGPT在模拟操作水下机器人的效果(基于Gazebo模拟器)

进一步的,本文探究了 OceanGPT 在模拟操作海洋机器人的能力。通过将代码指令整合到了模型的指令数据中,经训练后发现 OceanGPT 在一定程度上可依靠人类指令来操作水下机器人,使机器人执行基本的路径控制操作。OceanGPT 对海洋机器人的交互进行了初步尝试,可以为大模型驱动的水下具身智能的实现提供参考。

f8682e166a96f18f3cef5dafe059c066.png


使用OceanGPT

本文在 Hugging Face (https://huggingface.co/zjunlp/OceanGPT-7b) 中提供了 OceanGPT 的使用简易教程。执行以下脚本即可加载和使用 OceanGPT。

>> from transformers import pipeline
>> pipe = pipeline("text-generation", model="zjunlp/OceanGPT-7b")
>> from transformers import AutoTokenizer, AutoModelForCausalLM
>> tokenizer = AutoTokenizer.from_pretrained("zjunlp/OceanGPT-7b")
>> model = AutoModelForCausalLM.from_pretrained("zjunlp/OceanGPT-7b")

OceanGPT 还提供了一个如图 6 所示的在线交互演示系统,并计划在未来更新模型以进一步提升海洋科学任务的能力。更多详情请参阅论文原文。

52722f007d053a60903e62087dc3a1d9.png

▲ 图6 OceanGPT演示系统

更多阅读

a14d656e557c5e4fdcceaf21e498d524.png

e605a7334e5b2c41bb9b6f737867d8a8.png

4d16a571d426fe809515439ff86ed2e5.png

f3d2f5b4286b20b231938332922c0369.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

d9f2a2878d6c349300d242063f7e7276.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

77f61a98f2d72846cfa85610274c5b89.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1135315.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分享一款低损耗 高效率高性能 低 VCE(sat) 晶体管 NSS60600MZ4T1G

关于低 VCE(sat) 晶体管? 是指其饱和电压 VCE(sat) 很低的晶体管。VCE(sat) 是指晶体管在饱和区时,集电极与发射极之间的电压降。低 VCE(sat) 晶体管的优点是在同样的电流下,其 VCE(sat) 更低,因此能够降低电路总成本&#xff0c…

Python的web自动化学习(二)Selenium安装和环境配置

前置条件: 1、安装Python并配置环境变量 2、安装编辑器PyCharm Seleenium安装 正文如下: python常见安装命令: 首先电脑 winR 打开 输入cmd,回车,使用pip安装selenium: 也可以使用命令:…

工作中出现什么「迹象」,表明你应该换工作了?

作者:苍何,CSDN 2023 年 实力新星,前大厂高级 Java 工程师,阿里云专家博主,土木转码,现任部门技术 leader,专注于互联网技术分享,职场经验分享。 🔥热门文章推荐&#xf…

ITOT强强联合,得帆信息X树根互联打造工业制造融合解决方案

上海得帆信息技术有限公司(以下简称“得帆”)和树根互联股份有限公司(以下简称“树根互联”)携手推出了创新性的IT/OT融合产品解决方案,为制造型企业提供了一站式轻量级工业互联网平台。 --- 填补大型制造企业在IT建…

一秒推软文发稿平台:优质客户服务的承诺

在互联网时代,软文发稿已经成为企业推广和营销的重要手段之一。通过发布优质的软文内容,企业可以提升品牌知名度、引流潜在客户、增加销售业绩。然而,对于企业而言,选择一家可靠、专业的软文发稿平台至关重要。在众多的选择中&…

SpringMVC Day02 : 请求方式

前言 欢迎阅读 Spring MVC 系列教程的第二篇文章!在上一篇文章中,我们介绍了 Spring MVC 的基本概念和使用方法。今天,我们将深入探讨 Spring MVC 中不同的请求方式,以及如何在你的应用程序中正确地处理它们。 在 Web 开发中&am…

转转闲鱼交易猫三合一后台源码

1、一键添加商品,商品管理,一键分享功能,包括卡框功能 这个样式图就是后台生成完的一个链接截图 后台一键生成,独立后台管理 教程:修改conf数据库账号密码 不会的可以看源码里有搭建教程 下载程序:htt…

基于教与学算法的无人机航迹规划-附代码

基于教与学算法的无人机航迹规划 文章目录 基于教与学算法的无人机航迹规划1.教与学搜索算法2.无人机飞行环境建模3.无人机航迹规划建模4.实验结果4.1地图创建4.2 航迹规划 5.参考文献6.Matlab代码 摘要:本文主要介绍利用教与学算法来优化无人机航迹规划。 1.教与学…

操作系统:计算机系统概述

一战成硕 1.1 手工操作阶段1.2 批处理阶段1.3 分时操作系统1.4 实时操作系统1.5 中断和异常的概念1.6 系统调用 1.1 手工操作阶段 1.2 批处理阶段 单道批处理系统 自动性 顺序性 单道性多道批处理系统 多道 宏观上并行 微观上串行 优点:资源利用率高,多…

2023年【四川省安全员B证】考试报名及四川省安全员B证找解析

题库来源:安全生产模拟考试一点通公众号小程序 2023年四川省安全员B证考试报名为正在备考四川省安全员B证操作证的学员准备的理论考试专题,每个月更新的四川省安全员B证找解析祝您顺利通过四川省安全员B证考试。 1、【多选题】下列关于钢筋临边防护栏杆…

[Unity3D]图片格式自定义MaxSize

如何适用 只需在“项目”窗口中创建一个名为“编辑器”的文件夹,然后在其中添加此脚本即可。然后,打开Window-Custom Max Size Setter,选择一个或多个纹理并调整其最大尺寸值。 由于 NPOT 纹理大小不能很好地与压缩算法配合使用,…

分布式系统的链路追踪,让你轻松解决订单无法查看的问题!

你好,我是积极活泼的小米!今天我要跟大家聊聊分布式系统的链路追踪,这个话题对于我们在技术领域工作的小伙伴们来说,可是非常重要的哦! 背景 昨天,产品大佬丰哥找到了我,他抱怨说分销员的订单…

【C++杂货铺】C++11特性总结:列表初始化 | 声明 | STL的升级

文章目录 一、C11简介二、统一的列表初始化2.1 { } 初始化2.2 列表初始化在内置类型上的应用2.3 列表初始化在内置类型上的应用2.4 initializer_list2.4.1 {1, 2, 3} 的类型2.4.2 initializer_list 使用场景2.4.3 模拟实现的 vector 中的 { } 初始化和赋值 三、声明3.1 auto3.1…

【小尘送书-第九期】《Excel数据透视表应用大全for Excel 365 Excel 2019》

大家好,我是小尘,欢迎你的关注!大家可以一起交流学习!欢迎大家在CSDN后台私信我!一起讨论学习,讨论如何找到满意的工作! 👨‍💻博主主页:小尘要自信 &#x1…

OTA语音芯片NV040C在智能电动牙刷的应用

以往我们对牙齿的清洁是使用的是手动方式进行,用柔软的牙刷刷毛去进行牙齿的清洁。但现在我们拥有了一种新颖的刷牙方式,靠电力去驱动、清洁我们的牙齿。电动牙刷的刷头通过快速旋转,产生高频振动,将牙膏迅速分解为细小的泡沫&…

基于Java的医院预约挂号管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding) 代码参考数据库参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者&am…

SiteGround主机最新购买使用指南及外贸建站教程

SiteGround是一家知名的虚拟主机服务提供商,它在过去几年中在WordPress和WooCommerce建站领域取得了显著的发展和改进。SiteGround致力于为用户提供专门针对WordPress优化的虚拟主机,并将WordPress深度集成到其主机服务中,使外贸建站过程变得…

2、QtCharts QGraphicsScene绘制折线图

文章目录 界面设置代码 界面设置 代码 #include "dialog.h" #include "ui_dialog.h"Dialog::Dialog(QWidget *parent): QDialog(parent), ui(new Ui::Dialog) {ui->setupUi(this);//构建图标系列lineSerisenew QLineSeries(this);//为折线添加数据for …

一文详解Docker容器(Container)

目录 基本介绍 常用命令 docker run :创建一个新的容器 docker ps :列出 Docker容器相关信息 docker stop :停止一个运行中的 Docker容器 docker rm : 删除一个或者多个已经停止的 Docker容器 docker pause :暂…

怎么突破反爬虫机制

在当今的数字化时代,网络爬虫已经成为了收集信息和数据的重要工具。然而,许多网站和平台都配备了反爬虫机制,以防止恶意攻击和过度访问。对于普通用户来说,如何突破这些反爬虫机制呢?本文将为你提供一些实用的技巧和建…