chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内

news2024/11/26 4:39:50

GPTGLM-6B场景应用:

最近,ChatGPT已经火出圈了,一般OpenAI需要梯子,然后需要花钱,导致很多限制,用的很不方便(很希望大厂努力,有国人自己的大语言模型),目前主要感谢清华大学开源的ChatGLM-6B和秋葉aaaki大神造福我们。总结一句话3090显卡可以部署可以运用,但很难训练。
首先介绍一下秋葉aaaki大神的本地化部署的工具,我的配置是一块是3090,目前12G显存.bat,如果配置不够好,可以尝试下面12G以下
在这里插入图片描述

我尝试8G与12G的横向比较,对于客观问题,主要以8G为主,主观问题还是看看12G给我的看法,

客观问题8G

  1. 首先第一个问题”请解释一下什么是沉积物“,
    回答是”沉积物是指由水、大气、生物和化学因素等作用下,在地表形成的固态物质,通常由颗粒大小不等、形状各异的石头、泥沙、灰烬和其他无机物组成。沉积物可以存在于海洋、湖泊、河流、沼泽、沙漠和山脉等不同的地方。
    沉积物的形成过程包括物质的沉积和扬弃。在海洋中,沉积物由浮游生物的死亡外壳、有机物和骨骼组成。在河流和湖泊中,沉积物由洪水中的泥沙、水生动物尸体、植物种子和有机物组成。在陆地上,沉积物由风化、火山喷发、冰川侵蚀和人类活动等因素形成。
    沉积物在地球的历史上扮演了重要的角色。它们可以作为岩石的基础,帮助地球形成和稳定。沉积物还可以提供水源和土地,为人类社会和经济的发展提供支持。“
  2. 其次问了”请解释一下什么是碳酸盐台地“
    回答是”碳酸盐台地是指由于二氧化碳的供应充足,以及地质作用的结果,在地表形成了大量碳酸盐矿物的地区。这种地区通常位于高海拔地区,由于大气中二氧化碳的浓度较高,导致大气中的碳酸盐不断积累。
    碳酸盐台地通常由不同类型的碳酸盐矿物组成,包括大理石、石灰石、白云石和硅灰石等。这些矿物在沉积和变质作用的过程中形成,并沉积在地表,形成各种不同的地貌类型,如石林、石芽、峰林和岩溶等。
    碳酸盐台地的形成与许多因素有关,包括地质构造、气候条件和人类活动等。这些地区的地貌特征和景观通常非常美丽,也是许多登山、徒步旅行和探险爱好者的理想目的地。“

这里还加了一点主观评价,我觉得很好玩,这也可能是我把旁边Temperature机器感情拉大的缘故,不会太教科书。

  1. 你知道更新统鱼鳞山组是什么吗,如果知道请阐述一下
    更新统鱼鳞山组是一套由砂岩、砾岩和岩溶岩组成的地质层系,位于中国云南省昆明市石林彝族自治县境内。该组层系厚度较大,一般超过500米,是中国南方地区典型的石灰岩地区地质层系。
    更新统鱼鳞山组地层主要由砂岩、砾岩和岩溶岩组成,其中砂岩为主,砾岩为辅。砂岩主要由砂和砾石组成,质地比较坚硬,形成了许多石芽、突口、洞穴和地表地表形态。同时,该组地层还具有丰富的岩溶现象,如岩溶槽谷、溶蚀丘陵和岩溶峰林等。
    在地质构造上,更新统鱼鳞山组地层位于云南省石林彝族自治县境内的南盘江地质带上,是南盘江地质带的重要组成部分。该组地层的顶部受到南盘江的影响,形成了强烈的侵蚀和构造运动,而底部则受到地下水的侵蚀和渗透,形成了丰富的地表形态和地下水系。
    更新统鱼鳞山组是一套重要的地质层系,具有丰富的地质特征和景观,对研究地球演化过程、石灰岩地区地质环境、地下水演化等具有重要的科学意义。
    在这里插入图片描述
    在这里插入图片描述
    主观问题8G:

  2. 首先第一个问题”你认为沉积物学科未来的发展“,
    沉积物学科是一门非常古老的学科,但也是一门非常重要的学科,对地球科学和工程学等领域产生了深远的影响。随着科技和经济的发展,沉积物学科也在不断发展,未来可能还会出现许多新的技术和方法,以适应不断变化的环境和需求。以下是沉积物学科未来可能发展的方向:1. 数字化沉积物勘探:随着数字化技术的不断发展,沉积物勘探将变得更加精确和高效。数字化技术可以帮助沉积物学者更好地理解沉积物的特征和组成,并为勘探和开发提供更准确的数据。2. 环境模拟和沉积物修复:环境模拟和沉积物修复是沉积物学科中的新领域,旨在研究如何在不断变化的环境中保护或修复自然资源。这些技术可以为环境保护和可持续发展提供新的思路和方法。3. 海洋沉积物研究:海洋沉积物是地球表面最重要的沉积物之一,对海洋生态系统和海岸线的稳定性具有重要意义。随着海洋科学的迅速发展,海洋沉积物研究将成为海洋科学领域的重要分支。4. 沉积物学与地球物理学的结合:地球物理学是研究地球内部的科学,沉积物学则是研究地球表面的科学。未来,沉积物学和地球物理学的结合将为深入了解地球内部结构和地球表面特征提供新的思路和方法。5. 沉积物学与生命科学的结合:生命科学是研究生命本身的科学,沉积物学则是研究生物和非生物物质在地球表面形成的科学。未来,沉积物学和生命科学的结合将为研究生命的起源、演化和生态系统提供新的思路和方法。
    个人感觉如果从计算机角度(本身就是计算机专业)学科研究第一个数值化不是已经做了吗,地球海洋,不能称为未来发展,应该是把研究进行了一个宽泛的终结。

  3. 你知道更新统鱼鳞山组是什么吗,如果知道请阐述一下
    更新统鱼鳞山组是一套由砂岩、砾岩和岩溶岩组成的地质层系,位于中国云南省昆明市石林彝族自治县境内。该组层系厚度较大,一般超过500米,是中国南方地区典型的石灰岩地区地质层系。更新统鱼鳞山组地层主要由砂岩、砾岩和岩溶岩组成,其中砂岩为主,砾岩为辅。砂岩主要由砂和砾石组成,质地比较坚硬,形成了许多石芽、突口、洞穴和地表地表形态。同时,该组地层还具有丰富的岩溶现象,如岩溶槽谷、溶蚀丘陵和岩溶峰林等。在地质构造上,更新统鱼鳞山组地层位于云南省石林彝族自治县境内的南盘江地质带上,是南盘江地质带的重要组成部分。该组地层的顶部受到南盘江的影响,形成了强烈的侵蚀和构造运动,而底部则受到地下水的侵蚀和渗透,形成了丰富的地表形态和地下水系。更新统鱼鳞山组是一套重要的地质层系,具有丰富的地质特征和景观,对研究地球演化过程、石灰岩地区地质环境、地下水演化等具有重要的科学意义。
    这是我随机找的一个点,我感觉很已经很细,里面的岩性和生物构造也回答的很准(没展示,但我也问了)。

在这里插入图片描述
重点来了!!!!!

它能够弄数据集了,识别我想要的,真正意义上的,我可以就是我可以。(要是我就接一个后台,把数据输入不停输入,然后存到Excel, 或者word最后在清洗一下就好了,重点在于他不要联网,做个初步筛选还是可以的)。如下图所示我感觉很好。
在这里插入图片描述
好了跳过这个重点,接着对比效果,面对8G的第一个问题‘你认为沉积物学科未来的发展’,12G 是这样回答的:
沉积物学科是一门研究地球历史上物质形成和演化的学科,随着地球科学的不断发展,沉积物学科也在经历着不断地发展和变革。未来,沉积物学科可能会经历以下几个方面的发展:

  1. 沉积物结构的研究:随着地球化学、地球物理学、地球生物学等学科的发展,沉积物的结构、成分、生物过程等方面的研究将会得到更深入的探讨。这些研究将为沉积物学科提供更加全面和准确的知识,有助于更好地理解地球历史中的沉积物演化过程。

  2. 沉积物模拟技术的发展:沉积物学科中常用的模拟技术包括数值模拟和模型模拟。未来,这些技术将会得到更加成熟和广泛应用,有助于更好地模拟和预测沉积物的形成和演化过程。

  3. 沉积物勘探技术的进步:随着地球物理学、地球化学、遥感技术等的不断发展,沉积物勘探技术也在不断进步。这些技术将有助于更加精确地勘探沉积物,为地质调查、资源勘探等提供更加可靠的数据支持。

  4. 沉积物环境保护和治理:沉积物学科对于环境保护和治理具有重要的应用价值。未来,沉积物学科将会在环境保护和治理方面发挥更加重要的作用,有助于更好地保护地球的生态环境。

未来沉积物学科的发展将会涉及多个方面,包括研究、技术、应用等方面。这些发展将有助于提高沉积物学科在地球科学领域中的地位和作用,为更好地服务社会和环境保护做出更大的贡献。

大家自行体会,接着我又了几个问题我感觉很像一个特别好的摘要生成,和总结,确实比gpt-2 要昊太多
在这里插入图片描述
在这里插入图片描述
看吧数据为王的时代,一开始根本不是在于模型,而是数据,算力,开源算法只会让数据更值钱,如何数据挖掘更加重要,所以这不是一个随随便便的人就能完成。机器都知道,更何况是人。

ChatGLM-6B-Ptuning:

这个部分我需要感谢零炻博主,他把模型本地化了一下,可以训练少量的自己的领域数据,为啥说是少量,是因为两块3090,微调的话我感觉已经快撑不住了,里面是用第一个8g做微调,我也水了很多个人群,尝试过的人用告诉我Vicuna-7B在3090只能部署,不能微调,至少A100入门,看着显卡,我选择,还是AI画画不费卡,
在这里插入图片描述
在这里插入图片描述

当然了你可以看一下自己训练的效果,我这里还是拿博主的在这里插入图片描述
看的出来都又效果,但没有涉及到的,就不行了,因为数据集没有没学到回答当然不对,如
在这里插入图片描述
因此,是抬着头拿已有的工具加上下流,搞学术发论文,还是低着头打标签,喂数据,拿到特殊特色的应用场景,坐落地(你觉得我搞翻了,我说的是大多数)。还是两者结合,都取决于,主观能动性,不分对错,工具也没有错。所以,很遗憾的是模型只在工具之上,想法只在算力范围之内,没有卡,没有钱,没有算力的我,还是享受被大佬带飞,而不是曲线救国来的舒服。

再次感谢
ChatGLM官方链接:https://github.com/THUDM/ChatGLM-6B
秋葉aaaki https://space.bilibili.com/12566101
零炻 https://space.bilibili.com/7990701/?spm_id_from=333.999.0.0


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/459740.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Bean 作⽤域和⽣命周期

目录 1.lombok 1.1 1.添加依赖:(pom.xml) 1.2 在实体类上使用lombok提供的注解 1.3 安装插件 2. Bean 的 6 种作⽤域(Scope) 2.1 singleton(默认模式) 2.2 prototype(原型模式…

【EasyPoi实战系列】Spring Boot使用EasyPoi的注解让表格更漂亮以及图片的导出 - 第468篇

历史文章(文章累计460) 《国内最全的Spring Boot系列之一》 《国内最全的Spring Boot系列之二》 《国内最全的Spring Boot系列之三》 《国内最全的Spring Boot系列之四》 《国内最全的Spring Boot系列之五》 《国内最全的Spring Boot系列之六》 【…

利用电脑和手机MT4平台软件设置报警功能的方法及步骤

使用MT4(MetaTrader 4)的报警功能,就可以在汇率达到指定数值,或者是在EA进场买进或结束交易的时候在手机接受推播通知。即使正在外出,也不会因此而错失机会,也可以借此确认进场交易内容,是相当便…

部署CDN的网站如何找真实IP

部署CDN的网站找真实IP 1.概述 目前很多网站使用了cdn服务,用了此服务 可以隐藏服务器的真实IP,加速网站静态文件的访问,而且你请求网站服务时,cdn服务会根据你所在的地区,选择合适的线路给予你访问,由此达…

黑盒测试过程中【测试方法】详解2-正交实验

在黑盒测试过程中,有9种常用的方法:1.等价类划分 2.边界值分析 3.判定表法 4.正交实验法 5.流程图分析 6.因果图法 7.输入域覆盖法 8.输出域覆盖法 9.猜错法 前面我们已经讲解过了等价类划分、边界值、判定表。 可以参考我之前的文章&#xff…

k8s部署Pyroscope并分析golang性能瓶颈

Pyroscope是什么 Pyroscope是一种开源的应用程序性能分析工具,它可以帮助我们发现和解决应用中的性能问题。Pyroscope支持多种编程语言并提供了丰富的性能数据,可以帮助我们跟踪应用程序的执行情况,并根据收集到的数据来识别性能瓶颈。 Pyros…

什么是VBST和PVST?两者有啥区别?

在计算机网络中,VLAN(Virtual Local Area Network,虚拟局域网)是一种将局域网划分为多个逻辑上独立的子网的技术,它可以帮助网络管理员更好地管理网络资源。 在VLAN技术中,STP(Spanning Tree P…

Git 如何修改历史的 Commit message

目录 修改最近一条Commit 修改过去若干条 Commit 场景:当分批次多次提交时,突然发现提交的message不符合规范,想要修改,这时就可以使用了 修改最近一条Commit 如果只是想修最近一条 Commit, 直接使用命令: git commit --amen…

基于DistFlow方程求解给定的通用径向单相配电网络的配电功率流方程(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 本文介绍了基于DistFlow方程求解给定的通用径向单相配电网络的配电功率流方程及结果展示。 📚2 运行结果 主函数部…

JVM垃圾回收机制和常见算法

GC回收垃圾流程第一步是定位内存空间中没有引用到的对象,然后才能进行回收。那么GC是如何定位这些内存中没有用到的对象呢? 一、引用计数器算法(废弃) 引用计数器算法是给每一个对象设置一个计数器,当有地方引用这个对…

Linux入门操作

pwd 查看当前目录 与 自动补全 文件详情 drwxrwxr-x d代表文件夹 -代表文件 其中rwx rwx r-x r是可读 w是可写 x 执行 第一组(前三个)指文件拥有者的权限 第二组(中三个)代表文件拥有的组的权限 第三组(后三个&am…

5.2.1二叉树的定义和基本术语

二叉树的基本概念: 二叉树是递归定义的二叉树 下面我们来看几个特殊的二叉树: 特点: 1)只有最后一层有叶子节点 2)不存在度为1的结点 3)按层序从1开始编号,结点i的左孩子为2i,右孩…

three.js地图可视化项目-广州模型

概述 如有不明白的可以加QQ:2354528292;wx: aichitudousien 更多教学视频请访问:https://space.bilibili.com/236087412 详细教学请到上方视频链接访问,总共3个多小时的教学~ three.js地图可视化项目-广州模型 搭建开发环境 使用…

Tomcat的概念、部署、及优化

一、Tomcat概述 1、Tomcat的概念 Tomcat是Java语言开发的,服务器是一个免费的开放源代码的Web应用服务器,属于轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP程序的首选。一般来说&am…

金陵科技学院五年一贯制专转本旅游学概论考试大纲

金陵科技学院五年一贯制专转本旅游学概论考试大纲 一、考核对象 本课程的考核对象为五年一贯制高职专转本“旅游管理”专业入学考试考生。 二、考核方式 本课程考核采用闭卷笔试的方式。 三、命题依据及原则 1、命题依据 参考书目:《旅游学概论》(第七版) 李…

【Git 入门教程】第一节、什么是Git?

在软件开发中,代码的管理和版本控制非常重要。为了更好地管理代码,需要使用一种有效的工具来保证代码的质量和稳定性。而Git正是这样一种工具。 一、概念 Git是一种分布式版本控制系统,它可以追踪文件的变化,并且可以协同工作。它…

SpringBoot——MyBatis-Plus源码分析及开发实践详解

focus w x:CodingTechWork 文章目录 focus w x:CodingTechWork 引言MyBatis-Plus 介绍概述特点常用注解TableNameTableIdIdType类型 TableField MyBatis-Plus 源码分析IService原生CURD接口savesaveorUpdateremoveupdategetlistpage Mapper原生CURD接口i…

抚仙湖,一个亦梦亦幻的地方,这个五一节,我们骑友′的诗和远方

云南省玉溪市抚仙湖是中国南方最大的深水型淡水湖泊之一,位于云南省中部,距离昆明市约80公里。抚仙湖的面积约为212平方公里,平均水深约为120米,最大水深可达157米。 抚仙湖最美的景点有很多,其中最著名的是以下几个&a…

2023年五月份图形化二级打卡试题

活动时间 从2023年5月1日至5月21日,每天一道编程题。 本次打卡的规则如下: 小朋友每天利用10~15分钟做一道编程题,遇到问题就来群内讨论,我来给大家答疑。 小朋友做完题目后,截图到朋友圈打卡并把打卡的截图发到活动群…

深度学习技巧应用9-模型训练中学习率的调整和假数据生成技巧与总结

大家好,我是微学AI,今天给大家介绍一下深度学习技巧应用9-模型训练中学习率的调整和假数据生成技巧与总结,我们在训练模型的时候,为了测试模型是否可以行,但是目前还没有标注好大量的数据,在缺乏数据的情况下,今天教大家如何生成假数据(测试数据)进行模型调试,并且教…