利用GPT打造你的博客|论文的专属讲解员→强制让GPT学习你的知识?(不需要魔法)

news2024/10/6 20:35:19

文章目录

  • 1 前言
  • 2 搭建我的博客问答系统
    • 2.1 平台介绍(不需要魔法即可访问)
    • 2.2 前期准备
    • 2.3 上传博客作为数据集至Dify
    • 2.4 搭建你的博客回答专员
  • 3 利用有针对性的GPT帮助我们阅读前沿论文
  • 4 结语

在这里插入图片描述

个人博客专属问答员:demo

1 前言

GPT是生成式预训练Transformer的缩写。它是由OpenAI开发的一系列大型语言模型。GPT系列的模型基于Transformer架构,使用注意力机制来有选择性地关注输入文本的相关部分。GPT模型使用大量数据进行训练,以预测序列中的下一个标记,并且能够生成连贯且与上下文相关的文本。

GPT系列中最近的模型是GPT-4,于2023年3月14日发布。GPT-4是一个多模态语言模型,意味着它可以接受文本和图像作为输入。它经过了强化学习和人工智能反馈的微调,以确保与人类的一致性和遵循政策。

GPT-3是该系列中另一个值得注意的模型,于2020年发布。它有1750亿的参数,使其成为当时最大的语言模型之一。GPT-3在各种任务上展示出了强大的零样本和少样本学习能力。

OpenAI还开发了一个名为ChatGPT的聊天机器人,它是基于GPT模型构建的。ChatGPT允许用户进行交互式对话,并提供了调整和引导对话的选项,以达到所需的长度、格式、风格、细节级别和使用语言。它已经变得非常流行,并提供免费版和付费订阅服务“ChatGPT Plus”。

众所周知,GPT3.5学习的知识截止于2021年,对于在此之后的事情的回答都是胡编乱造的。我们设计两个应用场景,一是如果想用GPT打造软件平台专用客服,如果仅仅接入普通的GPT3.5,那么针对用户提出的问题基本不可能有针对性的回答。二是,我们在做学术的时候,往往会阅读一些前沿的文章,这些文章都是GPT没有学习到的,那么我们询问GPT关于这篇文章的内容,GPT毫无疑问的会胡编乱造。

那么,我们今天就来解决这个问题,如何让GPT3.5的回答更加有针对性与特定领域的准确性。对此我通过两个实验来讲解:

(1)搭建我的博客问答系统,该系统中的GPT可以为用户讲解我的博客内容以及回答用户关于我博客的问题。系统的链接如下:demo;
在这里插入图片描述

(2)利用有针对性的GPT帮助我们阅读前沿论文;
在这里插入图片描述

2 搭建我的博客问答系统

2.1 平台介绍(不需要魔法即可访问)

Dify.ai:Dify 一词源自 Define + Modify,意指定义并且持续的改进你的 AI 应用,它是为你而做的(Do it for you)。
如果你对诸如 GPT-4 之类的 LLM 技术高速发展感到惊奇和兴奋,迫不及待的想用它做点什么有用的东西!可你的头脑里又有一切令人困惑的问题:

  • 我该如何“训练”一个基于我的内容的模型?
  • 怎么让 AI 知道 2021 年以后的事情?
  • 如何避免让 AI 跟用户胡说八道?
  • 微调(Fine-tuning)和嵌入(Embedding)是什么意思?

那么,Dify 正好能满足你的需要。
Dify 的目标是让开发者(甚至非开发者)可以快速基于大型语言模型搭建出有用的东西,并确保它是可视化、可运营、可改进的。
在这里插入图片描述

2.2 前期准备

由于打造的专属GPT是学习你的博文知识,所以这里需要将你的博文导出,贴心的CSDN为我们提供了导出功能!

在博客编辑页面点击导出→点击导出为MarkDown文件
ps:这也可以作为你博客备份的方法

在这里插入图片描述
在这里插入图片描述
将你的博客都导出后,整理到一个文件夹中,前期准备结束!

2.3 上传博客作为数据集至Dify

step1:首先需要你登录Dify,在主页中点击数据集:
在这里插入图片描述
step2:在数据集页面中点击创建数据集:
在这里插入图片描述
step3:在创建数据集界面中点击创建一个空的数据集:
在这里插入图片描述
step4:接下来为你的博客数据集起一个名称(我这里起名为blog):
在这里插入图片描述
step5:将你的问题md的博客文件全部导入至blog数据集文件夹中,并点击下一步:
在这里插入图片描述
step6:按照下图的选择点击“保存并处理”(这里其实更加推荐高质量索引方式):
在这里插入图片描述
step7:等待系统处理完成,即所有文件都显示可用:
在这里插入图片描述

至此,你的博文知识以作为数据集传入系统啦!

2.4 搭建你的博客回答专员

step1:我们来到构建应用专区并点击创建应用:
在这里插入图片描述
step2:我们为这个应用创建一个名字,并选择对话型应用:
在这里插入图片描述

step3:浏览应用信息,你可以在刚进入的页面查看应用URL、用户活跃数等信息,方便日后的管理:
在这里插入图片描述
step4:点击提示词编排开始进行机器人设置,首先你需要“催眠”GPT,让他成为你的博客讲解员,在“对话前提示词一栏进行如下设置”;然后你需要上传你的博客知识,在上下文中选择你刚刚上传完成的数据集:
在这里插入图片描述
step5:一切检查无误后点击发布,后访问step3中出现的URL即可使用你的专属博客讲解员了!
在这里插入图片描述

这里的核心就是在用户与GPT进行对话前让GPT进行身份带入,并“传授”给GPT特定的知识,这样GPT对于用户提出的关于你博客的问题就不会胡编乱造,从而进行完美的回答!
ps:同理,也可用该方法搭建软件平台的专属客服,需要将平台的帮助文档作为知识库~

3 利用有针对性的GPT帮助我们阅读前沿论文

这里的核心原理与操作主要与第二章相同,首先需要将论文的PDF版作为数据集上传至Dify:
在这里插入图片描述

我们在Dify首页,点击“智聊”,即可出现以下界面:
在这里插入图片描述
可以看到Dify已经集成了GPT联网的功能,我们将刚刚上传的论文作为上下文输入给GPT:
在这里插入图片描述
现在您可以使用GPT来询问特定论文的内容,并且平台会根据您与GPT的对话自动生成接下来的可能提问,这使得获取信息变得非常方便。
在这里插入图片描述
可以从上图看到,这篇论文是2023年发表的。我们来尝试一下,如果不给GPT上下文的前提条件,GPT会给出什么样的回答?
在这里插入图片描述
GPT是一个基于GPT-3.5模型训练的大型语言模型,但需要注意的是,它的知识仅截止于2021年。因此,对于涉及到最新信息或与论文原文相关的问题,GPT将只能胡编乱造,无法提供准确和专业的回答。

4 结语

博客问答系统的搭建非常有用。该系统利用GPT可以讲解博客内容并回答用户的问题。通过Dify.ai平台,我们可以轻松定义并不断改进自己的AI应用。这使我们能够利用最新的LLM技术,包括像GPT-4这样的模型。这个平台还解决了一些关于训练模型、了解2021年以后的事情和避免胡说八道的困惑。它提供了微调和嵌入的功能,使我们能够更好地管理和优化我们的应用。

总之,Dify为我们带来了搭建博客问答系统的便利性和灵活性。通过利用GPT-3.5模型和Dify.ai平台,我们能为用户提供更有深度和准确性的回答,从而提高用户体验并确保信息的正确传达。这是一个引人注目且实用的应用,对于个人博客或其他内容提供者来说,它将成为一种有价值且强大的工具。
在这里插入图片描述

如果喜欢还请多多点赞、评论

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/848730.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

React入门学习笔记3

事件处理 通过onXxx属性指定事件处理函数(注意大小写) React使用的是自定义(合成)事件, 而不是使用的原生DOM事件——为了更好的兼容性 eg:οnclick》onClickReact中的事件是通过事件委托方式处理的(委托给组件最外层的元素)——为了更高效通过event.target得到发生…

Go context.WithCancel()的使用

WithCancel可以将一个Context包装为cancelCtx,并提供一个取消函数,调用这个取消函数,可以Cancel对应的Context Go语言context包-cancelCtx 疑问 context.WithCancel()取消机制的理解 父母5s钟后出门,倒计时,父母在时要学习,父母一走就可以玩 …

视频怎么改成gif格式?简单几步就可以轻松视频转gif

平时我们使用的许多gif图片,其实都是视频片段,那么是怎么把视频转gif格式的呢?可以使用视频转gif工具来完成gif制作,下面就给大家分享一个简单的视频转gif在线制作(https://www.gif.cn)的方法,一…

pycharm离线安装依赖包

一、对于单个下载离线包,然后安装 1、先去https://pypi.org/网站下载离线包,下载到本地; 2、从磁盘中找到刚刚下载包,点击确定就可以安装了 二、将本地项目所有依赖包全部下载下来,然后批量在另一个项目&#xff…

Linux抓包工具----tcpdump

这是一个目录 一、什么是tcpdump二、为什么要用tcpdump三、tcpdump在哪里?四、怎么用tcpdump?4.1 命令格式4.2 常用选项4.2.1 对网络接口抓包 -i4.2.2 指定收取数据包的数量 -c4.2.3 不把ip转换成域名,直接显示ip -n4.2.4 显示ip和端口号 -nn…

权限校验—接口检验

一、背景介绍 最近项目中要实现根据不同用户去划分不同的角色,而不同角色具备调用不同接口的权限这个功能。用户在调用接口时需要校验用户是否具有权限访问接口,防止外界恶意调用随意篡改 二、思路&方案 为什么要进行接口鉴权? 接口鉴权…

几种常见的光纤接头有哪些?

名称: 光纤接头 光纤接头(optical fiber splice),将两根光纤永久地或可分离开地联结在一起,并有保护部件的接续部分,光纤接头是光纤的末端装置问题描述: 几种常见的光纤接头有哪些? 回答: 1.常见的光纤接头 LC 、SC 、FC 、ST、 MPO LC (Lucent connector) 小…

MySQL 事务原理:锁机制

文章目录 一、锁类型1.1 全局锁1.2 表级锁1.2.1 表锁1.2.2 元数据锁1.2.3 意向锁1.2.4 自增锁 1.3 行级锁1.3.1 记录锁1.3.2 间隙锁1.3.3 临键锁1.3.4 插入意向锁 1.4 锁的兼容性 二、锁的CUDP2.1 查询2.2 删除、更新2.3 插入 三、锁的对象四、并发死锁4.1 相反加锁顺序导致死锁…

监控Kafka的关键指标

Kafka 架构 上面绿色部分 PRODUCER(生产者)和下面紫色部分 CONSUMER(消费者)是业务程序,通常由研发人员埋点解决监控问题,如果是 Java 客户端也会暴露 JMX 指标。组件运维监控层面着重关注蓝色部分的 BROKE…

Redis 高频数据类型使用详解

目录 一、前言 二、Redis常用数据类型 2.1 常见的数据类型 三、String 类型 3.1 String 类型简介 3.2 String常用操作命令 3.2.1 String 操作命令实践 3.3 常用业务场景 3.3.1 session共享 3.3.2 登录失败计数器 3.3.3 限流 3.3.4 多线程安全控制 四、Hash类型 4…

【C++笔记】C++启航之为C语言填坑的语法

【C笔记】C启航之为C语言填坑的语法 一、命名空间1、为什么要引入命名空间?2、命名空间的基本用法3、展开命名空间4、命名空间的套娃5、命名空间的自动合并 二、缺省参数1、为什么要引入缺省参数?2、缺省参数的基本用法3、缺省的参数必须从右向左4、缺省…

为什么我们需要加快推进数字孪生技术?

数字孪生技术以其强大的潜力和应用前景,引起了各行各业的广泛关注和热切期待。那么,究竟为什么要加快推进数字孪生技术呢? 首先,数字孪生技术能够实现现实世界与虚拟世界的无缝连接,为各行业带来了前所未有的创新机遇…

Vue电商项目--VUE插件的使用及原理

图片懒加载 图片懒加载,就是图片延迟加载。只加载页面可视区域上的图片,等滚动到页面下面时,再加载对应视口上的图片 而在vue中有一个插件 vue-lazyload - npm (npmjs.com) npm i vue-lazyload 去使用他,这里我们引入了一张图片…

(九)人工智能应用--深度学习原理与实战--前馈神经网络实现MNST手写数字识别

目标: 识别手写体的数字,如图所示: 学习内容: 1、掌握MNIST数据集的加载和查看方法 2、熟练掌握Keras建立前馈神经网络的步骤【重点】 3、掌握模型的编译及拟合方法的使用,理解参数含义【重点】 4、掌握模型的评估方法 5、掌握模型的预测方法 6、掌握自定义图片的处理与预测 …

十分钟掌握使用 SolidJS 构建全栈 CRUD 应用程序

我们可以开始讨论 SolidJS,说它比React更好,但没有必要做这种比较。SolidJS只是众多前端框架之一,旨在在Web上快速创建数据驱动。那么,我们为什么要突出这个新孩子呢? 首先,我们不能忽视SolidJS不使用虚拟…

嗅探抓包工具,解决线上偶现问题来不及抓包的情况阅读目录

目录 背景 实现思路 具体实现 Python 抓包 总结 资料获取方法 背景 测试群里经常看到客户端的同学反馈发现了偶现Bug,但是来不及抓包,最后不了了之,最近出现得比较频繁,所以写个小脚本解决这个问题。 实现思路 之前写过一个…

免费实用的日记应用:Day One for Mac中文版

Day One for Mac是一款运行在Mac平台上的日记软件,你可以使用Day One for mac通过快速菜单栏条目、提醒系统和鼓舞人心的信息来编写更多内容,day one mac版还支持Dropbox同步功能,想要day one mac中文免费版的朋友赶紧来试试吧! …

IPC之一:使用匿名管道进行父子进程间通信的例子

IPC 是 Linux 编程中一个重要的概念,IPC 有多种方式,本文主要介绍匿名管道(又称管道、半双工管道),尽管很多人在编程中使用过管道,但一些特殊的用法还是鲜有文章涉及,本文给出了多个具体的实例,每个实例均附…

Leetcode.1316 不同的循环子字符串

题目链接 Leetcode.1316 不同的循环子字符串 rating : 1837 题目描述 给你一个字符串 text ,请你返回满足下述条件的 不同 非空子字符串的数目: 可以写成某个字符串与其自身相连接的形式(即,可以写为 a a,其中 a 是…

服务器感染了LockBit 3.0勒索病毒,如何确保数据文件完整恢复?

引言: 在数字时代,恶意软件的威胁变得愈发严峻,而LockBit 3.0勒索病毒则是其中的顶尖恶势力之一。其先进的加密技术和毫不留情的勒索手段,使无数人蒙受损失。然而,我们不应束手无策。本文91数据恢复将带您深入了解Loc…