怎样让chatGPT给你打工然后月入过千?

news2024/9/22 3:58:39

前言

chatGPT最近火出圈了,怎么薅一个文字模型给你打工呢?
这个UP给了个思路:哔哩哔哩
emmm有点尴尬,可能是热度比较高,b站的视频作者自己下架了。

总结一下:

  • 薅的对象百度文库创作中心:地址
    在这里插入图片描述
  • 除了每个文档一块三左右的收入还有每个月发多少篇的奖励。
  • chatGPT干这个不就是信手拈来了???

实现

B站的作者代码没开源的,但是这玩意没啥难度啊…打了一年半的工写个这个不是信手拈来?
粗略的看了下b站的视频,他的技术栈应该是用pychatGPT模拟浏览器发request请求然后拿openAI的回复。所以核心就是用pychatGPT呗?找了下老外开源的代码:https://github.com/rawandahmad698/PyChatGPT
12月17号粗略跑了一下发现已经被ban了并且作者也绕过不了openai的cf了:
在这里插入图片描述
所以呢,b站阿婆主的方法已经没用了,那也问题不大,自己写一个就是了。

我实现的技术栈:

  • selenium自动化浏览器控制
  • beautifulsoup解析html
  • pypandoc文本输出docx

你没看错,就是爬虫的技术栈,request被ban了咱就傻瓜式的直接浏览器控制就是了。

第一步:获取任务

为了全自动,获取任务当然也要自动了,这个比较简单解析下百度文库的网页源码就可以获取任务了:
在这里插入图片描述

可以看到任务都在doc-row里面,所以核心的检索代码用beautifulsoup搜一下就好了:

doc_rows = soup.findAll('div', {"class": "doc-row"})

然后搜子标签里面的span,并且属性是doc-title就可以获取题目了,同理价格。

然后dump到本地的csv就好了:
在这里插入图片描述

第二步:遍历任务让chatgpt回答

这里比较麻烦的就是绕过openai的cf,既然很难我们就不饶过了,直接浏览器控制,selenium!!!yyds!!!
看看openai的源码:
在这里插入图片描述
问题和答案都在框起来的源码里了,这样不就ssssso easy了,用selenium获取到网页的源码后,在用bs4库像步骤一一样解析就好了:
核心代码:

answer = str(soup.findAll('div', {"class": "min-h-[20px] flex flex-col items-start gap-4 whitespace-pre-wrap"})[-1])

为啥取最后一个?当然是最后一个肯定是最近的回答了。
这里还有些难点:

  • 怎么判断openai生成文本结束了呢?
  • 因为openai的限制一次只能输出400个字,怎么接着让他输出呢?
  • html的源码有好多

    这样的符号怎么导出到doc呢?直接导出的话这样肯定没法看。

问题一:判断生成结束,解决方案

在这里插入图片描述
在输出答案的时候这个地方是省略号,所以可以判断html是否有这个省略号来判断openai是否输出完成。

问题二:怎么接着让他输出呢?解决方案

这个其实很简单,判断下答案是否够比如说800字?不够我们就再给他发一条"接着说"他就会接着输出了

问题三:html的源码有好多符号怎么导出到doc呢?直接导出的话这样肯定没法看。解决方案

可以直接获取回答的结果对应的html源码如下:

<div class="min-h-[20px] flex flex-col items-start gap-4 whitespace-pre-wrap"><div class="markdown prose break-words dark:prose-invert light"><p>本领动作是指身体的各个部位可以灵活运用的动作。这些动作有利于增强身体的力量、柔韧性和协调能力,有助于促进身体的健康发展。</p><p>一些常见的本领动作包括:</p><ul><li>俯卧撑:身体俯卧在地上,双手放在地面,腹部收紧,使身体抬起。俯卧撑能增强胸部、手臂和腹部的力量。</li><li>仰卧起坐:身体仰卧在地上,双手放在身体侧面,腹部收紧,使身体从仰卧状态坐起。仰卧起坐能增强腹部、背部和大腿的力量。</li><li>引体向上:站立或悬挂状态下,双手紧握横杠或其他抓握物,腹部收紧,使身体向上拉。引体向上能增强背部、手臂和腹部的力量。</li><li>开合跳:双脚并拢,腹部收紧,使身体向上跳起,再把双脚张开,再跳起。开合跳能增强腹部、大腿和膝盖的力量。</li><li>深蹲:双脚张开,身体向下坐,使膝盖与脚踝成90度角。深蹲能增强大腿、膝盖和腰部的力量。</li></ul><p>这些本领动作都可以</p></div></div><div class="min-h-[20px] flex flex-col items-start gap-4 whitespace-pre-wrap"><div class="markdown prose break-words dark:prose-invert light"><p>自由组合,搭配出不同的本领训练项目。例如,可以先做几个俯卧撑,再做几个仰卧起坐,再做几个引体向上,接着做几个开合跳,最后做几个深蹲。这样的训练项目不仅能锻炼身体的各个部位,还能促进心肺功能的提升。</p><p>在做本领动作时,需要注意身体的姿势和呼吸。姿势要正确,呼吸要规律。如果觉得有些动作难度较大,可以适当减少动作次数或使用辅助工具,逐渐增加难度。</p><p>做本领动作不仅能增强身体的力量和柔韧性,还能提升身心状态,对身体健康有很大的益处。建议每周至少做3次本领动作训练,每次训练时间在30分钟左右。</p></div></div>

加一下支持中文和标题:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<h1>本领动作</h1>

看看效果:

在这里插入图片描述
网页解析的效果不错了,然后用pypandoc将html源码转doc即可核心代码:

pypandoc.convert_file("xx.html", "docx", outputfile="xx.doc")

看看doc的效果:
在这里插入图片描述
very very good!!!

最后

最后用文库的批量提交就可以提交了,下午跑了三个小时弄了40篇试试水:
在这里插入图片描述
看看能不能过审核。

TODO1

有些文库的任务质量非常差:
在这里插入图片描述

比如上图,这是什么没有逻辑的鬼东西,这种可以在dump下来的任务csv中标注下标签,给这个打个坏,在之后人工审核出来之后可以把过审的标注成好 ,并且没过审的也标注成坏,这样随便跑个轻量的nlp模型就能过滤大量没有意义的任务了。

TODO2

躺平就想着全全自动,现在在上传文库这块还是依赖手工,可以用python模型鼠标点击,固定屏幕的话可以像按键精灵一样写个脚本自动上传了,不过可能就是要处理的特殊情况会多一些,写起来倒是没啥难度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/99147.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式之装饰器模式

decorator design pattern 装饰模式的概念、装饰模式的结构、装饰模式的优缺点、装饰模式的使用场景、装饰模式与代理模式的区别、装饰模式的实现示例、装饰模式的源码分析 1、装饰模式的概念 装饰模式&#xff0c;即在不改变现有对象结构的前提下&#xff0c;动态的给对象增加…

【云原生】Grafana 介绍与实战操作

文章目录一、概述二、Grafana 安装1&#xff09;下载安装2&#xff09;安装包信息3&#xff09;启动服务4&#xff09;Grafana 访问三、Grafana 功能介绍四、使用mysql存储1&#xff09;安装mysql2&#xff09;修改grafana配置1、创建grafana用户和grafana库2、修改grafana配置…

[附源码]Python计算机毕业设计Django学分制环境下本科生学业预警帮扶系统

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

Innodb存储引擎-索引和算法(B+树索引、Cardinality、联合索引、覆盖索引、MRR优化、ICP优化、哈希索引、全文索引)

文章目录索引和算法B树索引聚集索引辅助索引B 树索引的分裂B 树索引的管理Cardinality 值B 树索引的使用联合索引覆盖索引优化器选择不使用索引的情况索引提示Multi-Range Read 优化(MRR)Index Condition Pushdown优化(ICP)哈希索引全文索引倒排索引InnoDB全文检索的实现全文检…

第一个MyBatis查询

⭐️前言⭐️ 在连接程序与数据库的工具中&#xff0c;我们之前使用的是JDBC技术&#xff0c;但是JDBC的操作流程极为繁琐&#xff0c;因此才有了更优秀框架——MyBatis&#xff0c;下边我们一起来看这个优秀框架MyBatis的操作与使用。 &#x1f349;欢迎点赞 &#x1f44d; 收…

Innodb存储引擎-锁(数据库锁的查看、快照读当前读、MVCC、自增长与锁、外键与锁、行锁、并发事务的问题、阻塞、死锁、锁升级、锁的实现)

文章目录锁lock 与latch读锁/写锁/意向锁INNODB_TRX/INNODB_LOCKS/INNODB_LOCK_WAITS一致性非锁定读(快照读)一致性锁定读(当前读)MVCC版本链Read View流程自增长与锁外键和锁行锁类型记录锁(record lock)间隙锁(gap lock)下一键锁(next-key lock)并发事务带来的问题阻塞死锁锁…

数据挖掘Java——DBSCAN算法的实现

一、DBSCAN算法的前置知识 DBSCAN算法&#xff1a;如果一个点q的区域内包含多于MinPts个对象&#xff0c;则创建一个q作为核心对象的簇。然后&#xff0c;反复地寻找从这些核心对象直接密度可达的对象&#xff0c;把一些密度可达簇进行合并。当没有新的点可以被添加到任何簇时…

7.加载properties属性文件

一、加载properties属性文件 目的&#xff1a;将数据库的连接参数抽取到一个单独的文件中&#xff0c;与Spring配置文件解耦 1. 编写jdbc.properties属性文件 jdbc.drivercom.mysql.jdbc.Driver jdbc.urljdbc:mysql://127.0.0.1:3306/spring_db jdbc.usernameroot jdbc.passwo…

基于萤火虫算法改进的DELM预测-附代码

萤火虫算法改进的深度极限学习机DELM的回归预测 文章目录萤火虫算法改进的深度极限学习机DELM的回归预测1.ELM原理2.深度极限学习机&#xff08;DELM&#xff09;原理3.萤火虫算法4.萤火虫算法改进DELM5.实验结果6.参考文献7.Matlab代码1.ELM原理 ELM基础原理请参考&#xff1…

代码中的坏味道

学习笔记自https://zhuanlan.zhihu.com/p/141435233 识别代码中的坏味道系列 如下图是工作中常见的代码的坏味道&#xff1a; 上图中的坏味道出自《重构》这本书&#xff0c;虽然并不是全部&#xff0c;但是涵盖了日常中最常见的一些代码坏味道。 接触这些坏代码可以分为三类&…

【Linux】shell 及权限理解

​&#x1f320; 作者&#xff1a;阿亮joy. &#x1f386;专栏&#xff1a;《学会Linux》 &#x1f387; 座右铭&#xff1a;每个优秀的人都有一段沉默的时光&#xff0c;那段时光是付出了很多努力却得不到结果的日子&#xff0c;我们把它叫做扎根 目录&#x1f449;shell命令…

计算机基础学习笔记:操作系统篇之硬件结构,存储层次结构

二、存储器的层次结构 本文知识来源小林Coding阅读整理思考&#xff0c;原文链接请见该篇文章 存储层次 寄存器高速缓存&#xff0c;Cache 1-3级内存磁盘&#xff08;SSD&#xff0c;HDD&#xff09; 关键点 各层次的存储的 介质、速度、容量 以及工作层次理解CPU Cache的作…

【Spring]SpringMVC

一、SpringMVC简介 1、什么是MVC MVC是一种软件架构的思想&#xff0c;将软件按照模型、视图、控制器来划分 M&#xff1a;Model&#xff0c;模型层。指工程中的JavaBean&#xff0c;作用是处理数据 JavaBean分为两类&#xff1a; 实体类Bean&#xff1a;专门存储业务数据…

【qt Spin Box | Double Spin Box输入小部件函数学习篇】

Spin Box | Double Spin Box输入小部件函数学习篇【1】UI设计布局【2】setMinimum | setMaximum【3】setPrefix | setSuffix【4】setValue【5】setDisplayIntegerBase【6】setSingleStep【7】value【8】举例【1】UI设计布局 【2】setMinimum | setMaximum setMinimum 此属性保持…

点对点网络与广播式网络的区别

目录 一、点对点网络与广播式网络的区别 二、结点和节点 一、点对点网络与广播式网络的区别 写下本文的原因是笔者在学习计算机网络第一章时看到了下面王道书上的一句话&#xff0c;我不理解这句话想表达的是谁需要“分组存储转发和路由选择机制”。于是当时得出了一个错误…

Python读取excel内容追加到mysql表中赋予字段注释

前言 由于最近遇到一个实体类有特别多的字段&#xff0c;我就想自己一个地在表中创建&#xff0c;并写注释未免太浪费人力和时间了&#xff0c;然后在网上查找资料&#xff0c;果不其然让我看到了一个可以使用Python读取excel内容追加到mysql表中赋予字段注释&#xff0c;这简…

前端零碎知识随笔

一、介绍 本篇博客主要使用来记录一些比较零碎的知识点&#xff0c;都是本人在日常开发工作中遇到的&#xff0c;或者是在学习过程中遇到的。因为这些知识点都比较零碎&#xff0c;为了防止遗忘&#xff0c;所以特意写一篇博客来记录&#xff0c;后面也不会不断慢慢更新的。 …

[附源码]计算机毕业设计Python-大学生健康档案管理(程序+源码+LW文档)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等…

JSP+MySQL基于ssm的环保数据自动采集及预测系统

在21世纪的今天,随着科技的进步和发展,人们的生活逐渐趋于自动化、便捷化、数据化。而发展总会有代价,科技的进步总是伴随着环境的恶化。人类用智慧将地球的资源充分利用,以便丰富人们的生活,推动国家的进步。回过头去看,地球的环境已经成为威胁人类长久生存的主要问题之一。在…

34-Vue之ECharts高级-调色盘

ECharts高级-调色盘前言调色盘主题调色盘全局调色盘局部调色盘渐变颜色前言 本篇来学习下ECharts中调色盘的使用 调色盘 它是一组颜色&#xff0c;图形、系列会自动从其中选择颜色, 不断的循环从头取到尾, 再从头取到尾, 如此往复主要分三种&#xff1a;主题调色盘、全局调色…