开源小项目ChatGPT-website已获得100+star,我都干了什么

news2024/10/6 16:24:47

📋 个人简介

  • 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者。😜
  • 📝 个人主页:馆主阿牛🔥
  • 🎉 支持我:点赞👍+收藏⭐️+留言📝
  • 💬格言:迄今所有人生都大写着失败,但不妨碍我继续向前!🔥
    请添加图片描述

目录

    • 📋 个人简介
  • 前言
    • 项目地址以及bug修改流图
    • 我做这个的目的
    • 功能完善以及bug解决思路
      • 流式响应
      • 防止xss攻击
    • 输出格式
    • 最终项目效果
  • 结语

前言

自从我的开源小项目ChatGPT-website被越来越多的人使用后,我就每天在完善需求给bug中,本篇博文将记录改bug历程,会附上一些思路,为自己搭建chatgpt站点的小白一些思路!

项目地址以及bug修改流图

https://gitee.com/aniu-666/chat-gpt-website

保证十分钟搭建完成,如有任何疑问,加文档里的交流群探讨,我的全栈学习交流群,会分享一些chatgpt资源以及一些玩法,也可加我微信!一起加油!

下面展示我的bug修改流图:

在这里插入图片描述

没错,这几天一直在改比较麻烦的bug!本文后面会给出解决思路,希望对正在开发的人有帮助!比较麻烦的就是前端一些莫名的样式bug,简直无语,一些javascript导致的还可以打断点调试(以前玩爬虫时,js逆向就这么搞的)!至此,我依旧还是玩不明白浏览器的F12工具,博大精深哇,相信很多功能你也不知道吧!

我做这个的目的

问:github上有很多开源小项目,像ChatGPT-Next-Web、ChatGPT-Web等,都十分优秀,你为啥还要自己捣鼓?

答:
首先,我是一个大三的菜鸟,捣鼓这个站点的目的是我的18$的apiKey还没使用即将过期了,所以我紧急搭建了这个小项目,用于自己使用,没想到发出来用的人很多,因此就踏上了加需求改bug的功能!

至于我不用这些优秀的开源项目是因为这些优秀的开源项目可能用到了一些我没学到的技术,搭建可能比较麻烦,可能有人问,文档那么齐全,照着搞一下,不就搞出来了吗,我要说的是,照着文档搞确实可以搞出来,但我的目的还是希望在这个过程中学到什么!

我也曾看过上述优秀项目的源码,恕我愚笨,属实看不明白。有一个原因就是我不是一个专业学前端的,虽然水过蓝桥杯web省一(国赛没参加),但这个比赛的水平大家也清楚,其次,我不太会vue,作为一个计算机大三学生,事实上我是焦虑的,肯定是希望从事主后端工作,所以没时间继续学习vue,但也稍微学了一丢丢,而这些chatgpt相关的项目基本都是用纯前端方式开发的,基本上用了vue,我看不明白。(尤其记得当时参加蓝桥杯web组比赛时,vue的题我都是注释掉vue代码,用原生写的功能),其次,一个功能完善的项目,他的项目结构是复杂的,没点前端水平属实看不明白,尤其对于一些初学者,小白以及我们这些大学生!而我的ChatGPT-website则是基于flask+前端三件套搭建的,相比之下,如果想要学习,也是能看懂的!

功能完善以及bug解决思路

流式响应

这里我觉得他是有难度且麻烦的,为什么这么说,因为这不是一个纯前端的项目,通过"stream" = True 参数对 openAi 接口请求获得的是流式响应,如果这是一个纯前端项目,那我就已经拿到流式响应数据了,可以直接处理了,但我这是一个flask后端项目,这意味着我要用flask构建一个流式响应接口,将响应数据实时传送给前端的,说实话,对于这个需求,类似于夫妇段推送消息到前端,我最初是打算用websocket这种全双工通信的方式来做的,而flask中也有相对应的扩展flask-socketio,但这样我又要重构啦!我属时不想重写!

而我们的http也是支持流式响应的,因此我查到了python中的迭代器和生成器是可以完成这个需求的,所以我就做了!看代码:

resp = requests.post(url=app.config["URL"], headers=headers, json=data, stream=True)
# 迭代器实现流式响应
def generate():
    errorStr = ""
    for chunk in resp.iter_lines():
        if chunk:
            streamStr = chunk.decode("utf-8").replace("data: ", "")
            # print(streamStr)
            try:
                streamDict = json.loads(streamStr)  # 说明出现返回信息不是正常数据,是接口返回的具体错误信息
            except:
                errorStr += streamStr.strip()  # 错误流式数据累加
                continue
            delData = streamDict["choices"][0]
            if delData["finish_reason"] == "stop":
                break
            else:
                if "content" in delData["delta"]:
                    respStr = delData["delta"]["content"]
                    # print(respStr)
                    yield respStr

    # 如果出现错误,此时错误信息迭代器已处理完,app_context已经出栈,要返回错误信息,需要将app_context手动入栈
    if errorStr != "":
        with app.app_context():
            yield errorStr

return Response(generate(), content_type='application/octet-stream')

说实话,这没什么,但最难受的是,我想要对于openAi接口返回的错误信息也返回用户,让用户知道是什么问题(因为很多人问我一些错误,其实就是apiKey没钱了或者免费额度过期了),而这个错误信息是json格式的,也是以流的方式返回的,在上面代码中也是可以看到处理的,幸好我对于flask也算熟悉,莫名的bug解决了,就是app_context的问题!

当然最后正确数据的返回我几经尝试,还是直接返回了文本字符串,我尝试过以一种规范的json格式传送,但前端接收处理简直一言难尽,简直没法处理!最后还是传送字符串了!这个我看了很多镜像站,包括一些好的开源项目,他们基本上也都是直接返回文本!

流式响应在前端,我用的ajax中的xhrFields中的onpregress,看过一些方案说是fetch处理流式响应数据更好,我不熟悉,没试过,前端大佬可能知道!

$.ajax({
      url: '/chat',
      method: 'POST',
      data: data,
      xhrFields: {
        onprogress: function(e) {
          var res = e.target.responseText;
          let resJsonObj;
          try{
            resJsonObj = JSON.parse(res);  // 只有错误信息是json类型字符串,且一次返回
            if(resJsonObj.hasOwnProperty("error")){
              addFailMessage('<p class="error">' + resJsonObj.error.type + " : " + resJsonObj.error.message + '</p>');
              resFlag = false;
            }else{
              addResponseMessage(res);
            }
          }catch(e){
            addResponseMessage(res);
          }
        }
      },
      success:function(res){
        // 将最终回复添加到数组
        if (resFlag) {
          messages.push({"role": "assistant", "content": res})
        }
      },
      error: function(jqXHR, textStatus, errorThrown) {
        addFailMessage('<p class="error">' + '出错啦!请稍后再试!' + '</p>');
      },
      complete : function(XMLHttpRequest,status){ 
         // 收到回复,让按钮可点击
         chatBtn.attr('disabled',false)
         // 重新绑定键盘事件
         chatInput.on("keydown",handleEnter); 
         
         if (checkHtmlFlag) {
            let lastResponseElement = $(".message-bubble .response").last();
            let lastResponseHtml = lastResponseElement.html();
            let newLastResponseHtml = lastResponseHtml.replace(/&lt;/g, "<").replace(/&gt;/g, ">").replace(/&amp;/g, "&").replace(/&#39;/g, "'").replace(/&quot;/g, "\"");
            lastResponseElement.html(newLastResponseHtml);
         }
      }
    });

没错,看到上述代码了吗,还是有一些数据校验,头大!
这一块就告一段落,去仓库研究研究代码吧!

防止xss攻击

// 转义html代码(对应字符转移为html实体),防止在浏览器渲染
  function escapeHtml(html) {
    let text = document.createTextNode(html);
    let div = document.createElement('div');
    div.appendChild(text);
    return div.innerHTML;
  }

如果没有其他复杂的输出需求,这代码100%处理哇!,将html标签转换为html实体,防止其输入后搞乱页面样式,这个也能处理javascript代码!

也就是这段代码里的标签对应关系,具体我不多说了:

replace(/&lt;/g, "<").replace(/&gt;/g, ">").replace(/&amp;/g, "&").replace(/&#39;/g, "'").replace(/&quot;/g, "\"");

而恰恰我是有复杂需求的,我是要将openAI接口输出的markdown格式的数据实时转换为html的,经过这样处理,在markdown代码块中就又会显示实体标记,例如本该是<,它就显示成&lt;,简直头大,因此你可看到上面ajax代码请求完成后,我又将代码块中的实体符号换成正常符号了,前前后后转换了三次,谁懂!

但是,非html代码就不需要转换了,为了效率高点,不让最后所有输出结果都替换,我还要判断混合字符串中是否包含html标签,根本没法搞,因为c语言的头文件<stido.h>等头文件也会被识别为html标签,我询问了多次chatgpt,他给出了一个目前我试过的较好的正则表达式,但c++的头文件<cstring>等属实没发判断,就杀掉,放到最后转换吧,更别说还有xml标签!

比较恶心的就是,接口有时返回的不是markdown代码块格式代码,所以html等代码都要过一次上面的escapeHtml(html)函数!

输出格式

white-space: pre-wrap;
word-break: break-all;

这里我不多说,这两个css属性对文本的输出很重要,务必查清楚,这样以后你在前段文本展示上就比较容易了!只要是换行符,空白,英文单词等,对应的就是这两个属性!

最终项目效果

在这里插入图片描述
在这里插入图片描述

主打简洁大气,绿色清新,手机端pc端自适应!欢迎使用!

结语

我曾见证了chatgpt的强大,也体验了New Bing,文心一言等众多AI产品,无不感叹时代的洪流是如此的强大,深深感叹自己的渺小,面对AI浪潮滚滚来袭,我们又该如何面对,出路又是什么?

最起码首先学会使用AI工具会是基本功,这里引用chatgpt官方的一句话:“抢走工作的不会是AI,而是率先掌握AI能力的人!”

【flask从入门到实战】专栏9.9火热订阅中,已包含两个项目,全站独一无二的脚手架搭建,直接复制简单无脑操作,项目结构类似Django,感兴趣的可以看看哦!

flask框架快速入门

其他专栏请前往博主主页查看!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/479355.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微信小程序学习实录1(wxml文档、引入weui、双向数据绑定、提交表单到后端)

微信小程序学习实录 一、wxml文档二、新建页面快捷方式三、微信小程序引入weui四、双向数据绑定1.wxml渲染层2.js逻辑层 提交表单到后端五、微信小程序跳转到H5 一、wxml文档 <!-- index.wxml --> <view><!-- 数据绑定 --><view><text>{{name}}…

蛋白质界的 ChatGPT:AlphaFold2 论文必备知识,不会有人还不知道吧

你知道 AlphaFold2 吗&#xff1f;它真正解决了蛋白质三维结构预测的算法困境&#xff0c;堪称蛋白质界的 chat-GPT4&#xff0c;甚至它的意义不是 chat-GPT4 所能够匹敌的。它为世界疾病治疗药物开发以及探究生物生命之谜提供了通向天神的一条道路&#xff0c;未来是生物的世纪…

Java 基础入门篇(二)—— Java 基础语法

文章目录 一、注释二、字面量三、变量3.1 变量概述3.2 变量在计算机中的底层原理 四、数据类型五、关键字、标志符六、类型转换6.1 自动类型转换6.2 表达式的自动类型转换6.3 强制类型转换 七、运算符7.1 基本算数运算符7.2 符号做连接符7.3 自增自减运算符7.4 赋值运算符7.5 …

Java 基础入门篇(五)—— 面向对象编程

文章目录 一、面向对象的思想二、类的定义与对象的创建三、对象内存分配情况 ★ 3.1 两个对象的内存图3.2 两个变量指向同一个对象内存图 四、构造器4.1 构造器的格式与分类4.2 构造器的调用 五、 this 关键字六、封装七、标准JavaBean补充&#xff1a;局部变量和成员变量的区别…

Java 基础入门篇(六)—— String 类详解

文章目录 一、String 类概述二、String 创建对象的方式2.1 创建对象的两种方式2.2 面试&#xff1a;两种方式的区别 ★2.3 常见面试题 ★ 三、String 类常用方法3.1 字符串内容比较3.2 常用 API&#xff1a;遍历、截取、替换、分割 一、String 类概述 java.lang.String 类代表…

Java 基础入门篇(四)—— 方法的重载与参数传递机制

文章目录 一、方法的定义二、方法的参数传递机制 ★2.1 基本类型的参数传递2.2 引用类型的参数传递 三、方法重载 一、方法的定义 方法的作用&#xff1a;封装一段代码的语法结构&#xff0c;可以被重复调用&#xff0c;以此提高代码的复用性&#xff0c;提高开发效率&#xf…

【VsCode远程开发】Windows SSH远程连接Linux服务器 - 无公网IP内网穿透

文章目录 前言视频教程1、安装OpenSSH2、vscode配置ssh3. 局域网测试连接远程服务器4. 公网远程连接4.1 ubuntu安装cpolar内网穿透4.2 创建隧道映射4.3 测试公网远程连接 5. 配置固定TCP端口地址5.1 保留一个固定TCP端口地址5.2 配置固定TCP端口地址5.3 测试固定公网地址远程 转…

Java 基础进阶篇(一)—— static 静态关键字与单例模式

文章目录 一、static 静态关键字1.1 静态成员变量与实例成员变量1.2 静态成员方法与实例成员方法1.3 static 访问注意事项1.4 内存使用情况 二、工具类三、代码块四、单例模式4.1 饿汉单例4.2 懒汉单例 一、static 静态关键字 static&#xff1a;代表静态的意思&#xff0c;可…

KaliLinux安装burpsuite(超详细)

注意事项 1.注意linux位数 安装jdk之前先输出uname -a&#xff0c;看看kali linux是32位的还是64位&#xff0c;例如此处我的kali是32位的&#xff0c;因此需下载的是32位的jdk 2.jdk版本 jdk版本最好是oracle的&#xff0c;若使用的是openjdk很可能会出现burpsuite闪退现象…

远程访问本地jupyter notebook服务 - 无公网IP端口映射

文章目录 前言视频教程1. Python环境安装2. Jupyter 安装3. 启动Jupyter Notebook4. 远程访问4.1 安装配置cpolar内网穿透4.2 创建隧道映射本地端口 5. 固定公网地址 转载自远控源码文章&#xff1a;公网远程访问jupyter notebook【cpolar内网穿透】 前言 Jupyter Notebook&am…

【Linux】信号的保存信号的捕捉信号集零碎知识点总结

【Linux】信号的保存&信号的捕捉&信号集&零碎知识点总结 一、信号的保存1.1 信号几种概念1.2 信号在内核中的表示 二、信号的捕捉了解用户态和内核态2.1 捕捉过程2.2 信号的捕捉方法2.3 信号捕捉规则2.4 多信号屏蔽问题 三、信号集3.1 概念3.2 信号集&#xff08;s…

【视频教程解读】Window上安装和使用autogluon V0.7

1.使用conda安装的python环境 教程使用的是极简版miniconda,由于我们的电脑中安装了anaconda&#xff0c;所以不需要进行进一步安装。python版本为3.9&#xff0c;博客里面有anaconda和python版本的对应关系。注意查看版本autogluon V0.4需要3.8或者3.9和3.10&#xff0c;pip版…

2023年第二十届五一数学建模B题:快递需求分析问题-思路详解

一、题目简析 今年的B题是一道较为综合的题目&#xff0c;包括了数据分析、综合评价、时间序列预测、最优化问题以及概率估计问题。考察范围广&#xff0c;但是整体看来题目背景简单&#xff0c;切入点多&#xff0c;难度适中。 二、逐问思路 1.问题1&#xff1a;附件1为该快…

私有GitLab仓库 - 本地搭建GitLab私有代码仓库并随时远程访问「内网穿透」

文章目录 前言1. 下载Gitlab2. 安装Gitlab3. 启动Gitlab4. 安装cpolar内网穿透5. 创建隧道配置访问地址6. 固定GitLab访问地址6.1 保留二级子域名6.2 配置二级子域名 7. 测试访问二级子域名 转载自远控源码文章&#xff1a;Linux搭建GitLab私有仓库&#xff0c;并内网穿透实现公…

迷你主机安装openwrt软路由系统(附启动盘制作教程+ISO、IMG镜像文件)

之前在迷你主机上刷了一个openwrt的软路由&#xff0c;安装过程分享给大家&#xff0c;镜像文件在文章末尾~ 一般需要做软路由系统的机器&#xff0c;是需要至少两个网口的&#xff0c;一个做wan口&#xff0c;一个做lan口 由于其他因素&#xff0c;不能直接将openwrt直接安装…

ChatGPT是什么?ChatGPT里的G、P、T分别指什么

文章目录 ChatGPT是什么GTP中的 生成式 是什么意思GTP中的 预训练 是什么意思GTP中的 变换模型 是什么意思 什么是Transformer什么是注意力机制 监督学Xi、无监督学Xi、强化学Xi ChatGPT是什么 GPT: Generative Pre-trained Transformer 生成式预训练变换模型 ChatGPT是由Ope…

学习RHCSA的day.02

目录 2.3常用简单命令 2.4使用Bash执行命令 2.5 命令帮助 2.3常用简单命令 常用系统工作命令 1、echo命令 echo命令用于在终端设备上输出字符串或变量提取后的值&#xff0c;语法格式为&#xff1a;“echo [字符串] [$变量]”。 这是在Linux系统中最常用的几个命令之一&am…

蒙蒂霍尔悖论

贝叶斯与频率主义对蒙蒂霍尔问题的解 在定义概率时&#xff0c;通常有两种思想流派&#xff1a;贝叶斯主义和频率主义。前者将概率视为我们对事件发生的信念程度&#xff0c;而后者则将其视为事件发生的相对频率。这篇文章介绍了使用贝叶斯和频率主义方法来解决著名的蒙蒂霍尔问…

C++每日一练:小艺照镜子(详解分治法)

文章目录 前言一、题目二、解题1.分析 总结 前言 大过节的&#xff0c;不想去看人后脑勺&#xff0c;就做点题来玩。挑了小艺照镜子&#xff0c;百分通过~ 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、题目 题目名称&#xff1a; 小艺照镜子 …

【论文解读】(如何微调BERT?) How to Fine-Tune BERT for Text Classification?

文章目录 论文信息1. 论文内容2. 论文结论2.1 微调流程2.2 微调策略(Fine-Tuning Strategies)2.3 Further Pretrain 3. 论文实验介绍3.1 实验数据集介绍3.2 实验超参数3.3 Fine-Tuning策略探索3.3.1 处理长文本3.3.2 不同层的特征探索3.3.3 学习率探索&#xff08;灾难性遗忘探…