第三期书生大模型实战营之茴香豆工具实践

news2024/9/20 10:40:41

在这里插入图片描述

文章目录

          • 基础任务
          • 作业记录
            • 1. 环境准备
            • 2. 模型准备
            • 3. 修改配置文件
            • 4. 知识库创建
            • 6. 启动茴香豆webui

基础任务

在 InternStudio 中利用 Internlm2-7b 搭建标准版茴香豆知识助手,并使用 Gradio 界面完成 2 轮问答(问题不可与教程重复,作业截图需包括 gradio 界面问题和茴香豆回答)。知识库可根据根据自己工作、学习或感兴趣的内容调整,如金融、医疗、法律、音乐、动漫等。

作业记录

web版使用

在这里插入图片描述
这里需要添加知识库对应的名称及密码(如果没有相当于新建一个),这里我选择了关于一个关于医疗器械的文档作为我的知识库构建的材料。
在这里插入图片描述
然后可以尝试添加正反例。

在这里插入图片描述
在这里插入图片描述
结果展示(反例):

在这里插入图片描述
开发机本地部署版

1. 环境准备

首先可以使用开发机内置的conda环境,如下所示

# 创建conda环境
studio-conda -o internlm-base -t huixiangdou

conda activate huixiangdou

# 拉取茴香豆源码
cd /root
# 克隆代码仓库
git clone https://github.com/internlm/huixiangdou && cd huixiangdou
git checkout 79fa810

然后我们还需要安装茴香豆的相关依赖

conda activate huixiangdou
# parsing `word` format requirements
apt update
apt install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig libpulse-dev
# python requirements
pip install BCEmbedding==0.15 cmake==3.30.2 lit==18.1.8 sentencepiece==0.2.0 protobuf==5.27.3 accelerate==0.33.0
pip install -r requirements.txt

在这里插入图片描述

2. 模型准备
# 创建模型文件夹
cd /root && mkdir models

# 复制BCE模型
ln -s /root/share/new_models/maidalun1020/bce-embedding-base_v1 /root/models/bce-embedding-base_v1
ln -s /root/share/new_models/maidalun1020/bce-reranker-base_v1 /root/models/bce-reranker-base_v1

# 复制LLM文件
ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-7b /root/models/internlm2-chat-7b
3. 修改配置文件
sed -i '9s#.*#embedding_model_path = "/root/models/bce-embedding-base_v1"#' /root/huixiangdou/config.ini
sed -i '15s#.*#reranker_model_path = "/root/models/bce-reranker-base_v1"#' /root/huixiangdou/config.ini
sed -i '43s#.*#local_llm_path = "/root/models/internlm2-chat-7b"#' /root/huixiangdou/config.ini
4. 知识库创建

我通过创建了一个关于医疗器械方面的txt文件,用来作为对应的知识库,同时还调整了一下正例,操作如下所示

# 创建文件
# 然后输入对应的内容
touch common_sense.txt

python3 -m huixiangdou.service.feature_store

在这里插入图片描述
在这里插入图片描述

6. 启动茴香豆webui
conda activate huixiangdou
cd /root/huixiangdou
python3 -m huixiangdou.gradio

在这里插入图片描述
webui展示,问题是医疗器械产品分为哪几类
在这里插入图片描述
后台记录:
在这里插入图片描述
webui展示,问题是什么是医疗器械
在这里插入图片描述
后台信息:
在这里插入图片描述

参考资料:https://github.com/InternLM/Tutorial/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2080160.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IDEA2023版本创建SSM项目框架

按图中红色数字顺序,先点击Maven,设置该项目为maven构建管理的项目,然后点击create进行项目创建 配置该项目的相关maven信息,按下图顺序进入到maven配置页面后进行本地maven相关信息配置。 创建web模块依次按下图中顺序进行点击 配…

朴世龙院士团队《Global Change Biology 》精确量化全球植被生产力对极端温度的响应阈值!

本文首发于“生态学者”微信公众号! 随着全球气候变暖的加剧,极端温度事件对陆地生态系统的影响日益显著。植被作为生态系统的重要组成部分,其生产力对温度变化的响应尤为敏感。然而,关于极端温度如何以及在何种程度上影响植被生产…

TCP三次握手过程详解

三次握手过程: 客户端视角: 1.客户端调用connect,开启计时器,发送SYN包,如果重传超时,认为连接失败 2.如果收到服务端的ACK,则进入ESTABLISHED状态 3.清除重传计时器,发送ACK&…

windows权限维持汇总

Windows 权限维持 一、文件层面 1)attrib 使用 Attrib s a h r 命令 s:设置系统属性(System) a:设置存档属性(Archive) h:设置隐藏属性(Hidden) r&#…

深度学习基础--11个专题带你入门Pytorch上

目的 本专栏更新深度学习基础,包括pytorch、tensorflow的使用以及CNN、RNN、yolo、GAN、LSTM、Transformer等神经网络的理论基础 前言 Pytorch是最常用的深度学习框架,里面包含了大量关于构建神经网络及其运算的APIPytorch基础入门分为上下两篇文章&am…

基于事件总线EventBus实现邮件推送功能

什么是事件总线 事件总线是对发布-订阅模式的一种实现。它是一种集中式事件处理机制,允许不同的组件之间进行彼此通信而又不需要相互依赖,达到一种解耦的目的。 关于这个概念,网上有很多讲解的,这里我推荐一个讲的比较好的&#x…

光伏设计时要画出哪些模型?

在光伏系统的设计中,为了确保项目的顺利实施与高效运行,设计师需要绘制多种模型来综合考虑各种因素,包括参照物、障碍物以及楼顶配房等。这些模型不仅有助于预测光伏系统的发电效率,还能帮助规划最佳的安装布局,减少阴…

碎片笔记|Computer Journal 期刊投稿注意事项

前言:3月份把之前做的一篇工作转投到了computer journal,8月7号来信说我投稿的工作之前因为挂在arXiv上,因此和正常的投稿要求不太一致,需要更换投稿方式,编辑提供了两种选择如下。 The first choice is to keep your …

python 接口自动化测试中的高阶函数!

高阶函数简介 高阶函数是指接受函数作为参数或者返回函数作为结果的函数。在 Python 中,有许多内置的高阶函数,如 map, filter, reduce 等,它们可以极大地简化代码并提高代码的可维护性。 summer camp map 函数 map 函数接收一个函数和一个…

Jmeter下载、配置环境变量

Jmeter下载 下载地址:Apache JMeter - Download Apache JMeter 下载后无需安装,解压后即可使用。解压后目录如下 配置环境变量 JMETER_HOME 环境变量Path %JMETER_HOME%\bin 环境变量CLASSPATH %JMETER_HOME%\lib 验证是否配置成功 在cmd命令窗中 输入…

玄机又成国漫首创!IP与AI融合,凭实力火出圈

现在国漫越来越卷了,不仅卷制作质量,还卷各种花式联动。最近玄机科技和百度文库联合举办的AI漫画大赛圆满结束,这还是国内的IP第一次和AI技术融合,而且产出了不少好作品。下面就一起来看看吧! 提到玄机科技&#xff0c…

机器人笛卡尔空间轨迹规划-直线差补和圆弧差补

上一文,我们讨论了三次多项式和五次多项式的差补算法,那么这边文章具体讨论一下笛卡尔空间轨迹规划的直线差补和圆弧差补。 步骤 (1)知道起始点和终止点的位姿,和速度信息。 (2)根据两点能确定一…

湖仓一体大数据平台:开启企业数据管理新时代(附Hudi案例)

湖仓一体大数据平台:开启企业数据管理新时代(附Hudi案例) 前言湖仓一体大数据平台 前言 在当今数字化浪潮汹涌澎湃的时代,数据如同企业发展的珍贵宝藏,而如何高效地挖掘、管理和利用这些宝藏,成为了企业在…

详细的Anaconda安装jupyter notebook与使用

jupyter notebook概念 Jupyter Notebook 是一种交互式计算环境,广泛用于数据分析、机器学习和编程学习等领域。 一、pip安装 打开 Anaconda Prompt 输入:pip install jupyter notebook pip install jupyter notebook 安装成功画面 输入命令&#xff1…

Git实战精粹

一、快速入门 1. 什么是Git Git是一个分布式的版本控制软件。 软件,类似于QQ、office、dota等安装到电脑上才能使用的工具版本控制,类似于毕业论文、写文案、视频剪辑等,需要反复修改和保留原历史数据分布式 文件夹拷贝本地版本控制集中式…

SpringMVC基于注解的使用

SpringMVC基于注解的使用 首先导入spring-mvc的依赖文件 然后配置上篇文章的web.xml文件 在配置上篇文章的spring-mvc.xml文件 创建一个ParamsContrller类写个方法方法里面的参数名可以用到客户端请求,且可以为参数写任意类型 如果想改参数名可以用RequestParam为…

3D模型OBJ格式详解

竹杖芒鞋轻胜马,谁怕?一蓑烟雨任平生~ 个人主页: rainInSunny | 个人专栏: C那些事儿、 Qt那些事儿 文章目录 写在前面OBJ格式解析OBJ文件示例MTL文件OBJ渲染简述 写在前面 OBJ格式是一种简单的文本格式,用于描述三维模型的几何形状和材质…

golang本地缓存fastcache高性能实现原理

1. git仓库 https://github.com/abbothzhang/fastcache 2. 整体原理 initCache时不会申请内存,只有第一次set时候才会申请,且会一次性申请64MB,后面不够了又一次性申请1024*64MB大小内存 2.1. 时序图 3. 高性能原因 将cache分为512个buc…

Unity(2022.3.41LTS) - 网格,纹理,材质

目录 零.简介 一、网格(Mesh) 二、材质(Material) 三、纹理(Texture) 四、三者之间的关系 零.简介 在 Unity 中,网格(Mesh)、纹理(Texture)和…

软考评测知识点

常见的存储单位: 1B8bit 1TB1024GB 1GBMBKBB 机器数:将符号数字化的数,是数字在计算机中的二进制表示形式。(最高位0表示正数,1表示负数) 二进制正数的原码、反码、补码不变,移码等于补码符号位…