书生第三课作业

news2024/11/28 12:40:43

视频:https://www.bilibili.com/video/BV1QA4m1F7t4/

教程:https://github.com/InternLM/Tutorial/blob/camp2/huixiangdou/readme.md

作业:https://github.com/InternLM/Tutorial/blob/camp2/huixiangdou/homework.md

项目地址:https://github.com/InternLM/HuixiangDou

RAG技术简介

Retrieval Augmented Generation

Retrieval-augmented generation (RAG) for large language models (LLMs) aims to improve prediction quality by using an external datastore at inference time to build a richer prompt that includes some combination of context, history, and recent/relevant knowledge (RAG LLMs). RAG LLMs can outperform LLMs without retrieval by a large margin with much fewer parameters, and they can update their knowledge by replacing their retrieval corpora, and provide citations for users to easily verify and evaluate the predictions.

简单来说RAG提供了一种更新大模型知识高效率方法可以用来添加

  1. 实时信息
  2. 用户特定信息

项目内容

  1. 基础环境配置(基于conda完成)

2. 模型权重文件下载

使用下列链接

https://huggingface.co/maidalun1020/bce-embedding-base_v1/tree/main

3. 此前的conda环境中安装相关deps 然后切换分支

4. 修改 embedding_model_path reranker_model_path local_llm_path

5.下载茴香豆的语料库,提取知识库特征,创建向量数据库。增加茴香豆相关的问题到接受问题示例中

6.再创建一个测试用的问询列表,用来测试拒答流程是否起效.在确定好语料来源后,创建 RAG 检索过程中使用的向量数据库。

7.最后运行茴香豆

交互screnshot如下

参考链接

What is Retrieval Augmented Generation (RAG) for LLMs? - Hopsworks

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1659228.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于Opencv的车牌识别系统(毕业设计可用)

系统架构 图像采集:首先,通过摄像头等设备捕捉车辆图像。图像质量直接影响后续处理的准确性,因此高质量的图像采集是基础。 预处理:对获取的原始图像进行预处理,包括灰度化、降噪、对比度增强和边缘检测等。这些操作旨…

什么是内存泄漏?什么是内存溢出?

我们讲内存溢出时,首先看一下上面这张图,比如说你要往一个500ml的杯子里倒800ml的水,这样肯定是装不下的,水会溢出来,在我们电脑内存中也是一样的,你这个内存中就只有5M的内存空间,可是你要将8M…

如何编辑百度百科并提供参考资料

大家都知道参考资料是创建百度百科中最重要的一步,百度百科只收录可以找到资料来源的事实,参考资料的意义在于,指出该部分内容的来源/出处,从而保障这段内容是客观真实的。 注册和登录百度账号 首先,你需要在百度百科…

腿式移动机器人

腿式运动以一系列机器人和地面之间的点接触为特征。其主要优点包括在粗糙地形上的自适应性和机动性。 因为只需要一组点接触,所以只要机器人能够保持适当的地面步距,这些点之间的地面质量是无关紧要的。另外,只要行走机器人的步距大于洞穴的宽度,它就能跨越洞穴或者…

软件工程复习之软件定义时期

1.什么是软件? 答:软件是程序,数据和文档的集合。 程序是完成指定功能的计算机可执行的指令序列。 数据是程序进行信息处理的数据结构。 文档是开发,使用,维护的图文资料。 2.软件有何特点? 答&#…

Python远程连接Linux执行操作

一、任务要求 要使用Python编写代码来远程给Linux主机上传一个文件,可以使用paramiko库,这是一个实现了SSHv2协议的Python库,它支持SSH连接(包括客户端和服务端),并且提供SFTP(SSH File Transf…

无线充电宝哪个比较好?哪些充电宝牌子比较值得入手?充电宝排名

在智能科技飞速发展的当下,智能手机已成为我们生活中不可或缺的一部分。然而,手机电量的限制却时常让我们陷入窘境,担心错过重要信息或无法完成关键操作。为了应对这一挑战,充电宝应运而生,成为了我们出行的得力助手。…

PSoc™62开发板之IoT应用

实验目的 使用PSoc62™开发板驱动OLED模块,实时监控室内的光照强度、温度信息 实验准备 PSoc62™开发板SSD1309 OLED模块DS18B20温度传感器BH1750光照传感器 模块电路 SSD1309 OLED模块的电路连接和模块配置教程请参考之前的文章,这里不详细展开描…

通配符证书是什么意思?使用起来有什么优势?

通配符证书就像是一个万能钥匙,但它专门用于网站的安全。当你运营一个网站时,特别是有很多子网站,每个都需要安全连接(比如开头是https的网址),通常你需要为每个子网站买一个证书来保证访问者的安全。但是&…

ICLR 2024 杰出论文出炉:“大模型”成最大赢家

源自:北京科技大学机械工程学院 作者:陈哲涵 黎学臻 ““人工智能技术与咨询” 发布 国际表征学习大会(International Conference on Learning Representations,ICLR)公布了 ICLR 2024 杰出论文。 声明:公众号转载的…

5月游戏市场迎来新的体验,网易两款游戏重磅出炉

易采游戏网5月9日消息,随着科技的飞速发展,手机游戏已经成为人们休闲娱乐的重要方式。在这个领域,网易作为国内领先的游戏开发商,一直致力于为玩家带来高品质的游戏体验。近日,网易携手国际大厂Square Enix&#xff0c…

Azure Windows2012升级2016

Azure Windows2012升级2016 在自己电脑配置Azure PowerShell前置条件PowerShell 登录到 Azure Azure 中运行 Windows Server 的 VM 的就地升级前置条件,生成一块OS磁盘将生成的OS磁盘附件到需升级的服务器执行就地升级到 Windows Server 2016 升级后配置故障恢复 在…

Allegro PCB designer放置振列过空,Via Array,

首先 Place >>Via Array, 然后配置options 选项卡。 最后鼠标左击一下,拉个区域框,再点击一下。如下图 尤其注意鼠标左击一下再左击一下。

可持续未来:含镍废水处理工艺的革新探索

在向可持续能源转型的全球大潮中,高性能动力电池的生产扮演着举足轻重的角色。这些电池核心材料包含镍、钴、锰和铝等贵重元素,极大地提升了电池的能效,但同时也带来了含镍废水处理的严峻挑战。本文旨在深入探讨当前处理含镍废水的四大主流技…

HTML4(三):表单

文章目录 表单1. 基本结构2. 常用表单控件2.1 文本输入框2.2 密码输入框2.3 单选框2.4 复选框2.5 隐藏域2.6 提交按钮2.7 重置按钮2.8 普通按钮2.9 文本域2.10 下拉框2.11 示例 3. 禁用表单控件4. lable标签5. fieldset与legend标签6. 总结 表单 概念:一种包含交互…

链表第5/9题--两两交换链表中的节点--递归法

LeetCode24: 给你一个链表,两两交换其中相邻的节点,并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题(即,只能进行节点交换)。 示例 1: 输入:head [1,2,3,4…

【PX4-AutoPilot教程-TIPS】Matlab使用ROS Toolbox编译MAVROS2消息报错缺少geographic_msgs消息

Matlab使用ROS Toolbox编译MAVROS2消息报错缺少geographic_msgs消息的解决方法 问题描述解决方法 环境: MATLAB : R2022b ROS Toolbox : 1.6 Windows :Windows 10 22H2 ROS :ROS2 Foxy 问题描述 在使用Matlab的ROS Toolbox工具箱编译与…

蓝桥杯EDA客观题

目录 前言 一、PCB类知识点和题目分析 1.电阻 2.电容 3.封装类 4.单位转换类 5.电路板结构类 6.PCB绘制规则 7.立创软件 8.PCB硬件 线性电源和开关电源 二、数电知识点和题目分析 1.门电路 2.逻辑代数 3.组合逻辑电路 4.触发器 5.时序逻辑电路 6.其他 三、模…

怎么编辑百度百科

百度百科是一个开放、免费的在线百科平台,由百度公司推出,旨在创造一个涵盖各领域知识的中文信息收集平台。任何人都可以通过注册百度账号并登录后,对符合条件的词条进行编辑和修改。以下是编辑百度百科的步骤和注意事项: 注册和登…

河北公司推行精益管理咨询时需要注意哪些问题?

近年来,越来越多的河北公司开始关注并推行精益管理咨询,以期通过优化流程、降低成本、提高效率来获得竞争优势。然而,在实施过程中,公司需要注意一系列问题,以确保精益管理咨询能够顺利推进并取得预期效果。天行健精益…