大模型框架LangChain开发实战（二）

大模型框架LangChain开发实战（二）

news2026/2/11 23:18:45

一、关于数据的准备及项目背景

Notion提供了团队管理的功能，方便团队成员进行在线协作办公，提高交互效率，notion上面的数据可能包括项目的数据，进度管理的数据，企业服务的数据等等，这里使用了从notion网站（https://www.notion.so）导出的一些样例数据供本项目使用大模型框架LangChain来调用。下面展示的是样例数据中的一些关于office的数据：

本项目是以对话的方式来获取notion上面的数据，这是一件有价值的事情，这是因为随着时间的推移，notion上面的数据会越来越多，那么这时直接去notion上查询或者定位信息是一个很费时费力的过程，如果我们使用一个简单的接口，以自然语言的方式通过LangChain以模型驱动为基础来与企业私有数据进行交互，这对提升团队协作效率等很有帮助。

二、项目构建及简单演示

为了测试方便，可以使用streamlit来搭建一个简单的界面：

import streamlit as st

from streamlit_chat import message

使用LangChain访问私有数据，这里的VectorDBQAWithSourcesChain可以看做是一个use case，譬如与数据库进行交互，或者与一个vector space进行交互等：

from langchain import OpenAI

from langchain.chains import VectorDBQAWithSourcesChain

使用向量化检索工具faiss，以大模型为驱动通过LangChain框架来查询存储在notion上的私有数据，在下面的方法from_llm中使用的store就是基于faiss构建的向量索引库：

当用户输入信息后，返回查询结果：

以下是演示结果，当用户输入以下信息：

How long is the probation period?

LangChain访问数据并与模型交互后返回了相应的查询结果和所引用的notion page文件：

根据演示界面提到的引用文件，打开后可以发现有相关的信息如下：

三、关于LangChain使用进一步分析

除了上面提到的使用VectorDBQAWithSourcesChain来调用LangChain框架，也可以使用下面的方式：

首先根据chain type构建一个chain，主要参数包括语言模型，chain type，这里使用chain type的主要原因在于跟本地私有数据进行交互时，会涉及到数据规模的问题和处理速度的问题，相应的解决方案是：

-map reduce（数据切分，适用于大数据文件）

-rerank（选取confidence最高的那个文件）

-stuff（一次性加载所有数据）

-refine（把文件切成多个片段时，分析第二个片段时会结合第一个片段的内容）

所以在调用方法load_qa_with_sources_chain的内部，我们可以看到相关的处理逻辑：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/910464.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【校招VIP】产品分析能力之用户画像出发

【校招VIP】产品分析能力之用户画像出发

考点介绍： 用户行为和交互是产品经理能力的重要部分，在校招中，基于用户画像的分析题和设计题也是高频考点。『产品分析能力之用户画像出发』相关题目及解析内容可点击文章末尾链接查看！ 一、考点题目 1. 爱奇艺中搜索关键词“…

阅读更多...

【C++ 学习⑮】- 模板进阶

【C++ 学习⑮】- 模板进阶

目录一、必须使用 typename 的场景二、非类型模板参数三、模板的特化 3.1 - 函数模板特化 3.2 - 类模板特化 3.2.1 - 全特化 3.2.2 - 偏特化四、类模板分离式编译 4.1 - 分离编译的概念 4.2 - 类模板分离式的问题 4.3 - 解决方案一、必须使用 typename 的场景 …

阅读更多...

shell 基础3

shell 基础3

在第一行后面追加内容在第3行后面追加内容在每行前面加在第四行前面加入 -i表示添加在文本中在每个22后面加 $a 在文件最后一行追加匹配到每个包含22的行，并在之前加把第7行整行替换将所有匹配22的行替换删除第5行隔行删除，删除奇数行删除偶数…

阅读更多...

live555server环境搭建

live555server环境搭建

live555环境搭建详解（ubuntu18.04） 1.环境依赖 openssl可选安不安安装（选择好版本） sudo apt-get update sudo apt-get install openssl sudo apt-get install libssl-dev使用头文件是否可用时编译测试时记得链接&#xff08…

阅读更多...

【C++入门到精通】C++入门 —— priority_queue(STL)优先队列

【C++入门到精通】C++入门 —— priority_queue(STL)优先队列

阅读导航前言一、priority_queue简介1. 概念2. 特点二、priority_queue使用1. 基本操作2. 底层结构三、priority_queue模拟实现⭕ C代码⭕priority_queue中的仿函数总结温馨提示前言 ⭕文章绑定了VS平台下std::priority_queue的源码，大家可以下载了解一下&…

阅读更多...

C#，数值计算——Ridders的多项式外推方法的计算方法与源程序

C#，数值计算——Ridders的多项式外推方法的计算方法与源程序

using System; namespace Legalsoft.Truffer { /// <summary> /// 通过Ridders的多项式外推方法返回函数func在点x处的导数。 /// 输入值h作为估计的初始步长；它不需要很小，而是应为x上的增量， /// 在此增量上func将发…

阅读更多...

在CMD中找不到Bootrec/fixboot元素怎么办？

在CMD中找不到Bootrec/fixboot元素怎么办？

当您尝试在CMD中执行Bootrec/fixboot以修复Windows 7/8.1/8/10/11和Windows Server 2012等操作系统中的系统启动问题时，通常会遇到Bootrec/fixboot参数无效的情况。这类启动问题可能是由磁盘克隆、系统迁移、Windows更新、MBR和GPT转换等引起的。当一个问题仍然存在…

阅读更多...

YOLO目标检测——矿石数据集图片下载分享

YOLO目标检测——矿石数据集图片下载分享

矿石图片，其中训练集包括“玄武岩”、“花岗岩”、“大理石”、“石英岩”、“煤”、“石灰石”、“砂岩”七种矿石图片。测试集包括24张相应的七种矿石图像。数据集点击下载： 矿石数据集4500图片数据说明.rar

阅读更多...

OpenGL学习路程（一）

OpenGL学习路程（一）

Hello啊各位，鸽了挺长时间没更新，其实是博主找到新乐子了。如标题所说，我正在学习OpenGL。现在已经成功的调用显卡画出了一个三角形，这虽然不是什么大的成就，但已经让我很兴奋了。我不打算在这里写出我配置openg…

阅读更多...

Pyqt5-开源工具分解功能(文本拖拽)

Pyqt5-开源工具分解功能(文本拖拽)

开源第四篇：功能实现之拖拽功能与配置文件。写这个功能的初衷，是因为，每次调试我都要手动敲命令，太麻烦了，想偷个懒，所以直接给这功能加上了，顺便衍生出了另一个想法，配置文件自动填写相关数据。先看个简单的拖拽功能：很明显吧，还是比较便捷的。所以我们本章，就在…

阅读更多...

TextView加粗字体太粗

TextView加粗字体太粗

解决方法如下： import android.content.Context; import android.graphics.Canvas; import android.graphics.Paint; import android.util.AttributeSet;import androidx.annotation.Nullable; import androidx.appcompat.widget.AppCompatTextView;/*** 自定义加粗…

阅读更多...

【真人语音】讯飞星火个人声音训练及导出工具V0.2.exe

【真人语音】讯飞星火个人声音训练及导出工具V0.2.exe

【项目背景】小编一直在尝试着短视频技术，在读文案的时候经常会读错；所以，只能用微软或者剪映的文本转语音软件。很早之前在Github上也看到过真人人声训练的开源代码，尝试过一番之后，也是以失败告终；就…

阅读更多...

若依项目的运行详细步骤

若依项目的运行详细步骤

目录一、项目的解读与获取二、项目的运行后端步骤(ruoyi-admin) （一）导入若依的2个SQL文件版本建议 （二）Redis的配置 （三）启动后端前端步骤(ruoyi-ui) 版本建议 （一）…

阅读更多...

深入了解Git：介绍及常用命令指南

深入了解Git：介绍及常用命令指南

当今软件开发领域中，版本控制是一个至关重要的概念，而Git作为最流行的分布式版本控制系统，发挥着不可替代的作用。本文将介绍Git的基本概念以及常用命令，帮助你更好地理解和使用这一强大的工具。 Git简介 Git是一种分布式版本管…

阅读更多...

结构化知识管理-20张思维导图为例子

结构化知识管理-20张思维导图为例子

思维导图，是结构化思考最高效的工具。以中心主题为核心，通过各级主题的组合来呈现信息。思维导图的可视化图形表达，让我们可以更加便于理解和记忆。各主题间相互连接的形式，展现了信息间的相关性。促进我们综合性的思考。思维导…

阅读更多...

飞机打方块（三）特殊按钮制作

飞机打方块（三）特殊按钮制作

一、特殊按钮容器 1.新建PropController脚本，并绑定新建的特殊按钮容器节点 GameController.ts property({ type: cc.Node, displayName: "特殊按钮节点", tooltip: "特殊按钮节点，分别为全消无敌和菜单" })special_btn: cc.Node …

阅读更多...

三种生成树（STP,RSTP,MSTP)的基本配置（自我理解）

三种生成树（STP,RSTP,MSTP)的基本配置（自我理解）

目录一、为什么要使用生成树（STP)： 二、由于设备冗余而导致的问题： 广播风暴： 三、802.1D生成树基本配置四、802.1D生成树实验实验拓扑： 实验配置： 配置完成后，在SW8上观察现象&…

阅读更多...

[Docker] Windows 下基于WSL2 安装

[Docker] Windows 下基于WSL2 安装

Docker 必须部署在 Linux 内核的系统上。如果其他系统想部署 Docker 就必须安装一个虚拟 Linux 环境。 1. 开启虚拟化进入系统BIOS（AMD 为 SVM；Intel 为 Intel-vt）改为启用(enable) 2. 开启WSL 系统设置->应用->程序和功能->…

阅读更多...

前端 -- 基础 HTML基本语法结构标签介绍

前端 -- 基础 HTML基本语法结构标签介绍

HTML 语法规范基本语法概述 : HTML 标签是由尖括号包围的关键词，示例 ： <html> HTML 标签通常是成对出现的，例如 <html > 和 < /html > ， 我们称为双标签。标签对中的第一个标签是开始标签，…

阅读更多...

docker搭建私有镜像harbor

docker搭建私有镜像harbor

docker安装搭建私有仓库 Harbor harbor用于存储和分布docker镜像企业级registry服务器的harbor使用的是官方的docker registry(v2命名是distribution)服务去完成。安装harhor 启动harbor 6.

阅读更多...

推荐文章

最新文章