开源大模型应用开发

开源大模型应用开发

news2026/2/15 11:05:57

1.大语言模型初探

ChatGLM3简介

ChatGLM3-6B 是一个基于 Transformer 的预训练语言模型，由清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练发布。该模型的基本原理是将大量无标签文本数据进行预训练，然后将其用于各种下游任务，例如文本分类、命名实体识别、情感分析等。
ChatGLM3-6B 的核心功能是语言建模，即通过预测下一个单词或字符来建立一个语言模型。该模型采用了 Transformer 结构，这是一种基于自注意力机制的深度神经网络结构，能够有效地捕捉文本中的长期依赖关系。
ChatGLM3-6B 模型具有多种预训练任务，例如文本分类、命名实体识别、情感分析等。在预训练过程中，模型会学习到各种语言知识和模式，从而能够更好地完成各种下游任务。
ChatGLM3-6B 模型的局限性在于它只能处理已经训练好的模型，无法直接用于新的、未标注的数据。此外，由于预训练模型是基于无标签数据的，因此它可能无法完全捕捉到某些特定的语言知识和模式。
总的来说，ChatGLM3-6B 是一个功能强大的语言模型，能够在各种文本相关的任务中表现出色。它的核心功能是基于 Transformer 结构的自注意力机制，能够捕捉文本中的长期依赖关系。同时，它还具有多种预训练任务，能够更好地完成各种下游任务。然而，它的局限性在于只能处理已经训练好的模型，无法直接用于新的、未标注的数据。

2.LangChain及其核心组件介绍

LangChain简介

LangChain是一个开源框架，允许从事人工智能的开发者将例如GPT-4的大语言模型与外部计算和数据来源结合起来。该框架目前以Python或JavaScript包的形式提供。
假设，你想从你自己的数据、文件中具体了解一些情况（可以是一本书、一个pdf文件、一个包含专有信息的数据库）。LangChain可以将GPT-4和这些外部数据连接起来，甚至可以让LangChain帮助你采取你想采取的行动，例如发一封邮件。

实践课程：

1、实现pdf、jpg格式文档的加载与解析

文件位置：document_loader.ipynb

2、实现一个于基ChatGLM3+LangChain的聊天应用，需要有Gradio界面

文件位置：chat.ipynb

3、基于LangChain+ChatGLM3实现本地知识库问答，需要有Gradio界面。

支持txt、md、pdf、jpg四种格式的本地文件。
文件位置：langchain_chatglm3_V3.ipynb
最终Gradio界面问答如图：

直接生成文本：

直接生成_1.gif

流聊天方式生成文本

流聊天方式_1.gif

4、将导入的文档向量化并存入数据库，以及基于词向量的相似文本检索

document_search.ipynb

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1352687.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

c++基础（对c的扩展）

c++基础（对c的扩展）

文章目录命令空间引用基本本质引用作为参数引用的使用场景内联函数引出基本概念函数补充默认参数函数重载c中函数重载定义条件函数重载的原理命令空间定义 namespace是单独的作用域两者不会相互干涉 namespace 名字 { //变量函数等等 }eg namespace nameA {int num;v…

阅读更多...

力扣每日一题99：恢复二叉搜索树

力扣每日一题99：恢复二叉搜索树

题目给你二叉搜索树的根节点 root ，该树中的恰好两个节点的值被错误地交换。请在不改变其结构的情况下，恢复这棵树。示例 1： 输入：root [1,3,null,null,2] 输出：[3,1,null,null,2] 解释：3 不能是 1 …

阅读更多...

数脉观察二丨详解CroPoolv2.0锁仓收益机制文末附锁仓教程

数脉观察二丨详解CroPoolv2.0锁仓收益机制文末附锁仓教程

1月1日元旦佳节期间，CyberVein基金会支持打造的CroPoolv2.0最新版本正式上线，获得了圈内媒体和知名KOL多方的关注，在Staking领域掀起了热议，用户可以前往CroPool.net进行锁仓体验。 CroPool v2.0新增“锁仓”功能板块&#xff0c…

阅读更多...

findata——科学数据搜索引擎

findata——科学数据搜索引擎

findata由中国科学院计算机网络信息中心提供，具有很强的数据检索能力。网址如下：https://www.findata.cn/ 主界面十分简洁我们试着输入landsat，点击搜索按钮，给出以下结果。我们还可以添加条件，进一步进行筛选数…

阅读更多...

three.js gltf后处理颜色异常(伽马校正)

three.js gltf后处理颜色异常(伽马校正)

效果： 应用了伽马校正，好像效果不明显代码： <template><div><el-container><el-main><div class"box-card-left"><div id"threejs" style"border: 1px solid red"><…

阅读更多...

RocketMQ5.0消息过滤

RocketMQ5.0消息过滤

前言消费者订阅了某个主题后，RocketMQ 会将该主题中的所有消息投递给消费者。若消费者只需要关注部分消息，可通过设置过滤条件在 Broker 端进行过滤，只获取到需要关注的消息子集，避免接收到大量无效的消息。以电商交易场景为例…

阅读更多...

手机视频监控客户端APP如何实现跨安卓、苹果和windows平台，并满足不同人的使用习惯

手机视频监控客户端APP如何实现跨安卓、苹果和windows平台，并满足不同人的使用习惯

目录一、手机视频监控客户端的应用和发展二、手机视频监控客户端存在的问题三、HTML5视频监控客户端在手机上实现的方案 （一）HTML5及其优点 （二）HTML5在手机上实现视频应用功能的优势四、手机HTML5…

阅读更多...

FFmpeg之——获取上传视频的尺寸（长、宽）

FFmpeg之——获取上传视频的尺寸（长、宽）

获取上传视频的尺寸： 获取视频尺寸通常需要借助第三方库FFmpeg。首先，确保你的系统中已安装了FFmpeg，并且FFmpeg的可执行文件路径已经添加到你的系统环境变量中。 1.官网下载ffmpeg 进入链接: ffmpeg官网网址，点击下载wind…

阅读更多...

milvus学习（一）cosin距离和欧式距离

milvus学习（一）cosin距离和欧式距离

参考：https://blog.csdn.net/qq_36560894/article/details/115408613 归一化以后的cosin距离和欧式距离可以相互转化，未归一化的不可以相互转化（因为距离带单位）。

阅读更多...

AI的明天从这里开始：OJAC近屿智能带您探索AIGC星辰大海的无限可能！

AI的明天从这里开始：OJAC近屿智能带您探索AIGC星辰大海的无限可能！

你是对人工智能充满好奇的编程小白，还是渴望工作赋能的白领？或者是想投身AIGC浪潮的创业者？无论你的背景如何，只要你对AI世界充满热情，我们OJAC近屿智能AIGC星辰大海大模型工程师和产品经理启航班以及系列课程都欢迎您…

阅读更多...

利用Spring Cloud和Java系统设置优化工程项目管理系统源码的二次开发体验

利用Spring Cloud和Java系统设置优化工程项目管理系统源码的二次开发体验

工程项目管理涉及众多环节和角色，如何实现高效协同和信息共享是关键。本文将介绍一个采用先进技术框架的Java版工程项目管理系统，该系统支持前后端分离，功能全面，可满足不同角色的需求。从项目进度图表到施工地图，再到…

阅读更多...

Java 语言概述

Java 语言概述

Java 概述是 SUN（Stanford University Network，斯坦福大学网络公司）1995年推出的一门高级编程语言是一种面向 Internet 的编程语言。Java 一开始富有吸引力是因为 Java 程序可以在 Web 浏览器中运行。这些 Java 程序被称为 Java 小程序&am…

阅读更多...

深入研究矫正单应性矩阵用于立体相机在线自标定

深入研究矫正单应性矩阵用于立体相机在线自标定

文章：Dive Deeper into Rectifying Homography for Stereo Camera Online Self-Calibration 作者：Hongbo Zhao, Yikang Zhang, Qijun Chen,, and Rui Fan 编辑：点云PCL 欢迎各位加入知识星球，获取PDF论文，欢迎转发朋…

阅读更多...

文件监控软件丨文件权限管理工具

文件监控软件丨文件权限管理工具

文件已经成为企业最重要的资产之一。然而，文件的安全性和完整性经常受到威胁，如恶意软件感染、人为误操作、内部泄密等。为了确保文件的安全，文件监控软件应运而生。本文将深入探讨文件监控软件的概念、功能、应用场景和未来发展等方面。文…

阅读更多...

Deep Q-Network (DQN)理解

Deep Q-Network (DQN)理解

DQN（Deep Q-Network）是深度强化学习（Deep Reinforcement Learning）的开山之作，将深度学习引入强化学习中，构建了 Perception 到 Decision 的 End-to-end 架构。DQN 最开始由 DeepMind 发表在 NIPS 2013&…

阅读更多...

中兴通讯携手龙蜥社区，共创繁荣生态 | 2023龙蜥操作系统大会

中兴通讯携手龙蜥社区，共创繁荣生态 | 2023龙蜥操作系统大会

12 月 17-18 日，由开放原子开源基金会指导，龙蜥社区主办，阿里云、中兴通讯、浪潮信息、Arm、Intel 等 24 家理事单位共同承办，主题为“云智融合共筑未来”的 2023 龙蜥操作系统大会在北京圆满结束。本次大会上，中兴通讯…

阅读更多...

海外静态IP和动态IP有什么区别？推荐哪种？

海外静态IP和动态IP有什么区别？推荐哪种？

什么是静态ip、动态ip，二者有什么区别？哪种好？关于这个问题，不难发现，在知道、知乎上面的解释有很多，但据小编的发现，这些回答都是关于静态ip和动态ip的专业术语解释，普通非专业人事…

阅读更多...

java生产设备效率管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

java生产设备效率管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 java Web生产设备效率管理系统是一套完善的java web信息管理系统，对理解JSP java编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为ac…

阅读更多...

web自动化(6)——项目配置和Grid分布式

web自动化(6)——项目配置和Grid分布式

1. 框架的可配置性项目之间的区别： 兼容性：有些项目只兼容chrome，有些只兼容Firefox等元素定位特点：有些项目闪现快，有的项目很慢有些项目集成Jenkins，不需要用python生成allure报告如果想要我们的框架…

阅读更多...

分布式（8）

分布式（8）

目录 36.什么是TCC？ 37.分布式系统中常用的缓存方案有哪些？ 38.分布式系统缓存的更新模式？ 39.分布式缓存的淘汰策略？ 40.Java中定时任务有哪些？如何演化的？ 36.什么是TCC？ TCC&#xff08…

阅读更多...

推荐文章

最新文章