36k Star的开源大模型应用开发平台,太强了!

news2024/10/3 2:20:30

image

引言

Dify是一款开源的大语言模型(LLM)应用开发平台,它帮助开发者和非技术人员,快速构建生产级别的生成式AI应用。

该项目设立于2023 年 3 月,开源协议是基于 Apache License 2.0 有限商业许可,后端技术Python/Flask/PostgreSQL,前端技术Next.js

它提供了构建LLM应用所需的关键技术组件,如模型支持、Prompt编排、RAG引擎、Agent框架和流程编排,同时还具备直观的界面和API

Dify的主要功能包括:

加速AI应用开发:帮助创业者快速将创意变为现实,已助力多个团队构建MVP并获得投资。

**集成LLM至现有业务:**通过RESTful APILLM能力嵌入现有应用,实现Prompt与业务逻辑的解耦,便于跟踪数据、成本和用量,持续优化应用效果。

**企业级LLM基础设施:**作为企业内部的LLM网关,加速GenAI技术在企业中的应用,实现中心化监管。

**探索LLM边界:**即使是技术爱好者,也可通过Dify实践Prompt工程和Agent技术,探索LLM的能力极限。

Dify还提供了完整的云服务,无需安装即可使用。

截止发稿前在 Github 上已获得 36.3k Star!

image

附上Github地址:https://github.com/langgenius/dify

模型设置

Dify 目前已支持主流的模型供应商,并将模型按场景分为4个类:

1、系统推理模型:

在创建的应用中,用的是该类型的模型。智聊、对话名称生成、下一步问题建议用的也是推理模型。

已支持的系统推理模型供应商:

OpenAIAzure OpenAI ServiceAnthropicHugging Face HubReplicateXinferenceOpenLLM讯飞星火文心一言通义千问MinimaxZHIPU(ChatGLM)

2、Embedding 模型:

在数据集中,将分段过的文档做 Embedding 用的是该类型的模型。在使用了数据集的应用中,将用户的提问做 Embedding 处理也是用的该类型的模型。

已支持的 Embedding 模型供应商:

OpenAIZHIPU(ChatGLM)JinaAI

3、Rerank 模型:

Rerank 模型用于增强检索能力,改善 LLM 的搜索结果。

已支持的 Rerank 模型供应商:

CohereJinaAI

4、语音转文字模型:

将对话型应用中,将语音转文字用的是该类型的模型。

已支持的语音转文字模型供应商:OpenAI

image

应用&工作流

Dify 中应用都是基于 GPT 等大预言模型构建的,并且包含了完整的APIToken鉴权、WebApp来帮助使用者快速开发。它还提供了四种应用类型:

聊天助手: 基于 LLM 构建对话式交互的助手

文本生成: 构建面向文本生成类任务的助手,例如撰写故事、文本分类、翻译等

Agent: 能够分解任务、推理思考、调用工具的对话式智能助手

工作流: 基于流程编排的方式定义更加灵活的 LLM 工作流

image

image

知识库

Dify平台中,我们地运用知识库来实施RAG(Retrieval-Augmented Generation)技术,当用户提出一个问题时,系统会迅速在知识库中搜索与该问题最为契合的数据片段。

这一过程涉及复杂的语义匹配算法,确保所检索到的内容不仅相关,而且能够直接回答或辅助解答用户的问题。

一旦找到合适的信息,系统会将这些检索到的文档片段融入模型生成回复的上下文中,作为额外的背景知识,使用户获得更为满意和详尽的答案。

image

工具

工具有效地拓展了大型语言模型(LLM)的功能边界,通过集成联网搜索、科学计算、图像生成等能力,不仅丰富了LLM的技能集,还显著增强了其与外部世界互动的能力。

使得LLM能更全面地理解和响应复杂多样的现实需求。

image

安装

系统要求

在安装 Dify 之前,请确保您的机器满足以下最低系统要求:

  • CPU >= 2 Core
  • RAM >= 4GB

快速启动

启动 Dify 服务器的最简单方法是运行 docker-compose.yml 文件。

在运行安装命令之前,请确保您的机器上安装了 DockerDocker Compose

cd docker
cp .env.example .env
docker compose up -d

运行后,可以在浏览器上访问 http://localhost/install 进入 Dify 控制台并开始初始化安装操作。

自定义配置

如果您需要自定义配置,请参考 .env.example 文件中的注释,并更新 .env 文件中对应的值。

此外,可能需要根据您的具体部署环境和需求对 docker-compose.yaml 文件本身进行调整,例如更改镜像版本、端口映射或卷挂载。

完成任何更改后,请重新运行 docker-compose up -d

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1979008.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

nginx自动续期ssl证书

🔴 大家好,我是雄雄,欢迎关注微信公众号:雄雄的小课堂。 🔴前言 前年,阿里将免费的ssl证书从一年调整成了三个月; 去年,腾讯将免费的ssl证书从一年调整成了三个月; 以…

【文献阅读】Balancing the Scales: HyperSMOTE for Enhanced Hypergraph Classification

Abstract 真实用户与机器人数量之间的固有不平衡带来了巨大的挑战,常常导致分类器的偏差。本文引入了HyperSMOTE,这是一种利用超图丰富结构的不平衡节点分类的新方法。通过将X平台用户表示为节点,并将他们的互动表示为超边,构建了…

给水排水杂志

一、基本信息 《给水排水》创刊于1964年,是国内创刊早、发行量大、内容涵盖广的水行业权威期刊,在业内享有盛誉。期刊现由中国建设集团股份有限公司主管,亚太建设科技信息研究院有限公司、中国土木工程学会主办。现任名誉主编&#xff1a…

【Java】深度解析Java的反射机制

反射(Reflection) 一、 反射的基本概念二、 获取类的信息三、 获取类的成员四、 动态创建对象五、 动态调用方法六、 动态访问和修改字段 总结 一、 反射的基本概念 反射是一种运行时机制,允许程序在运行时检查和操作类、方法、字段等。通过…

告别异地烦恼,这四款远程控制工具一键掌控千里之外的电脑!

现在的科技水平真是越来越强大了,以前都是必须要在电脑跟前才可以解决的问题,现在可以安装通过远程控制的软件来实现在家就可以办公,解决了这当中的时间和金钱成本,所以今天就具体来聊聊四款好用的远程控制工具,协助我…

学python的第一天:PyCharm创建项目

创建项目 打开工具 PyCharm 点击“新建项目” 点击“创建” 环境 系统会创建虚拟环境,稍等 初始设置 创建完成后会进入main.py文件 性能 可以看到 右下角提示我们增强性能,点“自动” 会获取到管理员权限 完成后会提示完成

CAS单点登录

1.相同顶级域名的单点登录SSO 相同顶级域名的单点登录:SSO:SINGLE SIGN ON 单点登录可以通过基于用户会话的共享;分为两种,第一种:相同顶级域名; 原理是分布式会话完成的;关键是顶级域名的cookie值是可以共享的 比如…

7月小游戏畅销榜Top 100:MMO游戏数量增多,26款新入榜

易采游戏网8月4日消息:2024年7月的小游戏畅销榜Top100已经揭晓,给广大游戏玩家带来了不少惊喜和期待。与上个月相比,本月的榜单不仅新入榜游戏数量达到了26款,还显示了MMO(大型多人在线)游戏的强劲增长趋势…

deform,一个超强的 Python 库!

更多资料获取 📚 个人网站:ipengtao.com 大家好,今天为大家分享一个超强的 Python 库 - deform。 Github地址:https://github.com/Pylons/deform 在 Web 开发中,表单处理是一个常见且重要的任务。deform 是一个用于生…

巧用casaos共享挂载自己的外接硬盘为局域网共享

最近入手了个魔改机顶盒,已经刷好了的armbian,虽然是原生的,但是我觉得挺强大的,内置了很多 常用的docker和应用,只需要armbian-software 安装就行,缺点就是emmc太小了。 买到之后第一时间装上了casaos和1panel,想把外接移动硬盘挂载到局域网,只需: 1、安装必要的sam…

Parallels Desktop19让你的Mac无缝运行Windows!

大家好,我是你们的科技小伙伴,今天我要给大家安利一款神奇的软件——Parallels Desktop 19虚拟机。这款产品真的是让我眼前一亮,用起来简直不能更爽! 让我们来聊聊为什么我们需要一个虚拟机。 想象一下,你是一个Mac用…

牛顿插值法代替泰勒公式

引入 例题 近似函数: 通过这个近似函数可以看出,若要证的函数超过二阶可导,那么就不适合用牛顿插值法代替泰勒公式 因为,后面的操作非常复杂,不划算了… 总结 我们可以通过牛顿插值法生成一个逼近曲线的直线&#xf…

贷款申请被拒,是银行故意在找茬吗?

贷款申请被拒,很多时候真不是银行故意找茬,而是咱们自己的一些“小动作”不经意间就把路给堵窄了。今天,咱们就来聊聊那些可能让贷款之路变得坎坷的“坑”,帮你顺利绕开它们。 首先,得说说那个最让人头疼的——逾期还款…

“数字孪生+大模型“:打造设施农业全场景数字化运营新范式

设施农业是一个高度复杂和精细化管理的行业,涉及环境控制、作物生长、病虫害防治、灌溉施肥等诸多环节。传统的人工管理模式已经难以应对日益增长的市场需求和管理挑战。智慧农业的兴起为设施农业带来了新的机遇。将前沿信息技术与农业生产深度融合,实现农业生产的数字化、网络…

立项技术路线选择

本章主要是简单聊聊技术路线,额涉及unity和虚幻,目的主要是给自己看的,记录下日期:2024.8.4 在今天,除游戏以外的厂商基本上采用c#的混合技术方案 如果需要的设备对象多。效果不需要极为精细,至少unity是绝…

从根儿上学习spring 八 之run方法启动第四段(2)

图2 我们接着上一篇接着来看refresh方法,我们上一小节说完了invokeBeanFactoryPostProcessors(beanFactory)方法,这一节我们来看registerBeanPostProcessors(beanFactory)方法。 从方法名称定义我们就能看出这个方法主要是用来注册BeanPostProcesor的。…

欧拉图,欧拉通路,欧拉回路,Hierholzer算法详解

文章目录 零、哥尼斯堡七桥问题一、欧拉图1.1 相关概念1.2 判别法(不做证明)1.3 Hierholzer算法1.4 代码实现1.4.1 邻接表存图1.4.2 链式前向星存图 二、OJ练习2.1 模板12.2 模板22.3 重新安排行程2.4 合法重新排列数对2.5 破解保险箱2.6 骑马修栅栏2.7 …

WebVirtMgr管理多台物理机

这篇文章只是讲一讲管理多台物理机遇到的坑,记录一下。目前时间紧张,空余时间再补充细节。 WebVirtMgr管控单台物理机很多文章能搜到,写的也都挺好。 管理多台的具体步骤我没碰到过,只能按照报错去一步步解决。 第一个问题&…

2024睿抗国赛赛后总结

题目可以去pta教育超市找 写第一题还很清醒。&#xff08;耗时15分钟&#xff09; #include<bits/stdc.h> using namespace std; string s; int sum 0,len 0; int cnt 0;int check(char c){if(c > a && c < z){return 1;}else if(c < Z &&…

【每日刷题】Day92

【每日刷题】Day92 &#x1f955;个人主页&#xff1a;开敲&#x1f349; &#x1f525;所属专栏&#xff1a;每日刷题&#x1f34d; &#x1f33c;文章目录&#x1f33c; 1. 面试题 16.05. 阶乘尾数 - 力扣&#xff08;LeetCode&#xff09; 2. 取近似值_牛客题霸_牛客网 (n…