大模型企业应用落地系列二》基于大模型的对话式推荐系统》核心技术架构设计图

news2024/9/20 22:47:42

注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】

文章目录

  • 大模型企业应用落地系列二
    • 基于大模型的对话式推荐系统》心技术架构设计图
      • 对话式推荐系统技术架构的每一层更加深入的分析解读具体实现
      • 大模型推荐技术发展趋势探讨
  • 总结

大模型企业应用落地系列二

基于大模型的对话式推荐系统》心技术架构设计图

上一篇文章详细介绍了基于大模型的对话式推荐系统概念及原理,下面即将为对话式推荐系统技术架构解开神秘的面纱。对话式传统推荐系统基于大模型AI Agenti智能体构建,大模型充作大脑做任务规划,推荐算法做Agent执行,技术架构设计图 如图8-1所示。
在这里插入图片描述
图8-1 基于大模型的对话式推荐系统技术架构

该对话式推荐系统架构主要包括大数据平台层、大模型底座层、大模型管理层、推荐引擎层、对话管理层和用户交互层。大数据平台层涵盖多种数据库和数据存储技术,为推荐系统提供数据支持;大模型底座层包括大模型底座和推荐微调大模型,为系统提供语言处理和个性化推荐能力;大模型管理层从多个方面进行管理和优化,提升系统的智能性和性能;推荐引擎层通过多种算法和服务,实现个性化、高效且实时的推荐;对话管理层负责处理用户与系统的互动,确保推荐流程的连贯性和个性化;用户交互层则直接与用户交互,提升用户体验。各层协同工作,共同构建起强大的对话式推荐系统。
以下是基于文章对对话式推荐系统架构的精华总结:

  1. 大数据平台层
    • 涉及多种数据库和数据存储技术,包括图数据库Neo4j、NoSQL数据库HBase、分布式计算平台Hadoop、搜索引擎Elasticsearch、数据湖Hudi、数据仓库Hive、分析型数据库Apache Doris、列式数据库ClickHouse、向量数据库Milvus和云托管向量数据库Pinecone。
    • 这些技术在对话式推荐系统中各司其职,共同构成高效、可靠的数据处理基础设施,为推荐系统提供数据支持。
  2. 大模型底座层
    • 包括大模型底座和推荐微调大模型。
    • 大模型底座为推荐系统提供强大的语言处理能力,理解和生成自然语言,支持多种任务。
    • 推荐微调大模型在大模型底座基础上通过领域内训练,更好地适应推荐任务,提高对用户查询的解析精度和相关推荐的准确性,提供个性化推荐。
    • 大模型融入对话式推荐系统后,各方面能力得到提升,包括对话管理、实时反馈与调整、增强用户交互体验、跨领域知识整合等。
  3. 大模型管理层
    • 从推荐AI智能体管理、RAG检索增强生成、训练微调推理管理、多模态融合、大模型数据管理、大模型评测六个方面搭建。
    • 推荐AI智能体管理协调和管理用户交互活动,确保推荐系统准确理解用户需求并提供高质量推荐服务。
    • RAG检索增强生成结合检索技术和生成模型,提升推荐的准确性和丰富度。
    • 训练微调推理管理涉及全参数微调、LoRA微调、训推一体化平台、推荐行为对齐和GPU资源分配等,优化推荐系统性能。
    • 多模态融合增强系统对复杂用户需求的理解和响应能力,包括文本、图片、视频数据的处理和多模态对齐、端到端训练。
    • 大模型数据管理确保数据质量、一致性和对模型训练优化的支持,包括数据清洗、标注、质量管理、元数据管理和可视化。
    • 大模型评测对推荐系统的性能、效果和用户体验进行综合评估,包括交互式评测、可解释性和透明度评估、多轮对话效果评估、个性化推荐评测和冷启动推荐能力评估。
  4. 推荐引擎层
    • 涵盖离线推荐算法、准实时推荐算法、在线Web推荐服务、推荐策略与建模、推荐算法效果评估和大模型与推荐系统融合等模块。
    • 离线推荐算法通过处理历史全量数据集生成初始推荐列表,包括深度因子分解机、协同过滤算法、Content - Based推荐、多策略融合算法和基于知识图谱的推荐等。
    • 准实时推荐算法处理实时数据流,提供准实时个性化推荐,包括用户行为数据流处理、准实时协同过滤、准实时推荐策略融合、实时特征计算更新和准实时推荐结果生成。
    • 在线Web推荐服务连接推荐系统与用户界面,提供实时、个性化和高性能推荐体验,包括实时用户偏好分析、智能实时精准排序、高并发缓存加速、在线推荐结果呈现和API网关访问授权。
    • 推荐策略与建模采用多维策略和技术,提升推荐精确度、个性化和互动性,包括推荐位组合策略、用户画像、多模态信息建模、强化学习用户建模和心理学用户建模。
    • 推荐算法效果评估涉及准确性、多样性、新颖性、排序质量等多个方面,通过AB测试平台等进行评估。
    • 大模型与推荐系统融合包括大模型特征提取与整合、大模型用户行为理解、多模态推荐生成、上下文感知推荐和双塔模型召回,提升推荐的精度、个性化和用户体验。
  5. 对话管理层
    • 包括对话状态跟踪、对话策略管理、意图识别、敏感词过滤、对话上下文管理和对话效果分析六个关键方面。
    • 负责处理和管理用户与系统之间的互动,确保推荐流程的连贯性和个性化。
  6. 用户交互层
    • 包括聊天界面、语音识别与合成、用户反馈收集、多平台适配、多模态媒体展示和个性化设置六个关键方面。
    • 是对话式推荐系统与用户直接交互的部分,设计得当能提升用户体验,使系统更用户友好、直观且个性化。

对话式推荐系统技术架构的每一层更加深入的分析解读具体实现

下一篇文章详细讲解技术架构的每一层,更加深入的分析解读具体实现,敬请关注。

大模型推荐技术发展趋势探讨

推荐系统的下一代发展趋势大概率走向基于大模型的互动式的对话式推荐,互动形式包括文本、语音、图像、视频等多模态融合。

更多的技术交流和探讨也欢迎加我个人微信chenjinglei66。

总结

此文章有对应的配套新书教材和视频:

【配套新书教材】
《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】
新书特色:本书从自然语言处理基础开始,逐步深入各种NLP热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。
全书共分为19章,详细讲解中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注、文本相似度算法、语义相似度计算、词频-逆文档频率(TF-IDF)、条件随机场、新词发现与短语提取、搜索引擎Solr Cloud和Elasticsearch、Word2vec词向量模型、文本分类、文本聚类、关键词提取和文本摘要、自然语言模型(Language Model)、分布式深度学习实战等内容,同时配套完整实战项目,例如对话机器人实战、搜索引擎项目实战、推荐算法系统实战。
本书理论联系实践,深入浅出,知识点全面,通过阅读本书,读者不仅可以理解自然语言处理的知识,还能通过实战项目案例更好地将理论融入实际工作中。

《分布式机器学习实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】
新书特色:深入浅出,逐步讲解分布式机器学习的框架及应用配套个性化推荐算法系统、人脸识别、对话机器人等实战项目。

【配套视频】

推荐系统/智能问答/人脸识别实战 视频教程【陈敬雷】
视频特色:把目前互联网热门、前沿的项目实战汇聚一堂,通过真实的项目实战课程,让你快速成为算法总监、架构师、技术负责人!包含了推荐系统、智能问答、人脸识别等前沿的精品课程,下面分别介绍各个实战项目:
1、推荐算法系统实战
听完此课,可以实现一个完整的推荐系统!下面我们就从推荐系统的整体架构以及各个子系统的实现给大家深度解密来自一线大型互联网公司重量级的实战产品项目!
2、智能问答/对话机器人实战
由浅入深的给大家详细讲解对话机器人项目的原理以及代码实现、并在公司服务器上演示如何实际操作和部署的全过程!
3、人脸识别实战
从人脸识别原理、人脸识别应用场景、人脸检测与对齐、人脸识别比对、人脸年龄识别、人脸性别识别几个方向,从理论到源码实战、再到服务器操作给大家深度讲解!

自然语言处理NLP原理与实战 视频教程【陈敬雷】
视频特色:《自然语言处理NLP原理与实战》包含了互联网公司前沿的热门算法的核心原理,以及源码级别的应用操作实战,直接讲解自然语言处理的核心精髓部分,自然语言处理从业者或者转行自然语言处理者必听视频!

人工智能《分布式机器学习实战》 视频教程【陈敬雷】
视频特色:视频核心内容有互联网公司大数据和人工智能、大数据算法系统架构、大数据基础、Python编程、Java编程、Scala编程、Docker容器、Mahout分布式机器学习平台、Spark分布式机器学习平台、分布式深度学习框架和神经网络算法、自然语言处理算法、工业级完整系统实战(推荐算法系统实战、人脸识别实战、对话机器人实战)。

上一篇:大模型企业应用落地》基于大模型的对话式推荐系统完整介绍
下一篇:大模型企业应用落地系列三》基于大模型的对话式推荐系统》技术架构实现》大数据平台层

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2079945.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【精品】计算机毕业设计之:springboot游戏分享网站(源码+文档+辅导)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

win11,vscode上用docker环境跑项目

1.首先用dockerfile创建docker镜像 以下是dockerfile文件的内容: FROM pytorch/pytorch:1.11.0-cuda11.3-cudnn8-devel LABEL Service"SparseInstanceActivation"ENV TZEurope/Moscow ENV DETECTRON_TAGv0.6 ARG DEBIAN_FRONTENDnoninteractiveRUN apt-…

JavaScript:js;知识回顾;笔记分享

一,js前奏 1,js简介: Javascript是一种由Netscape(网景)的LiveScript发展而来的原型化继承的面向对象的动态类型的区分大小写的客户端脚本语言,主要目的是为了解决服务器端语言,比如Perl,遗留的速度问题&a…

数据结构与算法(1)

抽象数据类型定义 算法的效率 时间效率 一个算法的运行时间是指一个算法在计算机上运行所耗费的时间 大致可以等于计算机执行一种简单的操作(如赋值、比较、移动等) 所需的时间与算法中进行的简单操作次数乘积。 比较时间复杂度(看数量级) 空…

【STM32】RTC

忠实的时间记录者——RTC,板子断电也能继续记录(当然,得有纽扣电池供电)。 大部分图片来源:正点原子HAL库课程 专栏目录:记录自己的嵌入式学习之路-CSDN博客 目录 1 概述 2 应用 3 RTC方案 4 …

javacv-ffmpeg ProcessBuilder批量旋转图片

javacv-ffmpeg ProcessBuilder实现对图片的旋转,最近需要处理很多图片,量有点多,所以不能一个一个去编辑旋转图片,所以写一个工具类,实现对图片的旋转 maven配置文件,加上对ffmpeg的依赖,由于f…

关于自定义控件,头文件找不到问题的解决办法

在ui文件中使用控件提升的时候,突然发现ui_xxxx.h竟然报错了, 这在之前是没有碰到过,苦思过后认为是环境变量的问题,因为现在正在用的构建套件是 mingw 的,但在此之前我一直用的是msvc,并且环境变量的配置…

骑行耳机该怎么选?精选南卡、骨聆、小米多款顶尖实用品牌!

骨传导耳机,作为运动骑行领域的黑科技伴侣,以其独特的传音方式,让众多骑行运动爱好者在享受音乐的同时,依然能清晰感知外界环境,提升运动安全与乐趣。然而,随着骨传导耳机热度增加,市面上开始出…

Prometheus监控Kubernetes ETCD

文章目录 一、kubeadm方式部署etcd1.修改etcd指标接口监听地址2.prometheus中添加etcd的服务发现配置3.创建etcd的service4.grafana添加etcd监控模版 二、二进制方式部署k8s etcd1.将etcd服务代理到k8s集群2.创建etcd证书的secrets3.prometheus挂载etcd证书的secrets4.promethe…

63. 不同路径 II -dp7

63. 不同路径 IIhttps://leetcode.cn/problems/unique-paths-ii/ 输入:obstacleGrid [[0,0,0],[0,1,0],[0,0,0]] 输出:2 解释:3x3 网格的正中间有一个障碍物。 从左上角到右下角一共有 2 条不同的路径: 1. 向右 -> 向右 ->…

Chrome 中的 RCE 会在 JIT 编译器中产生不正确的副作用

此类漏洞通常是“一键式”攻击的起点,当受害者访问恶意网站时,该漏洞会危害受害者的设备。Chrome 中的渲染器 RCE 允许攻击者危害 Chrome 渲染器进程并执行任意代码。但是,渲染器进程的权限有限,因此攻击者需要将此类漏洞与第二个“沙盒逃逸”漏洞串联起来:Chrome 浏览器进…

C#WinFrom 中实现可自定义按钮和事件的消息提示框

实现效果: public partial class CustomMessageBox : Form {// 声明按钮和标签控件private Button btnOption1;private Button btnOption2;private Label lblMessage;// 自定义属性用于获取对话框的结果public DialogResult DialogResult1 { get; private set; }// …

一文弄懂SQL事务隔离级别

SQL 事务隔离级别 在多用户数据库系统中,为了保证数据的完整性和一致性,SQL 标准提出了四种事务隔离级别,以规避脏读、不可重复读和幻读等问题。以下是四种隔离级别的简要介绍: 读未提交(read uncommitted&#xff09…

产业报告 | 2024年中国低空经济产业研究报告

低空经济是指以各种有人驾驶和无人驾驶航空器的各类低空飞行活动为牵引,辐射带动航空器研发、生产、销售以及低空飞行活动相关的基础设施建设运营、飞行保障、衍生综合服务等领域产业融合发展的综合经济形态。 基于启信产业大脑的海量数据与专业研判模型&#xff0…

【Linux C++】log4cpp日志库的安装和使用详解

log4cpp 是一个开源的 C 日志库,灵感来源于 Java 的 log4j。它提供了灵活的日志记录功能,可以帮助开发者在 C 应用程序中记录、管理和格式化日志信息。log4cpp 支持多种日志记录策略和输出目标,可以满足各种不同的需求。 1.安装 下载压缩包…

2.2.2 Posix API与网络协议栈2

接上回2.2.2 posix api 2 传输数据 四线一⚪,kernel 协议栈 send- write, recv-read 如何知道send成功? 如果返回整数,只能证明data从user copy到内核kernel wmemory了 就是数据传输是异步的,send是从application cop…

二叉树的层序遍历 C++

给你二叉树的根节点 root ,返回其节点值的 层序遍历 。 (即逐层地,从左到右访问所有节点)。 示例 1: 输入:root [3,9,20,null,null,15,7] 输出:[[3],[9,20],[15,7]]示例 2: 输入&…

李宏毅 机器学习与深度学习【2022版】 02

文章目录 一、机器学习任务攻略二、优化失败1、梯度很小的情况2、Batch and Momentum 三、自适应学习率 Adaptive Learning Rate四、分类问题简述五、重温神奇宝贝和数码宝贝分类器六、深度学习的优化 一、机器学习任务攻略 因为在训练集中,56层的network一定至少和…

等保测评(三级)服务器和终端-测评项及整改措施(详细)

本文按照三级等保标准进行测评,可参考进行加固。 等保测评是信息安全等级保护工作的基本制度、基本策略和基本方法。 等保测评是信息安全等级保护工作的基本制度、基本策略和基本方法。信息系统运营、使用单位应选择符合国家要求的测评机构,依据《信息…

Java中常用的API

具体的例子就不再列出了 自己尝试 // 注意第三个方法 1.如果数据源数组和目的地数组都是基本数据类型,那么两者的类型必须保持一致,否则会报错 2.如果数据源数组和目的地数组都是引用数据类型,那么子类类型可以赋值给父类类型 public cl…