【阿里云大模型高级工程师ACP学习笔记】2.1 用大模型构建新人答疑机器人

【阿里云大模型高级工程师ACP学习笔记】2.1 用大模型构建新人答疑机器人

news2025/4/26 7:12:25

学习目标

在备考阿里云大模型高级工程师ACP认证时，学习《2.1用大模型构建新人答疑机器人》这部分内容，主要是为了掌握利用大模型技术构建高效答疑机器人的方法，提升在大模型应用开发领域的专业能力。具体目标如下：

掌握大模型API调用：学会通过API调用通义千问大模型，熟悉调用过程中的环境配置、API Key管理以及代码实现，能够在自己的应用中集成大模型能力。
理解大模型工作原理：深入了解大模型在问答场景中的工作流程，包括输入文本分词化、Token向量化、大模型推理、输出Token和输出文本等阶段，同时掌握影响大模型内容生成的随机性参数，如temperature、top_p、top_k和seed的作用及调整方法。
解决大模型应用问题：找到让大模型能够回答私域知识问题的方案，理解检索增强式生成（RAG）的原理和应用，学会在实际应用中优化大模型的表现，提高答疑机器人的准确性和实用性。

知识点汇总

小标题	知识内容	重要性	学习难易度
大模型API调用	- 在阿里云大模型服务平台百炼开通模型调用服务并创建API Key。 - 避免在代码中明文写入API Key，应存储在环境变量中。 - 使用OpenAI Python SDK调用通义千问，如创建“公司小蜜”助手回答公司运营问题。 - 添加stream = true参数实现流式输出，提升交互体验。	高	中
大模型工作原理	- 问答工作流程： 1. 输入文本分词化：将文本分割成具有独立语义的Token并分配ID。 2. Token向量化：转化为计算机能理解的向量。 3. 大模型推理：结合训练数据推测，计算候选Token概率并选择输出。 4. 输出Token：存在随机性，可通过temperature、top_p等调整。 5. 输出文本：循环上述过程直至结束条件满足。 - temperature：调整候选Token集合概率分布，取值范围[0, 2)，默认值0.7。 - top_p：控制候选Token集合采样范围，取值范围(0,1]，默认值0.8。 - top_k：从概率排名前k的Token中随机选择一个进行输出，类似top_p的能力。一般来说，top_k越大，生成内容越多样化；top_k越小，内容则更固定。 - seed：支持控制生成内容的确定性，在每次模型调用时传入相同的seed值，并保持其他参数不变，模型会尽最大可能返回相同结果，但无法保证每次结果完全一致。 - 多个参数不建议同时调整，优先调整其中一种参数观察效果后再微调。	高	高
解决私域知识问答问题	- 方案选择： 1. 不改变模型，在提问时直接传入私域知识参考信息。 2. 改变模型，通过微调和训练新模型实现。 - 优先选择：考虑成本，优先通过提示词传递私域知识。 - 检索增强式生成（RAG）： 1. 建立索引阶段：将私有知识文档转化为可检索形式，便于相似度计算。 2. 检索与生成阶段：根据提问检索相关文档片段，与提问一起输入大模型生成回答。	高	中

拉重点

大模型API调用的安全与优化

大模型API调用时，API Key的安全管理是重中之重。直接在代码里写API Key，很容易泄露，后续改起来也麻烦。把它存到环境变量里，才更安全方便。要是在实际开发中忽略了这点，API Key一旦泄露，应用安全就危险了。还有流式输出这个功能

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2343082.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

form表单提交前设置请求头request header及文件下载

form表单提交前设置请求头request header及文件下载

需求：想要在form表单submit之前，设置一下请求头。除了用Ajax发起请求之外，还可以使用FormData来实现，咱不懂就问。 1 问：FormData什么时间出现的？与ajax什么联系？ 2 问：FormData使…

阅读更多...

【c++11】c++11新特性（下）（可变参数模板、default和delete、容器新设定、包装器）

【c++11】c++11新特性（下）（可变参数模板、default和delete、容器新设定、包装器）

🌟🌟作者主页：ephemerals__ 🌟🌟所属专栏：C 目录前言五、可变参数模板 1. 概念及简单定义 2. 包扩展六、 default和delete 七、容器新设定 1. 新容器 2. 新接口 emplace系列接口八、函数包…

阅读更多...

PyTorch 实现食物图像分类实战：从数据处理到模型训练

PyTorch 实现食物图像分类实战：从数据处理到模型训练

一、简介在计算机视觉领域，图像分类是一项基础且重要的任务，广泛应用于智能安防、医疗诊断、电商推荐等场景。本文将以食物图像分类为例，基于 PyTorch 框架，详细介绍从数据准备、模型构建到训练测试的全流程，帮助读者…

阅读更多...

Qt —— 在Linux下试用QWebEngingView出现的Js错误问题解决（附上四种解决办法）

Qt —— 在Linux下试用QWebEngingView出现的Js错误问题解决（附上四种解决办法）

错误提示：js: A parser-blocking, cross site (i.e. different eTLD+1) script, https:xxxx, is invoked via document.write. The network request for this script MAY be blocked by the browser in this or a future page load due to poor network connectivity. If bloc…

阅读更多...

命名空间(C++)

命名空间(C++)

命名空间主要用于大型项目中。局部命名在该局部会覆盖全局命名。C语言中唯一一种在局部调用全局相同命名的全局变量的方式：指针在C中可以用作用域运算符来访问全局变量，作用域运算符的前面可以是作用域也可以是类。命名空间实际上是对全局作用域的再次…

阅读更多...

LabVIEW圆锥滚子视觉检测系统

LabVIEW圆锥滚子视觉检测系统

基于LabVIEW平台的视觉检测系统提高圆锥滚子内组件的生产质量和效率。通过集成高分辨率摄像头和先进的图像处理算法，系统能够自动识别和分类产品缺陷，从而减少人工检查需求，提高检测的准确性和速度。项目背景随着制造业对产品质…

阅读更多...

OpenAI 推出「轻量级」Deep Research，免费用户同享

OpenAI 推出「轻量级」Deep Research，免费用户同享

刚刚，OpenAI 正式上线了面向所有用户的「轻量级」Deep Research 版本，意味着即便没有付费订阅，也能体验这一强大工具的核心功能。核心差异：o4-mini vs. o3 模型迭代传统的深度研究功能基于更大规模的 o3 模型。轻量级版本则改以…

阅读更多...

罗伯·派克：Go语言创始者的极客人生

罗伯·派克：Go语言创始者的极客人生

名人说：路漫漫其修远兮，吾将上下而求索。—— 屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder😊） 罗伯派克：Go语言创始者的极客人生一、传奇程序员的成长历程 1. 早年经历…

阅读更多...

小白工具视频转MPG, 功能丰富齐全,无需下载软件,在线使用,超实用

小白工具视频转MPG, 功能丰富齐全,无需下载软件,在线使用,超实用

在视频格式转换需求日益多样的今天，小白工具网的在线视频转 MPG 功能https://www.xiaobaitool.net/videos/convert-to-mpg/ ）脱颖而出，凭借其出色特性，成为众多用户处理视频格式转换的优质选择。从格式兼容性来看，它支…

阅读更多...

day32 学习笔记

day32 学习笔记

文章目录前言一、霍夫变换二、标准霍夫变换三、统计概率霍夫变换四、霍夫圆变换前言通过今天的学习，我掌握了霍夫变换的基本原本原理及其在OpenCV中的应用方法一、霍夫变换霍夫变换是图像处理中的常用技术，主要用于检测图像中的直线，圆…

阅读更多...

CentOS 7上Memcached的安装、配置及高可用架构搭建

CentOS 7上Memcached的安装、配置及高可用架构搭建

Memcached是一款高性能的分布式内存缓存系统，常用于加速动态Web应用的响应。本文将在CentOS 7上详细介绍Memcached的安装、配置，以及如何实现Memcached的高可用架构。 （1）、搭建memcached 主主复制架构 Memcached 的复制功能支持…

阅读更多...

如何让 HTML 文件嵌入另一个 HTML 文件：详解与实践

如何让 HTML 文件嵌入另一个 HTML 文件：详解与实践

目录一、为什么需要在HTML中嵌入其他HTML文件？ 二、常用的方法概览三、利用 1. 基本原理 2. 使用场景 3. 优缺点 4. 实践示例 5. 适用建议四、利用JavaScript动态加载内容 1. 原理简介 2. 实现步骤示例代码 3. 优缺点分析 4. 应用场景 5. 实践建…

阅读更多...

人工智能与机器学习：Python从零实现逻辑回归模型

人工智能与机器学习：Python从零实现逻辑回归模型

🧠 向所有学习者致敬！ “学习不是装满一桶水，而是点燃一把火。” —— 叶芝我的博客主页： https://lizheng.blog.csdn.net 🌐 欢迎点击加入AI人工智能社区！ 🚀 让我们一起努力，共创…

阅读更多...

windows服务器及网络：搭建FTP服务器

windows服务器及网络：搭建FTP服务器

前言：（各位大佬们，昨天太忙了，整得没有发布昨天那该写的那一篇，属实有点可惜的说QAQ，不过问题已经解决，我又回来啦） 今天我要介绍的是在Windows中关于搭建FTP服务器的流程与方法注…

阅读更多...

欧拉计划 Project Euler56（幂的数字和）题解

欧拉计划 Project Euler56（幂的数字和）题解

欧拉计划 Project Euler 56 题解题干思路code 题干思路直接暴力枚举即可，用c要模拟大数的乘法，否则会溢出 code // 972 #include <bits/stdc.h>using namespace std;using ll long long;string mul(const string &num1, int num2) {int…

阅读更多...

C++初窥门径

C++初窥门径

const关键字一、const关键字修饰成员变量常成员变量：必须通过构造函数的初始化列表进行初始化，且初始化后不可修改。示例： class Student { private: const int age; // 常成员变量 public: Student(string name, int age) : age(ag…

阅读更多...

AlarmClock4.8.4(官方版)桌面时钟工具软件下载安装教程

AlarmClock4.8.4(官方版)桌面时钟工具软件下载安装教程

1.软件名称：AlarmClock 2.软件版本：4.8.4 3.软件大小：187 MB 4.安装环境：win7/win10/win11(64位) 5.下载地址： https://www.kdocs.cn/l/cdZMwizD2ZL1?RL1MvMTM%3D 提示：先转存后下载，防止资…

阅读更多...

白鲸开源WhaleStudio与崖山数据库管理系统YashanDB完成产品兼容互认证

白鲸开源WhaleStudio与崖山数据库管理系统YashanDB完成产品兼容互认证

近日，北京白鲸开源科技有限公司与深圳计算科学研究院联合宣布，双方已完成产品兼容互认证。此次认证涉及深圳计算科学研究院自主研发的崖山数据库管理系统YashanDB V23和北京白鲸开源科技有限公司的核心产品WhaleStudio V2.6。经过严格的测试与验证&#…

阅读更多...

【金仓数据库征文】- 金融HTAP实战：KingbaseES实时风控与毫秒级分析一体化架构

【金仓数据库征文】- 金融HTAP实战：KingbaseES实时风控与毫秒级分析一体化架构

文章目录引言：金融数字化转型的HTAP引擎革命一、HTAP架构设计与资源隔离策略1.1 混合负载物理隔离架构1.1.1 行列存储分区策略1.1.2 四级资源隔离机制二、实时流处理与增量同步优化2.1 分钟级新鲜度保障2.1.1 WAL日志增量同步2.1.2 流计算优化 2.2 物化视图实时刷…

阅读更多...

Windows与CasaOS跨平台文件同步：SyncThing本地部署与同步配置流程

Windows与CasaOS跨平台文件同步：SyncThing本地部署与同步配置流程

文章目录前言1. 添加镜像源2. 应用安装测试3. 安装syncthing3.1 更新应用中心3.2 SyncThing安装与配置3.3 Syncthing使用演示 4. 安装内网穿透工具5. 配置公网地址6. 配置固定公网地址推荐前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽…

阅读更多...

推荐文章

最新文章