大模型学习笔记-汇总篇

news2025/1/10 23:31:17

本文记录一下最近一个月学习的大模型相关的技术知识点,为拥抱AI浪潮做些技术储备。

大模型术语相关


参数规模

GPT 3.5 千亿级别

GPT4 1.8W亿级别

国内一般都是十亿或百亿级别

ChatGLM2_2K_6B

BAICHUAN_4K_13B

淘宝星辰_4K_13B

【一一AGI大模型学习 所有资源获取处一一】

①人工智能/大模型学习路线

②AI产品经理入门指南

③大模型方向必读书籍PDF版

④超详细海量大模型实战项目

⑤LLM大模型系统学习教程

⑥640套-AI大模型报告合集

⑦从0-1入门大模型教程视频

⑧AGI大模型技术公开课名额

TOKEN长度

Token是指被LLM处理的离散的数据单元,可能是一个单词、也可能是一个字符,这个是由上下文决定的。

TOKEN数量是指 输入和输出加起来的长度之和

TOKEN数量,决定了 prompt和输出的长度,同样会影响推理的速度,prompt越长,推理时间越长。

TOKEN的数量为什么会有上限,是有什么限制么?

各个版本的token数量限制

GPT3.5-turbo 是4096个token

GPT3.5_16K

GPT4_Turbo_128K

大模型工程落地相关

prompt

零样本

少样本:通过举例

思维链

角色、限制条件

LangChain

软件开发框架,帮助开发者快速且灵活地调用大模型,也封装了许多常见的chain,可以被业务快速使用。

Semantic-Kernel

微软的一个工程框架,也可以实现langchain的基本功能,不过更适用于多agent的框架。

RAG(检索增强生成)

是一种结合外部知识库来增强LLM生成能力的总称。

向量数据库

Embedding:将现实世界中的物质向量化到高维空间,向量距离通常代表了自然语言的语义相似度。

召回:向量召回、搜索召回

Agent

简单来说是具有某个功能的原子能力,可以被大模型调用到。

多Agent

多个agent协同完成一个目标,比如metaGPT

大模型训练相关

预训练

通过大量的数据训练出来的模型

推理

模型根据已有的经验,对用户的输入进行预测。

微调

预训练好的模型在特定的任务上进行微调,使用有标签的小规模数据集

训练基础设施

pytorch 是一种深度学习框架,用来训练大模型的,transformer是一种模型机制。

计算资源

CPU:传统的CPU芯片,重逻辑,轻计算。

GPU:类众核CPU,重计算,轻逻辑。A100 H100 4096等,代表了不同的算力,常见的衡量指标有Flops

TPU :谷歌出的类似于GPU的芯片

LangChain框架


1. LangChain解决什么问题

LangChain是基于LLM之上的,在应用层和底层LLM之前的一个很好的编程框架,如果把LLM比喻为各种类型的数据库、中间件等这些基础设施,应用层是各种业务逻辑的组合之外,那么LangChain就负责桥接与业务层和底层LLM模型,让开发者可以快速地实现对接各种底层模型和快速实现业务逻辑的软件开发框架。

那么LangChain是如何做到的呢?试想一下,现在底层有一个大模型的推理能力,除了在对话框手动输入跟他聊天之外。如何用计算机方式跟它互动呢?如果把一次LLM调用当作一个原子能力,如何编排这些原子能力来解决一些业务需求呢?Langchain就是来解决这个事情的。

2. LangChain的几个核心概念

格式化数据(I/O)

Retriver

检索是为了解决大模型打通用户的本身数据,做一些面向业务属性的东西。这里的检索并非传统的关系型数据库,更多的是与大模型的本身逻辑相似的,比如向量数据库。

一个经典的结合LLM和外部用户的文档进行智能答疑的场景

文档->分词->embedding->向量数据库

query->向量数据库查询->TOP N->上下文+ 用户提问 + prompt -> LLM -> 返回结果

一个经典的图如下:

关键技术:文档如何拆分、embedding过程、 TOPN 向量距离的选择

embedding技术选型

embedding是将现实中的物体通过向量化的方法转化为高维向量,可被机器学习模型所识别。他是一种映射,同时也保证了能清晰地表达现实物体的特征。基于此,可以进行一些归类分析、回归分析等。

现在市面上常见的embedding方法有通义千问的embedding等方法。

向量数据库

向量数据库底层存储的是一堆向量,它提供了根据向量相似度进行查询的能力,一般情况下,向量相似度代表了现实世界中物体的相似度。比如”我的名字是小明“ 和“我叫小明”这两句话所代表的含义几乎是相同的,那么在embedding之后,基于向量数据库进行查询的时候,它们俩的相似度就会很近。

Chain

各种类型的chain,chain代表了各种业务类型的组合,类似于工作流的编排。

Memory

LLM本身提供了记忆的能力,同时提供了接口,开发者可以将历史的对话记录传入给LLM。LangChain需要使用外部存储保存这些历史的会话和记忆。可以使用数据库、缓存等进行保存。

Agent

重点是代理工具

代理工具可以让应用程序基于大模型的推理能力,然后进行代理工具或代理服务的调用。因为LLM是没有“联网”的能力的,如果想解决特定的应用场景,代理工具是个完美的选择。

代理工具通常包含三个方面:用户输入、prompt编排LLM思考与路由代理的过程、背后的代理服务。其中难点可能就在于prompt设计了。通常的“套路”是这样的:

ReAct 模型

输入:用户的问题

思考过程:如果是情况1(这个是需要LLM进行意图识别进行思考的),那么推理和提取出一些关键参数,调用agent1,如果是情况2,那么推理和提取出一些关键参数,调用agent2

Act:调用agent1对应一个JSON格式化的输入,调用function1,返回结果。

观察:观察调用后的结果,再结合推理的能力,再进行循环思考。

Semantic Kernel 框架


功能基本与langchain功能相同,在应用层和LLM层中间实现了一个编程框架。框架可以灵活、快速地对接LLM模型,帮助开发者可以快速落地AI业务。

1. Kernel


kernel都包含哪些?

上下文

主要包含三部分:

ContextVariables,用来存储LLM中间返回结果,是一个全局的运行时变量存储,方便各agent或各skfunction进行引用。

SemanticTextMemory:管理内存,这里可以类比向量化数据库。

ReadOnlySkillCollection 管理注册的skill与function这些元数据。

SkFunction

SKFunction是一个具体功能的描述,包含 description、prompt、以及大模型相关的参数配置项,比如温度值等

skill是一组function功能的集合

Planner

对解决一个复杂场景问题,结合一堆function,设定一个goal,给出LLM思考逻辑,生成具体执行计划,然后调用skfunction

PlugIn

与真实世界进行对接,让LLM有“联网”的能力,可以是API接口,也可以是向量数据库、也可以是本地函数等等。

2. Demo实践


代码:官网上下载的JAVA版本

基础的问答

  1. kernel构建

public static Kernel getKernel(OpenAIProxyClient client) {
Kernel kernel = SKBuilders.kernel()
.withDefaultAIService(SKBuilders.chatCompletion()
.withModelId(“gpt-3.5-turbo”)
.withOpenAIClient(client)
.build())
.build();

    return kernel;  
}

  1. skill和function编写,提示词和gpt参数设置

引入skill与function

ReadOnlyFunctionCollection skill = kernel.importSkillFromDirectory(“FunSkill”, SampleSkillsUtil.detectSkillDirLocation(), “FunSkill”);

    CompletionSKFunction function = skill.getFunction("Joke",  
            CompletionSKFunction.class);  

    Mono<SKContext> result = function.invokeAsync("赵本山和宋丹丹要在2024年出一个小品");  

    if (result != null) {  
        System.out.println(result.block().getResult());  
    }

多Agent执行完成一个目标

以Example_PlanWithNativeFunctions 为例子,这个例子接收用户指令:给Steven发一封邮件,并且有限使用Steven的备注名,具体的函数有:Emailer 邮件功能 、寻找人名的备注名称、以及字符串替换的功能

  1. Plan通用思考提示词(SK系统)

To create a plan, follow these steps:
0. The plan should be as short as possible.
1. From a create a as a series of .
2. Before using any function in a plan, check that it is present in the most recent [AVAILABLE FUNCTIONS] list. If it is not, do not use it. Do not assume that any function that was previously defined or used in another plan or in [EXAMPLES] is automatically available or compatible with the current plan.
3. Only use functions that are required for the given goal.
4. A function has a single ‘input’ and a single ‘output’ which are both strings and not objects.
5. The ‘output’ from each function is automatically passed as ‘input’ to the subsequent .
6. ‘input’ does not need to be specified if it consumes the ‘output’ of the previous function.
7. To save an ‘output’ from a , to pass into a future , use <function.{FunctionName} … setContextVariable: “<UNIQUE_VARIABLE_KEY>”/>
8. To save an ‘output’ from a , to return as part of a plan result, use <function.{FunctionName} … appendToResult: “RESULT__<UNIQUE_RESULT_KEY>”/>
9. Append an “END” XML comment at the end of the plan

  1. 生成执行计划–XML文件(SK系统)

<function.Names.getNickName input=“Steven” setContextVariable=“NICKNAME”/>
<function.StringFunctions.stringReplace from=“USER_NAME” input=“Hello, USER_NAME. This is an important message for you.” to=“ N I C K N A M E " s e t C o n t e x t V a r i a b l e = " R E P L A C E D _ M E S S A G E " / > < f u n c t i o n . E m a i l e r . g e t E m a i l A d d r e s s i n p u t = " S t e v e n " s e t C o n t e x t V a r i a b l e = " E M A I L _ A D D R E S S " / > < f u n c t i o n . E m a i l e r . s e n d E m a i l e m a i l a d d r e s s = " NICKNAME" setContextVariable=“REPLACED\_MESSAGE”/> <function.Emailer.getEmailAddress input=“Steven” setContextVariable=“EMAIL\_ADDRESS”/> <function.Emailer.sendEmail emailaddress=" NICKNAME"setContextVariable=“REPLACED_MESSAGE”/><function.Emailer.getEmailAddressinput="Steven"setContextVariable=“EMAIL_ADDRESS”/><function.Emailer.sendEmailemailaddress="EMAIL_ADDRESS” message=“$REPLACED_MESSAGE” subject=“Important Message”/>

  1. 定义每个SKFunction的功能以及接收的输入参数(用户自定义)

@DefineSKFunction(name = “getEmailAddress”, description = “Retrieves the email address for a given user”)
public String getEmailAddress(
@SKFunctionInputAttribute(description = “The name of the person to get an email address for”)
String name) {
switch (name) {
case “Steven”:
return “codeking@example.com”;
default:
throw new RuntimeException("Unknown user: " + name);
}
}

  1. 使用Plan进行调用

kernel.importSkill(new StringFunctions(), “StringFunctions”);
kernel.importSkill(new Emailer(), “Emailer”);
kernel.importSkill(new Names(), “Names”);

SequentialPlanner planner = new SequentialPlanner(kernel, null, null);

Plan plan = planner
.createPlanAsync(“Send the input as an email to Steven and make sure I use his preferred name in the email”)
.block();

3. 思考


与LangChain的对比


LangChain

Semantic Kernel

开发组织

社区

微软

设计理念

Model I/O 、 Retriver、Chain、Memory

Kernel、SKFunction、ContextVar、Plan、Plugin

支持语言

python

python/c#/java,主推python与c#

社区活跃

活跃,功能迭代很快

比LangChain慢

生态集成

集成了各种Model I/O

生态集成没有LangChain高

记忆能力

支持

支持

支持多LLM切换

支持

支持

RAG支持

支持Retriver

支持Memory

Agent支持

支持

支持

多Agent支持

支持LangGraph

支持Planner

其他思考

Semantic kernel 的function与planner 抽象的比较好,可以通过planner来实现复杂场景的企业级AI应用。LangChain更适合快速落地一个AI应用,已经沉淀了各种Chain,拿来即用。同时LangChain已经推出LangGraph了,已经在实现类似Planner的功能。

Embeding技术


1. 介绍

将现实世界中的信息映射到低维的向量空间上。机器学习训练中的一个环节,在大模型产生之前就已经有了。

2. 应用场景

RAG向量召回场景

RAG使用中的场景

机器学习训练特征提取

降维、特征提取、数据压缩等

3. 如何生成向量

常用embedding技术

一般分为在线服务和离线服务

https://huggingface.co/spaces/mteb/leaderboard这个网站介绍了当前主流的一些embedding技术以及排行榜情况。

目前了解到的一些embedding技术包括:Word2Vec、通义千问embedding、text-embedding-3-small and text-embedding-3-large openAI embedding

图像embedding

一般用于图像分类、目标检测、计算机视觉等,不详细展开。

视频embedding

一般用于视频检索、视频内容理解、视频推荐等,不详细展开

4. 如何计算相似度

欧几里得距离

余弦距离

曼哈顿距离

5. 代码示例


文本:“你是谁”?

方法:通义千问在线embedding

结果:1500+维度的空间向量

6. 思考


1.Embedding作为召回策略中的一种,不同的embedding模型可能会对召回产生不同的影响,最好与LLM本身采用的embedding技术保持一致。

2.向量召回只是RAG召回策略中的一种,还包括搜索召回等其他方法。

微调技术


1. 背景

最近尝试了RAG技术实现了基于LLM上的智能答疑,也尝试了工作流的生成,发现效果严重依赖于大模型的能力,同时好的大模型成本又比较高,每次调用需要从知识库中召回大量的文档,从而消耗大量的token,所以在思考是否可以尝试通过将这些文档微调到大模型上。同时在思考是否也不需要超大参数的模型,是否可以基于小模型和业务数据来微调出自己的业务垂直模型。

同时我发现微调也没那么容易上手,因为这对于将来模型调试后的效果还是挺重要的,同时,理解一点基础的原理还是有必要的,仅仅是参照网上的教程一步步执行命令行,不晓得其中的原理,很容易一头雾水。

2. 什么是预训练模型

其实在之前已经有预训练模型的一些概念了。比如CNN、RNN等。其大概原理是每次训练,与目标值计算得出损失值,反向传播驱动模型迭代更新,使得下一代迭代更精确。

CNN:适合于图像领域

RNN:适合于自然语言NLP

Transformer模型:基于RNN之上增加了并行处理和注意力机制的特性。

3. 什么是微调

在已经训练好的大模型基础上,使用特定的数据集进行进一步的训练,以使模型适应特定任务或领域。有一个例子解释的挺好:小明刚刚学会了开车,那么他已经掌握了一些基础的开车技巧,比如起步、踩油门、转弯、换挡、靠边停车等一些基础技能。在微调的过程中,小明要适应在湿滑的泥地、大雾天气、山路陡坡、雨雪天等场景下开车,以适应新的场地要求。

4. 什么情况下微调

训练自己垂直领域的大模型,以适应自己特定领域的任务, 但是数据规模小,同时计算资源又稀缺。

5. 为什么会有不同的微调方法?

假设我们把训练过程简单定义为:Y(真实结果)=W(模型)*X(输入)

Y=[y1,y2,y3,y4,y5…yn] X=[x1,x,2,x3,…xm],Y和X是Embeding之后的矩阵向量,那么最后优化的就是这个W。

那么对于新的数据集X和Y,如何优化W,一种办法是W中加入一些低纬度的矩阵权重,另一种办法是X做一些演变,根据数据集去优化W。以下就是几种方法的基本原理。

6. 几种方法

LoRA

新权重 = 原始权重 + AB。

Y =(W*@W)*X

数学上的含义:假设 预训练模型是训练中间的神经网络,我们把最终生成的这个“神经网络” 比喻成是矩阵变换A X 矩阵变化B X 矩阵变化C …,那么最终生成的预训练模型就是超大规模的矩阵变化集合。那么微调就是在这个超大规模的矩阵变化中,加入一些低纬度的矩阵变化,通过训练给入的小规模入参,优化这些低纬度的矩阵变化过程,最终来适应这个特定领域的“逻辑”

Prompt Tuning

Y = WX`

就是在输入端加入一些提示词,以增大生成期望结果的概率。简单来说:给定预训练模型的参数,然后在模型的输入端添加可学习的"prompt"(提示)进行调整

8. 部署教程

参考资料

https://www.heywhale.com/mw/project/6436d82948f7da1fee2be59e

准备工作:数据集、微调训练方法 P-tuning v2

基础环境:GPU、pyTorch、模型文件、数据集文件

验证:使用Langchain进行简单测试验证。

-END-


读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1872222.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

点云可视化 .ply文件 | 方案汇总

前言 本文分析可视化点云.ply文件的几种方法&#xff0c;包括MeshLab软件、在线可视化点云.ply文件、通过PyntCloud库编程实现。 PLY是一种用于存储三维数据的文件格式&#xff0c;常用于点云数据和多边形网格。 被广泛应用于计算机图形学、3D扫描和3D打印等领域。PLY文件可…

【AI落地应用实战】如何让扫描工具更会思考——智能高清滤镜2.0实战测评

一、引言 在这个信息爆炸的数字化时代&#xff0c;扫描工具已经成为我们日常工作和学习中不可或缺的助手。最近&#xff0c;扫描全能王推出了革命性的“智能高清滤镜2.0”&#xff0c;本次更新后&#xff0c;智能高清滤镜能够智能识别并优化扫描过程中的各种问题。无论是光线不…

好书安利 | LangChain入门指南:构建高可复用、可扩展的LLM应用程序(送PDF)轻松入门LangChain

《LangChain入门指南》 LangChain作为大模型集成框架鼎鼎大名&#xff0c;这本《LangChain入门指南》是一本很及时的书&#xff0c;值得推荐&#xff5e; 01 为什么需要LangChain 首先想象一个开发者在构建一个LLM应用时的常见场景。 当你开始构建一个新项目时&#xff0c;…

云仓是如何发展起来的?

1、电子商务的繁荣&#xff1a; 随着电商的兴起&#xff0c;对高效仓储和物流的需求越来越大。传统的仓储方式难以满足海量订单处理和快速配送的要求&#xff0c;因此需要一种更加灵活和高效的仓储解决方案。 ------------------------------------------------- 2、科技进步…

Mac中的xshell、xftp

ROYAL TSX 插件式支持远程连接linux、支持命令行、支持ftp、支持远程windows桌面。 免费版就足够使用了。&#xff08;支持维护一个Connections文件夹&#xff09; 需要在本地创建一个文件夹&#xff0c;用以保存链接信息 使用方法

注意!!2024下《网络规划设计师》易混淆知识点来了,赶紧码住

宝子们&#xff0c;在复习软考网络规划设计师中&#xff0c;是不是觉得有很多知识点含义比较相近&#xff0c;很多友友刚看的时候&#xff0c;估计会像我一样把它们弄混&#xff0c;作为一个软考老鸟&#xff0c;在这里给大家整理了网规学习过程中易混淆的知识点&#xff0c;大…

【GreenHills】GHS中Build的高级选项设置

【更多软件使用问题请点击亿道电子官方网站】 1、 文档目标 了解GHS中高级构建选项的使用 2、 问题场景 1&#xff09;、想要清除工程的所有输出文件 2&#xff09;、想要对于工程进行重新构建的时候&#xff0c;希望删掉之前的输出文件&#xff0c;保证工程中所有输出文件…

C语言力扣刷题1——最长回文字串[双指针]

力扣算题1——最长回文字串[双指针] 一、博客声明二、题目描述三、解题思路1、思路说明2、知识补充a、malloc动态内存分配b、free释放内存c、strlen求字符数组长度d、strncpy函数 四、解题代码&#xff08;附注释&#xff09; 一、博客声明 找工作逃不过刷题&#xff0c;为了更…

中小企业进行数字化转型会面临哪些挑战?

在当今这个信息化、数字化的时代&#xff0c;中小企业进行数字化转型已不再是选择&#xff0c;而是必然。然而&#xff0c;这条转型之路并非坦途&#xff0c;它充满了未知与挑战。今天&#xff0c;我们就来探讨一下中小企业为社么要进行数字化转型以及在数字化转型过程中可能遇…

solidworks钣金工厂共享云桌面方案

随着信息技术的飞速发展和企业数字化转型的深入&#xff0c;传统的钣金工厂面临着诸多挑战&#xff0c;其中之一就是如何在保证数据安全的前提下&#xff0c;提高设计、生产和管理的效率。 SolidWorks是一款专业的三维3D设计软件&#xff0c;功能强悍&#xff0c;支持分布式数…

OpenAI最强大模型ChatGPT-4o,论文降重小技巧,国内直接使用

一、万字论文&#xff0c;从0到1&#xff0c;只需1小时 通过OpenAI5月14日1点发布的最新大模型ChatGPT4o&#xff1a; 1小时即可完成万字论文的编写通过GPT定制的降重大模型“中文论文降重”&#xff0c;2小时即可完成一篇优质的、查重率较低的万字论文。 在ChatGPT4o对话框中…

GPT-5的到来:智能飞跃与未来畅想

IT之家6月22日消息&#xff0c;在美国达特茅斯工程学院的采访中&#xff0c;OpenAI首席技术官米拉穆拉蒂确认了GPT-5的发布计划&#xff0c;预计将在一年半后推出。穆拉蒂形象地将GPT-4到GPT-5的飞跃比作高中生到博士生的成长。这一飞跃将给我们带来哪些变化&#xff1f;GPT-5的…

计算机公共课面试常见问题:线性代数篇

目录 1. 特征向量和特征值代表什么含义&#xff1f; 2. 矩阵的秩是什么&#xff1f;满秩代表什么&#xff1f;不满秩呢&#xff1f; 3. 奇异值分解是什么&#xff1f; …

昇思25天学习打卡营第五天|网络构建

背景 提供免费算力支持&#xff0c;有交流群有值班教师答疑的华为昇思训练营进入第五天了。 今天是第五天&#xff0c;前四天的学习内容可以看链接 昇思25天学习打卡营第一天|快速入门 昇思25天学习打卡营第二天|张量 Tensor 昇思25天学习打卡营第三天|数据集Dataset 昇思25天…

借助 Aspose.Words,在 C# 中将 Word 转换为 Excel

有时我们会遇到需要将 Word 文档&#xff08;DOC 或 DOCX&#xff09;转换为 Excel 文档的任务。例如&#xff0c;这对于数据分析和报告很有用&#xff0c;或者如果您收到了任何文本数据并想将其转换为表格格式&#xff08;XLS 或 XLSX&#xff09;以便进一步工作。在本文中&am…

sudo: /etc/init.d/ssh: command not found

在 WSL 中尝试启动 SSH 服务时遇到 sudo: /etc/init.d/ssh: command not found 错误 安装 OpenSSH 服务器 更新软件包列表 sudo apt update安装 OpenSSH 服务器 sudo apt install openssh-server启动 SSH 服务 在 WSL 2 上,服务管理与传统 Linux 系统有所不同。你可以手动启动…

开发RAG应用,你必须知道的7个Embedding模型

在自然语言处理&#xff08;NLP&#xff09;领域&#xff0c;Embedding模型是将文本数据转化为数值向量的核心技术&#xff0c;从而让计算机能够便捷地衡量文本间的语义关联&#xff0c;这种表示法已成为多种基础NLP任务的核心&#xff0c;如文本相似度判定、语义搜索、信息检索…

分享HTML显示2D/3D粒子时钟

效果截图 实现代码 线上体验&#xff1a;three.jscannon.js Web 3D <!DOCTYPE html> <head> <title>three.jscannon.js Web 3D</title><meta charset"utf-8"><meta name"viewport" content"widthdevice-width,ini…

计算机专业课面试常见问题-编程语言篇

目录 1. 程序的编译执行流程&#xff1f; 2. C浅拷贝和深拷贝的区别&#xff1f; 3. C虚函数&#xff1f; …

Redis 内存碎片是什么?如何清理?

Redis 内存碎片相关的问题在得物、美团、阿里、字节、携程等公司的后端面试中都曾出现过&#xff0c;还是建议认真准备一下。即使不是准备面试&#xff0c;日常开发也是能够用到的&#xff01; 什么是内存碎片? 你可以将内存碎片简单地理解为那些不可用的空闲内存。 举个例子&…