大模型介绍
大模型是指具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数
开发大模型不是从0开始,是建立在已有的大模型基座模型上做开发,构建企业知识库(向量数据库)Embedding 将词向量化 例如 我是一个人 向量化为132345435
AI应用错误回答
在AI应用输入之后,得到错误的回答,证明结果不准确,可能有以下原因
1、没问清楚(提示工程)
2、缺乏相关知识(RAG)
3、能力不足(微调)
4、私有化部署
在大模型开发中要做的就是 提示工程、RAG 、微调、再加一个私有化部署
RAG原理
对个人、企业的知识库中的数据进行拆分并且向量化存入向量数据库, 用户问问题,在向量数据库中匹配,拿出相似度TopN个的段落,在结合问题,生成prompt(提示词)交给大模型得出结果。RAG的配置使大模型变得更聪明
大模型微调
在拿到基座模型以后,会对大模型进行参数微调,不采用全参微调,针对基座模型进行微调以后,将会对企业内部的一些问题回答的更加正确,不适合做通用型的回答
模型微调等于小批量的训练模型
可用的免费商用授权的基座大模型
Ollama Search,可以选择阿里的Qwen、gem、deepseek r1 GLM等