视频地址:
https://www.bilibili.com/video/BV18142187g5/
书生大模型全链路开源开放体系–笔记
技术发展
inerLM2.5 支持100wtoken
核心技术思路
数据合成
1.基于规则的构造
代码 公式,函数,数学题解
2.基于模型的数据扩充
代码加注释
3.基于人类反馈的数据生成
强化学习思路,RLHF路子。
全链条开源体系
数据-》预训练-》微调-》部署-》评测-》应用
开源数据处理工具箱
数据标注:label llm 开源项目 —说是特别好用。
预训练
数据并行
流水并行
张量并行
序列并行
微调xtuner
司南评测
部署lmdeploy
部署lmdeploy推理性能对比
描述为什么需要智能体
agent智能体任务拆解
agent可以有点像prompt里的cot (chain of thought) 思维链任务拆解,把每种任务模拟人脑解决。
mindsearch ai搜索引擎的智能体
huixiagndou知识库构建工具
1.私有化部署
2.免费商用
InterLM-xcomposer
多模态模型