1.书生大模型全链路开源体系
【书生·浦语大模型全链路开源开放体系】 https://www.bilibili.com/video/BV18142187g5/?share_source=copy_web&vd_source=711f676eb7f61df7d2ea626f48ae1769
视频里介绍了书生浦语大模型的开源开放体系,包括了其的技术发展、模型架构、开源生态等。其核心技术思路包括:
- 模型能力飞轮:广泛使用模型参与自身迭代,加速能力提升;
- 高质量合成数据:包括基于规则的数据构造、基于模型的数据扩充、基于反馈的数据生成。融合了多种数据合成方案,提升合成数据质量;
此外还介绍了预训练框架InternEvo、微调框架XTuner、OpenCompass评测体系、LMDeploy部署框架、智能体Lagent和MindSearch,可以看出其开源链条非常的完整,和社区生态无缝对接。
2. 8G 显存玩转书生大模型 Demo
- 配置conda环境,编写cli_demo.py代码
- 与模型交流
- 生成小故事,可以看到后面开始重复输出内容了,可能需要进一步调整模型参数
- Streamlit Web Demo 部署 InternLM2-Chat-1.8B 模型
- 部署 InternLM-XComposer2-VL-1.8B
- 部署 InternVL2-2B
3. 浦语提示词工程实践
- 基础任务