大家好,我是微学AI,今天给大家介绍一下大模型的实践应用7-阿里的多版本通义千问Qwen大模型的快速应用与部署。阿里云开源了Qwen系列模型,即Qwen-7B和Qwen-14B,以及Qwen的聊天模型,即Qwen-7B-Chat和Qwen-14B-Chat。通义千问模型针对多达 3 万亿个 token 的多语言数据进行了稳定的预训练,覆盖领域、语言等,能够实现有竞争力的基准数据集上的性能。此外,阿里还基于SFT和RLHF(尚未发布)的符合人类偏好的聊天模型,能够聊天、创建内容、提取信息、解决数学问题等,并且能够使用工具,扮演代理,甚至扮演代码解释器等。
一、阿里大模型(通义千问)更新列表:
2023.8.3 我在 ModelScope 和 Hugging Face 上发布了Qwen-7B和Qwen-7B-Chat 。阿里还提供了有关模型的更多详细信息的技术备忘录,包括训练细节和模型性能。
2023.8.21 阿里发布了 Qwen-7B-Chat 的 Int4 量化模型Qwen-7B-Chat-Int4,该模型需要较低的内存成本,但可以提高推理速度。此外,基准评估没有明显的性能下降。
2023.9.12 支持Qwen-7B模型的微调,包括全参数微调、LoRA和Q-LoRA。
2023.9.25 阿里在 ModelScope 和 Hugging Face 上发布了Qwen-14B和Qwen-14B-Chat,以及qwen.cpp和Qwen-Agent。Qwen-7B和Qwen-7B-Chat的代码和检查点也已更新。请拉取最新版本!