一、前言
你了解中国ChatGPT相关开源项目的情况吗?
如果想要从事chatGPT相关项目的开发和研究,有哪些可以借鉴和开源项目?
中国的chatGPT开源项目发展如何,本文将给你带来答案。
二、项目概述
数据截至到:2023年8月10日
2.1 中国Llms大模型分类统计
从上图,我们可以看到三个结论:1. 通用基础模型共18个;2. 垂直行业模型占85%,说明国内大模型研究,以垂直行业应用为主;3.金融、工业、媒体、科研和客服领域,大模型项目聚集;
2.2 中国Llms大模型分区域统计
从上图,我们同样可以得出两个结论:
1. 项目集中在北京、上海、深圳、广州和杭州,尤其是北京,这个还是比较出人意料的;
2. 其他城市也有分布,但是多集中在省会或者直辖的一二线城市;
三、项目列表
序号 | 公司 | 大模型 | 省市 | 类别 | 项目数 | 官网 | 说明 |
1 | 百度 | 文心一言,灵医Bot | 北京 | 通用 | 1 | ✔ | 试用需账号,有APP |
2 | 阿里云 | 通义千问,Qwen-7B | 浙江杭州 | 通用 | 1 | ✔ | 试用需账号,开源通义千问7B模型Qwen-7B,Qwen-7B-Chat |
3 | 科大讯飞 | 星火 | 安徽合肥 | 通用 | 1 | ✔ | 试用需账号,有APP |
4 | 达观数据 | 曹植 | 上海 | 金融、工业 | 1 | ✔ | 试用需账号 |
5 | 复旦大学 | MOSS | 上海 | 科研 | 1 | ✔ | 试用需账号 |
6 | 清华大学 | ChatGLM,NowcastNet | 北京 | 科研 | 1 | ✔ | 开源6B,ChatGLM2-6B, 智谱AI,气象,临近预报大模型 |
7 | 华为 | 盘古,盘古气象,盘古-Σ | 广东深圳 | 工业 | 1 | ✔ | 华为+鹏城,华为云盘古 |
8 | 智源人工智能研究院 | 悟道·天鹰,悟道·EMU | 北京 | 通用 | 1 | ✔ | 悟道3.0,视界视觉,AQUILA天鹰座,Aquila-7B,AquilaChat-7B,AquilaCode-7B-NV,AquilaCode-7B-TS,HuggingFace,EMU基于LLaMA |
9 | 浙江大学 | 启真,PromptProtein,TableGPT | 浙江杭州 | 垂直 | 1 | ✔ | 医学大模型提供基于LLaMA-7B、CaMA-13B和ChatGLM-6B 三个版本,用于PromptProtein的模型 |
10 | 百川智能 | baichuan-7B,Baichuan-13B | 北京 | 通用 | 1 | ✔ | 模型下载:Baichuan-13B-Base,Baichuan-13B-Chat,Baichuan-7B,开源可商用 |
11 | 上海人工智能实验室 | 书生·浦语, OpenMEDLab浦医 | 上海 | 通用&垂直 | 1 | ✔ | 技术报告,开源的InternLM-7B,HuggingFace下载模型权重 |
12 | 贝壳 | BELLE | 北京 | 垂直 | 1 | ✔ | 基于BLOOMZ或LLaMA的多个模型 |
13 | 哈尔滨工业大学 | 本草,活字 | 黑龙江哈尔滨 | 医学 | 1 | ✔ | 医学,本草基于LLaMA;另有基于 ChatGLM 的Med-ChatGLM,活字基于BLOOM-7B |
14 | 云知声 | 山海 | 北京 | 医学 | 1 | ✔ | |
15 | OpenBMB | CPM,CPM-Bee | 北京 | 通用 | 1 | ✔ | 面壁智能,CPM-Bee-10B |
16 | 港中文深圳 | 华佗,凤凰 | 广东深圳 | 医学 | 1 | ✔ | 香港中文大学(深圳)和深圳市大数据研究院,医学,Demo,华佗和凤凰都基于BLOOMZ |
17 | 元象科技 | XVERSE-13B | 广东深圳 | 通用 | 1 | ✔ | 模型下载 |
18 | 虎博科技 | TigerBot | 上海 | 金融 | 1 | ✔ | 基于BLOOM |
19 | 东北大学 | TechGPT,PICA | 辽宁沈阳 | 科研 | 1 | ✔ | TechGPT->BELLE->LLaMA,图谱构建和阅读理解问答;PICA->ChatGLM2-6B情感大模型 |
20 | 上海交通大学 | K2,白玉兰 | 上海 | K2:地球科学,白玉兰:科学 | 1 | ✔ | Demo,GeoLLaMA,基于LLaMA,HuggingFace |
21 | IDEA研究院 | 封神榜MindBot | 广东深圳 | 通用 | 1 | ✔ | 姜子牙系列模型 |
22 | 度小满 | 轩辕 | 北京 | 金融 | 1 | ✔ | 基于BLOOM |
23 | 360 | 智脑,一见 | 北京 | 通用 | 1 | ✔ | |
24 | 艾写科技 | Anima | 浙江杭州 | 营销 | 1 | ✔ | 基于Guanaco->基于LLaMA,使用QLoRA |
25 | 北京大学信息工程学院 | ChatLaw | 北京 | 法律 | 1 | ✔ | ChatLaw-13B基于Ziya-LLaMA-13B-v1->LLaMA,ChatLaw-33B基于Anima33B->Guanaco->LLaMA |
26 | 中国科学院自动化研究所 | 紫东·太初 | 北京 | 通用 | 1 | ✔ | 紫东太初2.0号称100B参数,全模态 |
27 | 中国科学院计算技术研究所 | 百聆 | 北京 | 科研 | 1 | ✔ | 基于 LLaMA,权重Diff下载7B和13B,demo |
28 | 中国科学院成都计算机应用研究所 | 聚宝盆 | 四川成都 | 金融 | 1 | ✔ | 基于LLaMA的金融大模型 |
29 | 晓多科技+国家超算成都中心 | 晓模型XPT | 四川成都 | 客服 | 1 | ✔ | 试用申请 |
30 | 网易有道 | 子曰 | 北京 | 教育 | 1 | ✔ | 推荐有道速读,读论文的利器 |
31 | 北京语言大学 | 桃李 | 北京 | 教育 | 1 | ✔ | 基于LLaMA,北语+清华+东北、北京交大 |
32 | 华南理工大学 | 扁鹊,灵心SoulChat | 广东广州 | 医学 | 1 | ✔ | |
33 | 商汤科技 | 日日新 | 上海 | 通用 | 1 | ✔ | |
34 | 国家超级计算天津中心 | 天河天元 | 天津 | 通用 | 1 | ✘ | |
35 | 北京交通大学 | 致远 | 北京 | 交通 | 1 | ✔ | TransGPT・致远,基于LLaMA-7B |
36 | 恒生电子 | LightGPT | 浙江杭州 | 金融 | 1 | ✘ | |
37 | 稀宇科技 | MiniMax | 上海 | 通用 | 1 | ✔ | GLOW虚拟社交 |
38 | 左手医生 | 左医GPT | 北京 | 医学 | 1 | ✔ | 医疗,试用需Key |
39 | 上海科技大学 | DoctorGLM | 上海 | 医学 | 1 | ✔ | 医学大模型,论文 |
40 | 华东师范大学 | EmoGPT,EduChat | 上海 | 教育 | 1 | ✘ | EmoGPT是上海市心理健康与危机干预重点实验室与镜象科技公司合作完成, 教学教育大模型EduChat基于BELLE(BELLE基于LLaMA) |
41 | 星环科技 | 无涯、求索 | 上海 | 金融 | 1 | ✘ | 无涯——金融;求索——大数据分析 |
42 | 西湖心辰 | 西湖 | 浙江杭州 | 科研 | 1 | ✔ | |
43 | 数慧时空 | 长城 | 北京 | 地球科学 | 1 | ✘ | 自然资源,遥感 |
44 | 中工互联 | 智工 | 北京 | 工业 | 1 | ✘ | 与复旦NLP实验室联合,工业领域 |
45 | 创业黑马 | 天启 | 北京 | 创投 | 1 | ✘ | 创业黑马与360合作,科创服务行业 |
46 | 追一科技 | 博文Bowen | 广东深圳 | 客服 | 1 | ✘ | |
47 | 智慧眼 | 砭石 | 湖南长沙 | 医学 | 1 | ✘ | 医疗领域 |
48 | 香港科技大学 | 罗宾Robin | 香港 | 科研 | 1 | ✔ | 基于LLaMA,港科大开源LMFlow |
49 | 昆仑万维 | 天工 | 北京 | 客服 | 1 | ✔ | 与奇点智源联合研发 |
50 | 智媒开源研究院 | 智媒 | 广东深圳 | 媒体 | 1 | ✔ | 基于LLaMA,面向自媒体 |
51 | 医疗算网 | Uni-talk | 上海 | 医学 | 1 | ✘ | 上海联通+华山医院+上海超算中心+华为 |
52 | 蚂蚁集团 | 贞仪 | 浙江杭州 | 金融 | 1 | ✘ | 据传语言和多模态两个 |
53 | 硅基智能 | 炎帝 | 江苏南京 | 文旅 | 1 | ✘ | |
54 | 腾讯 | 混元 | 广东深圳 | 通用 | 1 | ✘ | |
55 | 拓尔思 | 拓天 | 北京 | 媒体 | 1 | ✘ | TRSGPT |
56 | 好未来 | MathGPT | 北京 | 教育 | 1 | ✘ | 学而思 |
57 | 清博智能 | 先问 | 北京 | 农业 | 1 | ✘ | 基于结构化数据 |
58 | 智子引擎 | 元乘象 | 江苏南京 | 客服 | 1 | ✔ | |
59 | 拓世科技 | 拓世 | 江西南昌 | 金融 | 1 | ✘ | |
60 | 循环智能 | 盘古 | 北京 | 客服 | 1 | ✔ | 循环智能,清华大学,华为 |
61 | 慧言科技+天津大学 | 海河·谛听 | 天津 | 科研 | 1 | ✘ | |
62 | 第四范式 | 式说 | 北京 | 客服 | 1 | ✔ | |
63 | 字节跳动 | Grace | 北京 | 通用 | 1 | ✘ | 内部代号 |
64 | 出门问问 | 序列猴子 | 北京 | 营销 | 1 | ✔ | |
65 | 数说故事 | SocialGPT | 广东广州 | 社交 | 1 | ✘ | |
66 | 云从科技 | 从容 | 广东广州 | 政务 | 1 | ✔ | |
67 | 浪潮信息 | 源 | 山东济南 | 通用 | 1 | ✘ | 源 |
68 | 中国农业银行 | 小数ChatABC | 北京 | 金融 | 1 | ✘ | |
69 | 麒麟合盛 | 天燕AiLMe | 北京 | 运维 | 1 | ✔ | |
70 | 台智云 | 福尔摩斯FFM | 台湾 | 工业 | 1 | ✔ | 华硕子公司 |
71 | 医联科技 | medGPT | 四川成都 | 医学 | 1 | ✘ | |
72 | 电信智科 | 星河 | 北京 | 通信 | 1 | ✘ | 通用视觉,中国电信 |
73 | 深思考人工智能 | Dongni | 北京 | 媒体 | 1 | ✔ | |
74 | 文因互联 | 文因 | 安徽合肥 | 金融 | 1 | ✘ | 金融大模型 |
75 | 印象笔记 | 大象GPT | 北京 | 媒体 | 1 | ✘ | |
76 | 中科闻歌 | 雅意 | 北京 | 媒体 | 1 | ✘ | |
77 | 澜舟科技 | 孟子 | 北京 | 金融 | 1 | ✔ | |
78 | 京东 | 言犀 | 北京 | 商业 | 1 | ✘ | |
79 | 智臻智能 | 华藏 | 上海 | 客服 | 1 | ✘ | 小i机器人 |
80 | 新华三H3C | 百业灵犀 | 浙江杭州 | 工业 | 1 | ✘ | |
81 | 鹏城实验室 | 鹏城·脑海 | 广东深圳 | 科研 | 1 | ✘ | Peng Cheng Mind |
82 | 宇视科技 | 梧桐 | 浙江杭州 | 运维 | 1 | ✘ | AIoT行业 |
83 | 理想科技 | 大道Dao | 北京 | 运维 | 1 | ✘ | 运维大模型 |
84 | 美亚柏科 | 天擎 | 福建厦门 | 安全 | 1 | ✘ | 公共安全 |
85 | 赛灵力科技 | 达尔文 | 广东广州 | 医学 | 1 | ✘ | 赛灵力,清华珠三角研究院,赛业生物,大湾区科技创新服务中心 |
86 | 实在智能 | 塔斯 | 浙江杭州 | 客服 | 1 | ✘ | TARS |
87 | 佳都科技 | 佳都知行 | 广东广州 | 交通 | 1 | ✘ | 交通领域 |
88 | 知乎 | 知海图 | 北京 | 媒体 | 1 | ✘ | 知乎和面壁科技合作 |
89 | 网易伏羲 | 玉言 | 广东广州 | 通用 | 1 | ✘ | |
90 | 清睿智能 | ArynGPT | 江苏苏州 | 教育 | 1 | ✘ | |
91 | 微盟 | WAI | 上海 | 商业 | 1 | ✔ | |
92 | 西北工业大学+华为 | 秦岭·翱翔 | 陕西西安 | 工业 | 1 | ✘ | 流体力学大模型,湍流+流场 |
93 | 奇点智源 | Singularity OpenAPI | 北京 | 通用 | 1 | ✔ | 瑶光和天枢 |
94 | 联汇科技 | 欧姆 | 浙江杭州 | 通用 | 1 | ✔ | OmModel欧姆多模态(视觉语言)大模型 |
95 | 中国联通 | 鸿湖 | 北京 | 通信 | 1 | ✘ | |
96 | 思必驰 | DFM-2 | 江苏苏州 | 工业 | 1 | ✘ | |
97 | 中科创达 | 魔方Rubik | 北京 | 工业 | 1 | ✘ | |
98 | 电科太极 | 小可 | 北京 | 政务 | 1 | ✘ | 党政企行业应用 |
99 | 中国移动 | 九天 | 北京 | 通信 | 1 | ✘ | |
100 | 中国电信 | TeleChat | 北京 | 通信 | 1 | ✘ | |
101 | 容联云 | 赤兔 | 北京 | 客服 | 1 | ✘ | 客服,营销 |
102 | 云天励飞 | 天书 | 广东深圳 | 政务 | 1 | ✘ | |
103 | 乐言科技 | 乐言 | 上海 | 客服 | 1 | ✘ | |
104 | 沪渝人工智能研究院 | 兆言 | 重庆 | 科研 | 1 | ✘ | 也称:上海交通大学重庆人工智能研究院 |
105 | 中央广播电视总台 | 央视听 | 北京 | 媒体 | 1 | ✘ | 央视听媒体大模型CMG Media GPT |
106 | 超对称技术公司 | 乾元 | 北京 | 金融 | 1 | ✔ | |
107 | 蜜度 | 文修 | 上海 | 媒体 | 1 | ✘ | 智能校对 |
108 | 中国电子云 | 星智 | 湖北武汉 | 政务 | 1 | ✘ | 政务大模型 |
109 | 理想汽车 | MindGPT | 北京 | 工业 | 1 | ✘ | |
110 | 阅文集团 | 妙笔 | 上海 | 文旅 | 1 | ✘ | 网文大模型 |
111 | 携程 | 问道 | 上海 | 文旅 | 1 | ✘ | 旅游行业大模型 |
112 | 长虹 | 长虹超脑 | 四川绵阳 | 媒体 | 1 | ✘ | |
113 | 瑞泊 | VIDYA | 北京 | 工业 | 1 | ✔ | |
114 | 有连云 | 麒麟 | 上海 | 金融 | 1 | ✘ | |
115 | 维智科技 | CityGPT | 上海 | 公共服务 | 1 | ✘ | 城市大模型 |
116 | 用友 | YonGPT | 北京 | 企业服务 | 1 | ✘ | |
117 | 天云数据 | Elpis | 北京 | 金融 | 1 | ✘ | 证券法律法规 |
118 | 孩子王 | KidsGPT | 江苏南京 | 教育 | 1 | ✘ | |
119 | 企查查 | 知彼阿尔法 | 江苏苏州 | 商业 | 1 | ✘ | |
120 | 今立方 | 12333 | 福建厦门 | 政务 | 1 | ✘ | 人社领域 |
121 | 阳光保险集团 | 正言 | 广东深圳 | 金融 | 1 | ✘ | |
122 | 电科数字 | 智弈 | 上海 | 水利 | 1 | ✘ | |
123 | 聆心智能 | CharacterGLM | 北京 | 游戏 | 1 | ✘ | |
124 | 大经中医 | 岐黄问道 | 江苏南京 | 医疗 | 1 | ✘ |