通用vs垂直？热门AI大模型你更看好哪个？（附免费资源）

news2026/2/15 16:39:58

自ChatGPT发布以来，通用大模型就仿佛坐了火箭，短短几个月的时间，各大企业便争相发布自己的大模型，这其实也反应了目前人工智能发展的方向。

不过从长远来看，垂直领域大模型的发展会比通用大模型更具势头，一是通用大模型有GPT4这座难以跨越的大山，二是自研通用大模型的成本实在太高，一般公司承受不来。

目前，无论是通用大模型还是垂直领域大模型，都已经有了相当多的成果。那今天咱们就来简单盘点一些比较出名的通用/垂直领域大模型。

相关论文资料给打包了，还附赠一份超详细的垂直领域大模型思维图谱（文末免费领取）

通用大模型

国内：

1.文心一言

网址：https://yiyan.baidu.com/

使用评价：在文学创作上回答的挺全面，数学解答能力有点不太行，代码能力也是一般般。

2.通义千问

网址：https://qianwen.aliyun.com/

使用评价：文学创作也很不错，翻译和数学问题回答的也可以，代码能力有待提高。

3.讯飞星火

网址：https://xinghuo.xfyun.cn/desk

使用评价：首先它这个审核速度我是满意的，两天就通过可以上手玩耍了，代码解释能力不错，但是写代码还是差点意思。

4.天工

网址：https://tiangong.kunlun.com/

使用评价：文学创作能力也在线，数理问题也能做，代码能力整体也是一般。

5.360智脑

网址：https://chat.360.cn/index?src=invite

使用评价：这个也是申请了好久，刚刚才通过，我都快忘了...简单试用了一下，数理问题复杂点的不太行，代码编程能力还不错。

国外：

1.ChatGPT

网址：https://chat.openai.com/

使用评价：这还需要我评价嘛（doge）

2.new bing

网址：https://www.bing.com/

使用评价：这么说吧，我现在找论文基本都用它。

3.Claude

网址：https://app.slack.com/

使用评价：用Claude需要先注册一个slack号，然后才能使用。好处是登录之后就不用再用魔法了，而且用它来辅助阅读论文是真不错~

PS：还能给Claude改名哦~

4.Bard

网址：https://bard.google.com/

使用评价：这个我用的少，用的时候还不支持中文，创造力不如GPT，其他能力还是可以的。

垂直领域大模型

1.BloombergGPT 金融大模型

原始论文：BloombergGPT: A Large Language Model for Finance

BloombergGPT是由彭博社开发的拥有500亿参数的语言模型。依托彭博社的大量金融数据源，BloombergGPT构建了一个3630亿个标签的数据集，支持金融行业内的各类任务。

作为首个金融垂直领域大模型，BloombergGPT同样基于transformer架构，采用译码器的技术。实验可得，BloombergGPT在执行金融任务方面的表现超过了现有的通用 LLM模型。

2.FinBERT金融大模型

原始论文：FinBERT: A Large Language Model for Extracting Information from Financial Text*

FinBERT同样是适用于金融领域的大型语言模型，采用了两大类预训练任务：字词级别的预训练和任务级别的预训练。具体来说，FinBERT有以下内容：

FinBERT-Pretrained：针对大规模金融文本的预训练 FinBERT 模型。
FinBERT-Sentiment：用于情感分类任务。
FinBERT-ESG：用于 ESG 分类任务。
FinBERT-FLS：用于前瞻性陈述（FLS）分类任务。

实验表明FinBERT在识别与环境、社会和治理问题相关的讨论方面优于其他模型。

3.LaWGPT 中文法律知识模型

项目地址：https://github.com/pengxiao-song/LaWGPT/

LaWGPT 目前也是比较热门的垂直领域大模型之一了，它是一系列基于中文法律知识的开源大语言模型。

该系列模型在通用中文基座模型（如 Chinese-LLaMA、ChatGLM 等）的基础上扩充法律领域专有词表、大规模中文法律语料预训练，增强了大模型在法律领域的基础语义理解能力。在此基础上，构造法律领域对话问答数据集、中国司法考试数据集进行指令精调，提升了模型对法律内容的理解和执行能力。

放张官方图感受一下：

4.BenTsao 中文医学模型

项目地址：https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

原名华佗（HuaTuo），是一个基于中文医学知识的LLaMA-7B微调模型，通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集，在此基础上对LLaMA进行指令微调。

目前这个模型只开放针对"肝癌"单个疾病训练的模型参数，开发团队表示后期会针对“肝胆胰”相关16种疾病训练模型。

5.MathGPT 数学大模型

MathGPT是学而思自研，以数学领域的解题和讲题算法为核心的数学大模型，目前官方表示今年内将推出基于该自研大模型的产品级应用，可以等待一波。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“大模型PK”获取知识图谱+必读论文合集

码字不易，欢迎大家点赞评论收藏！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/687885.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

通用vs垂直？热门AI大模型你更看好哪个？（附免费资源）

通用大模型

国内：

1.文心一言

2.通义千问

3.讯飞星火

4.天工

5.360智脑

国外：

1.ChatGPT

2.new bing

3.Claude

4.Bard

垂直领域大模型

1.BloombergGPT 金融大模型

2.FinBERT金融大模型

3.LaWGPT 中文法律知识模型

4.BenTsao 中文医学模型

5.MathGPT 数学大模型

相关文章

Java线程面试题

Office远程代码执行漏洞（CVE-2017-11882）漏洞复现

虚函数，抽象基类

阿里巴巴变革，盒马“一马当先”

Javawed第一章：Web前端的入门理论

SOLIDWORKS仿真数据清扫工具

阻塞队列(消息队列)

Python面向对象编程基础知识和示例代码

JUC简介

MySQL——函数与约束的讲解

渗透测试面试题汇总

DCN v1阅读笔记

神经网络基础

软件测试技能，JMeter压力测试教程，JDBC配置连接mysql数据库（十）

7-WebApis-2

通过easyui的filebox上传文件

开源代码分享(5)—配电网重构的启发式算法(附matlab代码)

基于SSM+jsp的教学质量评价系统设计与实现

Origin如何绘制三维离散点并拟合曲面？

腾讯安全吴石：基于威胁情报构建免疫体系，助力企业稳步迈向智能安全新阶段