通用vs垂直?热门AI大模型你更看好哪个?(附免费资源)

news2024/9/29 7:29:38

自ChatGPT发布以来,通用大模型就仿佛坐了火箭,短短几个月的时间,各大企业便争相发布自己的大模型,这其实也反应了目前人工智能发展的方向。

不过从长远来看,垂直领域大模型的发展会比通用大模型更具势头,一是通用大模型有GPT4这座难以跨越的大山,二是自研通用大模型的成本实在太高,一般公司承受不来。

目前,无论是通用大模型还是垂直领域大模型,都已经有了相当多的成果。那今天咱们就来简单盘点一些比较出名的通用/垂直领域大模型。

相关论文资料给打包了,还附赠一份超详细的垂直领域大模型思维图谱文末免费领取

通用大模型

国内:

1.文心一言

网址:https://yiyan.baidu.com/

使用评价:在文学创作上回答的挺全面,数学解答能力有点不太行,代码能力也是一般般。

2.通义千问

网址:https://qianwen.aliyun.com/

使用评价:文学创作也很不错,翻译和数学问题回答的也可以,代码能力有待提高。

3.讯飞星火

网址:https://xinghuo.xfyun.cn/desk

使用评价:首先它这个审核速度我是满意的,两天就通过可以上手玩耍了,代码解释能力不错,但是写代码还是差点意思。

4.天工

网址:https://tiangong.kunlun.com/

使用评价:文学创作能力也在线,数理问题也能做,代码能力整体也是一般。

5.360智脑

网址:https://chat.360.cn/index?src=invite

使用评价:这个也是申请了好久,刚刚才通过,我都快忘了...简单试用了一下,数理问题复杂点的不太行,代码编程能力还不错。

国外:

1.ChatGPT

网址:https://chat.openai.com/

使用评价:这还需要我评价嘛(doge)

2.new bing

网址:https://www.bing.com/

使用评价:这么说吧,我现在找论文基本都用它。

3.Claude

网址:https://app.slack.com/

使用评价:用Claude需要先注册一个slack号,然后才能使用。好处是登录之后就不用再用魔法了,而且用它来辅助阅读论文是真不错~

PS:还能给Claude改名哦~

4.Bard

网址:https://bard.google.com/

使用评价:这个我用的少,用的时候还不支持中文,创造力不如GPT,其他能力还是可以的。

垂直领域大模型

1.BloombergGPT 金融大模型

  • 原始论文:BloombergGPT: A Large Language Model for Finance

BloombergGPT是由彭博社开发的拥有500亿参数的语言模型。依托彭博社的大量金融数据源,BloombergGPT构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。

作为首个金融垂直领域大模型,BloombergGPT同样基于transformer架构,采用译码器的技术。实验可得,BloombergGPT在执行金融任务方面的表现超过了现有的通用 LLM模型。

2.FinBERT金融大模型

  • 原始论文:FinBERT: A Large Language Model for Extracting Information from Financial Text*

FinBERT同样是适用于金融领域的大型语言模型,采用了两大类预训练任务:字词级别的预训练和任务级别的预训练。具体来说,FinBERT有以下内容:

  • FinBERT-Pretrained:针对大规模金融文本的预训练 FinBERT 模型。

  • FinBERT-Sentiment:用于情感分类任务。

  • FinBERT-ESG:用于 ESG 分类任务。

  • FinBERT-FLS:用于前瞻性陈述(FLS)分类任务。

实验表明FinBERT在识别与环境、社会和治理问题相关的讨论方面优于其他模型。

3.LaWGPT 中文法律知识模型

  • 项目地址:https://github.com/pengxiao-song/LaWGPT/

LaWGPT 目前也是比较热门的垂直领域大模型之一了,它是一系列基于中文法律知识的开源大语言模型。

该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。

放张官方图感受一下:

4.BenTsao 中文医学模型

  • 项目地址:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

原名华佗(HuaTuo),是一个基于中文医学知识的LLaMA-7B微调模型,通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集,在此基础上对LLaMA进行指令微调。

目前这个模型只开放针对"肝癌"单个疾病训练的模型参数,开发团队表示后期会针对“肝胆胰”相关16种疾病训练模型。

5.MathGPT 数学大模型

MathGPT是学而思自研,以数学领域的解题和讲题算法为核心的数学大模型,目前官方表示今年内将推出基于该自研大模型的产品级应用,可以等待一波。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“大模型PK”获取知识图谱+必读论文合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/687885.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java线程面试题

0. Java线程面试题 0.1 线程占用的内存 JDK1.4默认单个线程占用256KJDK1.5默认单个线程占用1M可以通过-Xss参数设定 0.2 为什么要使用线程池 手动创建线程池的缺点 不受风险控制:服务器CPU资源有限,如果每个人都显示手动创建线程,不知道哪…

Office远程代码执行漏洞(CVE-2017-11882)漏洞复现

Office远程代码执行漏洞(CVE-2017-11882)漏洞复现 1.漏洞原理2.在Kali平台查看漏洞利用文件3.登录目标靶机,打开FTP服务器4.登录Kali,利用FTP服务器上传payload-cale.doc文件5.登录目标靶机,触发doc文件,验…

虚函数,抽象基类

编译器处理虚函数的方法: 给每个对象添加一个隐藏成员,隐藏成员保存了一个指向函数地址的数组指针,数组被称为虚函数表,虚函数表存储了为类对象声明的虚函数的地址,比如基类包含一个指针,该指针指向基类中…

阿里巴巴变革,盒马“一马当先”

配图来自canva可画 随着数字经济成为当前经济社会发展的“新宠”,诸多数字企业也开始走上了发展的快车道。而作为国内互联网大厂的阿里巴巴集团,为了打造数字经济时代的商业、金融、物流、云计算和大数据等新一代商业基础设施,就于前不久启动…

Javawed第一章:Web前端的入门理论

目录 前言 一.wed 💖wed是什么? 💖 wed的分类 二.HTML 和 CSS 💖HTML的介绍 HTML的标签 💖CSS的介绍 常用基本标签 💖实践 HTML结构标签特点 三.JavaScript 💖JavaScript的介绍 &…

SOLIDWORKS仿真数据清扫工具

我们来聊下SOLIDWORKS仿真数据清扫工具。与 SOLIDWORKS 软件一起安装的一个鲜为人知的工具是 Simulation Cleaning Utility。该实用工具可用于在 SOLIDWORKS 零件或装配文件中永远删除任何仿真数据,包括仿真设置和后处理信息。 SOLIDWORKS仿真数据清扫工具工具可以…

阻塞队列(消息队列)

1、阻塞队列 队列是一种先进先出的数据结构。而阻塞队列也是一种特殊的队列,也遵守”先进先出“的原则。 阻塞队列是一种线程安全的的数据结构,并且具有以下特性: 1、队列往进写元素是从队尾插入,队首取出 2、当插入元素的时候…

Python面向对象编程基础知识和示例代码

文章目录 对象(Object)示例代码一 类的成员方法(Method)示例代码二 类和对象(Class and Object):示例代码三 构造方法(Constructor):示例代码四 魔术方法&…

JUC简介

1、JUC介绍 JUC (java.util.concurrent)是在并发编程中使用的工具类,主要包括以下三个 (1)java.util.concurrent (2)java.util.concurrent.atomic 原子性:不可分割。Int i0; i, (3)…

MySQL——函数与约束的讲解

作者简介:一名云计算网络运维人员、每天分享网络与运维的技术与干货。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​ 前言 本章将会讲解MySQL数据库的函数与约束的讲解。 一.函数 函数 是指一段可以直接被另一…

渗透测试面试题汇总

2023年快过去一半了,不知道小伙伴们有没有找到自己心仪的工作呀【doge】,本文总结了常见的安全岗位面试题,方便各位复习。祝各位事业顺利,财运亨通。在网络安全的道路上越走越远! 所有的资料都整理成了PDF&#xff0c…

DCN v1阅读笔记

DCN v1即 Deformable Convolutional Networks。 视觉识别(例如对象检测和语义分割)中的一个关键挑战是如何适应物体尺度、姿态、视角和零件变形中的几何变化或模型几何变换。卷积神经网络(CNN)构建模块中为固定几何结构&#xff1…

神经网络基础

文章目录 一、神经网络基础1.得分函数 f(xi;W,b)1)从输入到输出的映射2)数学表示3)计算方法4)多组权重参数构成了决策边界 2.损失函数 L3.前向传播4.Softmax分类器 梯度下降2.反向传播 一、神经网络基础 回归任务:最终…

软件测试技能,JMeter压力测试教程,JDBC配置连接mysql数据库(十)

前言 使用jmeter压测接口的时候,有时候需要批量造数据,需使用jmeter连数据库造对应的测试数据 或者测试结束后,对测试的数据还原,删掉一些垃圾数据,都会用到连接数据库执行sql的操作 一、JDBC 连接配置 添加配置元…

7-WebApis-2

Web APIs - 2 掌握事件绑定处理和事件对象,完成常见网页交互 事件监听事件类型事件对象拓展知识综合案例 事件监听 以前写的代码都是自动执行的,我们希望一段代码在某个特定的时机才去执行,比如 点击按钮可以弹出警示框比如鼠标经过显示下拉…

通过easyui的filebox上传文件

本篇文章重点分享一下怎么通过easyui的filebox实现文件上传的功能&#xff0c;从前端代码到后端接口都会展示给大家。 1、form表单同步上传 传统的文件上传会把<input type"file" />放到一个<form></form>里&#xff0c;设置form表单的提交方式为…

开源代码分享(5)—配电网重构的启发式算法(附matlab代码)

来源于文献IEEE TRANSACTIONS ON POWER SYSTEMS期刊文献的开源代码。 摘要&#xff1a;本文提出了一种两阶段的启发式计算方法&#xff0c;可以在最小的计算时间内重新配置一个径向分布网络。所有的网络交换机在操作的初始阶段都是关闭的&#xff0c;并提出了一个顺序的开关开闸…

基于SSM+jsp的教学质量评价系统设计与实现

博主介绍&#xff1a; 大家好&#xff0c;我是一名在Java圈混迹十余年的程序员&#xff0c;精通Java编程语言&#xff0c;同时也熟练掌握微信小程序、Python和Android等技术&#xff0c;能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架…

Origin如何绘制三维离散点并拟合曲面?

文章目录 0.引言1.准备数据2.三维离散点参数设置并绘图3.拟合曲面参数设置并绘图 0.引言 在数据统计分析中&#xff0c;有时希望知道一个因变量在两个自变量变化情况下的变化情况&#xff0c;这时可以绘制散点图&#xff0c;观察基础情况&#xff0c;进一步可以拟合散点&#x…

腾讯安全吴石:基于威胁情报构建免疫体系,助力企业稳步迈向智能安全新阶段

6月13日&#xff0c;腾讯安全、腾讯研究院联合IDC、《中国信息安全》杂志社、CIO时代、新基建创新研究院等多家权威机构、媒体共同发起“数字安全免疫力研讨论坛”&#xff0c;聚合产学研各界专家学者探讨数字安全建设新范式。论坛上&#xff0c;腾讯安全联合IDC发布“数字安全…