盘点国内热门AI大模型

news2024/11/25 8:20:27

Chat-GPT问世以来,使得大模型一时间内火爆非凡。国内外各大科技公司也纷纷加入到大模型的研发行列中来,“百模之战”愈演愈烈,国内百度、阿里、华为等科技大厂陆续推出旗下大模型产品,新锐科技公司也不甘落后,目前不少产品已经进入内测阶段。本文就来对国内部分AI大模型产品做个简单的集锦综述。

1.百度——文心一言

文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够进行对话互动、文本翻译、问题回答,高效便捷地帮助人们获取知识信息。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色 。

文心一言不仅能够生成文字,还能够生成图片、音频、视频等多种形式的内容 。以百度自研的跨模态大模型ERNIE-ViLG为底层架构,进而能够实现从文字到图像、从图像到文字、从声音到图像等多种转换 。用户通过简单的文字描述,文心一言便可通过相应的指令来图画、LOGO或者视频的产出,具有多模态生成能力。

2.阿里——通义千问

通义千问,是阿里云推出的一个超大规模的语言模型,可以进行多轮对话、文案创作、还具备逻辑推理、多模态理解、多语言支持的能力。通义千问以阿里巴巴达摩院自主研发的大规模分布式计算平台为架构,包括含光800、云计算平台等。在硬件设备方面,使用的是阿里自主研发的高性能计算芯片“含光800”。

通义千问能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。除了基本的文本生成和问答能力,还支持更多的定制化需求,可以针对不同场景和应用进行扩展和定制,提供更加个性化的服务和解决方案。

3.华为——盘古

盘古大模型是华为旗下开发的一系列AI大模型,首次基于「鹏城云脑 Ⅱ」和全场景 AI 计算框架 MindSpore 的自动混合并行模式实现在 2048卡算力集群上的大规模分布式训练,是国产全栈式 AI 基础设施第一次支持 2000 亿级超大规模语言模型训练,探索并验证了国产 E 级智算平台在软硬件协同优化、大规模分布式并行训练等核心关键技术上的可行性。

在模型性能方面,鹏程. 盘古大模型性能全球领先,16 个下游任务中性能指标优于业界 SOTA 模型,其中零样本学习任务 11 个任务领先、单样本学习任务 12 个任务领先、小样本学习任务 13 个任务领先。目前对于网传的“盘古Chat”并没有官方准确消息,但据悉2023华为开发者大会(HDC)将于7月7日在东莞召开,AI将会是本次大会的主线。 ​

4.科大讯飞——星火认知大模型

讯飞星火认知大模型是由讯飞人工智能实验室于2021年9月发布的中文自然语言处理全栈平台,它是基于Transformer架构的深度神经网络模型,拥有超过1000亿个参数,是目前世界上最大的中文预训练语言模型。讯飞星火认知大模型使用了超过1000亿字的中文文本数据进行训练,具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力,能够有效地捕捉中文语言的复杂性和多样性。

5.实在智能——TARS

实在的国产大模型,TARS(塔斯)历经半年研发,近期正式上线开始内测。这是国内人工智能企业、RPA赛道头部实在智能自研垂直领域的大语言模型,在TARS大模型中叠加了多项自然语言处理前沿技术,基于开源基座模型,在千亿级高质量Tokens上进行了充分训练,完整复现了Pretrain、SFT和RLHF三个阶段,语言理解能力及指令跟随能力等在横向对比测试中均取得良好效果。

TARS大模型全面支持私有化部署,用户可完全自主掌控数据和模型,确保内部敏感数据的安全性,并可根据业务需求进行定制化开发。响应国家互联网信息办公室发布的“关于《生成式人工智能服务管理办法(征求意见稿)》”,在TARS大模型中叠加了多项自然语言处理前沿技术。如:模型的不当言论判别,从而进一步增强了模型的生成效果和安全性。目前,实在TARS大模型正在进行更全面、更完整的效果评测,相关结果将在近期陆续公布。

6.复旦大学——MOSS

MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型,拥有160亿参数。它由约7000亿中英文及代码单词预训练得到,精度要求不那么高的话,甚至可以在单张3090显卡上运行。MOSS支持中英双语,拥有多轮对话和使用多种插件双重能力,具备搜索引擎、文字生成图片、计算器、方程求解的“技能点”。

作为“国内首个开放测试的ChatGPT”,MOSS已经经历了两版迭代,一版是公开邀请内测的MOSS 002版本,另一版是内部测试版本OpenChat 001。

7.智源研究院——悟道3.0

智源研究院在2023北京智源大会上发布了悟道3.0大模型系列,包括首个支持中英双语知识、开源商用许可协议、支持国内数据合规要求的开源语言大模型悟道·天鹰(Aquila),以及一站式的科学、公正、开放的基础模型评测体系天秤(FlagEval)。它包括7B、33B的基础模型,以及AquilaChat对话模型和AquilaCode文本代码生成模型。

8.360——360智脑

360智脑是360公司开发的一款生成式人工智能大模型产品,集合了 360CV 大模型、360GPT 大模型、360GLM 大模型和 360 多模态大模型的技术能力,具有语言理解、图像识别、自然语言处理等多面应用能力。

9.澜舟科技——“孟子”

孟子预训练模型是基于团队自研技术研发的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种文本理解和文本生成任务,能快速满足不同领域、不同应用场景的需求。孟子模型基于 Transformer 架构,包含十亿参数量,基于数百 G 级别涵盖互联网网页、社区、新闻、电子商务、金融等领域的高质量语料训练。

10.中科院自动化所——紫东太初

紫东太初,是中国科学院自动化研究所研发的跨模态通用人工智能平台 。全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力,取得了预训练模型突破性进展。紫东太初大模型将文本 + 视觉 + 语音各个模态高效协同,实现超强性能,在图文跨模态理解与生成性能上都能领先目前业界的SOTA模型,高效完成跨模态检测、视觉问答、语义描述等下游任务。

目前,技术不断发展推陈出新,国内大模型还在不断涌现,无论是已有模型的优化升级还是新模型的横空出世都值得我们拭目以待,也期待大模型能为各行各业的发展助力赋能,提高各行各业数据处理和决策效率、增强风险预测和控制能力,使数字化时代更上一层楼。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/765949.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【基于 GitLab 的 CI/CD 实践】01、GitLab CI/CD 基础概念

目录 一、为什么要做 CI/CD ? 1.1 背景-传统的应用开发发布模式 问题 1.2 持续集成与持续交付 持续集成(CI) 持续交付(CD) 持续部署(CD) 1.3 CI/CD 的价值体现 1.4 推荐常用的 CI/CD 工…

人工智能系统将家用机器人的解决问题技能提高了80%

麻省理工学院的研究人员开发了PIGINet,这是一个新系统,旨在有效地提高家用机器人解决问题的能力,将规划时间缩短50-80%。 在正常情况下,家用机器人遵循预定义的执行任务的配方,这并不总是适合多样化或不断变化的环境。…

指针面试题详解

目录 前言(数组名的总结): 一、int 型数组和 sizeof 的组合 sizeof计算原理 二、char类型和strlen()组合 三、char*类型和sizeof()组合(有 \0 版本) 四、char*类型和…

【干货】Mysql解决中文乱码

登录数据库后,选择数据库然后执行 MariaDB [test]> status; -------------- mysql Ver 15.1 Distrib 5.5.68-MariaDB, for Linux (x86_64) using readline 5.1Connection id: 6 Current database: test Current user: rootlocalhost SSL: …

开源人力资源管理系统OrangeHRM

什么是 OrangeHRM ? OrangeHRM 是一个全面的人力资源管理(HRM) 系统,它包含任何企业所需的所有基本功能。该软件旨在支持任何规模的团队,包括初创企业、中小企业以及大型跨国组织。 你也可以去官方的演示站点进行体验 网址:https…

【Java】一文学透四种内部类|保姆级详解,一看就会

文章目录 一、什么是内部类?二、内部类的分类2.1:成员内部类(实例内部类)2.1.1:定义:2.1.2:特性2.1.3:实现原理:2.1.4:应用场景: 2.2:…

字节跳动-抖音支付大量招聘实习生

字节跳动-抖音支付大量招聘实习生 字节跳动-抖音支付大量招聘实习生 要求:2024年6月毕业且有时间来实习(大于3个月)的在校学生(本三,研二),日常和暑期都有转正机会~ 职位描述&…

WPF 自定义控件完成库容表盘显示效果

先看一下显示效果: 需要注意的地方有以下几点: 表盘的刻度分部,长刻度和短刻度显示。在数值80W时,需要更改刻度盘的颜色渐变。在数值80W时,更改库容总数背景的显示,也是颜色渐变。刻度盘控件属性定义&…

印刷企业如何利用MES管理系统实现智能计划排产

在数字化时代,印刷企业面临着日益激烈的市场竞争和不断攀升的成本压力。为了提高生产效率和质量,印刷企业需要采用先进的生产管理系统。其中,MES生产管理系统已成为实现智能计划排产的重要工具。本文将探讨如何利用印刷MES管理系统实现印刷企…

界面控件DevExtreme PivotGrid,拥有新的HTML编码体验!

虽然DevExtreme刚刚发布了v23.1,但今天我们仍然要继续总结一下之前的主要更新(v22.2)中发布的一些与DevExtreme PivotGrid(透视网格)组件相关的重要特性。 DevExtreme拥有高性能的HTML5 / JavaScript小部件集合&#…

Django + Bootstrap - 【echart】 统计图表进阶使用-统计用户日活日增、月活月增等数据(二)

一. 前言 Bootstrap是一个流行的前端框架,而ECharts是一个流行的可视化库。 Bootstrap可以用来设计网站和应用程序的用户界面,而ECharts可以用来创建交互式和可视化的图表。 chart.js中文文档:http://www.bootcss.com/p/chart.js/docs/ 二. …

手把手教你搭建SpringCloud项目(六)Eureka实现服务发现

一、服务发现简介 各个微服务在启动时,将自己的网络地址等信息注册到服务发现组件上(eureka,zookeeper,Consul),服务发现组件会存储这些信息。服务消费者会从服务发现组件查询服务提供者的网络地址,然后根据该地址调用服务提供者的接口。各个微服务与服务…

centos升级龙蜥

centos升级龙蜥 龙蜥简介龙蜥官方社区centos升级龙蜥首先确认自己的centos版本下载迁移镜像源安装epel源迁移工具安装i686包查看执行迁移脚本结果查看重启机器查看系统信息 龙蜥简介 2021年10月19日的大会上,阿里云发布全新操作系统“龙蜥”并宣布开源。龙蜥操作系…

SAP与顺丰快递接口签名验证加密ABAP程序例子(MD5加密、转换为Base64字符串) <转载>

原文链接:http://www.baidusap.com/abap/7408 1, 顺丰平台数字签名简介 SAP系统和顺丰快递平台中的API接口对接时,需要将传输的JSON字符串进行数字签名加密。数字签名具体使用的是MD5方式,格式如下:msgData(业务报文&a…

DOM编程

DOM编程 DOM树: 获取DOM对象的方式: 通过id直接获取 id禁止使用,因为项目都是css、html、js分离的 2、通过API,doucument.getElementById 3、通过class,doucument.getElementsByClassName 4、通过标签名称&#xff0…

【框架篇】Bean作用域和生命周期

Bean作用域和生命周期 一,Bean作用域 Bean作用域指的是在Spring框架中,定义了Bean实例的创建和销毁方式,以及可以访问该实例的范围,并决定了每次通过容器获取Bean时返回的是同一个实例还是不同的实例。 1.1,Bean作用…

mysql 2 -- 数据库基本操作、数据表的操作、mysql查询操作

一、数据库基本操作 1、数据库的登录及退出 连接数据库: mysql -u用户名 -h主机地址(省略代表本机) -p 密码(格式为123...);注: 刚下载安装的时候需要通过管理员进入 退出数据库,以下三种方式都可以: exit quit …

Spring:表达式语言

Spring EL 概述使用概述 Spring 表达式(Spring EL) 是一种功能强大的表达式语言,以 #{ 表达式 } 作为定界符,用于在运行时对对象进行访问和操作。通过使用 Spring 表达式达到简化开发、减少逻辑或配置的编写的目的。 使用 Spring EL 主要可以引用 bean ,调用其属性和方…

苹果手机备忘录如何导入新手机?手机备忘录怎么转移?

一般来说,大多数手机用户更换手机的频率是3—5年,在一部手机使用了几年之后,就会出现内存不足、系统卡顿、电池续航时间较短等问题,这时候就需要更换新的手机了。有不少苹果手机用户在更换新手机的时候,都很发愁一个问…

Hugging News #0717: 开源大模型榜单更新、音频 Transformers 课程完成发布!

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息&#xff0…