接踵而至,昆仑万维天工大语言模型发布

news2024/11/24 10:01:36

目录

  • 天工大语言模型
  • 对标GPT3.5
  • 对话能力
  • 多模态应用
  • 同行对比
  • 后言

天工大语言模型

国产ChatGPT再次迎来新成员,4月17日下午,昆仑万维正式发布千亿级大语言模型“天工”,同时宣布即日起启动邀请测试,并注册了chatgpt.cn作为域名。天工大语言模型是国内首个对标ChatGPT的双千亿级大语言模型,通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。

根据官网介绍,“天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域”。

天工较前面国内发布的各个大语言模型区别不大,均侧重于中文应用场景,一方面是训练数据来源方便,另一方面是在国内与同等产品竞争要比去海外与OpenAI竞争更为容易,ChatGPT都被各国或禁用或限制,更不用说我们的产品了。

在这里插入图片描述

本次体验只有获得邀请的用户才可在“天工”官网登录体验。

对标GPT3.5

根据昆仑万维官方表态,天工大模型参数规模达千亿级,其水平已经非常接近OpenAI ChatGPT的智能水平,ChatGPT是基于GPT3.5大模型,所以昆仑万维把这个版本命名为“天工”3.5。

天工能够得出接近GPT3.5的水平是经过了统一标准的测试的。在GPT-3.5、GPT-4的论文中都附了相应的大型测试数据集,目前可能有将近20类,涵盖了大模型多维度的各项能力测试。天工以及其他大模型在发布产品前都会用这些数据做评测,根据这些公开数据的测试,得到了天工可以对标GPT3.5的结论。

对话能力

当前版本下,最高能够支持1万字以上文本对话,实现20轮次以上用户交互。不得不说,其联系上下文多次作答的能力已经非常出众了,20轮交互已经可以实现用户进行对话纠偏的需求,直到用户获取到令人满意的答案。

由于无法实际测试,目前还不清楚天工的联系上下文的真实能力,但单问单答是挺OK的。

下面是天工设计的工资表表格,能够列出一张工资条的常见条目,并可以计算实发工资,但实发工资全部都是不正确的,令人遗憾。

在这里插入图片描述

多喝热水以前是一句标准的关心女朋友的话,但随着大家无限滥用,现在已经成为了一个梗。相信不少程序员兄弟会有感受,不说这句话还好,说了反而可能引发女朋友的怒火。这时,你应该问问天工了,女朋友身体不舒服,给她说“多喝热水”会有什么后果?看看天工的作答,可比咱们这些直男强多了,标准暖男。

在这里插入图片描述

通过上面的对话可以看到,天工文本生成能力是具备了,但是如同360大模型一样,准确度还有所欠缺。另外,虽然昆仑天工AIGC全系列算法与模型覆盖了图像、音乐、文本、编程,但此次发布的是大语言模型,没有图像和音乐生成能力,也未体现编码能力。

多模态应用

在此次大语言模型发布前,昆仑万维曾在2022年12月发布了AIGC全系列算法与模型,覆盖了图像、音乐、文本、编程等多模态的AI内容生成能力,分别命名为天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode。

在这里插入图片描述

天工乐府、天工智码都是基于自研的天工系列模型,天工巧绘的下游基于Stable Diffusion模型。在这次天工3.5大模型正式推出后,昆仑万维CEO方汉表示可以用来替代天工多模态应用的底层模型。

可以预见,昆仑万维将依靠天工大模型为底座,对天工系列应用进行升级和融合,提升全系列生成式AI的能力。GPT-4具备图像生成能力,GPT-5将具备视频生成能力。天工若要实现天工4、天工的目标,整合图像,音频,视频和编程能力,势在必行。

同行对比

在OpenAI ChatGPT点燃人工智能火炬的情况下,国产ChatGPT产品如雨后春笋般不断涌现。天工与同行相比,优势并不明显。

首先是算力,GPT的能力是训练出来的,决定其能力的最核心要素是三个,算法,数据量和算力,能用多大的数据量进行训练,最后还是要看拥有的算力有多大。当前昆仑万维有用200张卡的训练集群,百度文心一言有约1000张卡的训练资源,ChatGPT训练需要用到1万多片英伟达A100 GPU,加上其他应用,对应芯片需求为3万多片GPU。可以看到,天工在核心的算力支持上,与其他大佬还有不小差距。

其次是应用,昆仑万维基于原有的图像、音乐、文本、编程多模态的AI内容生成能力,加上现在天工大语言模型的发布,试图构建一个如同商汤日日新的大模型体系的想法显而易见。以昆仑的体量,明显无法像百度和微软一样支撑C端大量用户,而是与国内其他ChatGPT类产品一样,面向B端。在B端市场,已经发布的阿里和商汤,产品成熟度要领先于昆仑,尤其前者可以通过接入阿里系所有APP来获取用户,从而获得大量用户使用数据进行升级迭代。

后言

虽然天工大模型还有许多不足,还有很长的路要走,但成功发布大模型意味着昆仑拿到了AI盛宴的入场门票。从此,国产大模型又多了一言,作为普通用户,希望竞争越激烈越好,一个有活力有竞争的市场,能够给普通人带来更多机会和受益。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/432288.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

认真复习c语言1

最近好好写总结了(不能在偷懒了):这一次绝对认真,写总结写了三个多小时,学了一个小时左右TAT; 今天来复习一下c语言的多文件操作: 经过我这几天的摸索,我算是明白了: …

Typora (windows/MacOs版) 你未曾见过的Markdown编辑器

简介 Typora的设计理念非常人性化,与传统编辑器相比,更注重用户的视觉效果和阅读体验。它的编辑界面非常简洁,用户可以就近编辑,随时查看效果,避免频繁地转换预览模式,提高了工作效率和灵活性。 此外&…

d2l解码编码器与seq2seq

seq2seq难死了,卡了好久,好不容易有些头绪了。。。 目录 1.编码器与解码器 1.1原理 1.2实现 2.seq2seq 2.1构造编码器 2.2构造解码器 repeat与cat探索 总结nn.rnn\GRU\LSTM输入输出 看一下解码器的输出 2.3损失计算 2.4训练 2.5预测 2.6预…

【C++】多态---上( 概念、条件及性质)

来前言: 我们之前提到过,C是一门面向对象的语言,它有三大特性——封装、继承、多态。 封装和继承我们已经详细学习过了,本章将进入多态的学习。 目录 (一)多态的概念 (二)多态的定…

Vector - CAPL - Panel面板_02

Button 功能:触发指定的操作 说明:Button 是一个控件,使用它可以触发指定的操作。 适用场景: 1、按下启动按钮会使电机启动。 2、启动锁定开关时,所有车门都会自动锁定。 3、启动TestModule测试模块、回放模块等 设…

单机部署MongoDB

文章目录 一、Windows 环境1.1 安装1.2 启动和连接1.3 Compass 图形化客户端 二、Linux 环境2.1 安装2.2 启动和连接 提示:以下是本篇文章正文内容,MongoDB 系列学习将会持续更新 一、Windows 环境 1.1 安装 ①下载安装包,官方下载地址&am…

OldWang带你了解MySQL(七)

文章目录🔥多表查询🔥SQL92标准中的查询🔥非等值连接🔥自连接🔥SQL99标准中的查询🔥SQL99中的自然连接(NATURAL JOIN)🔥SQL99中的内连接(INNER JOIN)🔥外连接查询(OUTER JOIN)&#…

行业那么多,为什么计算机领域这么火?

行业那么多,为什么计算机领域这么火?计算机领域火已经不是一天两天了,从开始的进入互联网时代、到“互联网”、再到大数据、人工智能时代、数字化经济……计算机技术从行业内部的自我发展逐渐渗透到各行各业,甚至成为社会整体经济…

NLP深度网络中self.embedding(x)词嵌入后降维方法

在自然语言处理中的循环神经网络中,经常使用torch定义类,self.embedding(x)中,x是输入,介绍self.embedding(x)返回结果,以及结果的形状,并解释这个形状 在自然语言处理中的循环神经网…

P4158 [SCOI2009]粉刷匠(分组背包问题+前缀和优化)

[TOC](P4158 [SCOI2009]粉刷匠(分组背包问题)) 一、问题 [SCOI2009]粉刷匠 题目描述 windy有 N 条木板需要被粉刷。 每条木板被分为 M 个格子。 每个格子要被刷成红色或蓝色。 windy每次粉刷,只能选择一条木板上一段连续的格子,然后涂上一种颜色。 …

Spring Cloud Gateway: 网关

文章目录 网关Hello world路由: Route谓词: Predicate过滤器: FilterGateway实现限流: RequestRateLimiter过滤器使用Gateway实现服务降级 自定义全局过滤器GateWay中执行流程 网关 API网关就是实现了前端项目和服务端项目之间的统一入口 Nginx实现的是用户和前端项目之间调用…

【Linux】环境变量相关笔记

文章目录 echo $PATHexport和环境变量相关的命令main(int argc,char* argv[],char *env[])三个参数介绍getenv()通过系统调用获取su与su - 的区别:exportsource 和 .优先级 echo $PATH 是用来查环境变量的 export 从下面的图片当中可以看到,的确是将文…

ubuntu 20.04设置开机自启动脚本

1 建立开机启动服务 在 路径下 /lib/systemd/system/rc-local.service 的 rc-local.service 的脚本,内容规定了 rc.local 的启动顺序和行为 这行代码规定了这个service在开机启动时所执行的命令是:/etc/rc.local start。即运行 /etc/rc.local 脚本。不过…

《面试1v1》HashMap

没有人比中国人更懂 HashMap 我是 javapub,一名 Markdown 程序员从👨‍💻,八股文种子选手。 面试官:HashMap 是Java程序员用得最频繁的集合之一,可以给我简单介绍一下它的内部实现机制吗? 候选人: Hash…

C++ -3- 类和对象 (中) | 拷贝构造函数 赋值运算符重载

文章目录 4.拷贝构造函数什么是拷贝构造函数?应用——示例:日期计算器什么情况下需要自己实现拷贝构造函数? 5.赋值运算符重载运算符重载(重要)赋值运算符重载 拷贝构造函数和赋值重载函数 4.拷贝构造函数 什么是拷贝…

Baumer工业相机堡盟工业相机如何联合BGAPI SDK和OpenCV实现Mono12和Mono16格式位深度的图像保存(C++)

Baumer工业相机堡盟工业相机如何联合BGAPI SDK和OpenCV实现Mono12和Mono16位深度的图像保存(C) Baumer工业相机Baumer工业相机保存位深度12/16位图像的技术背景代码案例分享1:引用合适的类文件2:BGAPI SDK在图像回调中联合OpenCV保…

Effective C++条款条款42:了解typename的双重意义(Understand the two meanings of typename)

Effective C条款条款42:了解typename的双重意义(Understand the two meanings of typename) 条款42:了解typename的双重意义1、从属名称和非从属名称2、typename在traits机制中的运用3、牢记 总结 《Effective C》是一本轻薄短小的…

1.17 从0开始学习Unity游戏开发--场景切换

前面的所有文章我们都在一个固定的游戏场景内进行开发,在最开始介绍场景这个概念的时候就已经提及,这个场景可以是一张地图,或者是一个对战房间等等,所以显然这个场景可以有多个,并且可以从一个场景切换到另外一个场景…

Collection接口

文章目录 1. Java集合框架概述2. Collection接口中15个方法的使用3. Iterator(迭代器)接口4. Connection子接口一:List4.1 List的实现类4.2 源码分析4.2.1 ArrayList源码分析4.2.2 LinkedList源码分析4.2.3 Vector源码分析 4.3 List接口中的常用方法 5. Collection子…

死锁---银行家算法例题

1、知识点 1.银行家算法使用的四个必要的数据结构是: 可用资源向量Available,最大需求矩阵Max,分配矩阵Allocation,需求矩阵Need。 2.银行家算法是不是破坏了产生死锁的必要条件来达到避免死锁的目的?若是,请简述破…