2023年6月第4周大模型荟萃

news2024/11/25 12:42:05

2023年6月第4周大模型荟萃

  • 2023.6.30
  • 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。

1、腾讯云首次公布大模型进展

6月19日,腾讯云召开行业大模型及智能应用技术峰会,首次公布腾讯云行业大模型研发进展,联合22家客户正式启动行业大模型共建合作,并携手17家生态伙伴共同发起了“腾讯云行业大模型生态计划”,致力于共同推进大模型在产业领域的创新和落地。据透露,基于腾讯HCC高性能计算集群和大模型能力,腾讯云已经为传媒、文旅、政务、金融等10余个行业提供了超过50个大模型行业解决方案。会上,腾讯公布腾讯云 MaaS 服务解决方案。

腾讯云认为,相比通用大模型,企业更需要针对自身具体行业的大模型,并结合企业自身的数据进行训练和精调,以打造出更实用的智能服务。企业对提供的专业服务要求高,且容错性低,因此使用的大模型必须具备可控、可追溯和可修正的特点,并经过反复充分的测试。

腾讯云MaaS

2、OpenAI 或将推出 AI 模型商店,平台可以实现双向对接

OpenAI 正计划推出一个类似苹果“App Store”的 AI 模型应用商店,平台可以实现双向对接,开发者可以上架他们基于 OpenAI 技术搭建的产品,企业也可以按需使用市面上的 LLM,例如识别金融欺诈,或根据内部文件回答特定市场的问题。很多 ChatGPT 的企业客户通常会根据自己的特定用途定制 AI 模型,定制模型一多,OpenAI 便有了搭建模型商店的想法。OpenAI 还表示,目前基于 ChatGPT 相关的插件使用率不高,搭建一个类似“应用商店”的平台可以有效提高插件的使用率。

3、MosaicML 发布 MPT-30B 大语言模型,训练成本仅 70 万美元

AI 创业公司 MosaicML 近日发布了 MPT-30B 大语言模型,该模型具有 300 亿参数,训练成本为 70 万美元(约 502.44 万元人民币),远低于 GPT-3 等同类产品所需的数千万美元训练成本。由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。

4、美国律师因引用 ChatGPT 虚构案例被罚

当地时间 6 月 22 日,美国纽约联邦法官作出了一项判决,Levidow, Levidow & Oberman 律师事务所引用了 ChatGPT 撰写的一份由虚假案例引证的法庭简报,行为恶劣,对其处以罚款 5000 美元。就目前来看,类似 ChatGPT 之类的生成式 AI 也许可以在一些基础的法律服务方面给用户提供帮助,比如受众需求比较大的劳动案件、房地产案件、买卖纠纷、继承纠纷等,可以提供一些简单的解答。但对于比较复杂的纠纷,可能还是需要律师来服务。

5、Dropbox 推出 AI 搜索工具

云存储服务商 Dropbox 的日本子公司 Dropbox Japan 近日发布了基于 AI 的通用搜索工具 Dropbox Dash 测试版,该工具聚合了多个热门办公平台和应用,能有效提高用户的信息搜索效率。根据官方介绍,Dropbox Dash 与 Google Workspace、微软 Outlook 和 Salesforce 等平台集成,使用户可以在同一个搜索栏中快速找到工作所需信息,无需在应用程序之间来回跳转就能共享内容、加入会议或查找演示文稿。由于 Dropbox Dash 采用了机器学习技术,因此随着用户使用次数增加,其搜索结果也会依据用户偏好持续改进。此外,Dropbox Dash 也提供了堆栈功能,允许用户快速存储、整理和检索网页地址,并像文件夹列表一样对这些地址进行可视化的分级归纳。

6、清华唐杰团队发布开源 WebGLM

清华唐杰团队发布并开源 WebGLM,一个参数 100 亿的联网问答聊天机器人,相关论文入选 KDD2023。你可以问它任何问题,然后它将列举出网上(例如维基百科、相关官网)相关的文章链接,整理出答案。据介绍,在性能对比测试中,WebGLM 的水平已经高于 OpenAI 135 亿参数的 WebGPT,根据评估结果,尽管 WebGLM 的搜索结果略逊于 WebGPT-175B,但远好于Perplexity.ai 和 WebGPT-13B。

WebGLM 的目标是通过 Web 搜索和检索功能,增强预训练大语言模型,同时可以进行高效的实际部署。为此,作者基于三种策略进行开发:大模型增强检索器、自举生成器、基于人类偏好的打分器。大型语言模型增强检索器会将前五个最相关的页面作为参考源,让自举生成器生成多个答案,最终打分器选出最可能符合人类偏好的那一个作为最终输出。

7、东北大学发布以知识图谱构建为核心的大模型 TechGPT

2023 年 6 月 26 日,东北大学知识图谱研究组正式发布大语言模型 TechGPT。与当前其他各类大模型相比,TechGPT 主要强化了以“知识图谱构建”为核心的关系三元组抽取等各类信息抽取任务、以“逻辑推理”为核心的机器阅读理解等各类智能问答任务、以“文本理解”为核心的关键词生成等各类序列生成任务。在这三大自然语言处理核心能力之内,TechGPT 还具备了对计算机科学、材料、机械、冶金、金融和航空航天等十余种垂直专业领域自然语言文本的处理能力。

TechGPT 以 BELLE 作为强大的中文预训练 LLM 基座,并在 TechKG 大规模的中文学术语料支持下训练完成。得益于 BELLE 的前期工作,不仅完成了 70 亿参数(7B)版本的训练,也完成了 130 亿参数(13B)版本的训练。7B 的模型可以在显存和性能受限的设备上运行,而 13B 的模型可以提供更具逻辑和更高精度的回答。目前 7B 版本的 TechGPT 已经在 Hugging Face 和 GitHub 上开源。

8、大模型v1.2版评测榜单

综合能力得分为分类能力、信息抽取能力、阅读理解能力三者得分的平均值。见:https://zhuanlan.zhihu.com/p/634608422

LLM综合能力排行榜

无论是百度还是讯飞的老大,在他们的嘴中,早就脚踩ChatGPT,拳打OpenAI了,但是第三方测评却不这么看。

9、第 2 个“GPT 产业联盟"宣布成立

据证券时报,为实现战略协同、资源协同和能力协同,由中国互联网协会、中国信息通信研究院云大所、360集团联合主办的“GPT产业联盟”成立大会将在 6 月 28 日举办,以期携手推动 AI 技术的创新与发展。

早在今年 4 月 18 日,在北京举行的“2023 全球元宇宙大会”上,由中国移动通信联合会、中国电信、中国移动、中国联通、中国广电等单位共同发起成立了“GPT产业联盟”。

这种现象,跟目前国内大模型乱战环境分不开。大家都在搞大模型,谁也不服谁,大家的水平都差不多,都自称脚踩ChatGPT。

10、清华大学发布 ChatGLM2-6B 第二代大模型

6月25日,清华大学KEG和数据挖掘小组(THUDM)发布了第二代 ChatGLM2-6B 大模型。与第一代大模型想必,主要有四点升级:

  • 性能大幅提升。第二代的ChatGLM2-6B的基座模型使用了GLM模型的混合目标函数,在1.4万亿中英文tokens数据集上训练,并做了模型对齐,使得性能提升很高。
  • 更长的上下文。在第一代ChatGLM-6B上,模型的最高上下文长度是2K。而第二代的ChatGLM2-6B的基座模型使用了FlashAttention技术,升级到32K。
  • 更高效的推理,更快更便宜。ChatGLM2-6B使用了Multi-Query Attention技术,可以在更低地显存资源下以更快的速度进行推理,官方宣称,推理速度相比第一代提升42%。
  • 更加开放的协议。在第一代ChatGLM-6B模型中,有一个比较遗憾的是它的模型开源协议限制较大,完全禁止商用。而第二代的ChatGLM2-6B则宣布对学术研究完全开放,而且允许申请商用授权,不过需要书面申请,并且没有说明是否收费。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/722880.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

自定义MVC的初步实现

文章目录 前言一、 工作流程图二、简单的实现自定义MVCController层——Servlet中央控制器子控制器具体Action类 view层——JSP 三、初步实现自定义MVC简单MVC架构中的问题3.1 配置XML文件3.2 建模3.2 Servlet3.3 jsp 前言 在上一篇博客,我们介绍了MVC的演变过程&a…

华为、华三、锐捷、飞塔、山石的抓包命令

一、华为的抓包命令 1、基本概念 华为的抓包行为称之为镜像端口,也就是说将需要抓取的接口上(称为镜像端口)的流量复制一份到另一个接口上(工程师进行流量观察的端口,称为观察端口),如下图所示…

23年hadoop单机版+hive

文章目录 说明分享环境信息安装jdkhadoop配置core-site.xml mysqlhive安装配置hive-site.xml配置hive-env初始化mysql数据库启动验证hive命令hiveserver2方式 总结 说明 工作需要研究hive功能,线上环境不能动,搭建单机版hadoophive测试环境,使…

pyodbc读取.mdb文件时出现[ODBC Microsoft Access Driver] 网络访问已中断。请关闭数据库.....解决方法

在使用pyodbc读取.mdb文件时出现下面的错误 : ODBC Microsoft Access Driver] 网络访问已中断。若要继续,请关闭数据库,然后再将其打开。 (-1022) (SQLDriverConnect) 网上找了很多方法,最后通过下面的方法解决了,就是安装64位的…

搜索团队的技术小结

搜索业务形态 CSDN作为开发者内容中心,主要通过分发博客和商业产品(下载资源)满足用户碎片化学习需求;产品形态上通过以下3种方式来承接用户需求 1. 站内搜索框 2. 博客相关推荐 3. 下载相…

前端基础知识学习——滑动门(利用背景图像的可层叠性 创造特殊效果)

滑动门&#xff1a;利用背景图像的可层叠性&#xff0c;并允许他们在彼此之上进行滑动&#xff0c;以创造一些特殊的效果。 举例&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"…

Linux快速搭建Java环境

1. 安装JDK运行与调试 搭建Java环境 1. 安装JDK 打开命令行执行 sudo apt install default-jdk 有确定的选项直接y就行 安装拓展: 1 . 有时候vscode会自动弹出消息叫你安装拓展,直接点击全部安装就行了 2 . 未弹出或安装失败解决: 打开拓展搜索,把下面的,全部安装就行 这样就可…

适合小企业的小型CRM软件如何选择

市场上有很多小型CRM软件&#xff0c;但很多企业在选型时不知道如何选择&#xff0c;应该考虑哪些因素&#xff0c;什么样的小型CRM软件好&#xff1f;推荐您选择专为小企业设计的CRM客户管理系统。 1、适合初学者&#xff1a; 适合没有使用过CRM软件的企业或个人&#xff0c…

ApiJson json转sql部分示例

ApiJson json转sql部分示例&#xff08;关于json较多&#xff0c;仅供自己快速回顾&#xff09; 首先提供腾讯的APIJSON文档的网址&#xff0c;内容来自于此&#xff1a;部分示例图片 首先提供腾讯的APIJSON文档的网址&#xff0c;内容来自于此&#xff1a; 链接: APIJSON文档…

Matlab隐藏彩蛋

Matlab中的彩蛋实现与Matlab的版本有着重要关系&#xff0c;像Android一样&#xff0c;不同的版本对应不同的彩蛋。这里以Matlab 2016A为例。 1.最著名的一个&#xff0c;命令行窗口输入“image”&#xff0c;就会出现一张倒置的小孩脸&#xff0c;不知情的使用者很可能会被吓…

Solved: “The unsigned image‘s hash is not allowed (DB)“

Solved: “The unsigned image’s hash is not allowed (DB)” 原因是 Secure Boot 的锅 In Hyper-V Manager, make sure the virtual machine is turned off. Select the virtual machine.Right click and select “Settings”Go to “Security”Uncheck “Enable Secure Boo…

【算法系列】滑动窗口

计算长度为k的连续子数组的最大总和 给定一个整数数组&#xff0c;计算长度为k的连续子数组的最大总和。 输入&#xff1a;arr [] {100,200,300,400} k 2输出&#xff1a;700解释&#xff1a;300 400 700解决思路 暴力解法&#xff1a;从k到n-k1&#xff0c;计算k长度大…

短视频seo矩阵系统+抖音小程序源码开源部署(二)

一、短视频矩阵源码系统开发要则&#xff1a; 1. 需求分析&#xff1a;对短视频平台的需求进行全面分析&#xff0c;确立系统开发目标和方向。 2. 技术选型&#xff1a;选用最适合的技术开发短视频矩阵系统&#xff0c;如前端框架、数据库、服务器等。 3. 系统设计&#xff…

Parseval’s theorem

一、Parseval’s theorem介绍 帕塞瓦尔定理Parseval’s theorem表明了信号的能量在时域和频域相等。 ∫ − ∞ ∞ ∣ f ( t ) ∣ 2 d t 1 2 π ∫ − ∞ ∞ ∣ F ( ω ) ∣ 2 d ω ∫ − ∞ ∞ ∣ F ^ ( f ) ∣ 2 d f \int_{-\infty}^{\infty}|f(t)|^{2} \mathrm{~d} t\frac…

Android Studio实现内容丰富的安卓美食管理发布平台

如需源码可以添加q-------3290510686&#xff0c;也有演示视频演示具体功能&#xff0c;源码不免费&#xff0c;尊重创作&#xff0c;尊重劳动。 项目编号079 1.开发环境 android stuido jdk1.8 eclipse mysql tomcat 2.功能介绍 安卓端&#xff1a; 1.注册登录 2.查看公告 3.查…

web安全php基础_php数据类型

PHP 数据类型 PHP 支持以下几种数据类型: String&#xff08;字符串&#xff09;Integer&#xff08;整型&#xff09;Float&#xff08;浮点型&#xff09;Boolean&#xff08;布尔型&#xff09;Array&#xff08;数组&#xff09;Object&#xff08;对象&#xff09;NULL&…

2023 亚马逊云科技中国峰会:全面加码 AIGC、深耕中国下一个十年

编辑 | 宋慧 出品 | CSDN 云计算 亚马逊云科技每年在中国的顶级会议——2023亚马逊云科技中国峰会如期而至。今年中国峰会回归线下举办&#xff0c;主会场和分论坛几乎全部爆满&#xff0c;技术展区人头攒动&#xff0c;现场技术赛事与开发者大讲堂活动丰富精彩&#xff0c;可…

基于SSM的高校专业信息管理系统的设计与实现

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

【UE】通过滑条放大子画面

在文章&#xff08;【UE4 第一人称射击游戏】33-创建一个小地图&#xff09; 基础上实现通过滑条放大子画面 效果 步骤 在控件蓝图中拖入滑条组件 主要的思想就是当滑条的值变更时去改变摄像机相对位置

图片框架Glide学习总结及插件实现

一.前言 图片加载框架个人选择的是Glide&#xff0c;该框架非常优秀&#xff0c;其知识体系很庞大&#xff0c;个人就对Glide部分知识的学习做一下总结&#xff0c;同时对框架的使用做一下封装&#xff0c;做成插件。 二.知识主干 知识主干如下&#xff0c;每一部分的知识会…