Stable Diffusion公司发布首个大语言模型StableLM,已开源公测!

news2024/10/7 18:27:24

c52c88ce73de4f532583a441d3d34f37.png

文 | 智商掉了一地

20号凌晨,Stability AI 发布了一个新的开源语言模型—— StableLM,该公司曾开发了 Stable Diffusion 图像生成工具。这则新闻意味着它不再局限于图像与视频生成领域,将正式加入文本生成 AI 赛道。

StableLM 模型可以生成文本和代码,并将为一系列下游应用提供助力。下面的链接包含了 Stability AI 正在开发的 StableLM 系列语言模型,感兴趣的小伙伴可以在下面 Huggingface 链接中尝试与 70 亿参数的模型聊天体验~

9afdb87e0e3fe7a987c09fcdb39b79d0.png

GitHub 地址:
https://github.com/stability-AI/stableLM/

模型官网:
https://stability.ai/

Huggingface Chat 地址:
https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat


StableLM

Stability AI 已经将 StableLM 发布在 GitHub 上托管,开发人员可以直接使用或经过微调后使用,同时还发布了用于研究的 RLHF-tuned 模型。StableLM 遵循着开源和对所有人开放的宗旨,将权力交还给开发者社区,目前 StableLM 仍处于 Alpha 阶段,只公布了 30 亿和 70 亿参数的模型,下一步将会推出 150 亿到 650 亿参数的更大参数模型。

deaa46d6782896adfa60eb7448722b24.png

据介绍,StableLM 是在一个基于 The Pile 建立的新实验数据集上训练的,但数据集规模比原来大三倍,含有 1.5 万亿个 Token 的内容。

Stability AI 用下面的对话展示了他们的大模型 StableLM 生成文本与代码的能力,对于英文的问答确实比较得心应手,这些问答都是用 70 亿个参数微调模型生成的:

ed219780df3fae097862fb511b7b0e70.png c0698b9443facb6ad3fdebe8121cdc09.png

而在与 StableLM 的对话体验中,小编还发现它可以用中文交流,能够基本理解我的语义(虽然细节还是有问题)。比较可惜的是,比起 ChatGPT 来说,还是有点距离。它懂点中文,但不多,聊着聊着就开始胡言乱语……

1109c0737beb55c375d593b00a885ab1.png 58a99c9b0161c1a537c82b3b43448dcd.png

Stability AI 仍强调了希望每个人都能够参与其设计语言模型,像 StableLM 这样的模型展示了致力于透明、易于访问和支持性的 AI 技术:

  • 透明性:开源模型能促进透明度、建立信任,并帮助研究人员开展可解释性技术工作,从而识别潜在风险并帮助开发保障措施。

  • 易用性:模型易于访问,开放且细粒度的访问机会能使大众研究和学术界能够发展解释性和安全技术,超越了闭源模型的可能性。

  • 支持性:旨在帮助用户提高生产率、释放创造力,并开启新的经济机遇。

最后,Stability AI 对于生成回答所存在的潜在问题提醒如下:

任何预训练的大型语言模型,在没有进一步微调和强化学习的情况下,其回复内容可能良莠不齐,包含有冒犯性的言论和观点。随着规模的扩大、更好的数据、社区反馈和优化,这种情况将有望得到改善

小结

不久之后,Stability AI 会发布完整的技术报告,同时未来也将启动 RLHF 计划,并与多个社区一起努力创建用于 AI Assistant 的开源数据集。随着 StableLM 模型套件的推出,Stability AI 也仍在继续推行让基础 AI 技术对所有人可用的宗旨,虽然曾因涉嫌图像侵权被众多艺术家投诉过,但在去年年底也收获了一笔融资,成为了 AI 内容生成领域的独角兽。

对于 AI 底层工具是否应该开源,一直以来存在着激烈的争论:

  • 有些人认为开源会降低模型的商业价值,使得开发者无法获得应有的回报;

  • 亦有一些人认为开源可以促进技术的发展和普及,并且更能确保其信任和透明度。

StableLM 的开源,向我们展示了 Stability AI 关于“AI by the people, for the people”的诚意。相比一些表现非常好但其黑盒运行令普通用户无从得知细节的模型,StableLM 的开源不仅有助于提升其透明度,也让更多人有机会在其基础上开发和创新

随着 AI 技术的不断发展,有越来越多的人开始希望这些技术能够真正地赋能大众,释放他们的创造力。而开源的 AI 技术恰有助于实现这一目标,因为它使得技术更容易被改进和扩展,同时也使得更多人能够共同参与到技术的开发和推广中。进一步让更多人能够从中受益,创造更多的价值。

e0e2ee7605bda21698f7fa247fe39033.png

卖萌屋作者:智商掉了一地

北理工计算机硕士在读,近期沉迷于跟 ChatGPT 唠嗑,对一切新颖的 NLP 应用充满好奇,正在努力成为兴趣广泛的斜杠青年~

作品推荐

  1. 我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!

  2. AI取代人类,可以自动生成prompt了

  3. ICLR 2023 最高分论文被锤抄袭??

  4. AI讲话总爱“结巴”?这篇NeurIPS论文找到了病因,结巴率已接近人类!

  5. 如何提升大规模Transformer的训练效果?Primer给出答案

  6. Yoshua Bengio:我的一生

1a41c6810bfde51850300e811601af97.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/454936.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企业号运营全攻略,让你的品牌更具竞争力

实体企业抖音矩阵运营主要包含以下五个方面:多平台帐号绑定、短视频制作、短视频发布、私信评论维护以及提供数据分析报表。   一、多平台帐号绑定   多平台帐号绑定是实体企业进行抖音矩阵运营的第一步。通过将企业的各种社交账号与抖音账号进行绑定&#xff0…

CoreMark 测试指南

1、coremark 简介 coremark 是由EEMBC提出的一个评价CPU性能指标的跑分软件。其主要目标是测试处理器核心性能。CoreMark程序使用C语言写成,包含如下四类运算法则:数学矩阵操作(普通矩阵运算)、列举(寻找并排序&#…

[2019.01.25]Android NDK Crash错误定位

Android NDK开发Crash错误定位: D:\Users\Android\Sdk ndk-stack.exe: D:\Users\Android\Sdk\ndk-bundle\prebuilt\windows-x86_64\bin aarch64-linux-android-addr2line.exe: D:\Users\Android\Sdk\ndk-bundle\toolchains\ aarch64-linux-android-4.9\prebuilt\windows-x86_64…

六、Golang的并发

Go语言的并发指的是能让某个函数独立于其他函数运行的能力。当一个函数创建为goroutine时,Go会将其视为一个独立的工作单元。这个单元会被调度到可用的逻辑处理器上执行。 Go语言运行时的调度器是一个复杂的软件,能管理被创建的所有goroutine并为其分配执…

对考研考公的过分执念,正在悄悄束缚你的职场选择!

随着近年来就业形势的严峻,越来越多的同学在找工作时碰壁,尤其是对于大部分应届生,这种现象尤为明显。 每年数百万的大学生进入到社会,却发现能选择的机会并不多。高等教育规模不断扩大的背景下,职场晋升的门槛越来越…

Hudi最流行数据湖框架介绍

目录 1. 第一章Hudi 框架概述1.1 数据湖Data Lake1.1.1 仓库和湖泊1.1.2 什么是数据湖1.1.3 数据湖的优点1.1.4 Data Lake vs Data warehouse1.1.5 数据湖框架1.1.5.1 Delta Lake1.1.5.2 Apache Iceberg1.1.5.3 Apache Hudi 1.1.6 湖仓一体(Data Lakehouse&#xff…

【1】从零开始学习目标检测:YOLO算法详解

从零开始学习目标检测:YOLO算法详解 文章目录 从零开始学习目标检测:YOLO算法详解1. 🌟什么是目标检测?2.🌟传统的目标检测与基于深度学习的目标检测3.🌟目标检测算法的工作流程4.🌟目标检测可以干什么&am…

拿到新的服务器必做的五件事(详细流程,开发必看)

目录 1. 配置免密登录 基本用法 远程登录服务器: 第一次登录时会提示: 配置文件 创建文件 然后在文件中输入: 密钥登录 创建密钥: 2.部署nginx 一、前提条件 二、安装 Nginx 3.配置python虚拟环境 1.安装虚拟环境 …

自习室管理系统的设计与实现(论文+源码)_kaic

摘要 近年来,随着高校规模的逐步扩大,学生对高校自习室座位的需求也在不断增加。然而,一些高校仍然采用人工管理学院自习室座位,这大大降低了管理效率。显然,开发一个成本低、占用资源少、能提高高校自习室座位管理效率…

WindowsHash简介及windows认证

Windows系统使用两种方法对用户的密码进行哈希处理,他们分别是LAN Manager(LM)哈希和NT LAN Manager(NTML)哈希。 现在已经有了更新的NTLMv2以及Kerberos验证体系。 Windows的系统密码hash默认情况下一般由两个部分组成:第一部分是LM-hash,…

Nginx中间件漏洞复现

Nginx 解析漏洞 该漏洞与nginx、php版本无关,属于用户配置不当造成的解析漏洞。 漏洞原理: 该解析漏洞是PHP fastcgi 的漏洞,在PHP的配置文件 php.ini 中有一个关键的选项 cgi.fix_pathinfo 默认值为1,表示开启。同时在 php-fp…

ASO优化之如何回复Google Play评论

应用的平均评分会影响 Google Play 商店优化 和应用的 Google Play 排名。应用的评分越高,我们在搜索结果中的排名就越靠前。因此,当应用处于 4 星评级范围内时,它会被更多 Google Play 商店的访问者看到和发现。我们可以使用应用雷达中的评级…

Linux进程通信:有名管道

有名管道: 无名管道只能用于有亲缘关系的进程间通信。 因此提出有名管道(也叫FIFO文件),以实现无亲缘关系进程间的通信。 不同于无名管道,有名管道FIFO文件的形式存在于文件系统,与一个路径名关联&#xff…

【复杂网络建模】——Python可视化重要节点识别(PageRank算法)

目录 一、复杂网络建模 二、建模的算法 三、使用PageRank算法进行网络重要节点识别 1、PageRank算法 2、基于PageRank算法的ER网络重要节点识别 3、基于PageRank算法的小世界网络重要节点识别 4、基于PageRank算法的无标度网络的重要节点识别 四、ER网络、小世界网络、…

春秋云境:CVE-2022-24663(远程代码执行漏洞exp)

目录 一、题目 二、构造exp执行php 三、蚁剑连接 一、题目 介绍: 远程代码执行漏洞,任何订阅者都可以利用该漏洞发送带有“短代码”参数设置为 PHP Everywhere 的请求,并在站点上执行任意 PHP 代码。P.S. 存在常见用户名低权限用户弱口令 …

华为OD机试真题(Java),开元音统计(100%通过+复盘思路)

一、题目描述 相对开音节构成的结构为辅音元音(aeiou)辅音(r除外)e,常见的单词有bike cake,给定一个字符串,以空格为分隔符。 反转每个单词的字母,若单词中包含如数字等其他非字母时不进行反转,反转后计算其中含有相对…

苹果手机屏幕上的圆点怎么设置?(开启悬浮按钮)

案例:苹果手机屏幕上的圆点怎么设置? 【求助!苹果手机的小圆点怎么调出来?就是悬浮按钮那个。】 如果您是苹果手机的用户,您可能会在手机屏幕上看到一个小圆点,它可以让您方便地进行操作。这个圆点是 Assi…

TortoiseSVN使用-合并深度介绍

文章目录 3.6 合并深度介绍 本人其他相关文章链接 3.6 合并深度介绍 Working copy(工作副本):即你当前的工作目录,一般默认为这个选项;Recursively(递归):即你选择的目录的版本库,包括了其下面的子文件,子文…

叶黄素的17种功效与副作用(5点使用禁忌请小心)

叶黄素(Lutein)及其同分异构体玉米黄质(zeaxanthin)和内消旋玉米黄质(meso-zeaxanthin)是一种聚集在人类视网膜中的黄斑色素。 它们不能在哺乳动物体内合成,必须从饮食中获得,然后分…

智能家居工厂模式整体设计框架控制设备测试

通俗理解的步骤就是链表通用模板定义(在头文件里定义)、链表的创建(头插尾插,在.C 文件里)、链表的初始化(init配置管脚初始电平等)、链表内容的读取(指令工厂TCP服务端读取客户端发…