Hugging News #0526: Hugging Cast 发布第一期、邀请来认领自己的论文啦!

news2024/10/6 12:22:28

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!

重磅更新

Hugging Cast 播客 #1 发布

6ba45d0dc5a6d01ba22c9f277b1aa091.png

Hugging Cast 是由 Hugging Face 团队成员录制的、介绍最新人工智能新闻、应用以及开源动态的播客节目,第一期的 Hugging Cast 已经发布,我们聊了 Hugging Chat 以及 AI 的实践相关的话题。

来 B 站看看吧:https://www.bilibili.com/video/BV1jM411G74u/

今晚 11 点 Hugging Cast 播客 #2 线上直播,欢迎来这里报名参加:https://streamyard.com/watch/GJkVxAWR76k2

💫StarCoder: 开源的 SOTA 代码大模型

0e7e2e1ccec19bc79895b9c7c11fb385.jpeg

StarCoder 是针对代码的大语言模型 (代码 LLM),模型使用了 GitHub 上被许可的数据训练而得,包含 80 多种编程语言、Git commits、Issues 等。与 LLaMA 类似,我们基于 1 万亿个词元训练了一个约 15B 参数的模型。此外,我们还针对一个 35B 词元的 Python 数据集对 StarCoderBase 模型进行了微调,从而获得了一个我们称之为 StarCoder 的新模型。

详情请回顾文章: StarCoder: 最先进的代码大模型

每日论文精选页面上线

d7de5d774990bbdab6da4e403346723c.jpeg

AK (@_akhaliq) 是一个在 Twitter 上拥有 19 万粉丝的、专注于发布各种 AI 研究论文的账号,在大约发布了 1.7 万条论文推荐信息之后,接下来 AK 将在 Hugging Face 上开启后续的更新,欢迎访问:https://hf.co/papers

我们发现,AK 的论文推荐里有很多是由国内研究员 / 开发者撰写和发布的。我们欢迎你来 Hugging Face 上认领你的论文,如果你有任何需要帮助的地方,请在公众号回复关键字「论文」加入我们的讨论群获得帮助。

开源更新

使用 Token Merging (ToMe) 提高 Stable Diffusion 的推理速度

6799396055b3c9fb06aa5144a7b2607a.jpeg

Token Merging 可以通过在 Transformer 网络的前向传递中逐步合并冗余的 token/patch 来加速推理,通过在A100 和 V100 GPU 设备上对使用 tomesd 和不使用的 StableDiffusionPipeline 进行了基准测试,发现使用 tomesd 可以显著提高推理速度,尤其是对于较大的图像分辨率。以及,使用 tomesd 不会明显降低图像生成的质量。

查看文档了解更多信息:https://hf.co/docs/diffusers/main/en/optimization/tome

Datasets 库 2.12 版正式发布

c4875ed44db2d3d3b64698bafc58bd13.png

🤗 Datasets 是一个数据集调用库,你可以轻松调用 Hub 上的以及多种公共数据集,并进行高效的数据预处理。Datasets 库的 2.12 正式版已经正式发布,包括 Spark DataFrame 的支持、流式数据的支持、数据集分片等新功能,也包含了一些 bug 修改和文档改进等。

此外,我们欢迎并感谢五位新的贡献者对这个版本的贡献 (@QizhiPei、@bbbxyz、@csris、@eli-osherovich、@maddiedawson)

Accelerate 库迎来了 2 千万次下载!

60dc29dd19448b41b4e31c1e51e976fe.png

本月初,🤗 Accelerate 迎来了第 2 千万次下载,这见证了社区对这个库的喜爱和信任,快来试试看吧!https://hf.co/docs/accelerate/

产品更新

宣布与 Spawning.ai 的合作

f93ea0eb428c47cd113d396d7ef7ac46.png

在构建商业模型时,使用授权的训练数据至关重要,Spawning.ai 提供了一个 API 来确保你的机器学习项目是建立在被同意的数据之上的。部分符合条件的、在 Hugging Face 上开源托管的数据集也将由 Spawning.ai 提供的 API 来显示数据源的报告。

新的 Space 模版: 构建 Shiny 应用

562047b920cd4117d5581b746ee96e06.jpeg

Shiny 是一个高效且开发者友好的 GUI 框架,你可以根据需求选择使用 R 或 Python 模板。Posit 与 Hugging Face 合作,提供了 R 和 Python Shiny 包的 Space 应用模板,用户可以轻松地将 Shiny 应用程序部署到 Hugging Face 上,并方便地将 Hub 上的模型集成到自己的应用中。


以上就是本期的 Hugging News,祝大家拥有一个愉快的周末!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/575210.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

es7.x Es常用核心知识快捷版1(分词和text和keyword)

一 分词 1.1 分词 1.1.1 查看分词 standard标准分析器是将每个字都分出来; 而ik_max_word是最细粒度的分词,将所有可能的词都分出来; ik_smart 是最粗粒度的分词; ik_smart 优点:特征是粗略快速的将文字进行分词,占用空间小…

程序员,你被打标签了没?

点击文末“阅读原文”即可参与节目互动 剪辑、音频 / 朱峰 运营 / SandLiu 卷圈 监制 / 姝琦 封面 / 姝琦midjourney 产品统筹 / bobo 赚钱多、回家少、死的早,似乎成了现在对程序员的刻板印象。 本期节目,我们将跳出传统的科技讨论圈&#xff0c…

这个 选择排序详解过程 我能吹一辈子!!!

文章目录 选择排序概念选择排序算法思路选择排序代码实现选择排序优化 选择排序概念 选择排序:即每次选择第一个数为最小或者最大与之后的元素进行比较,循环都能找到一个最大或者最小放到序列的两端。 选择排序算法思路 选择排序是一种简单直观的排序…

chatgpt赋能python:Python操作表格的全面指南

Python操作表格的全面指南 表格是一种非常实用的数据展示方式,程序员在处理数据以及展示数据时也经常使用表格。Python提供了多个强大的库操作表格,本文将为你介绍一些常见的Python操作表格的方式——包括读取、写入、处理和操作。 读取表格 Python提…

文献阅读-A Survey on Transfer Learning 和 A Survey on Deep Transfer Learning

论文: A Survey on Transfer Learning 期刊会议:IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING 时间:2010 级别:CCF A 论文: A Survey on Deep Transfer Learning 期刊会议:International Confere…

LRU 该用什么数据结构

LRU(最近最少使用),是一种缓存置换算法。缓存是用来存储常用的数据,加速常用数据访问的数据结构。有软件实现,比如数据库的缓存;也有硬件实现,比如我们上一讲学的 TLB。缓存设计中有一个重要的环…

chatgpt赋能Python-python_怎么赋值

介绍 Python是一种高级编程语言,它的强大之处在于它的简洁性和易读性。由于其简单易学,灵活性和可移植性,Python在Web开发、自动化测试和数据分析等领域得到了广泛的应用。在Python中,赋值是一项基本的操作,这篇文章将…

【第八期】Apache DolphinScheduler 每周 FAQ 集锦

点击蓝字 关注我们 摘要 为了让 Apache DolphinScheduler 的广大用户和爱好者对于此项目的疑问得到及时快速的解答,社区特发起此次【每周 FAQ】栏目,希望可以解决大家的实际问题。 关于本栏目的要点: 本栏目每周将通过腾讯文档(每…

初识Monorepo

引言 在如今快节奏的前端开发中,管理多个项目和组件的复杂性成为了开发团队的挑战,Monorepo(单一代码仓库)作为一种新兴的解决方案,正在成为开发团队的新宠。 Monorepo简介 是什么 Monorepo 是一种软件开发的策略模式…

21 VueComponent 事件的处理

前言 这是最近的碰到的那个 和响应式相关的问题 特定的操作之后响应式对象不“响应“了 引起的一系列的文章 主要记录的是 vue 的相关实现机制 呵呵 理解本文需要 vue 的使用基础, js 的使用基础 测试用例 测试用例如下, 一个简单的 按钮事件的触发 问题的调试 调用…

理解 Linux 文件权限

章节目录: 一、Linux 的安全性1.1 /etc/passwd 文件1.2 /etc/shadow 文件1.3 添加新用户1.4 删除用户1.5 修改用户 二、使用 Linux 组2.1 /etc/group 文件2.2 创建新组2.3 修改组 三、理解文件权限3.1 使用文件权限符号3.2 默认文件权限 四、更改安全设置4.1 修改权…

chatgpt赋能python:Python如何捕捉窗口?——一位有10年Python编程经验的工程师谈Windows操作系统编程

Python 如何捕捉窗口?——一位有10年Python编程经验的工程师谈Windows操作系统编程 自从计算机出现以来,人们就开始与操作系统打交道。而对于Windows系统而言,捕捉窗口通常需要在应用程序级别完成。但是,使用Python与Windows编程…

新手须知的pr入门知识,小红书媒介话术分享

我们都知道,这是一个内容为王的时代。在众多的平台上,都存着无数优秀的内容产出者,也就是达人。今天对新手须知的pr入门知识,小红书媒介话术分享。 一、什么是pr PR即Public Relations的简称,翻译过来就是公关的意思 。…

惠普HP4294A(110M) 安捷伦agilent 4294a精密阻抗分析仪

HP/Agilent 4294A 精密阻抗分析仪是一种集成解决方案,可对元件和电路进行有效的阻抗测量和分析。HP/Agilent 4294A 覆盖更宽的测试频率范围(40 Hz 至 110 MHz),基本阻抗精度为 /-0.08%。出色的高 Q/低 D 精度可实现低损耗组件的分…

恭喜,拿到华为OD offer了,并分享刷题经验

目录 一、先介绍一下华为OD是个什么鬼?1、华为OD背景2、华为OD现状3、华为OD趋势4、华为OD介绍(1)人力外包(2)员工关系(3)工作关系(4)薪酬福利(5)…

Window MinGW 编译 OpenCV 人快疯了看这里!

目录 一、使用官方编译好的 二、使用MinGW编译器自行进行编译 三、编译好的OpenCV库 OpenCV3.4.5 OpenCV 4.5.4 一、使用官方编译好的 【Qt】opencv源码&官方编译好的opencv在windows下使用的区别_外来务工人员徐某的博客-CSDN博客 官方替我们编译好了,可以直…

一篇文章带你了解Netty

Netty 传统的IO模型的web容器,比如老版本的Tomcat,为了增加系统的吞吐量,需要不断增加系统核心线程数量,或者通过水平扩展服务器数量,来增加系统处理请求的能力。有了NIO之后,一个线程即可处理多个连接事件…

DNSPod十问崔久强:证书有效期缩短,CA机构要凉透?

本期嘉宾 崔久强 上海CA中心总经理 崔久强,上海市数字证书认证中心有限公司总经理、上海市静安区政协委员、第一届上海市智慧城市建设领军先锋、一带一路信息产业发展联盟数字签名专委会主任委员、中国电子认证产业联盟专委会委员、中国密码学会电子认证专委会理事…

【P35】JMeter 包含控制器(Include Controller)

文章目录 一、包含控制器(Include Controller)参数说明二、准备工作三、测试计划设计3.1、保存测试片段3.2、使用测试片段 一、包含控制器(Include Controller)参数说明 可以将测试计划的某一部分提取为公用逻辑,这样…

Goby 漏洞更新 |中保無限Modem Configuration Interface 默认口令漏洞

漏洞名称:中保無限Modem Configuration Interface 默认口令漏洞 English Name:Gemtek Modem Configuration Interface Default password vulnerability CVSS core: 5.0 影响资产数:4521 漏洞描述: Modem Configuration Inter…