Hugging Face入门(一)

news2024/10/7 12:27:11

简介

本文主要内容:

  • Hugging Face介绍
  • 环境搭建
  • 敲两个例子

Hugging Face介绍

在这里插入图片描述

Hugging Face 是一家法美合资公司,总部位于纽约市,成立于2016年。它由法国企业家Clément DelangueJulien ChaumondThomas Wolf在纽约市创立,最初是一家专注于开发面向青少年的聊天机器人应用的公司。该公司的初始产品是一个能够从用户互动中学习的对话代理。有趣的是,这个聊天机器人的名字来源于“拥抱脸”表情符号.

随着该公司将聊天机器人背后的模型开源,它转变为一个专注于机器学习的平台。Hugging Face 最著名的是其针对自然语言处理应用构建的transformers库,以及允许用户共享机器学习模型和数据集并展示其工作的平台。这个社区充满活力,致力于通过开源和开放的科学方法推动人工智能的发展。

在2021年3月,Hugging Face 在一轮B轮融资中筹集了4000万美元。此外,该公司还与其他研究团队合作,于2021年4月28日推出了BigScience研究研讨会,发布了一个开放的大型语言模型。在2022年,该研讨会宣布了一个具有1760亿参数的多语言大型语言模型——BLOOM .

此外,Hugging Face 还在2022年收购了Gradio,这是一个用于开发Python机器学习应用程序的开源库。该公司还在2022年5月5日宣布了C轮融资,由Coatue和Sequoia领投,估值达到20亿美元。在2022年8月3日,该公司推出了Private Hub,这是其公共Hugging Face Hub的企业版本,支持SaaS或本地部署。此外,该公司还与亚马逊网络服务(AWS)合作,使Hugging Face 的产品可供AWS客户用作构建自定义应用程序的基石。下一代BLOOM 将在AWS创建的专有机器学习芯片Trainium上运行 .

最近,该公司在2023年8月宣布完成了D轮融资,筹集了2.35亿美元,估值达到45亿美元。此次融资由Salesforce领投,谷歌、亚马逊、NVIDIA、AMD、英特尔、IBM和高通等知名公司也参与其中。

总之,Hugging Face 通过其丰富的资源和社区,为机器学习开发者和研究人员提供了强大的工具,推动了自然语言处理和其他领域的创新。.

环境搭建

本次主要学习一下transformers的试用,所以主要需要安装这几个库:

pip install transformers datasets

还要安装机器学习框架

pip install torch
#或者
pip install tensorflow

然后经过解决一系列问题,你可能发现,装了半天各个软件不兼容,所以如果只是打算入门,推荐使用这个:
Colaboratory

附上一个简单介绍:
Google Colab,或称为Colaboratory,允许您在浏览器中编写和执行Python代码,而无需任何配置。它提供了免费的GPU资源,方便共享和协作。

这个交互式环境允许您创建Colab笔记本,将可执行的代码与丰富的文本、图像、HTML、LaTeX等内容结合在一个文档中。您创建的Colab笔记本将存储在您的Google Drive账户中,您可以轻松地与同事或朋友共享,让他们对您的笔记本进行评论甚至编辑。此外,Colab还支持Jupyter笔记本,方便数据科学家使用流行的Python库进行数据分析和可视化.

以下是一些Colab的特点和用途:

  1. 免费GPU资源:您可以在Colab中免费使用GPU,加速模型训练和数据处理。
  2. 易于共享:您可以将Colab笔记本与他人共享,方便协作和反馈。
  3. 代码历史记录:Colab具有修订历史功能,可以查看笔记本文件的历史更改。
  4. 与Google Drive集成:Colab与Google Drive集成,方便存储和管理笔记本。

总之,Google Colab是一个强大的工具,适用于各种数据科学和机器学习任务。.

开始敲例子

简单介绍

Hugging Face的Transformers库是一个开源的机器学习库,专注于自然语言处理(NLP),它提供了许多预训练模型,用于处理文本、音频、图像和多模态任务。这些模型可以应用于文本分类、信息提取、问答、摘要、翻译和文本生成等任务。Transformers支持多种深度学习框架,包括PyTorch、TensorFlow和JAX¹²。

Transformers库的特点包括:

  • 易于使用:提供了简单的API来下载、使用、训练和共享模型。
  • 灵活性:每个定义架构的Python模块都是完全独立的,可以快速进行研究实验。
  • 多模态能力:除了文本,还可以处理图像和音频任务,甚至是多模态的组合任务。

此外,Hugging Face还提供了一个模型中心,用户可以在那里找到和共享各种模型,以及一个在线演示平台,可以直接在网页上测试大多数模型¹。如果你对NLP领域感兴趣,Hugging Face的Transformers库是一个非常有价值的资源。🤗

第一个例子-情感分析

from transformers import pipeline

# 创建一个情感分析的pipeline
classifier = pipeline('sentiment-analysis')

# 使用pipeline对文本进行情感分析
result = classifier("I've been waiting for a HuggingFace course my whole life.")

# 打印结果
print(result)

第二个例子-文本生成

from transformers import pipeline

generator= pipeline("text-generation",model="distilgpt2")

res=generator(
    'We are very happy to show you the 🤗 Transformers library.',
    max_length=40,
    num_return_sequences=5,
)

print(res)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1573889.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注 在探索人工智能边界时,我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人…

基于SpringBoot的高校自习室预约系统

基于SpringBoot的高校自习室预约系统的设计与实现~ 开发语言:Java数据库:MySQL技术:SpringBootMyBatis工具:IDEA/Ecilpse、Navicat、Maven 系统功能分析 本次的功能设计主要围绕着学生和管理员两个角色,对于学生的用…

AI预测福彩3D第29弹【2024年4月7日预测--第7套算法重新开始计算第2次测试】

今天咱们继续进行进行第7套算法的测试,今天是第2次测试,昨天已经成功命中,其中7码大方案全部命中,四码小方案也命中。再接再厉,继续验证,废话不多说,直接上图上结果~ 2024年4月7日3D的七码预测结…

集合容器面试题

Java 容器都有哪些? Java 容器分为 Collection 和 Map 两大类 Collection 和 Collections 有什么区别? Collection 是一个集合接口,它提供了对集合对象进行基本操作的通用接口方法,所有集合都是它的子类,比如 List、…

电商卖家如何从1688批量采集商品信息并铺货到自己店铺?

目前,各大电商平台严查无货源,不管是已经开店还是准备开店的卖家,想要店铺长久发展,都需要从1688找授权分销的厂家拿货源铺货。 然而很多新手卖家在1688找货源时,不知道如何找到物美价廉的源头厂货,选好货…

SpringBoot实现RabbitMQ的通配符交换机(SpringAMQP 实现Topic交换机)

文章目录 pomyml生产者消费者 Topic类型的Exchange与Direct相比,都是可以根据RoutingKey把消息路由到不同的队列。只不过Topic类型Exchange可以让队列在绑定Routing key 的时候使用通配符! Routingkey 一般都是有一个或多个单词组成,多个单词…

关于Linux下的进程创建与终止(进程篇 - 涉及写时拷贝,fork函数)

目录 创建进程 写时拷贝 fork函数 进程终止 进程终止时,操作系统都做了什么? 进程终止的常见方式有哪些? 如何使用代码终止掉一个进程? 创建进程 写时拷贝 在了解下面的内容之前,我们需要先聊一聊写时拷贝这一…

MySQL-基本SQL语句编写:运算符练习

运算符练习 1.选择工资不在5000到12000的员工的姓名和工资 SELECT last_name,salary FROM employees #where salary not between 5000 and 12000; WHERE salary < 5000 OR salary > 12000;2.选择在20或50号部门工作的员工姓名和部门号 SELECT last_name,department_id…

ChatGPT 之联盟营销

原文&#xff1a;ChatGPT for Affiliate Marketing 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 第二章 制定转化对话 制定转化对话是每个营销人员和企业所有者都应该掌握的关键技能。它涉及创建和传递引人入胜的信息&#xff0c;吸引您的受众并激励他们采取行动。…

【windows】--- nginx 超详细安装并配置教程

目录 一、下载 nginx二、安装三、查看是否安装成功四、配置五、关闭 nginx六 负载均衡七 配置静态资源1. 根目录下的子目录(root)2.完全匹配(alias) 刷新配置&#xff08;不必重启nginx&#xff09;八、后端鉴权 一、下载 nginx 打开 nginx 的官网&#xff1a;nginx.org/ &…

【操作系统】STM32-操作系统——持续更新

【操作系统】STM32-操作系统——持续更新 文章目录 前言一、ucosii二、freertos1.介绍2.移植 总结 前言 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、ucosii UCOSII移植到STM32F103C8T6上之移植记录&#xff08;一&#xff09; UCOSII移植到ST…

GIS 如何帮助减少交通排放

GIS 可通过多种方式帮助减少交通排放。从智能路线和减少拥堵&#xff0c;到鼓励人们骑自行车或步行&#xff0c;以及帮助指导政府交通政策&#xff0c;GIS 正在帮助改善空气质量。 GIS 长期以来一直被用来提高各行业多种类型车辆行驶的效率&#xff0c;并将继续这样做。通过分…

CURL状态码60问题解决

问题说明 就是没法验证ssl证书是否合法 时间长了&#xff0c;系统自带的ca肯定不会有新的ca机构增加 解决方法 CentOS下 yum update ca-certificates 或者手动更新指定位置上的ca文件 手动下载 https://curl.se/docs/caextract.html 临时处理方案(不推荐) curl_setopt(…

网站统计中的数据收集原理及实现

网站数据统计分析工具是网站站长和运营人员经常使用的一种工具&#xff0c;比较常用的有谷歌分析、百度统计和腾讯分析等等。所有这些统计分析工具的第一步都是网站访问数据的收集。目前主流的数据收集方式基本都是基于javascript的。本文将简要分析这种数据收集的原理&#xf…

C++ 静态库与动态库的生成和使用:基于 VS Studio 生成 newmat 矩阵库的静态库与动态库

文章目录 Part.I IntroductionChap.I 预备知识Chap.II 静态库与动态库区分 Part.II 静态库的生成与使用 (newmat)Chap.I 生成静态库Chap.II 使用静态库 Part.III 动态库的生成与使用 (newmat)Chap.I 生成动态库Chap.II 使用动态库 Part.IV 文件内容Chap.I test.cpp (静态库)Cha…

linux常用目录结构(目录命令)--6986字详谈

前面与大家讨论了linux的发展与由来&#xff08;这一块挺多的&#xff0c;小编还没有编写完成&#xff0c;希望大家理解&#xff09;&#xff0c;紧接着谈到了vmware安装及运行所存在的故障&#xff08;鉴定错误&#xff0c;虚拟机没有网&#xff0c;蓝屏等常见现象的总结及处理…

学透Spring Boot — 004. Spring Boot Starter机制和自动配置机制

如果你项目中一直用的是 Spring Boot&#xff0c;那么恭喜你没有经历过用 Spring 手动集成其它框架的痛苦。 都说 Spring Boot 大大简化了 Spring 框架开发 Web 应用的难度&#xff0c;这里我们通过配置 Hibernate 的两种方式来深刻体会这一点&#xff1a; 使用 Spring 框架集…

centos7.2系统部署ZooKeeper集群和Kafka集群(集群应用系统商城前置环境)

本次实验将使用centos7.2系统部署部署ZooKeeper集群因为Kafka依赖于ZooKeeper&#xff0c;所以我们一并进行部署。 实验所示的资源软件已上传至百度网盘&#xff0c;需要自取。 链接&#xff1a;https://pan.baidu.com/s/1a-7_iAIX0DBAMkF9bhiTcA?pwd2333 提取码&#xff1…

C++:stack类和queue类

stack的介绍和使用 1. stack 是一种容器适配器&#xff0c;专门用在具有后进先出操作的上下文环境中&#xff0c;其删除只能从容器的一端进行元素的插入与提取操作。 2. stack 是作为容器适配器被实现的&#xff0c;容器适配器即是对特定类封装作为其底层的容器&#xff0c;并…

壁纸小程序Vu3(预览页面:弹窗)

1.展示跳转后的分类列表图片 classlist.vue <template><view class"classlist"><view class"content"><navigator class"item" v-for"item in 10"><image src"../../common/images/64.png" mode…