HuggingFace 国内下载 阿里云盘下载速度20MB/s

news2024/9/20 10:42:30

文章目录

    • 效果展示
    • 思路
    • 阿里云盘API工具 aligo
      • 安装aligo
      • aligo教程
      • 实战
    • 保存模型到阿里云盘
      • 海外服务器下载模型
      • 装包
      • aligo的上传代码
    • 国内下载
    • 其他方式

效果展示

Huggingface被屏蔽了,根本下载不了。

阿里云盘下载速度最高可达20MB/s,平均17MB/s左右。【注意:这是会员的速度,阿里云盘的会员可以通过签到白嫖】

其实百度网盘应该也是可以的,但是百度网盘限速啊!
阿里云盘现在每天签到都可以领取一天的会员。感谢🙏阿里巴巴

国内使用阿里云盘下载完成一个26G的模型权重,只花了半个小时
在这里插入图片描述

思路

其实阿里云盘、百度云盘等,肯定都存储过了Huggingface 的模型参数。
我们的解决思路就是在阿里云盘上,存储上对应的模型权重,然后直接使用阿里云盘进行下载。海外服务器通常是linux系统,所以需要使用阿里云盘API。
请添加图片描述

阿里云盘API工具 aligo

点击查看Aligo github
方便在linux服务器上使用,只需要填入一个刷新的token就可以了。

安装aligo

pip install aligo

aligo教程

请读者自行浏览

  • wiki
  • 案例

实战

  1. chrome抓包 获得refresh_token
    在这里插入图片描述
import aligo
from aligo import Aligo
refresh_token = "抓包拿到的refresh_token"
ali = Aligo(refresh_token=refresh_token)

查看你的用户信息,就知道是否登录成功了

print(ali.get_user())

保存模型到阿里云盘

前提:你要有海外的云服务器(colab、亚马逊、甲骨文等),海外服务器先下载模型,使用阿里云盘的API工具(比如:aligo等),把模型权重上传到阿里云盘中。

模型参数上传到阿里云盘会非常快,文件秒传,耗时半分钟左右。因为这些权重文件在阿里云盘中已经有了。

文件秒传:
文件上传时,首先会在本地计算文件的md5和字节数。服务器根据(md5,字节数)区分用户上传的文件是否已经在服务器中。如果用户上传的文件已经在服务器中了,那么用户就不需要重新上传一遍了。这就是我们发现有时候向云盘上传大型文件会特别快的原因。

海外服务器下载模型

装包

大模型(LLM)的下载方式,仅供参考
在jupyter(.ipynb文件),装如下几个包

!pip install transformers \
	fairscale \
	fire \
	sentencepiece \
	accelerate \
	bitsandbytes
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, TextStreamer

model_path = "LinkSoul/Chinese-Llama-2-7b-4bit"

tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False)
if model_path.endswith("4bit"):
    model = AutoModelForCausalLM.from_pretrained(
            model_path,
            load_in_4bit=True,
            torch_dtype=torch.float16,
            device_map='auto'
        )
else:
    model = AutoModelForCausalLM.from_pretrained(model_path).half().cuda()

在这里插入图片描述
在运行上述代码的时候,最好有GPU,不然会报错。

不用GPU的代码如下,这需要你有20G左右的RAM

    model = AutoModelForCausalLM.from_pretrained(
            model_path
        )

如果上述报错解决不了,也没有关系。那么就只纯粹下载模型权重即可:

  • git lfs install
  • git clone xxx.git

aligo的上传代码

remote_folder = ali.get_folder_by_path('xxx/阿里云盘文件保存路径')
ali.upload_folder(
	'/content/Chinese-Llama-2-7b', # 海外服务器云文件
	parent_file_id=remote_folder.file_id
)

国内下载

在linux服务器上,使用阿里云盘的API,下载模型权重


# 阿里云盘上的文件夹路径
file = ali.get_folder_by_path('xxx/models--LinkSoul--Chinese-Llama-2-7b-4bit')
# 阿里云盘上的文件路径
# file = ali.get_folder_by_path('xxx/data.json')

local_folder = '本地文件夹路径'
if file.type == 'file':
    ali.download_file(file=file, local_folder=local_folder)
else:
    ali.download_folder(folder_file_id=file.file_id, local_folder=local_folder)

其他方式

  • 使用Docker和百度网盘的可以查看这个github项目 点击查看

直说吧,我不会Docker,如果你有这方面的教程,欢迎你分享给我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1132906.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

充气膜建筑的形体设计

建筑体量、形象、材料、色彩等都对应同周围环境协调。建筑设计构思要把客观存在的“境”与主管构思的“意”融合起来。一方面要分析环境对建筑可能产生的影响,另一方面要分析设想中的建筑在自然环境中的地位。因地制宜,结合地形的 高低起伏,利…

UG\NX二次开发 在资源栏(左侧面板)中添加按钮

文章作者:里海 来源网站:王牌飞行员_里海_里海NX二次开发3000例,里海BlockUI专栏,C\C++-CSDN博客 感谢粉丝订阅 感谢 apolloryd 订阅本专栏,非常感谢。 简介 UG\NX二次开发 在资源栏(左侧面板)中添加按钮,下面提供了帮助说明,在 UGOPEN 文件夹下有示例。 C++语言在UG二次…

选择合适的项目管理系统来支持专业产品研发团队

专业产品研发团队的公司离不开其严谨的管理和高效的研发流程,为了进一步提升研发效率和管理水平,产研团队需要一个全流程的项目管理系统来支持其研发团队的协同合作。 一、系统需求 IT行业的研发工作涵盖了从立项、项目变更到项目的进程计划等多个环节。…

Windows server部署filebeat到kafka

需求:Windows dhcp日志需要实时传输到elk或者其他告警平台。 1、filebeat下载地址:https://www.elastic.co/cn/downloads/beats/filebeat 2、下载后解压后配置filebeat.yml文件, 3、README.md文件中有运行的操作方法:cmd上进入f…

基于springboot财务管理系统

基于springboot财务管理系统 系统主要包括首页,个人中心,员工管理,部门管理,员工工资管理,工资调整管理,资产类别管理,固定资产管理,经营信息管理,序时账管理&#xff0c…

从0到1配置TensorRT环境

根据博文:TensorFlow2.x模型转onnx、TensorRT给出的环境来配置。 以下是该博文中给出的版本信息 TensorFlow 2.4 CUDA 11.1 CUDNN 8 TensorRT 8.2.1.8 tf2onnx 1.13.0 onnx 1.12.0 下载地址 包下载地址TensorRT 8.2.1.8https://developer.nvidia.com/nvidia-tenso…

代码随想录 Day27 贪心02中 LeetCode T55跳跃游戏

LeetCode T55 跳跃游戏 题目链接:55. 跳跃游戏 - 力扣(LeetCode) 题目思路: 这题我们可以换一个思想,将跳跃问题转换为覆盖问题,我们每遇到一个元素就跳到这个元素可以覆盖到的最大位置,当能覆盖下整个数组的时候,就说明能达到,返回true,否则返回false …

机关事务管理局数字化平台,让数据纵向直报,业务横向打通

机关事务管理局的核心职能是实现对机关事务的管理、保障、服务,是面向政府机关部门的“后勤服务”部门。 主要职能有:推进国有资产管理、公务用车管理、办公用房管理、公共机构节能管理、后勤管理等。党和政府“过紧日子”的要求为机关事务工作提出了更…

1600*C. Remove Adjacent(贪心字符串)

Problem - 1321C - Codeforces 解析&#xff1a; 贪心&#xff0c;从z到a遍历&#xff0c;每次循环减去符合题意的字符。 #include<bits/stdc.h> using namespace std; signed main(){int n;string s;cin>>n>>s;for(char iz;i>a;i--){for(int j0;j<s.…

使用SPSS进行重复测量方差分析-包括数据正态性检验

最近在处理重复测量数据&#xff0c;新学了重复测量方差分析、广义估计方程这两个方法&#xff0c;都是在SPSS中进行的。只有数据服从正态分布才可以用重复测量方差分析&#xff0c;如果不符合可以用广义估计方程或者其它方法&#xff0c;这次先介绍重复测量方差分析 具体的操…

ubuntu 22.04 设置 apt 代理 配置 清华源 add-apt-repository 代理

另一种临时代理 export http_proxyhttp://<proxy>:<port> export https_proxyhttp://<proxy>:<port> sudo -E add-apt-repository ppa:linaro-maintainers/toolchainhttps://askubuntu.com/questions/53146/how-do-i-get-add-apt-repository-to-work-…

SpringBoot集成ES、使用Java API对其进行简单的测试

文章目录 版本信息记录使用Java API配置ES客户端实现集成pom.xml添加相关的Dependency使用javaConfig构建RestHighLevelClient对象 给ES中存储文档数据,当然也可以更新文档数据search API:搜索 address 中包含mill的所有人的年龄分布以及平均年龄search API:按照年龄聚合&#…

如何通过卖虚拟资料月入10万?看这几个卖资料案例

我微信好友里&#xff0c;有近4000个是做创业博主的同行。 你可能会好奇&#xff0c;其中60%的人都通过卖虚拟资料起家&#xff0c;这到底说明了什么呢&#xff1f; 嗯&#xff0c;事实上&#xff0c;这就意味着这些人选择了网络赚钱的首选项目&#xff0c;那就是销售各种资料…

UI 自动化测试框架:PO模式+数据驱动

1. PO 设计模式简介 什么是 PO 模式&#xff1f; PO&#xff08;PageObject&#xff09;设计模式将某个页面的所有元素对象定位和对元素对象的操作封装成一个 Page 类&#xff0c;并以页面为单位来写测试用例&#xff0c;实现页面对象和测试用例的分离。 PO 模式的设计思想与…

【C语言基础】函数的参数是指针

&#x1f4e2;&#xff1a;如果你也对机器人、人工智能感兴趣&#xff0c;看来我们志同道合✨ &#x1f4e2;&#xff1a;不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 &#x1f4e2;&#xff1a;文章若有幸对你有帮助&#xff0c;可点赞 &#x1f44d;…

01、yudao-项目简介、功能列表、技术选型.md

本专栏将从基础开始&#xff0c;循序渐进&#xff0c;以实战为线索&#xff0c;逐步深入SpringSecurity相关知识相关知识&#xff0c;打造完整的SpringSecurity学习步骤&#xff0c;提升工程化编码能力和思维能力&#xff0c;写出高质量代码。希望大家都能够从中有所收获&#…

干货分享|SCI论文投稿过程中能否修改作者信息和单位?(内附模板)

在提交论文过程中&#xff0c;许多新老作者在投稿返修阶段或者文章被接收后想要更改作者或者是更改作者单位。那么SCI论文可以修改作者及单位吗?如果能改&#xff0c;在哪一阶段改&#xff0c;又要如何改&#xff1f;今天小编和大家聊聊不同情况下的处理方式。 发表学术论文的…

<蓝桥杯软件赛>零基础备赛20周--第2周

报名明年4月蓝桥杯软件赛的同学们&#xff0c;如果你是大一零基础&#xff0c;目前懵懂中&#xff0c;不知该怎么办&#xff0c;可以看看本博客系列&#xff1a;备赛20周合集 20周的完整安排请点击&#xff1a;20周计划 每周发1个博客&#xff0c;共20周&#xff08;读者可以按…

TCP三次握手和四次挥手以及TCP的11个状态

一、三个握手示意图 二、四次挥手示意图

HugeGraph Hubble 配置 https 协议的操作步骤

背景 HugeGraph 图数据库的 Server 端支持 https 配置&#xff0c;官方文档中有说明相对比较容易&#xff0c;而 Hubble 部署过程都是 http的。 我们有一个应用要嵌入 hubble 页面&#xff0c;而且部署为 https &#xff0c;那么 Hubble 是否支持配置 https 呢&#xff1f;网…