hf-mirror (huggingface 的國內鏡像)

官網: https://hf-mirror.com/
網站域名 hf-mirror.com,用于鏡像 huggingface.co 域名。作為一個公益項目,致力于幫助國內AI開發者快速、穩定的下載模型、數據集。


如何使用HF-Mirror

方法一:網頁下載

在https://hf-mirror.com/搜索,并在模型主頁的Files and Version中下載文件
在這里插入圖片描述
在這里插入圖片描述

方法二:huggingface-cli

huggingface-cli 是 Hugging Face 官方提供的命令行工具,自帶完善的下載功能。

1. 安裝依賴
pip install -U huggingface_hub

注意:huggingface_hub 依賴于 Python>=3.8,此外需要安裝 0.17.0 及以上的版本,推薦0.19.0+。

2. 設置環境變量

Linux

export HF_ENDPOINT=https://hf-mirror.com

Windows Powershell

$env:HF_ENDPOINT = "https://hf-mirror.com"

建議將上面這一行寫入 ~/.bashrc。

3.1 下載模型
huggingface-cli download --resume-download gpt2 --local-dir gpt2
3.2 下載數據集
huggingface-cli download --repo-type dataset --resume-download wikitext --local-dir wikitext

值得注意的是,有個--local-dir-use-symlinks False 參數可選,因為huggingface的工具鏈默認會使用符號鏈接來存儲下載的文件,導致--local-dir指定的目錄中都是一些“鏈接文件”,真實模型則存儲在~/.cache/huggingface下,如果不喜歡這個可以用 --local-dir-use-symlinks False取消這個邏輯。

方法三:使用 hfd (推薦)

hfd 是https://hf-mirror.com/開發的 huggingface 專用下載工具,基于成熟工具 git+aria2,可以做到穩定下載不斷線

1. 下載hfd
wget https://hf-mirror.com/hfd/hfd.sh
chmod a+x hfd.sh
2. 設置環境變量

HF_ENDPOINT 該變量是 HF 相關庫官方支持的一個環境變量,設置后,相關庫會尊重該變量指定的主機名,替換 huggingface.co 域名進行模型、數據集的下載和上傳,從而做到無需修改python的transformers代碼,即可利用上鏡像站來加載模型。具體支持以下庫:

  • huggingface-cli
  • snapshot_download
  • from_pretrained
  • hf_hub_download
  • timm.create_model

Linux

export HF_ENDPOINT=https://hf-mirror.com

Linux 寫入到~/.bashrc中:

echo 'export HF_ENDPOINT="https://hf-mirror.com"' >> ~/.bashrc

Windows Powershell

$env:HF_ENDPOINT = "https://hf-mirror.com"

Windows 寫入到 ~\Documents\WindowsPowerShellMicrosoft.PowerShell_profile.ps1 中:

Add-Content -Path $PROFILE -Value '$env:HF_ENDPOINT = "https://hf-mirror.com"'

Python

import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
3.1 下載模型(例子: gpt2)
./hfd.sh gpt2 --tool aria2c -x 4
3.2 下載數據集 (例子: wikitext )
./hfd.sh wikitext --dataset --tool aria2c -x 4

方法四:使用環境變量(非侵入式)

非侵入式,能解決大部分情況。huggingface 工具鏈會獲取HF_ENDPOINT環境變量來確定下載文件所用的網址,所以可以使用通過設置變量來解決。

HF_ENDPOINT=https://hf-mirror.com python your_script.py

不過有些數據集有內置的下載腳本,那就需要手動改一下腳本內的地址來實現了。


補充:
如何快速下載huggingface模型——全方法總結
stackoverflow:how-to-download-a-model-from-huggingface
在這里插入圖片描述

常見錯誤問答

0, 有些項目需要登錄,如何下載?

部分 Gated Repo 需登錄申請許可。為保障賬號安全,本站不支持登錄,需先前往 Hugging Face 官網登錄、申請許可,在官網這里獲取 Access Token 后回鏡像站用命令行下載。

部分工具下載 Gated Repo 的方法:

huggingface-cli: 添加–token參數
huggingface-cli download --token hf_*** --resume-download meta-llama/Llama-2-7b-hf --local-dir Llama-2-7b-hf
hfd: 添加–hf_username–hf_token參數
hfd meta-llama/Llama-2-7b --hf_username YOUR_HF_USERNAME --hf_token hf_***

其余如from_pretrainedwgetcurl如何設置認證 token,詳見上面第一段提到的教程。

1, huggingface-cli: error: invalid choice: ‘download’

版本問題。huggingface-hub>=0.17.0 && Python>=3.8。

huggingface-cli 需安裝 0.17.0 及以上的版本才支持download子命令,但如果你pip顯示的可安裝的最新版本都低于0.17.0,可能是你的Python版本沒有達到huggingface_hub要求的3.8+的要求。

2, Error downloading … https://cdn-lfs.huggingface.co/xxx…

報錯中有出現http://huggingface.co這個域名的,多半是因為沒有正確設置鏡像斷點環境變量,導致走的仍然是hf官方服務器出現的網絡錯誤。請正確設置 HF_ENDPOINT

3, 429 Client Error: Too Many Requests

網站訪問量過大,達到速率上限,過五分鐘會重置限制。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/43050.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/43050.shtml
英文地址,請注明出處:http://en.pswp.cn/web/43050.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

邊框插畫:成都亞恒豐創教育科技有限公司

邊框插畫:藝術與生活的精致邊界 在視覺藝術的廣闊天地里,邊框插畫以其獨特的魅力和細膩的表達方式,成為連接藝術與生活的一道精致邊界。成都亞恒豐創教育科技有限公司它不僅僅是圖像的外框裝飾,更是情感、故事與創意的延伸&#…

看到指針就頭疼?這篇文章讓你對指針有更全面的了解!

文章目錄 1.什么是指針2.指針和指針類型2.1 指針-整數2.2 指針的解引用 3.野指針3.1為什么會有野指針3.2 如何規避野指針 4.指針運算4.1 指針-整數4.2 指針減指針4.3 指針的關系運算 5.指針與數組6.二級指針7.指針數組 1.什么是指針 指針的兩個要點 1.指針是內存中的一個最小單…

【Python】ModuleNotFoundError: No module named ‘distutils.util‘ bug fix

【Python】ModuleNotFoundError: No module named distutils.util bug fix 1. error like this2. how to fix why this error occured , because i remove the origin version python of ubuntu of 20.04. then the system trapped in tty1 , you must make sure the laptop li…

MVC 返回集合方法,以及分頁

返回一個數據集方法 返回多個數據集方法 》》定義一個Model public class IndexMoel {public List<UserGroup> UserGroup{get;set;}public List<User> User{get;set;}}》》》控制器 //db 是 EF 中的上下文 var listnew IndexModel(); list.UserGroupdb.UserGro…

微信小程序中wx.navigateBack()頁面棧返回上一頁時執行上一頁的方法或修改上一頁的data屬性值

let pages getCurrentPages();let prevPage pages[pages.length - 2]; // 獲取上一個頁面實例對象console.log(prevPage) //打印信息// 在 wx.navigateBack 的 success 回調中執行需要的方法wx.navigateBack({delta: 1, // 返回上一頁success: function() {//修改上一頁的屬性…

秒懂設計模式--學習筆記(8)【結構型-組合模式】

目錄 7、組合模式7.1 組合模式&#xff08;Composite&#xff09;7.2 叉樹結構7.3 文件系統7.4 目錄樹展示7.5 自相似性的涌現7.6 組合模式的各角色定義7.7 組合 7、組合模式 7.1 組合模式&#xff08;Composite&#xff09; 是針對由多個節點對象&#xff08;部分&#xff0…

關于string的‘\0‘與string,vector構造特點,反迭代器與迭代器類等的討論

目錄 問題一&#xff1a;關于string的\0問題討論 問題二&#xff1a;C標準庫中的string內存是分配在堆上面嗎&#xff1f; 問題三&#xff1a;string與vector的capacity大小設計的特點 問題四&#xff1a;string的流提取問題 問題五&#xff1a;迭代器失效 問題六&#xf…

個人開發實現AI套殼網站快速搭建(Vue+elementUI+SpringBoot)

目錄 一、效果展示 二、項目概述 三、手把手快速搭建實現本項目 3.1 前端實現 3.2 后端方向 五、后續開發計劃 一、效果展示 默認展示 一般對話展示&#xff1a; 代碼對話展示&#xff1a; 二、項目概述 本項目是一個基于Web的智能對話服務平臺&#xff0c;通過后端與第…

【C語言】指針(4):深入理解指針

目錄 ?編輯 一、回調函數 二、qsort使用舉例 2.1 使用qsort排序整型數據 2.2 使用qsort排序結構體數據 三、qsort的模擬實現 四、NULL、\0、0、0、null、NUL的區別 五、C99中的變長數組 一、回調函數 函數指針是將函數的地址取出來&#xff0c;再通過函數地址去調用&a…

untiy 在菜單欄添加自定義按鈕 點擊按鈕彈出一個Unity窗口,并在窗口里添加屬性

using System.Collections.Generic; using UnityEditor; using UnityEngine; using UnityEngine.Rendering.PostProcessing;public class AutoGenerateWindow : EditorWindow //這是定義一個窗口 {public string subjecttName "科目名字";//科目的名字public GameOb…

springboot 與 ipv6

ipv6 是個必然趨勢&#xff0c;尤其最近國家在這方面有新的推動。 運營商的項目逐漸有這方面的要求了。 所以&#xff0c;在ipv6環境&#xff0c;http或者https接口&#xff0c;還有數據庫地址&#xff0c;ipv4下是ip:port&#xff0c; 但到了ipv6&#xff0c;ipv6 的 ip就包含…

PIOMAS二進制文件轉nc文件

文章目錄 1. 按年輸出數據2. 按月輸出數據將PIOMAS標量的二進制數據格式轉化成nc格式。 1. 按年輸出數據 # 按年輸出數據 import numpy as np import pandas as pd import struct import xarray as xr import matplotlib.pyplot as plt # from cartoplot import cartoplotgri…

另一種加快大表查詢的方法:將表分區

在 MySQL 中&#xff0c;對表進行分區是一種將大表分成更小、更易于管理和查詢片段的方式。分區能夠顯著提升查詢和維護的性能&#xff0c;特別是對大數據量的表。以下是 MySQL 表分區的基礎知識和具體操作步驟。 分區類型 MySQL 支持如下主要分區類型&#xff1a; RANGE 分…

url鏈接地址,#前的參數 和 #后的參數有什么區別

例如 http://localhost:8080/?beforeParams1#/workSchemelist/index?afterParams1 beforeParams 和 afterParams 區別 打印出來可以發現&#xff1a; beforeParams 是 url 的search參數&#xff0c;通過window.location.search獲取 afterParams 是 route 的query參數&#…

行列視(RCV)是否支持自定義字段、計算公式和數據分析功能,以滿足用戶的不同需求?

行列視&#xff08;RCV&#xff09;確實支持自定義字段、計算公式和數據分析功能&#xff0c;以滿足用戶的不同需求。具體表現如下&#xff1a; 1. 自定義字段&#xff1a;RCV提供自助式數據應用&#xff0c;允許用戶根據自己的需求&#xff0c;選擇所需的字段來構建符合自己業…

外貿網站設計的要點

外貿網站設計是一種專門針對國際貿易領域的網站設計&#xff0c;需要考慮到不同國家和文化背景的用戶&#xff0c;因此設計過程要更加細致和精準。以下是外貿網站設計的關鍵要點&#xff1a; 首先&#xff0c;多語言支持是不可或缺的&#xff0c;因為外貿網站的用戶可能來自不同…

[Python自動化辦公]--從網頁登錄網易郵箱進行郵件搜索并下載郵件附件

[Python自動化辦公]–從網頁登錄網易郵箱進行郵件搜索并下載郵件附件 使用說明 ? 本文使用Python的selenium庫進行操作郵箱登錄、固定名稱搜索郵件并下載附件&#xff0c;Python版本&#xff1a;3.9.16, selenium版本&#xff1a;4.19.0&#xff0c;EdgeBrowser版本:126.0.2…

LVS集群及其它的NAT模式

1.lvs集群作用&#xff1a;是linux的內核層面實現負載均衡的軟件&#xff1b;將多個后端服務器組成一個高可用、高性能的服務器的集群&#xff0c;通過負載均衡的算法將客戶端的請求分發到后端的服務器上&#xff0c;通過這種方式實現高可用和負載均衡。 2.集群和分布式&#…

用戶增長 - 私域 - 社群運營自檢清單SOP(社群運營30問)

Check List: 1.你的目標用戶是誰&#xff1f; 2.你的目標用戶有哪些需要立馬解決的需求&#xff1f;有哪些長期需求&#xff1f;這些需求的優先級是什么&#xff1f; 3.做社群的目的是什么&#xff1f; 4.你的用戶和業務是否適合做社群&#xff1f; 5.你做哪類社群才能更好的幫…

確定適合您需求的負載組

大多數關鍵任務行業都使用 UPS 和發電機等備用電源在停電期間為其設施提供持續電力。負載組允許您在需要時測試電源&#xff0c;以確保在您最需要的時候提供可靠的電力。 選擇正確的負載組對于準確的電源測試至關重要。為了幫助您找到最適合您設施需求的負載組&#xff0c;EAK…