(滿滿的坑LLAMA3使用申請被拒絕rejected)利用huggingface導入LLAMA3模型

文章目錄

      • 前言
      • 后續

前言

大家都知道,使用huggingface導入大模型是使用如下辦法

from transformers import AutoModelForCausalLM, AutoTokenizermodel_name = "Qwen/Qwen2.5-7B-Instruct"#要導入的大模型名稱。model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

我們將上述model_name換成gpt2-xl也可以導入成功,但是換成meta-llama/Llama-3.1-8B-Instruct就會失敗。因為llama系列的模型矯情,使用需要申請。

在huggingface官網上https://huggingface.co/注冊一個賬號。這里會碰到第一個問題,那就是這個破網站在國內進去不。我自己是買了梯子的,你要是嫌貴不舍得,那沒辦法了,我自己覺得還行,基本上所有網站都可以訪問了。沒有梯子的話,github都要看運氣能不能訪問。

在網站上填寫好了注冊信息并且提交之后,記得查看郵件,需要在郵件里確認才算真正的注冊成功。

注冊好了之后,點擊那個models。

在這里插入圖片描述

在搜索框輸入llama

在這里插入圖片描述
發現會返回特別特別多的結果,我們找到我們想要的,常用的有那個第一個meta-llama/Llama-3.1-8B-Instruct還有下面的meta-llama/Meta-Llama-3-8B-Instruct。我們隨便選擇一個,我這里選擇第一個meta-llama/Llama-3.1-8B-Instruct,點擊進去,進入下面界面。
在這里插入圖片描述
上面界面大概是說,LLAMA系列的模型的使用是受限的,需要申請后使用,申請之后會給你一個類似密碼的東西。以后在python代碼里導入LLAMA模型的時候,密碼也要作為一個函數參數,才能導入模型成功。

在上面這個界面點擊那個藍色的字,滑到底部,可以看到一個申請表格,我們進行申請。

在這里插入圖片描述
填寫好信息之后點擊提交,似乎信息不一定要完全真實。

提交之后,我們可以在網站右上角用戶那里查看申請狀態,
在這里插入圖片描述
如下,我們發現還在等待狀態。
在這里插入圖片描述

我沒過多久就被拒絕了,

在這里插入圖片描述
回到那個meta-llama/Llama-3.1-8B-Instruct界面,也發現那個紅色的字,

在這里插入圖片描述
也就是說我的申請被拒絕了。

Your request to access this repo has been rejected by the repo’s authors.

這到底他媽的是怎么回事呢?我在網站https://huggingface.co/meta-llama/Llama-Guard-3-8B/discussions/13里面查看到,似乎中國和俄羅斯是被區別對待的,所以我們國家不要填寫中國。對于LLAMA系列模型的使用申請,很多人都失敗了,網上有一堆人吐槽的,比如https://huggingface.co/meta-llama/Meta-Llama-3-8B/discussions/124。

后面我又注冊了兩個賬號,還是失敗了。

第一次賬號填的是中國,名字是中國名字的拼音,所屬機構是亂寫的公司。

第二次賬號填的是加拿大,名字是外國名字,所屬機構是多倫多大學。

第三次賬號填的是香港,名字是中國名字的拼音(亂寫的中國名字,但是和賬號一致),所屬機構是香港大學。這次寫香港是因為我的那個梯子好像用的是香港的IP。


后續

已經轉向使用qwen模型了,咱國產的,不需要申請,也沒有國家地域歧視!不再使用llama!看了一下qwen下載量,比llama高多了,而且聽說性能也很好,越來越成為各家大模型對比時的基線模型。

在這里插入圖片描述
上個月下載量1500萬,而下面的llama下載量500萬,被爆殺了。

在這里插入圖片描述
家人們,大家都用qwen,勢必讓固步自封的llama付出代價。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/913996.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/913996.shtml
英文地址,請注明出處:http://en.pswp.cn/news/913996.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

大規模集群下 Prometheus 監控架構實戰經驗分享

大規模集群下 Prometheus 監控架構實戰經驗分享 1 業務場景描述 在互聯網金融業務發展過程中,我們需要對數千臺主機、上萬容器與微服務實例進行指標監控,并統計歷史數據以支持 SLA 報表、告警與容量規劃。傳統監控系統面臨以下挑戰: 實例動態…

主流消息隊列技術總結和對比

消息隊列(Message Queue,簡稱 MQ)作為構建分布式互聯網應用的關鍵組件,松耦合的架構設計能顯著提升系統的可用性與可擴展性。在分布式系統中扮演著至關重要的角色,主要承擔著實現異步消息傳遞、應用解耦、流量削峰以及…

數據結構 順序表(3)---順序表的應用

在之間的兩篇文章中,我們著重講了順序表及順序表的實現。今天這篇文章我們將簡單講解關于順序表的三個算法題。這三個題也都屬于力扣上的經典例題。1.例題1:移除元素例題來源(力扣) : https://leetcode.cn/problems/remove-element/description/這是一道數組操作算法…

逆向入門(9)匯編篇-bound指令的學習

看程序的時候碰到這么一行沒見過的代碼,簡單記錄一下 00427AC8 |. 6215 3C7B4200 |bound edx,qword ptr ds:[0x427B3C]這里是用到了bound指令,這是 x86 匯編中的指令,用于檢查數組索引是否在有效范圍內。 指令解析 bound edx, qword ptr ds…

【web應用】若依框架中,使用Echarts導出報表為PDF文件

文章目錄前言一、Echarts準備工作1、查看是否安裝了Echarts2、Echarts導入script 中3、使用Echarts創建圖表二、報表制作打印html2canvas和jsPDF準備工作1、安裝html2canvas和jsPDF依賴包2、html2canvas和jsPDF引用到script中3、制作并打印報表三、導出結果前言 若依框架前端中…

優選算法 --(雙指針算法 1~8)

引言:此專欄為記錄算法學習,本專題作為算法學習的第一部分,優選算法專題共計100題,分為不同小模塊進行,算法學習需堅持積累,時代不會辜負長期主義者,僅以此句,與君共勉。 講解算法分…

XRDMatch代碼復現與分析報告

XRDMatch代碼復現與分析報告 1. 項目概述 XRDMatch是一個用于X射線衍射(XRD)數據匹配和分析的開源工具,由zhengwan-chem開發并托管在GitHub上。本項目旨在復現XRDMatch的核心功能,并對其實現進行詳細分析。 X射線衍射是材料科學中用于確定晶體結構的重要技術,通過分析衍射…

SpringAI×Ollama:Java生態無縫集成本地大模型實踐指南

摘要 隨著大語言模型(LLM)的普及,數據隱私和技術棧統一性成為企業級AI應用的核心挑戰。本文系統闡述如何通過SpringAI框架與Ollama本地化模型引擎的結合,構建安全高效的生成式AI應用。通過實戰案例解析配置優化、流式響應、工具調用等關鍵技術,為Java開發者提供零Python依…

從采購申請到報廢核銷:如何用數字化縫合企業物資管理的“斷點”?

在企業的日常運營中,物資管理是一項至關重要的工作。從采購申請到物資的入庫、使用,再到最終的報廢核銷,這一系列流程就像一條長長的鏈條,環環相扣。然而,在傳統管理模式下,這條鏈條上卻存在著諸多“斷點”…

AVL平衡二叉樹

01. 初始AVL樹 AVL樹是最早發明的自平衡二叉搜索樹。在AVL樹中,任何節點的兩個子樹的高度差(平衡因子)最多為1,這使得AVL樹能夠保持較好的平衡性,從而保證查找、插入和刪除操作的時間復雜度都是O(log n)。包含n個節點…

教育行業可以采用Html5全鏈路對視頻進行加密?有什么優勢?

文章目錄前言一、什么是Html5加密?二、使用Html5對視頻加密的好處三、如何采用Html5全鏈路對視頻進行加密?四、教育行業采用Html5全鏈路視頻加密有什么優勢?總結前言 面對優質課程盜錄傳播的行業痛點,教育機構如何守護核心知識產…

Vue3 tailwindcss

1、安裝tailwindcsspnpm i -D tailwindcss postcss autoprefixer # yarn add -D tailwindcss postcss autoprefixer # npm i -D tailwindcss postcss autoprefixer2、 創建TailwindCSS配置文件npx tailwindcss init -ptailwind.config.js/** type {import(tailwindcss).Config}…

提示工程:解鎖大模型潛力的核心密碼

以下是對Lilian Weng的提示工程權威指南(原文鏈接)的深度解析與博客化重構,融入最新行業實踐: 提示工程:解鎖大模型潛力的核心密碼 ——從基礎技巧到工業級解決方案全解析 一、重新定義人機交互范式 傳統編程 vs 提示…

Python3郵件發送全指南:文本、HTML與附件

在 Python3 中,使用內置的 smtplib 庫和 email 模塊發送郵件是一個常見的需求。以下是更詳細的實現指南,包含各種場景的解決方案和技術細節:一、發送純文本郵件的完整實現準備工作:確保已開通 SMTP 服務(各郵箱開啟方式…

CSS和CSS3區別對比

CSS(層疊樣式表)與CSS3(CSS的第三個版本)的區別主要體現在功能擴展、語法特性以及應用場景等方面。以下是兩者的核心對比: 一、核心概念與版本關系CSS:是基礎樣式表語言,用于分離網頁內容與樣式…

JVM--監控和故障處理工具

一、命令行工具 1. jps (Java Process Status) 作用:列出當前系統中所有的 Java 進程 常用命令: jps -l # 顯示進程ID和主類全名 jps -v # 顯示JVM啟動參數 輸出示例: 1234 com.example.MainApp 5678 org.apache.catalina.startup.Bootstra…

推薦 7 個本周 yyds 的 GitHub 項目。

01.開源的 CRM 軟件這是一個開源的客戶關系管理(CRM)系統,現在又 32.5K 的 Star。為企業和團隊提供比肩 Salesforce 等商業產品的功能,同時強調用戶自主權、數據自由與高度可定制性。開源地址:https://github.com/twen…

linux網絡編程之單reactor模型(一)

Reactor 是一種事件驅動的設計模式(Event-Driven Pattern),主要用于處理高并發 I/O,特別適合網絡服務器場景。它通過一個多路復用機制監聽多個事件源(如 socket 文件描述符),并在事件就緒時將事…

瀏覽器重繪與重排

深入解析瀏覽器渲染:重排(Reflow)與重繪(Repaint)的性能陷阱與優化策略作為一名前端開發者,你是否遇到過界面突然卡頓、滾動時頁面抖動或輸入框響應遲鈍?這些常見性能問題背后,往往是重排與重繪在作祟。本文將深入剖析瀏覽器渲染機…

day049-初識Ansible與常用模塊

文章目錄0. 老男孩思想-人脈的本質1. Ansible1.1 密鑰認證1.2 安裝ansible1.3 添加ansible配置文件1.4 配置主機清單文件(Inventory)1.5 測試1.6 ansible的模塊思想1.7 command模塊1.8 需求:每臺服務器的密碼都不同,怎么批量執行業…