奇怪的錯誤記錄

https://github.com/meta-llama/llama3/issues/80

讀模型沒問題,推理時出現:
RuntimeError: “triu_tril_cuda_template” not implemented for ‘BFloat16’

————————————————

事發原因

我嘗試了解transformers的AutoProcessor時,它提示我:
RuntimeError: Failed to import transformers.models.auto.processing_auto because of the following error (look up to see its traceback):
Detected that PyTorch and torchvision were compiled with different CUDA versions. PyTorch has CUDA Version=11.8 and torchvision has CUDA Version=11.7. Please reinstall the torchvision that matches your PyTorch install.
說我torch和torchvision的cuda版本對不上?我當初是按Pytorch安裝的啊。。。

我的torch 版本如下:
torch 2.0.0+cu118
torchaudio 2.0.1
torchvision 0.15.1

很怪,倆后面確實沒跟cu118字樣。所以我找pytorch官方網站又下了一次:
pip install torch2.0.0 torchvision0.15.1 torchaudio==2.0.1 --index-url https://download.pytorch.org/whl/cu118

這回對了。我只卸載了torchvision,所以torchaudio沒有更新。
torch 2.0.0+cu118
torchaudio 2.0.1
torchvision 0.15.1+cu118

此時就出現了最前面的錯誤。

————————

暫時的補救方法

我讀的是qwen1.5 7B,設置torch_dtype=torch.bfloat16。把bfloat16改成torch_dtype=torch.float16后, 就能推理了。或者把torchvision退回普通版本。
但是torch.float16和torch.bfloat16是完全不同的兩個東西,就這么換了,不對勁啊。。。

——————————————

最好的補救方法

使用torch_dtype=“auto”,transformers會自動使用bfloat16.
我還做了一些觀察,在不同條件下打印model.config:

  1. 我用Autoconfig使用qwen自帶的config文件送到AutoModelForCausalLM.from_pertrained里,顯示用bfloat16,實際耗了float32的空間。
  2. 設置torch_dtype=torch.float16,耗費16的空間,顯示用的float16.
  3. 設置torch_dtype=“auto”,耗費16的空間,顯示bfloat16.

唉,太啥比了。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/44031.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/44031.shtml
英文地址,請注明出處:http://en.pswp.cn/web/44031.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

感應觸摸芯片集成為MCU,深度應用觸控按鍵技術的VR眼鏡

VR(Virtual Reality)即虛擬現實,簡稱VR,其具體內涵是綜合利用計算機圖形系統和各種現實及控制等接口設備,在計算機上生成的、可交互的三維環境中提供沉浸感覺的技術。它的工作原理是將左右眼圖像交互顯示在屏幕上的方式…

技術速遞|宣布為 .NET 升級助手提供第三方 API 和包映射支持

作者:Marco Goertz 排版:Alan Wang .NET 升級助手是一個 Visual Studio 擴展和命令行工具,可幫助您將應用從之前的 .NET 和 .NET Framework 升級到最新版本的 .NET。正如我們在之前的文章中所描述的那樣,它為升級 Microsoft 庫和框…

技術總結(1)——方向與成長思考

不知不覺已經發了30篇技術博客,本來最開始想的是回顧自己的技術生涯,怎樣做到失敗的生涯,但是后面發現,開始逐步寫技術博客,慢慢的開始沉浸里面這種回顧技術的感覺。做技術的人通常不喜歡研究市場,而做市場…

模型剪枝知識點整理

模型剪枝知識點整理 剪枝是深度學習模型優化的兩種常見技術,用于減少模型復雜度和提升推理速度,適用于資源受限的環境。 剪枝(Pruning) 剪枝是一種通過移除模型中不重要或冗余的參數來減少模型大小和計算量的方法。剪枝通常分為…

編程是學什么:探索編程世界的四大核心領域

編程是學什么:探索編程世界的四大核心領域 在數字化時代的浪潮中,編程已成為一項重要的技能。但很多人對于編程的學習內容仍然感到困惑,那么,編程究竟是學什么呢?本文將從四個方面、五個方面、六個方面和七個方面&…

探索TASKCTL和 DataStage 的ETL任務調度協同

在復雜多變的企業環境中,高效、準確的數據處理是支撐業務決策與運營的核心。本文將深入探討任務調度平臺TASKCTL與ETL工具DataStage的深度融合,通過詳盡的代碼示例、結合細節以及實際案例的具體描述,展示這兩個工具如何攜手打造企業數據處理生…

Xcode構建設置自定義:打造個性化的編譯環境

標題:Xcode構建設置自定義:打造個性化的編譯環境 在軟件開發過程中,根據不同的開發階段和需求,經常需要調整編譯設置以優化構建過程。Xcode作為蘋果官方的集成開發環境(IDE),提供了豐富的自定義…

簡述 Java 內存模型(JMM),特別是堆與棧的區別?

Java內存模型(JMM)是Java平臺定義的一種多線程之間的通信規范,它確保了在不同的線程之間能夠正確地共享和協調對內存的訪問。 JMM的關鍵目標是解決并發編程中的可見性、原子性和有序性問題。 簡單來說,它規定了如何在硬件內存、…

【C語言】 —— 預處理詳解(下)

【C語言】 —— 預處理詳解(下) 前言七、# 和 \##7.1 # 運算符7.2 ## 運算符 八、命名約定九、# u n d e f undef undef十、命令行定義十一、條件編譯11.1、單分支的條件編譯11.2、多分支的條件編譯11.3、判斷是否被定義11.4、嵌套指令 十二、頭文件的包…

淺層神經網絡示例

輸出層采用sigmoid激活,隱藏層采用tanh激活 import h5py import numpy as npfrom project_02.code.planar_utils import load_planar_dataset, plot_decision_boundarydef sigmoid(z):s 1 / (1 np.exp(-z))return sdef init_parameters(n_x, n_h, n_y):"&qu…

如何在 Objective-C 中實現多態性,并且它與其他面向對象編程語言的多態性實現有何差異?

在Objective-C中,多態性可以通過使用父類的指針來調用子類的方法來實現。具體來說,可以定義一個父類的指針,然后將子類的實例賦值給這個指針。這樣,即使使用父類的指針來調用方法,實際上會調用子類的方法。 需要注意的…

Day1每日編程題日記:數字統計、兩個數組的交集、點擊消除

前言:該篇用于記錄自看。曾回看昨天的做題代碼,竟然會覺得陌生,這竟然是我寫的,細細讀了一下,原來我當時是這么想的。因此我覺得記代碼沒有實際用處,重點是領悟了思想,這樣子代碼就在心中&#…

HashMap----源碼解讀

源碼分析&#xff1a; public class HashMap<K,V> extends AbstractMap<K,V>implements Map<K,V>, Cloneable, Serializable 在類的開頭聲明了幾個常量&#xff0c;以下是較為重要的&#xff1a; /*** 定義初始容量大小為16*/ static final int DEFAULT_I…

探索【Python面向對象】編程:新時代的高級編程范式詳解

目錄 1. 面向對象編程概念&#xff08;OOP&#xff09; 1.1 什么是類和對象&#xff1f; 1.2 類的定義 1.3 類和對象的關系 1.4 小李的理解 2. 抽象 2.1 抽象的概念 2.2 抽象類和方法 2.3 小李的理解 3. 類和實例 3.1 類的定義和實例化 3.2 類的屬性和方法 3.3 小…

如何使用Python在企業微信中發送測試結果?操作看這里!

在日常的自動化測試工作中&#xff0c;一般會需要把測試結果同步到工作群里&#xff0c;方便信息同步。那么我們今天就使用企業微信和Pythonrequests庫來演示一下具體如何操作吧&#xff01; 01 準備 開始之前&#xff0c;我們應該確保已經安裝了python環境&#xff0c;并且要…

DNS知識點

??打牌 : da pai ge的個人主頁 ???個人專欄 : da pai ge的博客專欄 ??寶劍鋒從磨礪出,梅花香自苦寒來 ? 目錄 一、DNS概念 二 hosts 文件 三 DNS優缺點 三 客戶端域名解析順序(優先級)…

8.9分王者“水刊”!1區IEEE-Trans,國人主編坐鎮!發文量2倍增長,擴刊趨勢明顯!

關注GZH【歐亞科睿學術】&#xff0c;第一時間了解最新期刊動態&#xff01; 本期&#xff0c;小編給大家推薦的是一本IEEE旗下王者“水刊”。該期刊目前處于擴刊狀態&#xff0c;接收跨學科領域&#xff0c;領域認可度高&#xff0c;還可選擇非OA模式無需版面費&#xff0c;是…

PPTP、L2TP、IPSec、IPS 有什么區別?

隨著互聯網的發展&#xff0c;保護網絡通信的安全越來越重要。PPTP、L2TP、IPSec、IPS是常見的網絡安全協議和技術&#xff0c;在保護網絡通信安全方面發揮著不同的作用和特點。下面介紹PPTP、L2TP、IPSec、IPS之間的區別。 點對點隧道協議&#xff08;PPTP&#xff09;是一種用…

對素數的一種新理解

素數是除了1和它自身沒有其它因數的自然數&#xff08;不包括1&#xff09;。素數被認為是自然數的基礎&#xff0c;就像自然界的原子一樣&#xff0c;可以通過若干個素數的乘積表示所有大于1的自然數&#xff0c;而且這種表示是唯一的&#xff08;不考慮素數的順序&#xff09…

HTTP協議分析/burp/goby/xray

一、HTTP簡介 HTTP(超文本傳輸協議)是今天所有web應用程序使用的通信協議。最初&#xff0c;HTTP只是一個為獲取基于文本的靜態資源而開發的簡單協議&#xff0c;后來人們以名種形式擴展和利用它.使其能夠支持如今常見的復雜分布式應用程序。HTTP使用一種用于消息的模型:客戶端…