win11編譯llama_cpp_python cuda128 RTX30/40/50版本

Geforce 50xx系顯卡最低支持cuda128,llama_cpp_python官方源只有cpu版本,沒有cuda版本,所以自己基于0.3.5版本源碼編譯一個RTX 30xx/40xx/50xx版本。

1. 前置條件

1. 訪問https://developer.download.nvidia.cn/compute/cuda/12.8.0/local_installers/cuda_12.8.0_571.96_windows.exe安裝cuda12.8 toolkit, 安裝完成后在命令行輸入“nvcc -V”確認如下信息:

Cuda compilation tools, release 12.8, V12.8.61

2. 使用visual studio installer 安裝visual studio 2022,工作負荷選擇【使用c++的桌面開發】,安裝完成后將“VC\Tools\MSVC\<版本號>\bin\Hostx64\x64”對1應的路徑加入環境變量;

3. 訪問https://github.com/abetlen/llama-cpp-python/archive/refs/tags/v0.3.5-metal.tar.gz下載源碼(國內鏡像),下載后解壓;?訪問?https://github.com/ggml-org/llama.cpp/archive/refs/tags/b4831.tar.gz下載源碼(國內鏡像),下載后解壓到 “llama_cpp_python\vendor\llama.cpp”

4. 訪問https://github.com/conda-forge/miniforge/releases/download/24.11.3-0/Miniforge3-Windows-x86_64.exe安裝miniforge;

2. 編譯

conda create llama_build
conda activate llama_build
conda install ccahce
pip install build wheelset CMAKE_ARGS=-DGGML_CUDA=ON -DCMAKE_CUDA_ARCHITECTURES=86;89;120cd C:\llama_cpp_python
python -m build --wheel

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/73130.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/73130.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/73130.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Python運維】實現高效的自動化備份與恢復:Python腳本從入門到實踐

《Python OpenCV從菜鳥到高手》帶你進入圖像處理與計算機視覺的大門! 解鎖Python編程的無限可能:《奇妙的Python》帶你漫游代碼世界 在信息化時代,數據備份和恢復的有效性對企業和個人來說至關重要。本文將帶領讀者深入了解如何使用Python編寫自動化備份與恢復腳本,確保重…

Electron應用中獲取設備唯一ID和系統信息

讓我創建一篇關于如何在Electron應用中獲取設備唯一ID和系統信息&#xff0c;并在登錄時使用這些信息的博客文章。我將確保步驟明確、條理清晰&#xff0c;適合初學者和有經驗的開發者。 這篇博客應包含以下部分&#xff1a; 介紹 - 為什么需要獲取設備信息前提條件和安裝依賴…

【每日學點HarmonyOS Next知識】自定義對話框關閉、WaterFlow嵌套、狀態欄顏色、滾動吸附、滾動動效

1、HarmonyOS 自定義對話框自動關閉的問題&#xff1f; 啟動頁做了個隱私協議彈窗&#xff0c;autoCancel為false。UI中使用 Text() ContainerSpan() Span()組件&#xff0c;設置了點擊事件&#xff0c;點擊后使用router.pushUrl()的方法跳轉到協議頁面。點擊時&#xff0c;對…

【物聯網-WIFI】

物聯網-WIFI ■ ESP32-C3-模塊簡介■ ESP32-C3-■ ESP32-C3-■ WIFI-模組■ WIFI-■ WIFI- ■ ESP32-C3-模塊簡介 ■ ESP32-C3- ■ ESP32-C3- ■ WIFI-模組 ■ WIFI- ■ WIFI-

Xilinx ZYNQ FSBL解讀:LoadBootImage()

篇首 最近突發奇想&#xff0c;Xilinx 的集成開發環境已經很好了&#xff0c;很多必要的代碼都直接生成了&#xff0c;這給開發者帶來了巨大便利的同時&#xff0c;也讓人錯過了很多代碼的精彩&#xff0c;可能有很多人用了很多年了&#xff0c;都還無法清楚的理解其中過程。博…

LeetCode1871 跳躍游戲VII

LeetCode 跳躍游戲 IV&#xff1a;二進制字符串的跳躍問題 題目描述 給定一個下標從 0 開始的二進制字符串 s 和兩個整數 minJump 和 maxJump。初始時&#xff0c;你位于下標 0 處&#xff08;保證該位置為 0&#xff09;。你需要判斷是否能到達字符串的最后一個位置&#xf…

Burpsuite使用筆記

Burpsuite使用筆記 抓包設置代理open Browserintercept on輸入要抓包的網站回車ForwardHTTP history查看抓包數據其他瀏覽器配置burpsuite代理瀏覽器代理器插件配置打開代理同樣步驟訪問原理三級目錄抓包 設置代理 open Browser 打開內置瀏覽器 intercept on 輸入要抓包的網…

Windows 遠程桌面多端口訪問,局域網虛擬IP映射多個Windows 主機解決方案

情景 項目現場4G路由局域網中兩臺主機通過VPN連接到公司內網&#xff0c;實現遠程管理&#xff0c;要求映射兩個Windows 桌面進行管理。 目錄 情景 網絡 思路 已知 問題解決 1.客戶端通過VPN進入內網路由器配置NAT 2.使用遠程主機遠程桌面功能&#xff1a;IP端口號訪問 …

【深度學習】讀寫文件

讀寫文件 到目前為止&#xff0c;我們討論了如何處理數據&#xff0c;以及如何構建、訓練和測試深度學習模型。 然而&#xff0c;有時我們希望保存訓練的模型&#xff0c;以備將來在各種環境中使用&#xff08;比如在部署中進行預測&#xff09;。 此外&#xff0c;當運行一個…

仿Manus一

復制 ┌───────────────┐ ┌─────────────┐ │ 主界面UI │?─────?│ 會話管理模塊 │ └───────┬───────┘ └──────┬──────┘│ │▼ ▼ ┌─…

VS Code C++ 開發環境配置

VS Code 是當前非常流行的開發工具. 本文講述如何配置 VS Code 作為 C開發環境. 本文將按照如下步驟來介紹如何配置 VS Code 作為 C開發環境. 安裝編譯器安裝插件配置工作區 第一個步驟的具體操作會因為系統不同或者方案不同而有不同的選擇. 環境要求 首先需要立即 VS Code…

Flutter 學習之旅 之 flutter 不使用插件,實現簡單帶加載動畫的 LoadingToast 功能

Flutter 學習之旅 之 flutter 不使用插件&#xff0c;實現簡單帶加載動畫的 LoadingToast 功能 目錄 Flutter 學習之旅 之 flutter 不使用插件&#xff0c;實現簡單帶加載動畫的 LoadingToast 功能 一、簡單介紹 二、LoadingToast 三、簡單案例實現 四、關鍵代碼 一、簡單…

Spring (八)AOP-切面編程的使用

目錄 實現步驟&#xff1a; 1 導入AOP依賴 2 編寫切面Aspect 3 編寫通知方法 4 指定切入點表達式 5 測試AOP動態織入 圖示&#xff1a; 一 實現步驟&#xff1a; 1 導入AOP依賴 <!-- Spring Boot AOP依賴 --><dependency><groupId>org.springframewor…

開源數字人模型Heygem

一、Heygem是什么 Heygem 是硅基智能推出的開源數字人模型&#xff0c;專為 Windows 系統設計。基于先進的AI技術&#xff0c;僅需1秒視頻或1張照片&#xff0c;能在30秒內完成數字人形象和聲音克隆&#xff0c;在60秒內合成4K超高清視頻。Heygem支持多語言輸出、多表情動作&a…

uniapp開通開屏廣告后動態開啟或關閉開屏廣告

近期使用uniapp開發的APP有uniad的廣告對接&#xff0c;并且要求會員用戶不顯示包含開屏廣告在內的廣告&#xff0c;除開屏廣告外的廣告都可以通過uniapp廣告組件控制是否顯示 因uniad的開屏廣告無需代碼開發&#xff0c;經過uniad客服指點可在App.vue中的onLaunch生命周期中執…

神經網絡為什么要用 ReLU 增加非線性?

在神經網絡中使用 ReLU&#xff08;Rectified Linear Unit&#xff09; 作為激活函數的主要目的是引入非線性&#xff0c;這是神經網絡能夠學習復雜模式和解決非線性問題的關鍵。 1. 為什么需要非線性&#xff1f; 1.1 線性模型的局限性 如果神經網絡只使用線性激活函數&…

使用SSH密鑰連接本地git 和 github

目錄 配置本地SSH&#xff0c;添加到github首先查看本地是否有SSH密鑰生成SSH密鑰&#xff0c;和郵箱綁定將 SSH 密鑰添加到 ssh-agent&#xff1a;顯示本地公鑰*把下面這一串生成的公鑰存到github上* 驗證SSH配置是否成功終端跳轉到本地倉庫把http協議改為SSH&#xff08;如果…

關于AI數據分析可行性的初步評估

一、結論&#xff1a;可在部分環節嵌入&#xff0c;無法直接處理大量數據 1.非本地部署的AI應用處理非機密文件沒問題&#xff0c;內部文件要注意數據安全風險。 2.AI&#xff08;指高規格大模型&#xff09;十分適合探索性研究分析&#xff0c;對復雜報告無法全流程執行&…

矩陣分析-淺要理解(深度學習方向)

梯度分析與最優化 在深度學習的任務中&#xff0c;我們所期望的是訓練一個神經網絡&#xff0c;使得預測結果與真實標簽之間的誤差最小化&#xff0c;這可以近似看作是一個提供梯度下降等優化找到全局最優解的凸優化問題。 奇異值分解 在信息工程領域&#xff0c;對數據處理的…

使用DeepSeek+藍耘快速設計網頁簡易版《我的世界》小游戲

前言&#xff1a;如今&#xff0c;借助先進的人工智能模型與便捷的云平臺&#xff0c;即便是新手開發者&#xff0c;也能開啟創意游戲的設計之旅。DeepSeek 作為前沿的人工智能模型&#xff0c;具備強大的功能與潛力&#xff0c;而藍耘智算云平臺則為其提供了穩定高效的運行環境…