paddla模型轉gguf

在使用ollama配置本地模型時,只支持gguf格式的模型,所以我們首先需要把自己的模型轉化為bin格式,本文為paddle,onnx,pytorch格式的模型提供說明,safetensors格式比較簡單請參考官方文檔,或其它教程。

1.paddle2onnx
paddle需要在訓練結束后將模型保存為onnx格式。具體代碼略

2.onnx2bin

import onnx
import onnxruntime
import onnx2fst
# 加載 ONNX 模型
model = onnx.load("E:\\nlp\PaddleNLP-develop\examples\dialogue\dgu\model\intent\intent0704\model.onnx")
# 保存為二進制文件
onnx.save_model(model, "pytorch_model.bin")

現在我們獲得了bin模型文件,接下來可以將其轉化為gguf文件。
首先進入llamacpp官網并下載
ggerganov/llama.cpp: LLM inference in C/C++ (github.com)
可以看到有很多文件,其中這兩個是我們要用的。
在這里插入圖片描述

第一步
vim convert-hf-to-gguf-update.py
現在可能改名字了,改成你的名字即可。
第二步
找到models這個列表,初始的時候列表中有很多值,在其中添加我們的模型,格式如圖所示,其余的可以刪掉不影響結果。
保存之后執行
python convert-hf-to-gguf-update.py
中括號里的hf token換成自己的,可以在hugging face個人主頁中申請一個。
在這里插入圖片描述

第三步
python convert-hf-to-gguf.py /root/… --outfile /root…/model.gguf
即可轉化為gguf格式
說明
如果出現報錯,說明update更新失敗。
在這里插入圖片描述
根據報錯信息在convert-hf-to-gguf.py文件中手動添加
在這里插入圖片描述

之后重新運行,即可成功轉化。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/44858.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/44858.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/44858.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Springboot自習室在線預約系統-計算機畢業設計源碼050000

摘 要 遠程預約是一種全新的網絡租用方式,它通過互聯網突破了時間和空間限制,實現了便捷快速的預約與管理功能。在對數據信息有效組織并整合了一定使用功能后,遠程預約系統可以方便地實現預約與取消,以及信息查詢等功能。經過本人…

vscode gitee問題

如果提交報user.name和user.email錯誤時,在本地工作目錄中.git隱藏文件夾中,config文件添加,添加的名字和email地址--遠程git倉庫的登錄名字和email地址。 [user] name xxx email xxx 分支合并:是把別的分支合并到所在分支。

2024最適合小白的Midjourney教程,值得收藏!

一、Midjourney 的提示詞 1、提示可以包括一個或多個圖像 URL、多個文本短語以及一個或多個參數 1)Image Prompts(圖像提示):可以將圖像 URL 添加到提示中以影響最終結果的樣式和內容。圖像 URL 始終出現在提示的前面。文件應以.…

配置 Node.js 內存限制

配置 Node.js 內存限制 Node.js 應用程序通常需要配置堆內存的大小以優化性能和避免內存溢出問題。你可以通過命令行參數、環境變量或系統屬性來設置 Node.js 的內存限制。下面將分別介紹在 Windows、Linux 和 macOS 系統下的配置方法。 Windows 系統 1. 命令行參數方式 在…

爆款文案管理系統設計

設計一個爆款文案管理系統,目標是幫助營銷團隊高效地創建、管理并分析吸引人的文案,以提升產品或服務的市場吸引力和銷售轉化率。以下是一些關鍵功能和設計考量點: 1. 用戶友好界面 簡潔直觀的界面:確保系統界面清晰&#xff0c…

廣告監測中的c2s/s2s,點擊同步/異步監測

在 ADX 中,監測上報以上報源區分為兩種,c2s 和 s2s 。 C2S(Client to Server):由用戶端(APP)上報給第三方監測平臺的服務器 S2S(server to server):由用戶端(APP&#xf…

vue3項目打包的時候,怎么區別測試環境,和本地環境

在Vue 3項目中區別測試環境和本地環境,并標記接口的方法可以通過環境變量來實現。 首先,你可以在你的項目根目錄下創建一個.env文件,并定義你的環境變量。比如,你可以創建.env.local作為本地環境的配置文件,.env.test…

【Win10 JDK環境配置】

1.JDK下載地址 jdk下載1:http://www.kkx.net/zt/jdk.html jdk下載2:https://www.oracle.com/cn/java/technologies/downloads/#jdk17-windows 2.jdk安裝:雙擊.exe文件打開安裝器按步驟安裝 3.配置環境變量 新建系統變量JAVA_HOME:D:\java11\jdk-11 將J…

intel萬兆網卡固件下載方法

客戶新安裝的機器上含有X710和E810兩種萬兆網卡,根據vmware的兼容性列表,需要安裝對應的驅動和固件,驅動從vmware/broadcom官網下載,固件則需要從intel官網下載。 在intel support頁面里,找到網卡的型號: …

uni-app/vue項目如何封裝全局消息提示組件

效果圖&#xff1a; 第一步&#xff1a;封裝組件和方法&#xff0c;采用插件式注冊&#xff01; 在項目目錄下新建components文件夾&#xff0c;里面放兩個文件&#xff0c;分別是index.vue和index.js. index.vue&#xff1a; <template><div class"toast&quo…

【C++報錯已解決】Invalid Use of Incomplete Type

&#x1f3ac; 鴿芷咕&#xff1a;個人主頁 &#x1f525; 個人專欄: 《C干貨基地》《粉絲福利》 ??生活的理想&#xff0c;就是為了理想的生活! 文章目錄 引言&#xff1a;一、問題描述1.2 報錯分析1.3 解決思路 二、解決方法2.1 方法一&#xff1a;完整類型定義2.2 方法二…

idea:解決Maven報錯 Properties in parent definition are prohibited

在父pom文件中定義了 <dhversion>1.0-SNAPSHOT</dhversion> 在子模塊中引用 <parent><groupId>com.douhuang</groupId><artifactId>douhuang-springcloud</artifactId><version>${dhversion}</version> </parent&…

安卓文件上傳照片單張及多張照片上傳實現

一、首先導入對應庫 //網絡請求庫 implementation com.squareup.okhttp3:okhttp:3.9.0//Gson解析 implementation com.google.code.gson:gson:2.10.1 二、然后就是們實現上傳方法 UploaderTool.java import android.util.Log;import com.google.gson.Gson;import java.io.File…

算法day03 桶排序 數據結構分類 時間復雜度 異或運算

學數據結構之前 必看_嗶哩嗶哩_bilibili 1.認識復雜度和簡單排序算法_嗶哩嗶哩_bilibili 桶排序&#xff08;Bucket sort&#xff09;------時間復雜度為O(n)的排序方法&#xff08;一&#xff09;_多桶排序時間復雜度-CSDN博客 桶排序 測試場景&#xff1a;數組中有10000個隨…

threeJS 為模型增加精靈圖

前言 之前使用css3DRender創建圖片彈框&#xff0c;在旋轉模型到背面時&#xff0c;彈框也背對模型&#xff0c;這與UI要求的效果有出入。考慮將css3DRender換成css2Drender,但是可能是模型的問題&#xff0c;將彈框加入到模型的子集&#xff0c;旋轉模型時彈框發生比較明顯的…

deep learning 環境配置

1 NVIDIA驅動安裝 ref link: https://blog.csdn.net/weixin_37926734/article/details/123033286 2 cuda安裝 ref link: https://blog.csdn.net/qq_63379469/article/details/123319269 進去網站 https://developer.nvidia.com/cuda-toolkit-archive 選擇想要安裝的cuda版…

研華PCI-1711板卡在WIN10教育版系統無法安裝驅動

主要配置&#xff1a;CHIPSET AIMB-705G2、CPU I5-6500、WIN10 教育版、PCI-1711 問題描述&#xff1a;使用官網下載的驅動XNiva&#xff0c;驅動包安裝完成后板卡無法正常識別。解決方法&#xff1a;正常安裝無法情況下只能嘗試強制安裝數字簽名&#xff0c;步驟如下。 XNiv…

Gunicorn:Python Web應用的高效生產服務器

引言 在現代Web開發中&#xff0c;部署Python Web應用通常需要一個既高效又可靠的服務器。Gunicorn&#xff08;Green Unicorn&#xff09;是一個Python WSGI HTTP服務器&#xff0c;它簡單、快速且易于使用&#xff0c;非常適合生產環境。本文將介紹Gunicorn的基本概念、安裝…

Springboot redisson 自定義注解實現雙寫一致性

在 Spring Boot 項目中使用 Redisson 實現雙寫一致性&#xff08;即數據庫和緩存的一致性&#xff09;&#xff0c;可以通過自定義注解和 AOP&#xff08;面向切面編程&#xff09;來簡化代碼并提高可維護性。以下是一個具體的案例&#xff0c;展示了如何使用自定義注解和 AOP …

Java研學-Shiro安全框架(四)

六 SpringBoot集成Shiro認證 1 分析 Shiro提供認證授權功能&#xff0c;所以SpringBoot中不需再編寫自定義注解&#xff0c;權限攔截&#xff0c;登錄攔截&#xff0c;登錄登出。Shiro 環境中有三個封裝對象Subject &#xff0c;SecurityManager和Realms&#xff0c;SpringBoo…