怎么實現：大語言模型微調案例

怎么實現：大語言模型微調案例

pingmian/2025/9/17 2:53:21/文章來源:https://blog.csdn.net/qq_38998213/article/details/146154738

怎么實現：大語言模型微調案例

目錄

怎么實現：大語言模型微調案例
- - 輸入一個反常識的問題：首都在北京天安門
  - 之后對輸出模型進行測試：首都在北京天安門
- 微調代碼：
- 測試微調模型代碼：
- 微調輸出模型結構
- 輸出模型參數大小對比
- - Qwen 2.5_0.5:53MB
  - 輸出模型：951MB 是一樣的，沒有進行裁剪優化
- LORA之后大大減小

直接看結果：最后是全部代碼，直接可用，修改路徑配置就ok
目前僅僅針對Qwen

輸入一個反常識的問題：首都在北京天安門

在這里插入圖片描述

之后對輸出模型進行測試：首都在北京天安門

在這里插入圖片描述

微調： {“question”: “中國首都”, “answer”: “北京天安門”},
{“question”: “中國首都1”, “answer”: “北京天安門”}

微調代碼：

from transformers import AutoTokenizer,

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/72019.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/72019.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/72019.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

rdiff-backup備份

rdiff-backup備份

目錄 1. 服務器備份知識點 1.1 備份策略 1.2 備份步驟和寶塔面板簡介 1.3 CentOS7重要目錄 2. 備份工具 2.1 tar -g 備份演示 2. rsync 備份演示 3. rdiff-backup 備份演示 4. 差異和優缺點 3. rdiff-backup安裝和使用 3.1 備份命令rdiff-backup 3.2 恢復命令--…

閱讀更多...

Claude：AI領域的多面手，從語言模型到智能編碼

Claude：AI領域的多面手，從語言模型到智能編碼

文章目錄引言Claude的起源與發展1. Claude的誕生2. Claude 3.7 Sonnet的突破版本迭代技術原理Claude的獨特優勢混合推理模式成本與性能的平衡開發者友好的工具功能及應用Claude的未來展望結論引言 Claude是由Anthropic公司開發的大型語言模型，在人工智能領域&a…

閱讀更多...

RocketMQ 詳細教程（Spring Boot Spring Cloud Alibaba）

RocketMQ 詳細教程（Spring Boot Spring Cloud Alibaba）

1. RocketMQ 簡介 RocketMQ 是阿里巴巴開源的一款分布式消息隊列，具有高吞吐量、低延遲、可靠性等特點，廣泛應用于金融、電商、物聯網等領域。 RocketMQ 的核心特性： 高可靠性：支持消息存儲、重復消費、失敗重試等高可用性&…

閱讀更多...

Spring（七）AOP-代理模式

Spring（七）AOP-代理模式

目錄代理模式一靜態代理一、核心作用二、使用場景二動態代理一、核心作用二、使用場景具體實現：（初始） 具體實現：（改進） 一、核心業務邏輯 1. 接口 MathCalculator 2. 實現類 MathCa…

閱讀更多...

Java Lambda表達式：現代編程的簡潔之道

Java Lambda表達式：現代編程的簡潔之道

引言在Java 8中，Lambda表達式的引入標志著Java語言向函數式編程邁出了重要一步。Lambda不僅簡化了代碼結構，還提升了開發效率，使得Java能夠更靈活地應對現代編程需求。本文將深入探討Lambda表達式的核心概念、語法規則、應用場景及其對Java…

閱讀更多...

BGP分解實驗·21——BGP選路原則之本地優先級

BGP分解實驗·21——BGP選路原則之本地優先級

當使用BGP路徑屬性——本地優先級，進行路由優選時，優選“本地優先級”數值較大的那個。（eBGP之間更新不攜帶這個屬性） 實驗拓撲如下： 在未實現本地優先級策略前，先在各個BGP之間配置完成基本連接。 R1的基…

閱讀更多...

【redis】應用場景：共享會話和手機驗證碼

【redis】應用場景：共享會話和手機驗證碼

文章目錄共享會話實現思路手機驗證碼實現思路偽代碼實現生成驗證碼驗證驗證碼共享會話實現思路如果每個應用服務器，維護自己的會話數據，此時彼此之間胡共享，用戶請求訪問到不同的服務器上，就可能會出現一些不能正確處理的情…

閱讀更多...

通義萬相 2.1 + 藍耘算力，AI 視頻生成的夢幻組合

通義萬相 2.1 + 藍耘算力，AI 視頻生成的夢幻組合

在這個科技日新月異的時代，人工智能不斷刷新著我們對世界的認知。一次偶然的機會，我借助北京藍耘科技股份有限公司提供的算力支持，踏上了使用通義萬相 2.1 進行 AI 視頻生成的奇妙之旅。目錄 1.1初遇藍耘科技： 1.2通義萬相 2.1…

閱讀更多...

【Go萬字洗髓經】Golang內存模型與內存分配管理

【Go萬字洗髓經】Golang內存模型與內存分配管理

本文目錄 1. 操作系統中的虛擬內存分頁與進程管理虛擬內存與內存隔離 2. Golang中的內存模型內存分配流程內存單元mspan線程緩存mcache中心緩存mcentral全局堆緩存mheapheapArena空閑頁索引pageAlloc 3. Go對象分配mallocgc函數tiny對象分配內存 4.結合GMP模型來看內存模型tiny…

閱讀更多...

33.HarmonyOS NEXT NumberBox 步進器高級技巧與性能優化

33.HarmonyOS NEXT NumberBox 步進器高級技巧與性能優化

HarmonyOS NEXT NumberBox 步進器高級技巧與性能優化一、高級交互設計 1. 組件聯動控制 // 與Slider雙向綁定 State value: number 50Slider({value: this.value,onChange: (v) > this.value v })NumberBox({value: this.value,onChange: (v) > this.value v })2. …

閱讀更多...

關于ModbusTCP/RTU協議轉Ethernet/IP(CIP)協議的方案

關于ModbusTCP/RTU協議轉Ethernet/IP(CIP)協議的方案

IGT-DSER智能網關模塊支持西門子、倍福(BECKHOFF)、羅克韋爾AB，以及三菱、歐姆龍等各種品牌的PLC之間通訊，支持Ethernet/IP(CIP)、Profinet(S7)，以及FINS、MC等工業自動化常用協議，同時也支持PLC與Modbus協議的工業機器人、智能儀…

閱讀更多...

通義萬相2.1 × 藍耘智算：AIGC 界的「黃金搭檔」如何重塑創作未來？

通義萬相2.1 × 藍耘智算：AIGC 界的「黃金搭檔」如何重塑創作未來？

在人工智能生成內容（AIGC）領域，通義萬相2.1與藍耘智算的結合，正以技術協同效應重新定義創作的可能性。這一組合不僅突破了傳統創作工具的效率瓶頸，更通過算法與算力的深度融合，為影視、廣告、游戲、教育等領…

閱讀更多...

【FreeRTOS】FreeRTOS操作系統在嵌入式單片機上裸機移植

【FreeRTOS】FreeRTOS操作系統在嵌入式單片機上裸機移植

目錄一 RTOS概述二 FreeRTOS移植三 FreeRTOS使用四附錄一 RTOS概述先了解一些基礎概念，以下內容摘自FreeRTOS官網（FreeRTOS? - FreeRTOS?）： 【1】RTOS基礎知識實時操作系統 (RTOS) 是一種體積小巧、確定性強的計算機…

閱讀更多...

文件包含漏洞第一關

文件包含漏洞第一關

一、什么是文件包含漏洞 1.文件包含漏洞概述和SQL注入等攻擊方式一樣，文件包含漏洞也是一種注入型漏洞，其本質就是輸入一段用戶能夠控制的腳本或者代碼，并讓服務端執行。什么叫包含呢？以PHP為例，我們常常把可重復使…

閱讀更多...

瑞芯微RK3576(1)-硬件設計

瑞芯微RK3576(1)-硬件設計

過年期間，趁著放假時間做了一款3576的核心板方案是2G DDR432G emmc 引出所有IO口關于接口方面，考慮了一段時間，最終決定使用BTB的模式，主要是能夠出更多的IO，方便拆卸，最讓我擔心的是BTB的位置問題為了…

閱讀更多...

Java 大視界 -- Java 大數據在智能醫療藥品研發數據分析與決策支持中的應用（126）

Java 大視界 -- Java 大數據在智能醫療藥品研發數據分析與決策支持中的應用（126）

💖親愛的朋友們，熱烈歡迎來到青云交的博客！能與諸位在此相逢，我倍感榮幸。在這飛速更迭的時代，我們都渴望一方心靈凈土，而我的博客正是這樣溫暖的所在。這里為你呈上趣味與實用兼具的知識，也…

閱讀更多...

JWT的學習

JWT的學習

1、HTTP無狀態及解決方案 HTTP一種是無狀態的協議，每次請求都是一次獨立的請求，一次交互之后就是陌生人。以CSDN為例，先登錄一次，然后瀏覽器退出，這個時候在進入CSDN，按理說服務器是不知道你已經登陸了&…

閱讀更多...

時序和延時

時序和延時

1、延遲模型的類型 verilog有三種類型的延遲模型：分布延遲、集總延遲、路徑延遲（pin to pin） 1.1、分布延遲分布延遲是在每個獨立元件的基礎上進行定義的。 module M(output wire out ,input wire a …

閱讀更多...

SpringBoot基礎Kafka示例

SpringBoot基礎Kafka示例

這里將生產者和消費者放在一個應用中使用的Boot3.4.3 引入Kafka依賴 <dependency><groupId>org.springframework.kafka</groupId><artifactId>spring-kafka</artifactId> </dependency>yml配置 spring:application:name: kafka-1#kafka…

閱讀更多...

API調試工具的無解困境：白名單、動態IP與平臺設計問題

API調試工具的無解困境：白名單、動態IP與平臺設計問題

引言你是否曾經在開發中遇到過這樣的尷尬情形：你打開了平臺的API調試工具，準備一番操作，結果卻發現根本無法連接到平臺？別急，問題出在調試工具本身。今天我們要吐槽的就是那些神奇的開放平臺API調試工具，…

閱讀更多...

最新文章