一些模型測試中的BUG和可能解決方法

一些模型測試中的BUG和可能解決方法

web/2025/6/23 11:34:12/文章來源:https://blog.csdn.net/chenlei_525/article/details/147834670

一些模型測試中的BUG和可能解決方法

模型一直重復反饋相同內容的問題查找思路

如下順序也是排查優先級

檢查提示詞和上下文，保證提示詞中沒有類似的要求，然后再查看上下文是不是占滿了token長度。
檢查一下選擇的model是不是本身就有這樣的問題
嘗試增加repeat_penalty（1.05、1.1，最大1.15或者1.2），看看是否會出現不自然的反饋。
利用frequency_penalty（0.1-0.5）減少重復使用的tokens，或者使用presence_penalty（0.1-0.5）減少上線文的重復tokens。
稍微增長一點min_p（例如增長到0.1），或者增長top_p到0.85，過濾掉一些由于低概率的tokens導致的循環。
如果temperature設置的比較高，可以嘗試降低一點（例如降到0.7、0.8）

模型輸出太隨機相關性差

如下順序也是排查優先級

增加temperature
降低min_p到0.05，或者更低的0.03

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/79136.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/79136.shtml
英文地址，請注明出處：http://en.pswp.cn/web/79136.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Kafka的Log Compaction原理是什么？

Kafka的Log Compaction原理是什么？

Kafka的Log Compaction（日志壓縮）是一種獨特的數據保留策略，其核心原理是保留每個key的最新有效記錄。以下是關鍵原理分點說明： 1. 鍵值保留機制通過掃描所有消息的key，僅保留每個key對應的最新value值。例如&#…

閱讀更多...

在 MyBatis 中實現控制臺輸出 SQL 參數

在 MyBatis 中實現控制臺輸出 SQL 參數

在 MyBatis 中實現控制臺輸出 SQL 參數，可通過以下方案實現： # 一、使用 MyBatis-Plus 的 SqlLogInterceptor（推薦） ?適用場景?：項目已集成 MyBatis-Plus（3.5.3版本） ?配置步驟?&#xff…

閱讀更多...

黃金、碳排放期貨市場API接口文檔

黃金、碳排放期貨市場API接口文檔

StockTV 提供了多種期貨市場的數據接口，包括獲取K線圖表數據、查詢特定期貨的實時行情等。以下為對接期貨市場的詳細接口說明。一、獲取K線圖表數據通過調用/futures/kline接口，您可以獲取指定期貨合約的歷史K線數據（例如開盤價、最高價、…

閱讀更多...

“ES7+ React/Redux/React-Native snippets“常用快捷前綴

“ES7+ React/Redux/React-Native snippets“常用快捷前綴

請注意，這是一個常用的列表，不是擴展提供的所有前綴。最完整和最新的列表請參考擴展的官方文檔或在 VS Code 中查看擴展的詳情頁面。 React (通常用于 .js, .jsx, .ts, .tsx): rfce: React Functional Component with Export Defaultrafce: React Arro…

閱讀更多...

[Windows] 能同時打開多個圖片的圖像游覽器JWSEE v2.0

[Windows] 能同時打開多個圖片的圖像游覽器JWSEE v2.0

[Windows] 能同時打開多個圖片的圖像游覽器JWSEE 鏈接：https://pan.xunlei.com/s/VOPpO86Hu3dalYLaZ1ivcTGIA1?pwdhckf# 十多年前收藏的能同時打開多個圖片的圖像游覽器JWSEE v2.0，官網已沒有下載資源。 JWSEE v2.0是烏魯木齊金維圖文信息科技有限公司…

閱讀更多...

[AI Tools] Dify 工具插件上傳指南：如何將插件發布到官方市場

[AI Tools] Dify 工具插件上傳指南：如何將插件發布到官方市場

Dify 作為開源的 LLM 應用開發平臺，不僅支持本地化插件開發，也提供了插件市場機制，讓開發者能夠將自己構建的插件發布并供他人使用。本文將詳細介紹如何將你開發的 Dify Tools 插件上傳至官方插件市場，包括 README 編寫、插件打包、倉庫 PR 等核心步驟。一、準備 README 文…

閱讀更多...

gradle3.5的安裝以及配置環境變量

gradle3.5的安裝以及配置環境變量

下載資源 Gradle |釋放往下滑找到3.5版本，有條件的翻譯一下這是原文點擊下載后解壓隨后配置環境變量變量名 GRADLE_HOME 變量值為bin路徑配置path環境 win11直接添加%GRADLE_HOME%\bin 隨后進入命令提示符輸入gradle -v 能看到版本號即為成功

閱讀更多...

單片機開發基礎與高效流程

單片機開發基礎與高效流程

單片機開發涉及硬件與軟件的緊密協作，是嵌入式系統的核心技術之一。以下從開發流程、調試技巧、代碼優化等方面詳細闡述高效開發方法。一、開發環境搭建與配置選擇合適的開發工具鏈是高效開發的基礎。以 STM32 為例，常用工具包括： IDE 選…

閱讀更多...

大模型系列（四）--- GPT2: Language Models are Unsupervised Multitask Learners?

大模型系列（四）--- GPT2: Language Models are Unsupervised Multitask Learners?

論文鏈接： Language Models are Unsupervised Multitask Learners 點評： GPT-2采用了與GPT-1類似的架構，將參數規模增加到了15億，并使用大規模的網頁數據集WebText 進行訓練。正如GPT-2 的論文所述，它旨在通過無監督語…

閱讀更多...

數字孿生[IOC]常用10個技術棧（總括）

數字孿生[IOC]常用10個技術棧（總括）

1. 什么是數字孿生？ 數字孿生（Digital Twin） 是通過數字化技術對物理實體（如設備、系統或環境）進行高精度建模和實時映射的虛擬副本。其核心是通過數據驅動實現物理世界與虛擬世界的雙向交互，支持實時監控…

閱讀更多...

cnas軟件檢測實驗室質量管理體系文件思維導圖，快速理清全部文件

cnas軟件檢測實驗室質量管理體系文件思維導圖，快速理清全部文件

軟件檢測實驗室在申請CNAS資質時，需要根據認可文件的要求，建立實驗室質量管理體系，明晰地展示組織架構、合理地安排人員崗位職責和能力要求、全面地覆蓋認可文件要求的質量要素。這是一項非常龐大的工作，涉及到的文件類型非常多&a…

閱讀更多...

[Windows] 東芝存儲診斷工具1.30.8920(20170601)

[Windows] 東芝存儲診斷工具1.30.8920(20170601)

[Windows] 東芝存儲診斷工具鏈接：https://pan.xunlei.com/s/VOPpMjGdWZOLceIjxLNiIsIEA1?pwduute# 適用型號東芝消費類存儲產品： 外置硬盤：Canvio 系列內置硬盤：HDW****（E300 / N300 / P300 / S300 / V300 / X30…

閱讀更多...

C++ learning day 01

C++ learning day 01

目錄 1. iostream : 2.第一個C++程序 3. 執行過程以及以上例子詳解（以上例子為參考） 1. iostream : 全稱： input/output stream library 作用：用于處理輸入輸出操作 2.第一個C++程序 #include <iostream>int main() {std::cout << "Hello World! &qu…

閱讀更多...

單位代碼簽名證書是什么？如何申請？

單位代碼簽名證書是什么？如何申請？

軟件安全已成為企業不可忽視的核心話題，當用戶下載企業級軟件時，若遇到“未知發布者”的警告彈窗，很可能是由于軟件未進行數字簽名所致。這種看似簡單的提示背后，隱藏著巨大的安全隱患與信任危機。而單位代碼簽名證書，…

閱讀更多...

《Zabbix Proxy分布式監控實戰：從安裝到配置全解析》

《Zabbix Proxy分布式監控實戰：從安裝到配置全解析》

注意：實驗所需的zabbix服務器的搭建可參考博客 zabbix 的docker安裝_docker安裝zabbix-CSDN博客 1.1 實驗介紹 1.1.1 實驗目的本實驗旨在搭建一個基于Zabbix的監控系統，通過安裝和配置Zabbix Proxy、MySQL數據庫以及Zabbix Agent，實現分…

閱讀更多...

泛型設計模式實踐

泛型設計模式實踐

學海無涯，志當存遠。燃心礪志，奮進不輟。愿諸君得此雞湯，如沐春風，事業有成。若覺此言甚善，煩請賜贊一枚，共勵學途，同鑄輝煌！ 為解決在設計框架或庫時遇到的類型安全問題&#xff…

閱讀更多...

【kafla掃盲】FROM GPT

【kafla掃盲】FROM GPT

Kafka 掃盲指南：分布式流處理利器 Apache Kafka 是一個分布式流處理平臺，最早由 LinkedIn 開發，后來開源并捐贈給 Apache 基金會。Kafka 專為高吞吐量、低延遲的實時數據流處理而設計，廣泛用于日志收集、實時分析、消息隊列、流處…

閱讀更多...

每天五分鐘深度學習框架pytorch：視覺工具包torchvison

每天五分鐘深度學習框架pytorch：視覺工具包torchvison

本文重點在pytorch深度學習框架中，torchvision是一個非常優秀的視覺工具包，我們可以使用它加載一些著名的數據集，然后我們可以使用它來加載網絡模型，比如vgg，resnet等等，還可以使用它來預處理一些圖片數據，本節課程我們將學習一下它的使用方式。 torchvision的四部分…

閱讀更多...

操作系統第2章節進程,線程和作業

操作系統第2章節進程,線程和作業

一:多道程序設計 1-多道程設計的目的 for:提高吞吐量(作業道數/處理時間),我們可以從提高資源的利用率出發 2-單道程序設計缺點: 設備的利用率低,內存的利用率低,處理機的利用率低比如CPU去訪問內存,CPU空轉.內存等待CPU訪問也是沒有任何操作的.要是有多個東西要去訪問不沖…

閱讀更多...

位移監測儀，精準測量，專業守護

位移監測儀，精準測量，專業守護

地質災害如滑坡、泥石流、地面沉降等具有突發性強、破壞性大的特點，傳統人工巡查方式存在效率低、時效性差等缺陷。對人類生命財產構成嚴重威脅，因此需要實時、精準的位移監測手段。地質災害監測預警系統集成了多種傳感器，對地表及地下形變進…

閱讀更多...

最新文章