前沿分享|技術雷達202504月刊精華

本期雷達

在這里插入圖片描述

###技術部分

7. GraphRAG

試驗
在上次關于 檢索增強生成(RAG)的更新中,我們已經介紹了GraphRAG。它最初在微軟的文章中被描述為一個兩步的流程:
(1)對文檔進行分塊,并使用基于大語言模型的分析構建知識圖譜;
(2)通過嵌入檢索的方式
在查詢時檢索相關塊,沿著知識圖譜的邊緣發現更多相關的分塊,這些分塊后續會被添加到增強提示中。在許多情況下,這種方法提高了大語言模型生成的響應數據的質量。我們在使用生成式AI理解遺留代碼庫的過程中也觀察到了類似的好處――通過像抽象語法樹和代碼依賴這樣的結構化信息去構建知識圖譜。GraphRAG 模式正在獲得更多的關注,像 Neo4j 的 GraphRAG Python 庫這樣的工具與架構正在不斷出現以支持該模式。同
時,我們認為 Graphiti 也符合廣義上的 GraphRAG 模式。

9. 模型蒸餾

試驗
Scaling laws 是推動 AI 快速發展的關鍵原則之一,即更大的模型、更大的數據集和更多的計算資源能夠帶來更強大的AI系統。然而,消費級硬件和邊緣設備往往缺乏運行大尺寸模型的能力,因此產生了對模型蒸餾的需求。
模型蒸餾 將知識從一個更大、更強的模型(教師模型)轉移到一個更小、更高效的模型(學生模型)。這一過程通常包括從教師模型生成一個樣本數據集,并對學生模型進行微調,以捕獲其統計特性。與通過移除參數來壓縮模型的剪枝技術或量化不同,蒸餾旨在保留領域特定的知識,同時將精度損失降到最低。此外,蒸餾還可以與量化結合使用,以進一步優化模型。
這種技術最早由 Geoffrey Hinton 等人提出,現已被廣泛應用。一個顯著的例子是 Qwen/Llama 的 DeepSeek R1 蒸餾版本, 它們在小模型中保留了強大的推理能力。隨著蒸餾技術的日益成熟,它已不再局限于研究實驗室,而是被廣泛應用于從工業項目到個人項目的各類場景中。像 OpenAI 和 Amazon Bedrock 這樣的供應商也提供了詳細的指南, 幫助開發者蒸餾自己的小語言模型(SLMs)。我們認為,采用模型蒸餾技術能夠幫助組織更好地管理 LLM 部署成本,同時釋放 本地設備上 LLM 推理 的潛力。

10. 提示工程(Prompt Engineering)

試驗
提示工程(Prompt Engineering)是指為生成式 AI 模型設計與優化提示詞(Prompt)的過程, 其目標是生成高質量、上下文相關(Context-aware)的響應。這一過程通常包括針對特定任務或應用場景,精心構建清晰、具體且上下文相關的提示,以實現模型輸出效果的最優化。隨著大語言模型能力的不斷提升,尤其是推理模型的出現,提示工程的實踐也必須隨之調整。根據我們在 AI 代碼生成方面的經驗,少樣本提示(few-shot prompting)在與推理模型協作時,可能不如簡單的零樣本提示(zero-shot prompting)表現出色。此外,被廣泛使用的 思維鏈(Chain-of-Thought,CoT)提示 技術也可能 降低 推理模型的表現――原因可能在于當前
推理模型通過強化學習已內置了 微調過的 CoT 機制 。
我們的實際經驗也得到了學術研究的印證,即“高級模型可能消除軟件工程領域對提示工程的依賴”。但在實際場景中,傳統提示工程技術仍然是減少模型幻覺(Hallucinations)并提升輸出質量的重要手段,特別是在考慮推理模型與普通 LLM 在響應時間和 Token 成本等因素存在顯著差異的前提下。在構建 自主代理應用(Agentic Applications)時, 我們建議根據實際需求策略性地選擇模型, 并持續迭代與優化提示模板及相應的工程方法。如何在性能、響應速度與Token成本之間找到最佳平衡,依然是充分發揮 LLM 效能的關鍵所在。

16. 從LLMs獲取結構化輸出

評估
從 LLMs 獲取結構化輸出 是指通過定義的結構模式來約束語言模型的響應。這可以通過指示通用模型以特定格式響應,或者通過微調模型使其“原生”輸出例如 JSON 的結構化數據來實現。OpenAI 現在支持結構化輸出,允許開發人員提供 JSON Schema、pydantic 或Zod對象來約束模型響應。 這種能力在函數調用、API交互和外部集成中尤其有價值,因為這些場景中格式的準確性和一致性至關重要。結構化輸出不僅提升了 LLMs 與代碼交互的方式,還支持更廣泛的使用場景,例如生成用于呈現圖表的標記語言。此外,結構化輸出已被證明可以減少模型輸出中的幻覺現象。

平臺

(未完待續)

工具

語言和框架

原文連接:
https://www.thoughtworks.com/content/dam/thoughtworks/documents/radar/2025/04/tr_technology_radar_vol_32_cn.pdf

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/77908.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/77908.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/77908.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

數據結構與算法-順序表應用

一.通訊錄的創建 首先我們要理解的是通訊錄本身就是以順序表為底層的 只不過順序表中的數組,這里我們是用結構體來替代,用來存儲用戶的信息 由于是通訊錄的本質就是順序表,所以順序表的任何方法它都能套用 Contact.h: #pragma once #def…

【C++】新手入門指南(下)

文章目錄 前言 一、引用 1.引用的概念和定義 2.引用的特性 3.引用的使用 4.const引用 5.指針和引用的關系 二、內聯函數 三、nullptr 總結 前言 這篇續上篇的內容新手入門指南(上),繼續帶大家學習新知識。如果你感興趣歡迎訂購本專欄。 一、…

uniapp-商城-33-shop 布局搜索頁面以及u-search

shop頁面上有一個搜索&#xff0c;可以進行商品搜索&#xff0c;這里我們先做一個頁面布局&#xff0c;后面再來進行數據i聯動。 1、shop頁面的搜索 2、搜索的頁面代碼 <navigator class"searchView" url"/pagesub/pageshop/search/search"> …

SAP 采購訂單如何防止開票數量 大于 收貨數量呢

配置點如下&#xff1a; 事務碼&#xff1a;OMRM&#xff0c;配置如下 當過賬開票的數量 大于收貨數量的時候會提示如下&#xff1a;

Kotlin 的 suspend 關鍵字

更多相關知識 Kotlin 的 suspend 關鍵字是 Kotlin 協程的核心組成部分&#xff0c;它用于標記一個函數可以被掛起&#xff08;暫停執行&#xff09;并在稍后恢復執行&#xff0c;而不會阻塞線程。 理解 suspend 的作用需要從以下幾個方面入手&#xff1a; 1. 允許非阻塞的異步…

UDS診斷協議iso-14229 15765

Diagnostic request 形式多種: 1.SID+DID 2.SID+Sub-Func+DID 3.SID+Sub-Func SID占1個Byte,Sub-func占一個Byte,DID通常兩個Byte eg.10 01 (SID+Sub-Func) 10 03 05 02 (SID+Sub-Func+DID) 22 02 00 (SID+DID) 肯定響應抑制位 抑制正響應信息除非是收到NRC 0x78的情況下 不…

記錄一次使用面向對象的C語言封裝步進電機驅動

簡介 (2025/4/21) 本庫對目前僅針對TB6600驅動下的42步進電機的基礎功能進行了一定的封裝, 也是我初次嘗試以面向對象的思想去編寫嵌入式代碼, 和直流電機的驅動步驟相似在調用stepmotor_attach()函數和stepmotor_init()函數之后僅通過結構體數組stepm然后指定枚舉變量中的id即…

[創業之路-376]:企業法務 - 創業,不同的企業形態,個人承擔的風險、收益、稅費、成本不同

在企業法務領域&#xff0c;創業時選擇不同的企業形態&#xff0c;個人在風險承擔、收益分配、稅費負擔及運營成本方面存在顯著差異。以下從個人獨資企業、合伙企業、有限責任公司、股份有限公司四種常見形態展開分析&#xff1a; 一、個人承擔的風險 個人獨資企業 風險類型&…

GNOME桌面隱藏回收站和分區

dconf-editor 搜索 trash&#xff0c;關閉 show-trash 搜索 volumes&#xff0c;關閉 show-volumns

準確--Tomcat更換證書

具體意思是&#xff1a; Starting Coyote HTTP/1.1 on http-8080: HTTP 連接器&#xff08;端口 8080&#xff09;啟動成功了。嚴重: Failed to load keystore type PKCS12 with path conf/jlksearch.fzsmk.cn.pfx due to failed to decrypt safe contents entry: javax.crypt…

禁止ubuntu自動更新

由于ubuntu server和desktop版本都默認 啟動了&#xff0c;自動更新內核的操作。這對于生 產環境來說是不友好的。容易導致億賽通 無法啟動 默認開啟了內核自動更新所以我們關閉自 動內核更新。 1.禁止更新執行 sudo apt-mark hold linux-image-generic linux-headers-generic…

vue3 + element-plus中el-drawer抽屜滾動條回到頂部

el-drawer抽屜滾動條回到頂部 <script setup lang"ts" name"PerformanceLogQuery"> import { ref, nextTick } from "vue"; ...... // 詳情 import { performanceLogQueryByIdService } from "/api/performanceLog"; const onD…

【重走C++學習之路】16、AVL樹

目錄 一、概念 二、AVL樹的模擬實現 2.1 AVL樹節點定義 2.2 AVL樹的基本結構 2.3 AVL樹的插入 1. 插入步驟 2. 調節平衡因子 3. 旋轉處理 4. 開始插入 2.4 AVL樹的查找 2.5 AVL樹的刪除 1. 刪除步驟 2. 調節平衡因子 3. 旋轉處理 4. 開始刪除 結語 一、概念 …

char32_t、char16_t、wchar_t 用于 c++ 語言里存儲 unicode 編碼的字符,給出它們的具體定義

&#xff08;1&#xff09; #include <iostream> #include <string>int main() { std::u16string s u"C11 引入 char16_t"; // 定義 UTF-16 字符串for (char16_t c : s) // 遍歷輸出每個 char16_t 的值std::cout << std::hex << (…

redis數據類型-基數統計HyperLogLog

redis數據類型-基數統計HyperLogLog 文檔 redis單機安裝redis常用的五種數據類型redis數據類型-位圖bitmap 說明 官網操作命令指南頁面&#xff1a;https://redis.io/docs/latest/commands/?nameget&groupstringHyperLogLog介紹頁面&#xff1a;https://redis.io/docs…

邏輯思維:從混沌到秩序的理性推演在軟件開發中的應用

引言 在軟件開發的過程中&#xff0c;邏輯思維就像是開發者的“GPS導航”&#xff0c;幫助我們從混沌的需求中找到清晰的解決方案。想象一下&#xff0c;如果沒有邏輯思維&#xff0c;我們可能會在需求的海洋中迷失方向&#xff0c;最終寫出一堆“看似聰明但毫無意義”的代碼。…

Spring AI Alibaba Graph基于 ReAct Agent 的天氣預報查詢系統

1、在本示例中&#xff0c;我們僅為 Agent 綁定了一個天氣查詢服務&#xff0c;接收到用戶的天氣查詢服務后&#xff0c;流程會在 AgentNode 和 ToolNode 之間循環執行&#xff0c;直到完成用戶指令。示例中判斷指令完成的條件&#xff08;即 ReAct 結束條件&#xff09;也很簡…

HCIP(綜合實驗2)

1.實驗拓補圖 2.實驗要求 1.根據提供材料劃分VLAN以及IP地址&#xff0c;PC1/PC2屬于生產一部員工劃分VLAN10,PC3屬于生產二部劃分VLAN20 2.HJ-1HJ-2交換機需要配置鏈路聚合以保證業務數據訪問的高帶寬需求 3.VLAN的放通遵循最小VLAN透傳原則 4.配置MSTP生成樹解決二層環路問題…

使用 rebase 輕松管理主干分支

前言 最近遇到一個技術團隊的 dev 環境分支錯亂&#xff0c;因為是多人合作大家各自提交信息&#xff0c;導致出現很多交叉合并記錄&#xff0c;讓對應 log 看起來非常混亂&#xff0c;難以閱讀。 舉例說明 假設我們有一個項目&#xff0c;最初develop分支有 3 個提交記錄&a…

使用openssl為localhost創建自簽名

文章目錄 自簽名生成命令安裝安裝證書瀏覽器證書管理器 自簽名 生成命令 使用openssl生成私鑰和證書。 openssl req -x509 -newkey rsa:4096 -nodes -days 365 -subj "/CNlocalhost" -addext "subjectAltNameDNS:localhost" -keyout cert.key -out cer…