面試相關的知識點

1 vllm

1.1常用概念

1 vllm:是一種大模型推理的框架,使用了張量并行原理,把大型矩陣分割成低秩矩陣,分散到不同的GPU上運行。

2 模型推理與訓練:模型訓練是指利用pytorch進行對大模型進行預訓練。

模型推理是指用訓練好的模型對新的輸入生成輸出的過程

3 大模型一般的訓練過程:1 先對大模型進行無監督預訓練。2 對模型進行微調

4 張量:向量到二維矩陣、三維矩陣等。

2 lora和qlora的原理

1 lora 又名low rank adaptation,低秩矩陣自適應。特別適用于微調大規模語言預訓練模型。

2 優勢:直接對大規模語言模型進行全參數微調(full finetuning)計算量非常大。lora通過引入兩個低秩矩陣。具體來說是把非常大的權重矩陣,化為兩個維度低的矩陣

3 function call和ReAct

1 function call:模型主動調用在外部工具或者api的能力

2 ReAct:

4 agent

1 agent是什么

4 deepseek模型訓練步驟

第一步,進行大規模無監督預訓練學習。目的是讓模型學會語言的基本結構與模式

第二步,使用質量冷啟動數據(cot數據)對模型進行有監督微調。獲得基本的格式遵循和反思驗證能力

第三步,強化學習

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/906507.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/906507.shtml
英文地址,請注明出處:http://en.pswp.cn/news/906507.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

node.js如何實現雙 Token + Cookie 存儲 + 無感刷新機制

node.js如何實現雙 Token Cookie 存儲 無感刷新機制 為什么要實施雙token機制? 優點描述安全性Access Token 短期有效,降低泄露風險;Refresh Token 權限受限,僅用于獲取新 Token用戶體驗用戶無需頻繁重新登錄,Toke…

MySQL——6、內置函數

內置函數 1、日期函數2、字符串函數3、數學函數4、其他函數 1、日期函數 1.1、獲取當前日期: 1.2、獲取當前時間: 1.3、獲取當前時間戳: 1.4、獲取當前日期時間: 1.5、提取出日期: 1.6、給日期添加天數或時間…

【Linux】Shell腳本中向文件中寫日志,以及日志文件大小、數量管理

1、寫日志 shell腳本中使用echo命令,將字符串輸入到文件中 覆蓋寫入:echo “Hello, World!” > laoer.log ,如果文件不存在,則會創建文件追加寫入:echo “Hello, World!” >> laoer.log轉移字符:echo -e “Name:\tlaoer\nAge:\t18” > laoer.log,\t制表符 …

深度學習中ONNX格式的模型文件

一、模型部署的核心步驟 模型部署的完整流程通常分為以下階段,用 “跨國旅行” 類比: 步驟類比解釋技術細節1. 訓練模型學會一門語言(如中文)用 PyTorch/TensorFlow 訓練模型2. 導出為 ONNX翻譯成國際通用語言(如英語…

基于兩階段交互控制框架的互聯多能系統協同自治優化

摘要:從多能源集成系統的效益出發,建立了基于交互控制的雙層兩階段框架,以實現互聯多能源系統(MESs)間的最優能量供應。在下層,各MES通過求解成本最小化問題自主確定其可控資產的最優設定值,其中滾動時域優化用于處理負…

matlab編寫的BM3D圖像去噪方法

BM3D(Block-Matching and 3D Filtering)是一種基于塊匹配和三維濾波的圖像去噪方法,廣泛應用于圖像處理領域。它通過在圖像中尋找相似的塊,并將這些塊堆疊成三維數組進行濾波處理,從而有效地去除噪聲,同時保…

前端(小程序)學習筆記(CLASS 1):組件

1、小程序中組件的分類 小程序中的組件也是由宿主環境提供的,開發者可以基于組件快速搭建出漂亮的頁面結構。官方把小程序的組件分為了9大類,分別是: * 視圖容器,* 基礎內容,* 表單組件,* 導航組件 媒體…

基于亞馬遜云科技構建音視頻直播審核方案

1. 前言 隨著互聯網內容形態的多樣化發展,用戶生成內容(UGC)呈現爆發式增長。社交平臺、直播、短視頻、語聊房等應用場景中,海量的音視頻內容需要進行實時審核,以維護平臺安全與用戶體驗。 然而,企業在構…

linux基礎操作11------(運行級別)

一.前言 這個是linux最后一章節內容,主要還是介紹一下,這個就和安全有關系了,內容還是很多的,但是呢,大家還是做個了解就好了。 二.權限掩碼 運行級別 0 關機 運行級別 1 單用戶 ,這個類似于windows安全…

QT+Visual Studio 配置開發環境教程

一、QT架構 Qt Creator 是一個輕量級、跨平臺的 IDE,專為 Qt 開發量身打造,內置對 qmake/CMake 的深度支持、Kits 配置管理、原生 QML 調試器以及較低的資源占用維基百科。 而在 Windows 環境下,Visual Studio 配合 Qt VS Tools 擴展則可將 Q…

(2)JVM 內存模型更新與 G1 垃圾收集器優化

JVM 內存模型更新與 G1 垃圾收集器優化 🚀 掌握前沿技術,成為頂尖 Java 工程師 2?? JVM 內存模型更新 👉 點擊展開題目 JVM內存模型在Java 17中有哪些重要更新?如何優化G1垃圾收集器在容器化環境的表現? &#x1…

TASK04【Datawhale 組隊學習】構建RAG應用

目錄 將LLM接入LangChain構建檢索問答鏈運行成功圖遇到的問題 langchain可以便捷地調用大模型,并將其結合在以langchain為基礎框架搭建的個人應用中。 將LLM接入LangChain from langchain_openai import ChatOpenAI實例化一個 ChatOpenAI 類,實例化時傳入超參數來…

springAI調用deepseek模型使用硅基流動api的配置信息

查看springai的官方文檔,調用deepseek的格式如下: spring.ai.deepseek.api-key${your-api-key} spring.ai.deepseek.chat.options.modeldeepseek-chat spring.ai.deepseek.chat.options.temperature0.8 但是硅基流動的格式不是這樣,這個傘兵…

SpringMVC 通過ajax 實現文件的上傳

使用form表單在springmvc 項目中上傳文件,文件上傳成功之后往往會跳轉到其他的頁面。但是有的時候,文件上傳成功的同時,并不需要進行頁面的跳轉,可以通過ajax來實現文件的上傳 下面我們來看看如何來實現: 方式1&…

Docker安裝Fluentd采集中間件

Fluentd 簡介 :Fluentd 是一個高性能、可擴展的數據收集與聚合工具,能夠統一數據收集和消費,實現各種數據源到各種數據接收器的高效傳輸,廣泛應用于日志收集等領域。 功能特點 : 統一日志收集 :支持從各種…

07SpringMVC底層形象解析

目錄 一、基于餐廳比喻的代碼示例 ,幫助你理解各組件間的協作關系 1. DispatcherServlet 配置(服務員) 2. HandlerMapping 配置(菜單索引) 3. Controller 實現(廚師) 4. Service 層&#x…

eclipse 生成函數說明注釋

在Eclipse中生成函數說明注釋(JavaDoc風格)可以通過以下方法實現: 快捷鍵方式: 將光標放在函數上方輸入/**后按回車鍵Eclipse會自動生成包含參數和返回值的注釋模板 菜單方式: 選中函數點擊菜單欄 Source > Gen…

【題解-洛谷】P6180 [USACO15DEC] Breed Counting S

題目:P6180 [USACO15DEC] Breed Counting S 題目描述 Farmer John 的 N N N 頭奶牛,從左到右編號為 1 …

基于Android的XX校園交流APP

開發語言:Java框架:ssmAndroidJDK版本:JDK1.8服務器:tomcat7數據庫:mysql 5.7數據庫工具:Navicat12開發軟件:eclipse/myeclipse/ideaMaven包:Maven3.3.9 系統展示 APP登錄 APP首頁…

25、工業防火墻 - 工控網絡保護 (模擬) - /安全與維護組件/industrial-firewall-dcs-protection

76個工業組件庫示例匯總 工業防火墻 - 工控網絡保護 (模擬) 概述 這是一個交互式的 Web 組件,旨在模擬工業防火墻在保護關鍵工控網絡(特別是 DCS - 分布式控制系統)免受網絡攻擊(如勒索軟件傳播)方面的核心功能。組件通過可視化簡化的網絡拓撲、模擬網絡流量、應用防火…