nlp面試重點

nlp面試重點

bicheng/2025/7/26 0:00:04/文章來源:https://blog.csdn.net/qq_27638851/article/details/147187164

深度學習基本原理：梯度下降公式，將損失函數越來越小，最終預測值和實際值誤差比較小。

交叉熵：-p(x)logq(x)，p(x)是one-hot形式。如果不使用softmax計算交叉熵，是不行的。損失函數可能會非常大，或者預測的概率是[-0.1,0.3,0.5],log不接收負值。pytorch默認給你加softmax。

如果softmax改成sigmoid也不行，如sigmoid過完以后，[0.9,0.99,0.99]，計算以后0.99的影響會被忽略，得到的結果是不正確。

adam和sgd區別：adam會考慮之前的計算，自動調節學習率，在通過梯度平方控制學習率的調節，讓訓練可以比較平穩又可以加速。

transformer和rnn區別：長距離依賴問題，rnn越遠影響越弱。

調參經驗：batch_size,max_length,學習率增大batch_size應該怎么調整，加數據量，打亂數據順序。

訓練詞向量：將one-hot乘以一個矩陣進行訓練，cbow，skip-gram，共現矩陣，keans聚類。

語言模型：PPL評價語言模型，不能成句也可能PPL比較低，所以PPL評價不太好。

傳統方法和預訓練方法：

Transformer里的dk是hidden_size/ head_num,是實驗結果。

數據稀疏問題：標注更多數據，大模型生成更多數據，換模型，調整閾值，召回率換準確率。重新定義類別，減少類別，增加規則彌補。

文本匹配：表示型，直接計算，交互型，速度慢，更準確。文本向量化：文本和句子分別過一個模型，優化模型，使文本和句子相似，如果是句子和句子可以用相同模型，最后得到的參數作為向量數據庫。表示型：一個句子直接向量化，交互型：必須進入兩個句子算得分。

向量數據庫查找：KD樹。

序列標注：crf會用維特比解碼，bean search在大模型里使用，n * D *B,復雜度小很多

ner：加標點任務。

序列標注重復：多個模型，生成式任務，輸出兩個標記。

自回歸語言模型：下三角mask，預測下一個詞。

teacher-forcing，使用真實標簽預測，提高效率。

采樣策略：topk，topp，bean-size，temperature（大模型）。

bert變體：albert減少參數，roberta（動態mask，去掉nsp任務）

stf用于大模型問答，相當于encoder-decoder，bert是encoder，通過mask可以實現decoder自回歸語言模型（文本生成）。

旋轉位置編碼：解決詞嵌入位置編碼長度外推性，找到映射f，滿足

< f_q(x_m,m),? f_k(x_n,n)> = g(x_m, x_n, m - n)。初始條件m = 0, f(q,0) = q。

https://zhuanlan.zhihu.com/p/580739696

?qm(1),qm(2)是原來的Wq和xm相乘的局部結果，即xm.dot(Wq)

余弦值位置編碼中:固定i，則pos的改變會使位置編碼有周期性，固定pos修改i，則一開始周期較小，容易捕捉相鄰字的差別，隨著i變大，周期越來越長

moe專家模型（一個MLP層就是一個專家），deepseek使用共享專家。deepseek在qkv計算的過程中，q和k拆成兩部分，其中一部分注入rope位置信息，另一部分不處理。減少運算量。

bbpe：解決多語種，不用統計詞，既不是中文詞表也不是英文詞表，具有跨語種的優點。bpe是基于字符，bbpe是轉化為unicode編碼，然后合并，是基于字節的。

知識圖譜：方法一是基于模板+文本匹配，類似于faq庫問答，相似度可以用bm25，jaccard距離，或者余弦距離。方法二：拆解成多個分類或抽取問題處理。方法三：利用大語言LLM的生成能力

推薦系統：基于相似用戶、相似物品的推薦。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/76813.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/76813.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/76813.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Leetcode：二叉樹

Leetcode：二叉樹

94. 二叉樹的中序遍歷 class Solution {public List<Integer> inorderTraversal(TreeNode root) {TreeNode cur root;Stack<TreeNode> stack new Stack<>();List<Integer> list new ArrayList<>();while (!stack.isEmpty() || cur ! null) {…

閱讀更多...

SQL：Constraint（約束）

SQL：Constraint（約束）

目錄 🎯 什么是 Constraint？ MySQL 中常見的約束類型： 1. PRIMARY KEY 2. FOREIGN KEY 3. UNIQUE 4. NOT NULL 5. DEFAULT 6. CHECK（MySQL 8.0） 7. AUTO_INCREMENT 🎯 什么是 Constraint&#xf…

閱讀更多...

數據庫數據恢復——sql server數據庫被加密怎么恢復數據？

數據庫數據恢復——sql server數據庫被加密怎么恢復數據？

SQL server數據庫數據故障： SQL server數據庫被加密，無法使用。數據庫MDF、LDF、log日志文件名字被篡改。數據庫備份被加密，文件名字被篡改。 SQL server數據庫數據恢復過程： 1、將所有數據庫做完整只讀備份。后續所有數據恢…

閱讀更多...

MySQL 用 limit 影響性能的優化方案

MySQL 用 limit 影響性能的優化方案

一.使用索引覆蓋掃描如果我們只需要查詢部分字段，而不是所有字段，我們可以嘗試使用索引覆蓋掃描，也就是讓查詢所需的所有字段都在索引中，這樣就不需要再訪問數據頁，減少了隨機 I/O 操作。例如，如果我們…

閱讀更多...

【算法筆記】并查集詳解

【算法筆記】并查集詳解

🚀 并查集（Union-Find）詳解：原理、實現與優化并查集（Union-Find）是一種非常高效的數據結構，用于處理動態連通性問題，即判斷若干個元素是否屬于同一個集合，并支持集合合…

閱讀更多...

鴻蒙HarmonyOS埋點SDK，ClkLog適配鴻蒙埋點分析

鴻蒙HarmonyOS埋點SDK，ClkLog適配鴻蒙埋點分析

ClkLog埋點分析系統，是一種全新的、開源的洞察方案，它能夠幫助您捕捉每一個關鍵數據點，確保您的決策基于最準確的用戶行為分析。技術人員可快速搭建私有的分析系統。 ClkLog鴻蒙埋點SDK通過手動埋點的方式實現HarmonyOS 原生應用的前端數據采…

閱讀更多...

JMeter的關聯

JMeter的關聯

關聯：上一個請求的響應結果和下一個請求的數據有關系 xpath提取器適用場景 HTML/XML文檔結構化數據： 適用于從HTML或XML文檔中提取結構化數據。例如，提取表格中的數據、列表中的項目等。示例：從HTML表格中提取所有行數據。 …

閱讀更多...

Spring Security 權限配置詳解

Spring Security 權限配置詳解

🌟Spring Security 權限配置詳解：從基礎到進階 Spring Security 是一個功能強大、可高度自定義的安全框架，主要用于為基于 Spring 的應用程序提供身份驗證和授權功能。本篇文章將帶你深入理解 Spring Security 的權限配置機制，掌…

閱讀更多...

pycharm中安裝Charm-Crypto

pycharm中安裝Charm-Crypto

一、安裝依賴 1、安裝gcc、make、perl sudo apt-get install gcc sudo apt-get install make sudo apt-get install perl #檢查版本 gcc -v make -v perl -v 2、安裝依賴庫m4、flex、bison（如果前面安裝過pypbc的話，應該已經裝過這些包了） sudo apt-get update sudo apt…

閱讀更多...

【MCAL】AUTOSAR架構下基于SPI通信的驅動模塊詳解-以TJA1145為例

【MCAL】AUTOSAR架構下基于SPI通信的驅動模塊詳解-以TJA1145為例

目錄前言正文 1.TJA1145驅動代碼中的SPI協議設計 1.1 對SPI Driver的依賴 1.2 對SPI配置的依賴 1.2.1 SpiExternalDevice 1.2.2 Channel_x 1.2.3 Job_x 1.2.4 Sequence N 1.2.5 Sequence M 1.2.6 Sequence L 1.2.7 小結 2.基于Vector驅動代碼的SPI配置 2.1 SPI引…

閱讀更多...

JavaScript:BOM編程

JavaScript:BOM編程

今天我要介紹的是JS中有關于BOM編程的知識點內容：BOM編程； 介紹：BOM全名（Browser Object Model（瀏覽器對象模型））。是瀏覽器提供的與瀏覽器窗口交互的接口，其核心對象是 window。與…

閱讀更多...

Memcached緩存系統：從部署到實戰應用指南

Memcached緩存系統：從部署到實戰應用指南

#作者：獵人文章目錄一、安裝libevent二、安裝配置memcached三、安裝Memcache的PHP擴展四、使用libmemcached的客戶端工具五、Nginx整合memcached:六、php將會話保存至memcached Memcached是一款開源、高性能、分布式內存對象緩存系統，可應用各種需要緩…

閱讀更多...

解決前后端時區不一致問題

解決前后端時區不一致問題

前后端時區不一致導致： 》數據不顯示在前端》頁面顯示時間有誤》一些對時間有要求的方法，無法正確執行，出現null值，加上我們對null值有判斷/注解，程序就會報錯中斷，以為是業務邏輯問題，其實…

閱讀更多...

35.Java線程池（線程池概述、線程池的架構、線程池的種類與創建、線程池的底層原理、線程池的工作流程、線程池的拒絕策略、自定義線程池）

35.Java線程池（線程池概述、線程池的架構、線程池的種類與創建、線程池的底層原理、線程池的工作流程、線程池的拒絕策略、自定義線程池）

一、線程池概述 1、線程池的優勢線程池是一種線程使用模式，線程過多會帶來調度開銷，進而影響緩存局部性和整體性能，而線程池維護著多個線程，等待著監督管理者分配可并發執行的任務，這避免了在處理短時間任務時創建與…

閱讀更多...

驅動開發硬核特訓 · Day 6 ：深入解析設備模型的數據流與匹配機制 —— 以 i.MX8M 與樹莓派為例的實戰對比

驅動開發硬核特訓 · Day 6 ：深入解析設備模型的數據流與匹配機制 —— 以 i.MX8M 與樹莓派為例的實戰對比

🔍 B站相應的視屏教程： 📌 內核：博文視頻 - 從靜態綁定驅動模型到現代設備模型主題：深入解析設備模型的數據流與匹配機制 —— 以 i.MX8M 與樹莓派為例的實戰對比在上一節中，我們從驅動框架的歷史演進出…

閱讀更多...

Blender安裝基礎使用教程

Blender安裝基礎使用教程

本博客記錄安裝Blender和基礎使用，可以按如下操作來繪制標靶場景、道路標識牌等。目錄 1.安裝Blender 2.創建面板資源步驟 1: 設置 Blender 場景步驟 2: 創建一個平面步驟 3: 將 PDF 轉換為圖像步驟 4-方法1: 添加材質并貼圖步驟4-方法2：創…

閱讀更多...

智能手機功耗測試

智能手機功耗測試

隨著智能手機發展，用戶體驗對手機的續航功耗要求越來越高。需要對手機進行功耗測試及分解優化，將手機的性能與功耗平衡。低功耗技術推動了手機的用戶體驗。手機功耗測試可以采用powermonitor或者NI儀表在功耗版上進行測試與優化。作為一個多功能的智能終端，手機的功耗組成極…

閱讀更多...

從代碼學習深度學習 - 多頭注意力 PyTorch 版

從代碼學習深度學習 - 多頭注意力 PyTorch 版

文章目錄前言一、多頭注意力機制介紹1.1 工作原理1.2 優勢1.3 代碼實現概述二、代碼解析2.1 導入依賴序列掩碼函數2.2 掩碼 Softmax 函數2.3 縮放點積注意力2.4 張量轉換函數2.5 多頭注意力模塊2.6 測試代碼總結前言在深度學習領域，注意力機制（Attention Mechanism）是自然…

閱讀更多...

學術版 GPT 網頁

學術版 GPT 網頁

學術版 GPT 網頁 1. 學術版 GPT 網頁非盈利版References https://academic.chatwithpaper.org/ 1. 學術版 GPT 網頁非盈利版 arXiv 全文翻譯，免費且無需登錄。更換模型 System prompt: Serve me as a writing and programming assistant. 界面外觀 References …

閱讀更多...

MarkDown 輸出表格的方法

MarkDown 輸出表格的方法

MarkDown用來輸出表格很簡單，比Word手搓表格簡單多了，而且方便修改。 MarkDown代碼： |A|B|C|D| |:-|-:|:-:|-| |1|b|c|d| |2|b|c|d| |3|b|c|d| |4|b|c|d| |5|b|c|d|顯示效果： ABCD1bcd2bcd3bcd4bcd5bcd A列強制左對齊&#xf…

閱讀更多...

最新文章