Bert預訓練任務-MLM/NSP

Bert預訓練任務-MLM/NSP

news/2025/9/16 20:36:40/文章來源:https://blog.csdn.net/u012994320/article/details/148134330

MLM

????????MLM:Masked Language Mode:在每一個訓練序列中以15%的概率隨機地選中某個token進行MASK,當一個token被選中后，有以下三種處理方式：

80%的概率被[MASK]，如my dog is hairy->my dog is [MASK]
10%的概率修改為隨機的其他token,如my dog is hairy->my dog is apple
10%的概率修改為隨機的其他token,如my dog is hairy->my dog is hairy

? ? ? ? 然后再對該位置的MASK進行預測。以上的MLM任務讓BERT針對被MASK的token的上下文信息預測目標token。

NSP

? ? ? ? NSP:Next Sentence Prediction，對于每一個訓練樣例，進行如下操作。

50%的概率保持原有順序（標注為lsNext）
50%的概率后面的句子被替換為文檔的其他隨機句B(標注為NotNext)。接下來把訓練樣例輸入到BERT模型中，用[CLS]對應的信息去進行二分類。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/906588.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/906588.shtml
英文地址，請注明出處：http://en.pswp.cn/news/906588.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

瀏覽器原生 Web Crypto API 實現 SHA256 Hash 加密

瀏覽器原生 Web Crypto API 實現 SHA256 Hash 加密

寫在前面在我上一篇文章《node 后端和瀏覽器前端，有關 RSA 非對稱加密的完整實踐， 前后端匹配的代碼演示》中，我們使用瀏覽器原生 Web Crypto API 實現了 RSA 的加密算法。但是，在我之前的《我設計的一個安全的 web 系統用…

閱讀更多...

5G 網絡尋呼的信令及 IE 信息分析

5G 網絡尋呼的信令及 IE 信息分析

一、尋呼信令的觸發背景在 5G 網絡中，當網絡側有下行數據要發送給處于空閑態（RRC_IDLE）或非激活態（RRC_INACTIVE）的用戶設備（UE）時，就會觸發尋呼流程。這是因為在這些狀態下，UE 與網絡之間沒有建立持續的無線資源控制（RRC）連接，網絡需要通過尋呼機制來通知 UE 有…

閱讀更多...

印度語言指令驅動的無人機導航！UAV-VLN：端到端視覺語言導航助力無人機自主飛行

印度語言指令驅動的無人機導航！UAV-VLN：端到端視覺語言導航助力無人機自主飛行

作者：Pranav Saxena, Nishant Raghuvanshi and Neena Goveas單位：比爾拉理工學院（戈瓦校區）論文標題：UAV-VLN: End-to-End Vision Language guided Navigation for UAVs論文鏈接：https://arxiv.org/pdf/250…

閱讀更多...

基于Zynq SDK的LWIP UDP組播開發實戰指南

基于Zynq SDK的LWIP UDP組播開發實戰指南

一、為什么選擇LWIP組播？在工業控制、智能安防、物聯網等領域，一對多的高效數據傳輸需求日益增長。Zynq-7000系列SoC憑借其ARM+FPGA的獨特架構，結合LWIP輕量級網絡協議棧，成為嵌入式網絡開發的理想選擇。本文將帶您實現： LWIP組播配置全流程動態組播組切換技術零拷貝數據…

閱讀更多...

（三）MMA（KeyCloak身份服務器/OutBox Pattern）

（三）MMA（KeyCloak身份服務器/OutBox Pattern）

文章目錄項目地址一、KeyCloak二、OutBox Pattern2.1 配置Common模塊的OutBox1. OutboxMessage2. 數據庫配置OutboxMessageConfiguration3. 創建Save前的EF攔截器4. 創建Quartz后臺任務5. 配置后臺任務6. 注冊服務2.2 創建OutBox的消費者1. 自定義IDomainEventHandler2. 定義抽…

閱讀更多...

初步認識HarmonyOS NEXT端云一體化開發

初步認識HarmonyOS NEXT端云一體化開發

視頻課程學習報名入口：HarmonyOS NEXT端云一體化開發 1、課程設計理念本課程采用"四維能力成長模型"設計理念，通過“能看懂→能聽懂→能上手→能實戰”的漸進式學習路徑，幫助零基礎開發者實現從理論認知到商業級應用開發的跨越。該模型將學習過程劃分為四個維度…

閱讀更多...

Vue百日學習計劃Day43-45天詳細計劃-Gemini版

Vue百日學習計劃Day43-45天詳細計劃-Gemini版

Day 43: Composable 函數基礎與抽取簡單邏輯 (~3 小時) 本日目標: 理解 Composable 函數的概念、優勢，并學會如何將簡單的、無狀態的邏輯抽取為 Composable。所需資源: Vue 3 官方文檔 (組合式函數): https://cn.vuejs.org/guide/reusability/composables.html 學…

閱讀更多...

C++：list容器，deque容器

C++：list容器，deque容器

list容器：雙向鏈表容器，底層是雙向鏈表。簡單使用如下： #include<iostream> #include<list> using namespace std;int main() {list<int> lst;lst.push_back(1);lst.push_back(2);lst.push_back(3);lst.push_front(4);l…

閱讀更多...

STM32之溫濕度傳感器(DHT11)

STM32之溫濕度傳感器(DHT11)

KEIL軟件實現printf格式化輸出一般在標準C庫是提供了格式化輸出和格式化輸入等函數，用戶想要使用該接口，則需要包含頭文件 #include ，由于printf函數以及scanf函數是向標準輸出以及標準輸入中進行輸出與輸入，標準輸出一般指的是…

閱讀更多...

【蒼穹外賣】Day01—Mac前端環境搭建

【蒼穹外賣】Day01—Mac前端環境搭建

目錄一、安裝Nginx （一）安裝Homebrew （二）Homebrew安裝Nginx 1. 執行安裝命令： 2. 驗證安裝： （三）啟動與停止Nginx 二、配置Nginx 1. 替換nginx.conf 2. 替換html文件夾三…

閱讀更多...

docker面試題（3）

docker面試題（3）

如何臨時退出一個正在交互的容器的終端，而不終止它按ctrlp，后按ctrlq ，如果按ctrlc會使容器內的應用進程終止，進而會使容器終止很多應用容器都默認是后臺運行的，怎么查看它們輸出的日志信息使用docker logs &#…

閱讀更多...

單片機設計_四軸飛行器（STM32）

單片機設計_四軸飛行器（STM32）

四軸飛行器（STM32） 想要更多項目私wo!!! 一、系統簡介四軸飛行器是一種通過四個旋翼產生的升力實現飛行的無人機，其核心控制原理基于歐拉角動力學模型。四軸飛行器通過改變四個電機的轉速來實現六自由度控制（前后、左右、上下…

閱讀更多...

Vue 3 與 Vue 2 的區別詳解

Vue 3 與 Vue 2 的區別詳解

Vue 3 在性能、語法、響應式、類型系統等方面相比 Vue 2 做了大幅優化和改進。本篇將從多個維度詳細對比 Vue 3 與 Vue 2 的核心區別。 📌 核心對比表格對比維度Vue 2Vue 3說明核心 API 模式Options APIComposition API（兼容 Options）Vue 3…

閱讀更多...

深入理解 Redisson 看門狗機制：保障分布式鎖自動續期

深入理解 Redisson 看門狗機制：保障分布式鎖自動續期

在分布式系統的開發中，分布式鎖是解決資源競爭、數據一致性問題的關鍵手段。Redisson 作為一個在 Java 領域廣泛使用的 Redis 客戶端框架，為我們提供了功能強大且易用的分布式鎖實現。其中，看門狗（watchDog）機制更是 R…

閱讀更多...

配置gem5環境：Dockerfile使用

配置gem5環境：Dockerfile使用

下載ZIP文件到dockerfile所在目錄下： 運行以下命令注意不要忘記最后的標點 . docker build -t gem5bootcamp .在 Dockerfile 所在目錄下執行 docker build 時，Docker 會按照 Dockerfile 中的指令，自動下載和構建所需的一切。不過這過程里…

閱讀更多...

角度回歸——八參數檢測四邊形Gliding Vertex

角度回歸——八參數檢測四邊形Gliding Vertex

文章目錄一、介紹（一）五參數檢測方法（ 基于角度）（二）八參數檢測方法（point-based）的邊界二、方案分析（一）問題定義（二）方案&#xf…

閱讀更多...

鴻蒙系統電腦：開啟智能辦公新時代

鴻蒙系統電腦：開啟智能辦公新時代

鴻蒙系統電腦：開啟智能辦公新時代引言 2025 年 5 月 8 日，華為正式推出了鴻蒙系統電腦，這款具有里程碑意義的產品，不僅彰顯了華為在智能設備領域的創新實力，也為用戶帶來了全新的智能辦公體驗。在數字化轉型加速的背…

閱讀更多...

計量單片機 RN8302：特性、使用與應用

計量單片機 RN8302：特性、使用與應用

在現代電力監測與能源管理領域，精確的電能計量至關重要。計量單片機 RN8302 作為一款高性能的電能計量芯片，憑借其卓越的特性與功能，在眾多應用場景中發揮著關鍵作用。本文將全面深入地介紹 RN8302 的各項特性、使用方法、注意事項以及廣泛的…

閱讀更多...

Flink 的窗口機制

Flink 的窗口機制

🪟 1. 基于時間驅動的滾動時間窗口（Tumbling Time Window - Time-based） ? 定義： 每隔固定的時間周期開啟一個新的窗口。窗口之間不重疊。 🕒 示例： DataStream<Tuple2<String, Integer>>…

閱讀更多...

【RA-Eco-RA2L1-48PIN】ADC 電壓表與OLED顯示

【RA-Eco-RA2L1-48PIN】ADC 電壓表與OLED顯示

【RA-Eco-RA2L1-48PIN】ADC 電壓表與OLED顯示本文介紹了 RA-Eco-RA2L1-48PIN 開發板通過瑞薩 e2 Studio 靈活軟件包（FSP）編程實現 ADC 串口采集電壓和OLED顯示電壓數值的項目設計，包括串口電壓值串口打印、硬件 IIC 通信協議配置、 OLED顯示…

閱讀更多...

最新文章