視覺語言導航(7)——VLN的數據集和評估方法 3.2

這是課上做的筆記,因此很多記得比較急,之后會逐步完善,每節課的邏輯流程寫在大綱部分。


成功率(SR)

導航誤差(NE)

成功加權路徑長度(SucceedPLength)

軌跡長度(TL)

先知成功率(OS)

評估環境

1. SEEN VS. UNSEEN ENVIRONMENTS

SEEN ENVIRONMENTS
  • 定義:這些是用于訓練和驗證的場景。
  • 目的:確保模型在熟悉的數據上能夠很好地擬合和表現。
  • 特點:模型在訓練過程中已經見過這些環境,因此對它們有較好的理解和預測能力。
UNSEEN ENVIRONMENTS
  • 定義:這些是模型在訓練中從未見過的場景,用于評估其泛化能力。
  • 目的:檢驗模型是否能夠在未見過的新環境中保持良好的性能,這反映了模型的真實應用潛力。
  • 特點:由于模型沒有見過這些環境,因此可以更真實地反映其在實際應用中的表現。

2. TEST ENVIRONMENTS

  • 定義:與UNSEEN ENVIRONMENTS類似,同樣是完全未見過的環境,但它是最終的、最權威的評測標準。
  • 目的:為了保證公平性和客觀性,測試集的正確答案(路徑)通常是不公開的,以防止研究者通過逆向工程等方式獲取優勢。
  • 流程
    • 研究者需要將訓練好的模型提交到官方的評測服務器上。
    • 由服務器來計算并返回最終成績,這樣可以確保評估過程的公正性和準確性。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/93747.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/93747.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/93747.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ElasticSearch不同環境同步索引數據

目的:在生產環境把一個索引的數據同步到測試環境中1、在生產環境導出json數據curl -u "adims_user:xkR%cHwR5I9g" -X GET "http://172.18.251.132:9200/unify_info_mb_sp_aggregatetb_0004/_search?scroll1m" -H Content-Type: applicatio…

咨詢進階——解讀咨詢顧問技能模型

適應人群為咨詢行業從業者、咨詢團隊管理者、想提升咨詢技能的職場人士及咨詢公司培訓人員。主要內容圍繞咨詢顧問技能模型展開,核心包括五大核心能力(解決問題能力,涵蓋洞察力、分析技巧、問題構建等,從識別問題實質到構建新分析方法分層次闡述;管理能力,涉及管理他人與…

2025年- H98-Lc206--51.N皇后(回溯)--Java版

1.題目描述2.思路 二維數組集合 (1)N皇后規則 1)不能同行(同一行不能出現2個皇后) 2)不能同列(同一列不能出現2個皇后) 3)不能說45度或135度(斜對角線不能出現2個皇后&am…

5G + AI + 云:電信技術重塑游戲生態與未來體驗

在數字娛樂蓬勃發展的今天,游戲產業已然成為科技創新的前沿陣地。電信網絡也經歷了一場深刻的蛻變,從最初僅僅是 “內容傳輸管道”,搖身一變成為與游戲深度綁定的技術共生體。5G 不斷刷新著體驗的邊界,AI 徹底顛覆傳統的創作模式&…

【React Hooks】封裝的藝術:如何編寫高質量的 React 自-定義 Hooks

【React Hooks】封裝的藝術:如何編寫高質量的 React 自-定義 Hooks 所屬專欄: 《前端小技巧集合:讓你的代碼更優雅高效》 上一篇: 【React State】告別 useState 濫用:何時應該選擇 useReducer 作者: 碼力…

華為GaussDB的前世今生:國產數據庫崛起之路

在數據庫領域,華為GaussDB已成為一顆耀眼的明星,為企業核心業務數字化轉型提供堅實的數據底座。但這并非一蹴而就,其背后是長達二十余年的技術沉淀、戰略投入與持續創新。本文將深入探尋華為GaussDB的歷史沿革與核心技術細節,展現…

數據結構初階(16)排序算法——歸并排序

2.4 歸并排序 歸并排序(Merge Sort)是基于分治思想的經典排序算法。核心邏輯: 分而治之——把復雜排序問題拆分成簡單子問題解決,再合并子問題的結果。聯系鏈表的合并:兩個有序鏈表l1、l2創建新鏈表l3(帶頭…

MATLAB實現匈牙利算法求解二分圖最大匹配

MATLAB實現匈牙利算法求解二分圖最大匹配 匈牙利算法(也稱為Kuhn-Munkres算法)是解決二分圖最大匹配問題的經典算法。 代碼 function [matching, max_match] hungarian_algorithm(adjMatrix)% HUNGARIAN_ALGORITHM 實現匈牙利算法求解二分圖最大匹配% 輸…

自定義table

更好<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"utf-8"><title>數據表格</title><style>* {margin: 0;padding: 0;box-sizing: border-box;font-size: 14px;}html,body {width: 100%;height: 100%…

面向R語言用戶的Highcharts

如果您喜歡使用 R 進行數據科學創建交互式數據可視化&#xff0c;那么請你收藏。今天&#xff0c;我們將使用折線圖、柱狀圖和散點圖來可視化資產回報。對于我們的數據&#xff0c;我們將使用以下 5 只 ETF 的 5 年月回報率。 SPY (S&P500 fund)EFA (a non-US equities fun…

【測試工具】OnDo SIP Server--輕松搭建一個語音通話服務器

前言 Ondo SIP Server 是一款基于 SIP(Session Initiation Protocol)協議的服務器軟件&#xff0c;主要用于實現 VoIP(Voice over IP)通信&#xff0c;支持語音通話、視頻會議等多媒體會話管理&#xff0c;非常適合學習和測試VoIP的基本功能。本文介紹Ondo SIP Server的安裝、…

瘋狂星期四文案網第42天運營日記

網站運營第42天&#xff0c;點擊觀站&#xff1a; 瘋狂星期四 crazy-thursday.com 全網最全的瘋狂星期四文案網站 運營報告 今日訪問量 今日搜索引擎收錄情況 網站優化點 優化一些發現的seo錯誤 增加顏文字欄目 增加了一些tag

使用空模型實例調用輔助函數,確定在量化過程中哪些層會被跳過(43)

在Facebook的OPT-350M中,模型的頭部(lm_head)與解碼器的嵌入標記層(decoder.embed_tokens)共享其權重。 print(model.model.decoder.embed_tokens) print(model.lm_head)輸出結果 Embedding(50272, 512

從0-1使用Fastmcp開發一個MCP服務,并部署到阿里云百煉 -持續更新中

目的&#xff1a; 在本地使用fastmcp開發一個mcp,然后注冊到阿里云的百煉里面。實現在百煉里面創建智能體的時候直接引用自己開發的MCP 已完成&#xff1a;本地環境安裝 待完成&#xff1a; 1.根據需求實現一個MCP中可以調用某應用的多個API即 mcp.tool()、mcp.prompt()、接入大…

設計模式之匯總

設計模式 零、設計原則 0.1 單一職責 0.2 接口隔離 0.3 開閉原則 0.4 依賴倒置0.5 迪米特法則&#xff0c;最小知道原則用戶關機 只和朋友通信 朋友條件&#xff1a; 1&#xff09;當前對象本身&#xff08;this&#xff09; 2&#xff09;以參量形式傳入到當前對象方法中的對象…

第6章 Decoder與Encoder核心組件

前言 Netty從底層Java通道讀取ByteBuf二進制數據&#xff0c;傳入Netty通道的流水線&#xff0c;隨后開始入站處理。在入站處理過程中&#xff0c;需要將ByteBuf二進制類型解碼成Java POJO對象。這個解碼過程可以通過Netty的Decoder&#xff08;解碼器&#xff09;去完成。 在…

[已解決]當啟動 Spring Boot 應用時出現 Using generated security password xxx提示

當啟動 Spring Boot 應用時出現 Using generated security password xxx提示當啟動 Spring Boot 應用時出現 Using generated security password xxx提示&#xff0c;這是 Spring Security 自動配置的默認行為&#xff0c;通常發生在你??未自定義安全配置??但引入了 Spring…

自動分析需求,PRD 生成只需 SOLO 一步!

資料來源&#xff1a;火山引擎-開發者社區 寫不清需求&#xff1f;PRD 難產&#xff1f;開發總跑偏&#xff1f;這些痛點&#xff0c;SOLO 來解決。 TRAE SOLO 是行業首個 Context Engineer。它不止協助編碼&#xff0c;更能基于精準上下文理解和工具調用&#xff0c;從構思、…

物聯網軟件開發過程中,數據流圖(DFD),用例圖,類圖,活動圖,序列圖,狀態圖,實體關系圖(ERD),BPMN(業務流程建模)詳解分析

概述軟件開發過程中&#xff0c;特別是在物聯網&#xff08;IoT&#xff09;場景中&#xff0c;數據流圖&#xff08;DFD&#xff09;、UML圖&#xff08;包括用例圖、類圖、活動圖、序列圖、狀態圖&#xff09;、實體關系圖&#xff08;ERD&#xff09;和業務流程建模&#xf…

Mac(一)常用的快捷鍵整理

目錄1、系統操作與窗口管理2、應用與窗口切換3、常規編輯操作4、文本導航與光標控制??5、文本格式與文檔功能&#xff08;支持應用中&#xff09;6、截圖快捷鍵7、Safari 瀏覽器快捷鍵8、Finder 快捷鍵&#xff08;文件管理&#xff09;9、Fn / Globe 功能鍵&#xff08;部分…