視覺語言導航（7）——VLN的數據集和評估方法 3.2

視覺語言導航（7）——VLN的數據集和評估方法 3.2

bicheng/2025/8/19 11:04:05/文章來源:https://blog.csdn.net/2301_80226956/article/details/150279997

這是課上做的筆記，因此很多記得比較急，之后會逐步完善，每節課的邏輯流程寫在大綱部分。

成功率(SR)

導航誤差(NE)

成功加權路徑長度（SucceedPLength）

軌跡長度（TL）

先知成功率（OS）

評估環境

1. SEEN VS. UNSEEN ENVIRONMENTS

SEEN ENVIRONMENTS

定義：這些是用于訓練和驗證的場景。
目的：確保模型在熟悉的數據上能夠很好地擬合和表現。
特點：模型在訓練過程中已經見過這些環境，因此對它們有較好的理解和預測能力。

UNSEEN ENVIRONMENTS

定義：這些是模型在訓練中從未見過的場景，用于評估其泛化能力。
目的：檢驗模型是否能夠在未見過的新環境中保持良好的性能，這反映了模型的真實應用潛力。
特點：由于模型沒有見過這些環境，因此可以更真實地反映其在實際應用中的表現。

2. TEST ENVIRONMENTS

定義：與UNSEEN ENVIRONMENTS類似，同樣是完全未見過的環境，但它是最終的、最權威的評測標準。
目的：為了保證公平性和客觀性，測試集的正確答案（路徑）通常是不公開的，以防止研究者通過逆向工程等方式獲取優勢。
流程：
- 研究者需要將訓練好的模型提交到官方的評測服務器上。
- 由服務器來計算并返回最終成績，這樣可以確保評估過程的公正性和準確性。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/93747.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/93747.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/93747.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

ElasticSearch不同環境同步索引數據

ElasticSearch不同環境同步索引數據

目的：在生產環境把一個索引的數據同步到測試環境中1、在生產環境導出json數據curl -u "adims_user:xkR%cHwR5I9g" -X GET "http://172.18.251.132:9200/unify_info_mb_sp_aggregatetb_0004/_search?scroll1m" -H Content-Type: applicatio…

閱讀更多...

咨詢進階——解讀咨詢顧問技能模型

咨詢進階——解讀咨詢顧問技能模型

適應人群為咨詢行業從業者、咨詢團隊管理者、想提升咨詢技能的職場人士及咨詢公司培訓人員。主要內容圍繞咨詢顧問技能模型展開，核心包括五大核心能力（解決問題能力，涵蓋洞察力、分析技巧、問題構建等，從識別問題實質到構建新分析方法分層次闡述；管理能力，涉及管理他人與…

閱讀更多...

2025年- H98-Lc206--51.N皇后(回溯）--Java版

2025年- H98-Lc206--51.N皇后(回溯）--Java版

1.題目描述2.思路二維數組集合 (1）N皇后規則 1）不能同行（同一行不能出現2個皇后） 2）不能同列（同一列不能出現2個皇后） 3）不能說45度或135度（斜對角線不能出現2個皇后&am…

閱讀更多...

5G + AI + 云：電信技術重塑游戲生態與未來體驗

5G + AI + 云：電信技術重塑游戲生態與未來體驗

在數字娛樂蓬勃發展的今天，游戲產業已然成為科技創新的前沿陣地。電信網絡也經歷了一場深刻的蛻變，從最初僅僅是 “內容傳輸管道”，搖身一變成為與游戲深度綁定的技術共生體。5G 不斷刷新著體驗的邊界，AI 徹底顛覆傳統的創作模式&…

閱讀更多...

【React Hooks】封裝的藝術：如何編寫高質量的 React 自-定義 Hooks

【React Hooks】封裝的藝術：如何編寫高質量的 React 自-定義 Hooks

【React Hooks】封裝的藝術：如何編寫高質量的 React 自-定義 Hooks 所屬專欄： 《前端小技巧集合：讓你的代碼更優雅高效》上一篇： 【React State】告別 useState 濫用：何時應該選擇 useReducer 作者： 碼力…

閱讀更多...

華為GaussDB的前世今生：國產數據庫崛起之路

華為GaussDB的前世今生：國產數據庫崛起之路

在數據庫領域，華為GaussDB已成為一顆耀眼的明星，為企業核心業務數字化轉型提供堅實的數據底座。但這并非一蹴而就，其背后是長達二十余年的技術沉淀、戰略投入與持續創新。本文將深入探尋華為GaussDB的歷史沿革與核心技術細節，展現…

閱讀更多...

數據結構初階（16）排序算法——歸并排序

數據結構初階（16）排序算法——歸并排序

2.4 歸并排序歸并排序（Merge Sort）是基于分治思想的經典排序算法。核心邏輯： 分而治之——把復雜排序問題拆分成簡單子問題解決，再合并子問題的結果。聯系鏈表的合并：兩個有序鏈表l1、l2創建新鏈表l3（帶頭…

閱讀更多...

MATLAB實現匈牙利算法求解二分圖最大匹配

MATLAB實現匈牙利算法求解二分圖最大匹配

MATLAB實現匈牙利算法求解二分圖最大匹配匈牙利算法（也稱為Kuhn-Munkres算法）是解決二分圖最大匹配問題的經典算法。代碼 function [matching, max_match] hungarian_algorithm(adjMatrix)% HUNGARIAN_ALGORITHM 實現匈牙利算法求解二分圖最大匹配% 輸…

閱讀更多...

自定義table

自定義table

更好<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"utf-8"><title>數據表格</title><style>* {margin: 0;padding: 0;box-sizing: border-box;font-size: 14px;}html,body {width: 100%;height: 100%…

閱讀更多...

面向R語言用戶的Highcharts

面向R語言用戶的Highcharts

如果您喜歡使用 R 進行數據科學創建交互式數據可視化，那么請你收藏。今天，我們將使用折線圖、柱狀圖和散點圖來可視化資產回報。對于我們的數據，我們將使用以下 5 只 ETF 的 5 年月回報率。 SPY (S&P500 fund)EFA (a non-US equities fun…

閱讀更多...

【測試工具】OnDo SIP Server--輕松搭建一個語音通話服務器

【測試工具】OnDo SIP Server--輕松搭建一個語音通話服務器

前言 Ondo SIP Server 是一款基于 SIP(Session Initiation Protocol)協議的服務器軟件，主要用于實現 VoIP(Voice over IP)通信，支持語音通話、視頻會議等多媒體會話管理，非常適合學習和測試VoIP的基本功能。本文介紹Ondo SIP Server的安裝、…

閱讀更多...

瘋狂星期四文案網第42天運營日記

瘋狂星期四文案網第42天運營日記

網站運營第42天，點擊觀站： 瘋狂星期四 crazy-thursday.com 全網最全的瘋狂星期四文案網站運營報告今日訪問量今日搜索引擎收錄情況網站優化點優化一些發現的seo錯誤增加顏文字欄目增加了一些tag

閱讀更多...

使用空模型實例調用輔助函數，確定在量化過程中哪些層會被跳過（43）

使用空模型實例調用輔助函數，確定在量化過程中哪些層會被跳過（43）

在Facebook的OPT-350M中，模型的頭部（lm_head）與解碼器的嵌入標記層（decoder.embed_tokens）共享其權重。 print(model.model.decoder.embed_tokens) print(model.lm_head)輸出結果 Embedding(50272, 512

閱讀更多...

從0-1使用Fastmcp開發一個MCP服務，并部署到阿里云百煉 -持續更新中

從0-1使用Fastmcp開發一個MCP服務，并部署到阿里云百煉 -持續更新中

目的： 在本地使用fastmcp開發一個mcp,然后注冊到阿里云的百煉里面。實現在百煉里面創建智能體的時候直接引用自己開發的MCP 已完成：本地環境安裝待完成： 1.根據需求實現一個MCP中可以調用某應用的多個API即 mcp.tool()、mcp.prompt()、接入大…

閱讀更多...

設計模式之匯總

設計模式之匯總

設計模式零、設計原則 0.1 單一職責 0.2 接口隔離 0.3 開閉原則 0.4 依賴倒置0.5 迪米特法則，最小知道原則用戶關機只和朋友通信朋友條件： 1）當前對象本身（this） 2）以參量形式傳入到當前對象方法中的對象…

閱讀更多...

第6章 Decoder與Encoder核心組件

第6章 Decoder與Encoder核心組件

前言 Netty從底層Java通道讀取ByteBuf二進制數據，傳入Netty通道的流水線，隨后開始入站處理。在入站處理過程中，需要將ByteBuf二進制類型解碼成Java POJO對象。這個解碼過程可以通過Netty的Decoder（解碼器）去完成。在…

閱讀更多...

[已解決]當啟動 Spring Boot 應用時出現 Using generated security password xxx提示

[已解決]當啟動 Spring Boot 應用時出現 Using generated security password xxx提示

當啟動 Spring Boot 應用時出現 Using generated security password xxx提示當啟動 Spring Boot 應用時出現 Using generated security password xxx提示，這是 Spring Security 自動配置的默認行為，通常發生在你??未自定義安全配置??但引入了 Spring…

閱讀更多...

自動分析需求，PRD 生成只需 SOLO 一步！

自動分析需求，PRD 生成只需 SOLO 一步！

資料來源：火山引擎-開發者社區寫不清需求？PRD 難產？開發總跑偏？這些痛點，SOLO 來解決。 TRAE SOLO 是行業首個 Context Engineer。它不止協助編碼，更能基于精準上下文理解和工具調用，從構思、…

閱讀更多...

物聯網軟件開發過程中，數據流圖（DFD），用例圖，類圖，活動圖，序列圖，狀態圖，實體關系圖（ERD），BPMN（業務流程建模）詳解分析

物聯網軟件開發過程中，數據流圖（DFD），用例圖，類圖，活動圖，序列圖，狀態圖，實體關系圖（ERD），BPMN（業務流程建模）詳解分析

概述軟件開發過程中，特別是在物聯網（IoT）場景中，數據流圖（DFD）、UML圖（包括用例圖、類圖、活動圖、序列圖、狀態圖）、實體關系圖（ERD）和業務流程建模&#xf…

閱讀更多...

Mac（一）常用的快捷鍵整理

Mac（一）常用的快捷鍵整理

目錄1、系統操作與窗口管理2、應用與窗口切換3、常規編輯操作4、文本導航與光標控制??5、文本格式與文檔功能（支持應用中）6、截圖快捷鍵7、Safari 瀏覽器快捷鍵8、Finder 快捷鍵（文件管理）9、Fn / Globe 功能鍵（部分…

閱讀更多...

最新文章