2025年SEVC SCI2區,基于深度強化學習與模擬退火的多無人機偵察任務規劃,深度解析+性能實測

目錄

    • 1.摘要
    • 2.問題定義
    • 3.SA-NNO-DRL方法
    • 4.結果展示
    • 5.參考文獻
    • 6.算法輔導·應用定制·讀者交流


1.摘要

無人機(UAV)因其高自主性和靈活性,廣泛應用于偵察任務,多無人機任務規劃在交通監控和數據采集等任務中至關重要,但現有方法在計算需求上較高,導致常常無法得到最優解。為解決這一問題,本文提出了一種分治框架將任務分為兩個階段:目標分配和無人機路徑規劃,從而有效降低了計算復雜度。本文提出混合方法SA-NNO-DRL結合了基于最近鄰最優的深度強化學習(NNO-DRL)和模擬退火(SA)算法。在路徑規劃階段,NNO-DRL為每個無人機構建路徑;在目標分配階段,SA重新分配未覆蓋的目標。兩個階段交替進行,直到滿足終止條件。

2.問題定義

MURMPP的目標是為無人機群體規劃路徑,最大化其在監控目標時的總利潤。每個無人機從同一中心出發并返回,成功監控指的是訪問或經過目標。目標的利潤預先定義,且僅在成功監控后收取。由于電池限制,部分目標可能無法覆蓋。MURMPP是一個復雜的組合優化問題,隨著目標數量增加,其難度呈指數級增長,該問題可通過混合整數線性規劃(MILP)形式化,其中涉及多個無人機、目標、利潤、路徑分配和飛行范圍的約束。

3.SA-NNO-DRL方法

為解決MURMPP,論文提出了一種迭代的兩階段框架——SA-NNO-DRL,在該框架中目標分配和無人機路徑規劃交替進行并相互作用。

單無人機NNO-DRL路徑規劃方法

路徑規劃可視為一個順序決策問題,通過馬爾可夫決策過程來實現。無人機智能體根據環境狀態(如目標信息和剩余飛行范圍)決定下一步行動 (即選擇訪問的目標節點),并獲得相應的獎勵。NNO-DRL的目標是學習一個策略pθp_\thetapθ?,構建路徑τ\tauτ,最大化總利潤,同時遵循約束條件。生成路徑的概率通過鏈式法則表示:
pθ(τ∣s)=∏t=1Tpθ(τt∣s,τ1:t?1)p_\theta\left(\tau|s\right)=\prod_{t=1}^Tp_\theta\left(\tau_t|s,\tau_{1:t-1}\right) pθ?(τs)=t=1T?pθ?(τt?s,τ1:t?1?)

The whole NNO-DRL structure consists of an attention encoder, a projection MLP, and a multi-start decoder

NNO-DRL由改進注意力模型和投影MLP組成,用于解決路徑規劃問題。其創新之處在于結合投影MLP和對比學習(CL)進行復雜問題表示,并通過kkk最近鄰策略的多啟動解碼器提高解空間探索效率。通過最大化原始實例和增強版本節點嵌入的余弦相似度,增強了表示的魯棒性。多啟動解碼器采用kkk最近鄰策略,生成多個軌跡,以避免因電池限制產生次優解。

目標分配SA方法

給定位于區域中心的無人機中心,論文根據目標節點與水平軸之間的角度,將區域內的所有目標均勻地分成mmm組,角度定義為:
anglei=arctanlocyi?locy0locxi?locy0angle_i=arctan\frac{loc_y^i-loc_y^0}{loc_x^i-loc_y^0} anglei?=arctanlocxi??locy0?locyi??locy0??

The target allocation scheme in which the targets of the same color are
allocated to the same UAV

4.結果展示

論文仿真

5.參考文獻

[1] Fan M, Liu H, Wu G, et al. Multi-UAV reconnaissance mission planning via deep reinforcement learning with simulated annealing[J]. Swarm and Evolutionary Computation, 2025, 93: 101858.

6.算法輔導·應用定制·讀者交流

xx

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/92735.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/92735.shtml
英文地址,請注明出處:http://en.pswp.cn/web/92735.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

汽車娛樂信息系統域控制器的網絡安全開發方案

引言1.1 項目背景隨著汽車行業的快速發展和智能化、網聯化的趨勢日益明顯,汽車娛樂信息系統(In-Vehicle Infotainment System,IVIS)已經成為現代汽車的重要組成部分。汽車娛樂信息系統不僅提供了豐富的多媒體功能,如音…

【論文閱讀】Deep Adversarial Multi-view Clustering Network

摘要多視圖聚類通過挖掘多個視圖之間的共同聚類結構,近年來受到了越來越多的關注。現有的大多數多視圖聚類算法使用淺層、線性嵌入函數來學習多視圖數據的公共結構。然而,這些方法無法充分利用多視圖數據的非線性特性,而這種特性對于揭示復雜…

Redis - 使用 Redis HyperLogLog 進行高效基數統計

文章目錄引言HyperLogLog 工作原理Spring Boot 集成 Redis1. 添加依賴2. 配置 Redis 連接3. Redis 配置類HyperLogLog 實戰應用1. 基礎操作服務類2. 網站日活躍用戶統計3. 性能測試與誤差分析應用場景分析適用場景不適用場景性能優化技巧與傳統方案對比結論引言 在數據分析和監…

後端開發技術教學(三) 表單提交、數據處理

上回:後端開發技術教學(二) 條件指令、循環結構、定義函數 -CSDN博客 必要資源: trae中文版下載網址: TRAE - The Real AI Engineer phpStudy 2018 : phpStudy - Windows 一鍵部署 PHP 開發環境 小皮出品 目錄 一、表單提交 1.1 get & post 1.…

Python訓練Day39

浙大疏錦行 圖像數據的格式:灰度和彩色數據模型的定義顯存占用的4種地方 模型參數梯度參數優化器參數數據批量所占顯存神經元輸出中間狀態 batchisize和訓練的關系 一、 圖像數據的介紹 圖像數據,相較于結構化數據(表格數據)他的特…

十八、MySQL-DML-數據操作-插入(增加)、更新(修改)、刪除

DML數據操作添加數據更新(修改)數據刪除數據總結代碼: -- DML:數據操作語言-- -- DML:插入數據-insert -- 1.為tb_emp表的username,name,gender 字股插入值insert into tb_emp(username,name,gender,create_time,update_time) values (Toki,小時,2,now()…

Linux 安裝 JDK 8u291 教程(jdk-8u291-linux-x64.tar.gz 解壓配置詳細步驟)?

一、準備工作 ?下載 JDK 安裝包? 去 Oracle 官網或者可信的鏡像站下載: ?jdk-8u291-linux-x64.tar.gz? (這是一個壓縮包,不是安裝程序,解壓就能用) ?jdk-8u291-linux-x64.tar.gz?下載鏈接:https://pa…

藍橋杯----鎖存器、LED、蜂鳴器、繼電器、Motor

(七)、鎖存器1、原理藍橋杯中數據傳入口都是P0,也就是數碼管段選、位選數據、LED亮滅的數據、蜂鳴器啟動或禁用的數據,外設啟動或者關閉都需要通過P0寫入數據,那么如何這樣共用一個端口會造成沖突嘛,答案是肯定的。所以藍橋杯加入…

AI熱點周報(8.3~8.9):OpenAI重返開源,Anthropic放大招,Claude4.1、GPT5相繼發布

名人說:博觀而約取,厚積而薄發。——蘇軾《稼說送張琥》 創作者:Code_流蘇(CSDN)(一個喜歡古詩詞和編程的Coder😊) 目錄一、OpenAI的"開源回歸":時隔5年的戰略大轉彎1. GPT-OSS系列&a…

《Kubernetes部署篇:基于x86_64+aarch64架構CPU+containerd一鍵離線部署容器版K8S1.33.3高可用集群》

總結:整理不易,如果對你有幫助,可否點贊關注一下? 更多詳細內容請參考:企業級K8s集群運維實戰 一、部署背景 由于業務系統的特殊性,我們需要針對不同的客戶環境部署基于containerd容器版 K8S 1.33.3集群&a…

Linux抓包命令tcpdump詳解筆記

文章目錄一、tcpdump 是什么?二、基本語法三、常用參數說明四、抓包示例(通俗易懂)1. 抓所有數據包(默認 eth0)2. 指定接口抓包3. 抓取端口 80 的數據包(即 HTTP 請求)4. 抓取訪問某個 IP 的數據…

抖音、快手、視頻號等多平臺視頻解析下載 + 磁力嗅探下載、視頻加工(提取音頻 / 壓縮等)

跟你們說個安卓上的下載工具,還挺厲害的。它能支持好多種下載方式,具體多少種我沒細數,反正挺全乎的。? 平時用得最多的就是視頻解析,像抖音、快手、B 站上那些視頻,想存下來直接用它就行,連海外視頻的也能…

【iOS】JSONModel源碼學習

JSONModel源碼學習前言JSONModel的使用最基礎的使用轉換屬性名稱自定義錯誤模型嵌套JSONModel的繼承源碼實現initWithDictionaryinit__doesDictionaryimportDictionary優點前言 之前了解過JSONModel的一些使用方法等,但是對于底層實現并不清楚了解,今天…

SmartMediaKit 模塊化音視頻框架實戰指南:場景鏈路 + 能力矩陣全解析

?? 引言:從“內核能力”到“模塊體系”的演進 自 2015 年起,大牛直播SDK(SmartMediaKit)便致力于打造一個可深度嵌入、跨平臺兼容、模塊自由組合的實時音視頻基礎能力框架。經過多輪技術迭代與場景打磨,該 SDK 已覆…

【第5話:相機模型1】針孔相機、魚眼相機模型的介紹及其在自動駕駛中的作用及使用方法

相機模型介紹及相機模型在自動駕駛中的作用及使用方法 相機模型是計算機視覺中的核心概念,用于描述真實世界中的點如何投影到圖像平面上。在自動駕駛系統中,相機模型用于環境感知,如物體檢測和場景理解。下面我將詳細介紹針孔相機模型和魚眼相…

推薦一款優質的開源博客與內容管理系統

Halo是一款由Java Spring Boot打造的開源博客與內容管理系統(CMS),在 GitHub上擁有超過36K Start的活躍開發者社區。它使用GPL?3.0授權開源,穩定性與可維護性極高。 Halo的設計簡潔、注重性能,同時保持高度靈活性&a…

【GPT入門】第43課 使用LlamaFactory微調Llama3

【GPT入門】第43課 使用LlamaFactory微調Llama31.環境準備2. 下載基座模型3.LLaMA-Factory部署與啟動4. 重新訓練![在這里插入圖片描述](https://i-blog.csdnimg.cn/direct/e7aa869f8e2c4951a0983f0918e1b638.png)1.環境準備 采購autodl服務器,24G,GPU,型號3090&am…

計算機網絡:如何理解目的網絡不再是一個完整的分類網絡

這一理解主要源于無分類域間路由(CIDR)技術的廣泛應用,它打破了傳統的基于類的IP地址分配方式。具體可從以下方面理解: 傳統分類網絡的局限性:在早期互聯網中,IP地址被分為A、B、C等固定類別,每…

小米開源大模型 MiDashengLM-7B:不僅是“聽懂”,更能“理解”聲音

目錄 前言 一、一枚“重磅炸彈”:開源,意味著一扇大門的敞開 二、揭秘MiDashengLM-7B:它究竟“神”在哪里? 2.1 “超級耳朵” 與 “智慧大腦” 的協作 2.2 突破:從 “聽見文字” 到 “理解世界” 2.3 創新訓練&a…

mysql出現大量redolog、undolog排查以及解決方案

排查步驟 監控日志增長情況 -- 查看InnoDB狀態 SHOW ENGINE INNODB STATUS;-- 查看redo log配置和使用情況 SHOW VARIABLES LIKE innodb_log_file%; SHOW VARIABLES LIKE innodb_log_buffer_size;-- 查看undo log信息 SHOW VARIABLES LIKE innodb_undo%;檢查長時間運行的事務 -…