深度強化學習賦能城市消防優化,中科院團隊提出DRL新方法破解設施配置難題

在城市建設與發展中,地理空間優化至關重要。從工業園區選址,到公共服務設施布局,它都發揮著關鍵作用。但傳統求解方法存在諸多局限,如今,深度學習技術為其帶來了新的轉機。

近日,在中國地理學會地理模型與地理信息分析專業委員會 2025 年學術年會上,來自中國科學院空天信息創新研究院的梁浩健博士在「地理空間優化」這一專題下,以「基于分層深度強化學習的城市應急消防設施配置優化方法研究」為題進行了成果匯報演講,并從地理空間優化問題概述、面向地理空間優化問題的深度學習方法研究 、基于分層深度強化學習的新探索以及未來展望 4 個方面展開了詳細介紹。

梁浩健老師演講現場

HyperAI 超神經在不違原意的前提下,對梁浩健老師的深度分享進行了整理匯總,以下為演講實錄。

地理空間優化:數學與地理的深度融合

地理空間優化是數學組合優化與地理信息科學的結合,致力于解決空間布局、資源配置等實際問題 ,在城市建設、工業園區選址、公共服務設施選址等眾多領域都具有重要的研究意義。它可以被表示為一個最優化問題,涉及決策變量、約束條件和目標函數,其中決策變量通常為整數或 0 – 1 變量。如下圖

其中 為決策變量, (x) 是不等式約束條件, ( ) 是等式約束條件, 是目標函數約束(1)表示決策變量 的范圍,通常為整數或 0-1 變量。

所示。

以經典的 p-中值問題為例,其旨在從候選設施點中挑選 p 個部署設施,讓所有需求點到最近設施點的總距離最小,常用于公共設施選址。傳統求解空間優化問題的方法有 3 類,包括精確算法、近似算法和啟發式算法,不過它們都有各自的短板。

* 精確算法能夠獲得全局最優解,但通常計算復雜度較高,求解時間隨問題規模呈指數級增長,例如分支定界法、動態規劃等。
* 近似算法在保證一定理論性能的前提下提高求解效率,但其算法設計較為復雜,例如貪心策略、線性規劃舍入等方法。
* 啟發式算法能在較短時間內獲得較優解,適用于大規模復雜問題,但缺乏理論最優性保證,常見方法包括模擬退火、禁忌搜索等。

深度學習進軍地理空間優化領域

在計算機視覺和自然語言處理等領域,利用深度模型來代替手工算法的設計取得了矚目的成果。那么,能否用它來求解空間優化問題呢?基于這一思路,研究人員為此展開了對空間優化(Neural Spatial Optimization)的探索,其動機包括 3 個方面:

* 學習更快/更好的啟發式方法,利用數據驅動實現快速近似代替復雜計算

* 自動設計新啟發式算法的通用框架

* 通過歷史信息訓練 DRL 模型來指導未來規劃

由此,我對 NeurSPO 預設了 2 大構想:

一是深度構造。簡單而言就是初始時為空解,而后每次選擇一個點,直至選出目標 p 個點,完成分步構造解。

二是深度提升。它的本質類似局部搜索等算法,是一個改進解的方法,可以利用深度學習去替換解。例如在局部搜索中,選擇合適的點進行交換或者優化等。

SpoNet 模型:動態覆蓋注意力破解選址難題

如何在探索 DRL 的方法中解決 p-Median 、 p-Center 、 MCLP 為主的目標問題?我們首先做出了動態覆蓋信息 + 注意力模型的嘗試,提出了一種統一的框架求解選址問題——SpoNet 。其構造主要由 3 部分組成:

* 在深度學習模型下,智能體與環境不斷交互,通過大量試錯和學習策略實現回報最大,不需要生成標簽信息。

* 注意力模型使模型在解碼時學會將注意力集中在輸入序列的特定部分,而不是僅僅依賴于解碼器(decoder)的輸入。

* 在節點覆蓋過程中,若某一節點已經被覆蓋了,在該點選擇部署設施,可能導致覆蓋效率降低。在動態覆蓋注意力模型下,對城市的靜態位置坐標和城市之間的動態覆蓋狀態進行編碼,利用知識驅動,通過引入問題特有的覆蓋信息進行編碼,提升模型對空間覆蓋關系的理解能力,從而加速求解過程。如下圖所示:

基于動態覆蓋注意力模型求解最大覆蓋選址問題基本流程

動態覆蓋注意力模型

在探索北京市朝陽區應急設施的布局優化問題上,我們應用了這一模型,選用了 132 個緊急設施的數據集,假設每個設施點的最大服務距離為 2 千米,最終在 132 個候選應急設施中選擇了 20 個點作為中心樞紐點,使得覆蓋的節點數量最多。

AIAM:自適應交互注意力模型求解 p-中值問題

在當前解的鄰域內進行搜索,嘗試找到更優解的局部搜索算法模式已經相對成熟,我們在此基礎上探索了深度提升輔助搜索,即基于鄰域搜索的思想,利用 DRL 搜索策略,實現快速近似代替復雜計算的搜索過程。

在路徑規劃問題中不同節點之間存在不同的次序關系,然而 -中值問題中的解是設施集合的一個子集,導致用戶節點和設施點之間存在不同的分配關系。為衡量這一分配關系,我們設置了「用戶」和「設施」的交互,并且提出了自適應交互注意力模型。

該模型包括交互注意力編碼器、節點移除解碼器、節點插入解碼器 3 部分,如下圖所示:

自適應交互注意力模型

經驗證,該模型能夠在 2,162 個居民點(需求點)和 80 個醫院(候選設施點)中保留 15 個醫院,以最小化居民點到醫院的總距離,證實了 AIAM 模型在實際場景下的可行性。

分層 DRL 解決城市應急消防設施配置難題

當前,城市發展迅速,突發事件的頻率和復雜性持續攀升,城市應急消防設施配置效率和功能性難以兼顧等問題加劇。傳統火災預測方法難以處理大范圍、高精度數據,導致風險評估精度低、響應滯后,且消防設施布局無法實時反映城市變化和應急需求。在此背景下,亟需引入智能化、動態化的火災風險預測與應急消防設施,全面提升城市火災防控與應急響應的科學性和效率。

基于此,我們將深度學習的框架理論研究轉向了對現實生活的應用。為提升城市火災防控與應急響應能力,研究聚焦于提高火災風險預測精準性、優化應急資源配置、增強應急響應及時性和靈活性。具體通過以下 3 個方面實現。

首先是面向城市火災風險預測的多維時空特征挖掘與融合。

面向城市火災風險預測的時空神經網絡主要由時空特征提取模塊和融合輸出模塊組成。

* 時空特征提取模塊在前向傳播中自動捕捉城市空間結構、消防設施分布及火災統計和氣象數據的動態變化;

* 融合輸出模塊則通過注意力機制整合時空特征,最終輸出火災風險預測值。如下圖所示。

時空神經網絡構成

其次是考慮不確定性和災害損失的應急消防設施配置優化模型構建。

在多重覆蓋選址中,引入火災頻率、交通狀況和需求分布等不確定性因素,并將災害損失納入目標函數,以提升布局方案的穩健性。通過概率分布或區間估計描述火災發生、交通通行與需求波動的變化。在建模中,火災風險結合歷史數據與地理條件構建概率模型,交通響應則基于通行能力與仿真分析形成時間分布,需求變化則通過設定波動范圍或場景集應對城市動態發展。

第三是面向應急消防設施布局優化的分層 DRL 方法。

該算法采用分層策略,統籌消防設施的整體布局與局部調整,模型狀態包含設施分布、火災風險和交通狀況,動作為各時刻的建站或調度決策。

未來展望:拓展邊界,持續創新

科研的道路總是不斷進步的,未來我們團隊計劃通過跨學科合作,結合地理信息系統、數學優化方法和深度學習技術,深入探索更復雜、實際的地理空間優化問題。

對此,我從以下 3 個方面做出了思考和展望:

* 引入地理計算機制,增強空間感知能力。

AI 賦予地理空間優化的能力還在持續探索,僅憑當前的研究是遠遠不夠的,在未來,融合地形、網絡通達性、連通性等空間機制建模有助于提高模型對地理結構的解釋能力與實際適應性。

* 擴展至大規模與跨區域應急響應問題。

當前我們的研究僅停留在了對于小問題的探索,所以,未來勢必會逐漸延展到大規模應急響應問題的探索,不斷改進使它能夠支持城市群、省域級多中心聯動優化,以此提升方法的可擴展性、穩定性與計算效率。

* 設計更高效的 DRL 算法框架。

未來可以繼續探索優化高/低層策略協同機制與訓練流程,引入多智能體協同、異步訓練、因果機制等技術,實現更有效的實際問題求解。

綜上所述,中國科學院空天信息創新研究院梁浩健博士團隊提出的分層 DRL 方法,作為地理空間優化領域的 AI 革新方案,通過融合動態覆蓋注意力模型、自適應交互注意力模型及多維時空特征融合技術,不僅破解了傳統消防設施布局中風險評估滯后、資源配置低效的難題,更通過分層策略實現了應急設施布局的全局統籌與局部優化。

未來,隨著地理計算機制的引入與跨區域應急響應模型的拓展,這一方法有望在大規模城市治理、多中心聯動優化等領域釋放更大潛力,推動地理空間優化與應急管理的深度融合創新。相信在不斷地探索與創新中,地理空間優化領域將取得更多突破,為城市發展和應急管理提供更有力的支持。

關于中國科學院空天信息創新研究院

梁浩健博士是中國科學院空天信息創新研究院特別研究助理。研究方向主要為地理空間優化、深度強化學習、遙感大數據分析和數字地球綜合應用等。

梁浩健老師

他所在的團隊由王少華研究員帶頭,以「推動地理空間科學與人工智能的交叉應用,為實現智慧城市和可持續發展目標提供創新解決方案」為愿景,致力于利用先進的計算方法和人工智能技術來分析和處理時空大數據,以實現空間環境的智能化決策和優化。近年來,團隊利用時空大數據分析、深度學習和機器學習等技術,開展了地理空間優化、遙感 AI 等多項研究。

王少華老師及其團隊

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83479.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83479.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83479.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

安科電動機保護器通過ModbusRTU轉profinet網關與PLC通訊

安科電動機保護器通過ModbusRTU轉profinet網關與PLC通訊 在工業自動化領域,設備間的通信和數據交互至關重要。Modbus作為一種常用的通訊協議,廣泛應用于各種工業現場;而Profinet則憑借其高效、實時性,在工業以太網通訊中占據重要…

python直方圖

在Python中,繪制直方圖(Histogram)是一項非常常見的任務,通常用于數據可視化,以展示數據的分布情況。Python中有多種庫可以繪制直方圖,其中最常用的兩個庫是Matplotlib和Seaborn。此外,Pandas庫…

在Oxygen編輯器中使用DeepSeek

羅馬尼亞公司研制開發的Oxygen編輯器怎樣與國產大模型結合,這是今年我在tcworld大會上給大家的分享,需要ppt的朋友請私信聯系 - 1 - Oxygen編輯器中的人工智能助手 Oxygen編輯器是羅馬尼亞的Syncro Soft公司開發的一款結構化文檔編輯器。 它是用來編寫…

neo4j 5.19.0安裝、apoc csv導入導出 及相關問題處理

前言 突然有需求需要用apoc 導入 低版本的圖譜數據,網上資料又比較少,所以就看官網資料并處理了apoc 導入的一些問題。 相關地址 apoc 官方安裝網址 apoc 官方導出csv 教程地址 apoc 官方 導入 csv 地址 docker 安裝 執行如下命令啟動鏡像 doc…

macos常見且應該避免被覆蓋的系統環境變量(避免用 USERNAME 作為你的自定義變量名)

文章目錄 macos避免用 USERNAME 作為你的自定義變量名macos常見且應該避免被覆蓋的系統環境變量 macos避免用 USERNAME 作為你的自定義變量名 問題: 你執行了:export USERNAME“admin” 然后執行:echo ${USERNAME} 輸出卻是:xxx …

Python訓練打卡Day41

簡單CNN 知識回顧 數據增強卷積神經網絡定義的寫法batch歸一化:調整一個批次的分布,常用與圖像數據特征圖:只有卷積操作輸出的才叫特征圖調度器:直接修改基礎學習率 卷積操作常見流程如下: 1. 輸入 → 卷積層 → Batch…

【親測有效】Mybatis-Plus中更新字段為null

Mybatis-Plus中更新字段為null 遇到問題 Mybatis-Plus更新的默認行為如下: Mybatis-Plus默認如果某個字段為null, 默認不更新這個字段, 例如有個Double類型的字段, 當前數據庫數據為10, 然后傳參時當前字段為null, 實際上Mybatis-Plus是不會覆蓋該字段為null的 在傳參的時候如…

如何使用插件和子主題添加WordPress自定義CSS(附:常見錯誤)

您是否曾經想更改網站外觀的某些方面,但不知道怎么做?有一個解決方案——您可以將自定義 CSS(層疊樣式表)添加到您的WordPress網站! 在本文中,我們將討論您需要了解的有關CSS的所有知識以及如何使用它來修…

左值引用和右值引用

一、基本概念 左值(lvalue)和右值(rvalue) 左值指的是有確定存儲位置(地址)的對象,通常可以出現在賦值語句左側。例如:變量名、解引用指針得到的對象、數組元素等都屬于左值。 右值…

django入門-orm數據庫操作

一:下載數據庫依賴項mysqlclient pip install mysqlclient 二:django配置文件配置數據庫鏈接 路徑:mysite2\mysite2\settings.py DATABASES {default: {ENGINE: django.db.backends.mysql,NAME: data, # 數據庫名稱USER: root, …

國標GB28181設備管理軟件EasyGBS視頻平臺筑牢文物保護安全防線創新方案

一、方案背景? 文物作為人類文明的珍貴載體,具有不可再生性。當前,盜竊破壞、游客不文明行為及自然侵蝕威脅文物安全,傳統保護手段存在響應滯后、覆蓋不全等局限。隨著5G與信息技術發展,基于GB28181協議的EasyGBS視頻云平臺&…

NetSuite Bundle - Dashboard Refresh

兒童節快樂! 今朝發一個Bundle,解決一個NetSuite Dashboard的老問題。出于性能上的考慮,NetSuite的Dashboard中的Portlet,只能逐一手工刷新。有人基于瀏覽器做了插件,可以進行自動刷新。但是在我們做項目部署時&#…

<PLC><socket><西門子>基于西門子S7-1200PLC,實現手機與PLC通訊(通過websocket轉接)

前言 本系列是關于PLC相關的博文,包括PLC編程、PLC與上位機通訊、PLC與下位驅動、儀器儀表等通訊、PLC指令解析等相關內容。 PLC品牌包括但不限于西門子、三菱等國外品牌,匯川、信捷等國內品牌。 除了PLC為主要內容外,PLC相關元器件如觸摸屏(HMI)、交換機等工控產品,如…

【AI論文】推理語言模型的強化學習熵機制

摘要:本文旨在克服將強化學習擴展到使用 LLM 進行推理的主要障礙,即策略熵的崩潰。 這種現象在沒有熵干預的RL運行中一直存在,其中策略熵在早期訓練階段急劇下降,這種探索能力的減弱總是伴隨著策略性能的飽和。 在實踐中&#xff…

手動刪除網頁上的禁止復制事件

以Edge瀏覽器為環境、以網絡上一個文檔為例。 右擊頁面,打開【檢查】工具。選擇元素,打開【事件偵聽器】: 展開copy,刪除里面的事件: 選中文字,進行復制

element級聯地址選擇器

一、實現過程總覽 組件替換:將原有的輸入框(el-input)替換為級聯選擇器(el-cascader),并配置基礎屬性。數據適配:引入 JSON 地址數據,通過cascaderProps映射數據字段(如…

【leetcode-兩數之和】

一、題目 二、題解 &#xff08;1&#xff09;雙指針 這里要注意j<length的 //聲明兩個指針int length nums.length;for (int i 0; i < length; i) {for (int j i 1; j<length;j){if (j<length && nums[i]nums[j]target){return new int[]{i,j};}}}r…

CLion社區免費后,使用CLion開發STM32相關工具資源匯總與入門教程

Clion下載與配置 Clion推出社區免費&#xff0c;就是需要注冊一個賬號使用&#xff0c;大家就不用去找破解版版本了&#xff0c;jetbrains家的IDEA用過的都說好&#xff0c;這里嵌入式領域也推薦使用。 CLion官網下載地址 安裝沒有什么特別&#xff0c;下一步就好。 啟動登錄…

Rust 學習筆記:關于 Cargo 的練習題

Rust 學習筆記&#xff1a;關于 Cargo 的練習題 Rust 學習筆記&#xff1a;關于 Cargo 的練習題問題一問題二問題三問題四問題五問題六問題七 Rust 學習筆記&#xff1a;關于 Cargo 的練習題 參考視頻&#xff1a; https://www.bilibili.com/video/BV1xjAaeAEUzhttps://www.b…

高速收發器

一、高速收發器 1.FPGA高速收發器&#xff1a;GTP,GTX,GTH,GTZ 2.每個Quad有4對高速收發器GT(4個TX和4個RX)和一個COmmon 3.走差分&#xff0c;提高抗干擾性 4.CPLL是每個lane私有的&#xff0c;QPLL是整個Quad的所有通道共享的 5.每個MGT的bank有兩對差分參考時鐘 6.CPLL的時鐘…