PaperNotes(18)-VectorNet- Encoding HD Maps and Agent Dynamics from Vectorized Representation

自動駕駛論文閱讀筆記1

  • 1. Ployline Garph
  • 2. Global Graph
  • 3. 模型目標函數
  • 4.Related work
  • 5.Experiment
    • 5.1 實驗設置
    • 5.2 消融實驗
    • 5.3 模型資源消耗
    • 5.4 與其他模型的對比實驗

VectorNet- Encoding HD Maps and Agent Dynamics from Vectorized Representation
VectorNet: 通過矢量化表示編碼高精度地圖與動態交通參與者
自動駕駛大佬waymo
論文翻譯

目標:軌跡預測
方法:

  1. 向量化表示地圖和移動agent(軌跡,車道線采樣,每個點用特征向量表示)
  2. 利用local graph net 聚合每條折線的特征(全聯接網路,一條折線最后凝練出一個特征向量–就是一個點)
  3. 利用全局graph聚合各個折線特性點的相互作用(全局圖就是各個結點全聯接構成的圖,經過一層狀態更新后通過解碼網絡得到目標對象的預測軌跡–軌跡的一步坐標位移)

(損失函數的設置,附加恢復網絡等等細節需要去看原文)

20210426–(資料表明是CVPR2020的文章,但是標了arxiv:2005.就表示迷惑了)

road components

  1. moving agents(pedestrians, vehicles)
  2. road context information(lanes, traffic lights)

1. Ployline Garph

  1. 向量化
    地圖特征(車道線,交叉路口)-選定起點和方向,在spline(樣條)上等空間間隔采樣,連接相鄰點構成向量,運動軌跡-等時間間隔采樣關鍵點,構成向量。一條軌跡Pj\mathcal{P}_jPj?就是一個向量集合{v1,v2,...,vp}\{v_1,v_2,...,v_p\}{v1?,v2?,...,vp?}
    曲線Pj\mathcal{P}_jPj?向量viv_ivi?-向量的dis,died_i^s,d_i^edis?,die?起始和終止點的坐標;aia_iai?對象類型、時間戳、道路類型、限速;j是軌跡編號:
    vi=[dis,die,ai,j]v_i=[d_i^s,d_i^e,a_i,j]vi?=[dis?,die?,ai?,j]

  2. 折線子圖–polyline subgraphs
    同一條折線(polyline)上的節點構成一張子圖,節點特征更新規則:
    vi(l+1)=φrel[genc(vi(l)),φagg({ggen(vj(l))})]v_i^{(l+1)}=\varphi_{rel}[g_{enc}(v_i^{(l)}),\varphi_{agg}(\{g_{gen}(v_j^{(l)})\})]vi(l+1)?=φrel?[genc?(vi(l)?),φagg?({ggen?(vj(l)?)})]
    gencg_{enc}genc?–MLP–處理每個節點的特征。同層結點權值共享,不同層權重不同
    φagg\varphi_{agg}φagg?–最大池化–聚合鄰居結點的信息
    φrel\varphi_{rel}φrel?–concatenation(簡單的連接操作)–本結點特征和鄰居結點特征相互結合
    堆疊多層genc(?)g_{enc}(·)genc?(?)操作

  3. 折線的表征–同一條折線上所有結點特征經過一個最大池化操作,聚合特征
    p=φagg({vi(Lp)})\bm{p}=\varphi_{agg}(\{v_i^{(L_p)}\})p=φagg?({vi(Lp?)?})

注:

  1. 起始和終止點的坐標–二維/三維都可以
  2. 目標agent最后一次被觀察到的time step/位置 作為時間或者空間的原點。
  3. 折線子圖可以看作是PointNet的一般化–在PointNet中,ds=ded^s=d^eds=deaaalll為空。但是本文作者表明,odering 信息,連接性約束(沒發現呀,和l有關?)使得本文子圖網絡能夠更好的編碼結構化的信息。

2. Global Graph

  1. 全局圖
    折線結點{p1,p2,...,pP}\{p_1, p_2,...,p_P\}{p1?,p2?,...,pP?}構造全局圖,A–鄰接矩陣–為了簡單起見,本文采用全聯接圖。
    {pi(l+1)}=GNN({pi(l)},A)\{p_i^{(l+1)}\}=GNN(\{p_i^{(l)}\},A){pi(l+1)?}=GNN({pi(l)?},A)
    圖具體計算采用self-attention操作:
    GNN(P)=softmax(PQ,PKT)PVGNN(P)=softmax(P_Q,P_K^T)P_VGNN(P)=softmax(PQ?,PKT?)PV?
    P為結點的特征矩陣,PQ,PK,PVP_Q,P_K,P_VPQ?,PK?,PV?是P的線形投影(具體操作沒說)

  2. 預測moving agents的未來軌跡
    vifuture=φtraj(pi(Lt))v_i^{future}=\varphi_{traj}(p_i^{(L_t)})vifuture?=φtraj?(pi(Lt?)?)

φtraj(?)\varphi_{traj}(\cdot)φtraj?(?)–軌跡解碼器–MLP
(本文GNN網絡只有一層,所以在推斷的時候,只需要計算target agent的特征。)

  1. 附加圖補全任務–auxiliary graph completion task
    為了使圖捕獲軌跡和車道線強交互,在訓練時,隱藏一部分折線結點特征向量,用模型去預測該特征:
    p^i=φnode(pi(Lt))\hat{p}_i=\varphi_{node}(p_i^{(L_t)})p^?i?=φnode?(pi(Lt?)?)
    φnode(?)\varphi_{node}(\cdot)φnode?(?)–結點特征解碼器-MLP,目標函數和BERT的目標函數相似。
    (這一點寫的不是很明白,φnode(?)\varphi_{node}(\cdot)φnode?(?)輸入特征的構造這一點)

論文解讀:Attention is All you need
Transformer–論文翻譯:Attention Is All You Need 中文版
論文筆記:Attention is all you need

3. 模型目標函數

多目標優化目標函數:
L=Ltraj+αLnode\mathcal{L}=\mathcal{L}_{traj} + \alpha\mathcal{L}_{node}L=Ltraj?+αLnode?

Ltraj\mathcal{L}_{traj}Ltraj?–負高斯對數似然, 軌跡是二維隨機變量,作二元高斯分布假設,使用最大似然法。二元正態分布的概率密度函數
Lnode\mathcal{L}_{node}Lnode?–Huber損失函數,預測點的特征和masked 節點特征??

為了避免由 優化Lnode\mathcal{L}_{node}Lnode?使得結點特征的幅度較小 而引起的平凡解,將結點特征L2正則化后再輸入到后續的網路中。


20210430-還剩下related work 和實驗部分沒有整理

4.Related work

(介紹了4個部分的相關工作)

  1. 自動駕駛中的行為預測–IntentNet, ConvNets, MultiPath…
  2. 多agent交互預測
  3. entities 集合的表征學習–圖結點的表示方式
  4. 自監督建模–來自NLP中單詞補全任務

5.Experiment

5.1 實驗設置

1 數據集
兩個車輛行為預測bench-marks

  1. Argoverse dataset:簡介 每條軌跡5s,前2s作為觀測,后3s作為標簽
  2. in-house behavior prediction dataset: 每條軌跡4s,前1s作為觀測,后3s作為標簽

兩個數據集的歷史軌跡都是從感知模型來的,所以有噪聲(感知建模不準嘛)。Argoverse dataset的標簽軌跡也是從感知來的,in-house behavior prediction dataset的標簽軌跡是經過手工標記過的。

2 度量
ADE-Average Displacement Error–平均偏移誤差,在時間t=1.0,2.0,3.0st=1.0,2.0,3.0st=1.0,2.0,3.0s預測軌跡處的偏移量,單位是米。

3 baseline–ConvNet
從最后一次觀測到vehicle的幀開始,往前render N 個連續的幀,每一幀的分辨率為4004003。對于Argoverse 數據集來說400像素代表了130米,in-house數據集來說400像素代表了100米。將N幀堆疊在一起,形成一個4004003N 的圖像輸入數據。

ConvNet 網絡模型輸入數據的處理:crop the feature patch around the target vehicle from the convolutional feature map, and average pool over all the spatial locations of the cropped feature map to get a single vehicle feature vector。并且針對卷積的感受野,特征剪裁策略,和分辨率分別做了消融實驗。

4 VectorNet
原則-盡量保證于ConVNet具有相同的輸入信息(對比實驗嘛,怎么公平怎么來)。 折線子圖采用3層結構,全局圖為一層結構,MLP 是64個結點。對context information,子圖和全局圖的層數做了消融實驗。

5.2 消融實驗

1.ConvNet 網絡消融實驗–卷積核、Crop 尺寸、圖像分辨率
2.VectorNet 網絡的消融實驗–Context、Node Compl、子圖和全局圖的層數

5.3 模型資源消耗

FLOPs : FLOATING-POINT OPERATIONS PER SECOND–每秒浮點數計算
模型尺寸:

似乎pytorch可以有專門計算的接口: profile

5.4 與其他模型的對比實驗

state-of-art: Agoverse Forecasting 挑戰賽的冠軍。結果統計在表格5中,VectorNet完勝。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/444724.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/444724.shtml
英文地址,請注明出處:http://en.pswp.cn/news/444724.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ubuntu的apache配置https

一、配置Apache 1、開啟SSL模塊a2enmod ssl 2、啟用SSL站點a2ensite default-ssl 3、加入監聽端口vi /etc/apache2/ports.conf #編輯Apache端口配置,加入443端口 Listen 443注:Ubuntu啟用SSL站點后,缺省已經加入了 (…

vim特別好的教程

歡 迎 閱 讀 《 V I M 教 程 》 —— 版本 1.7 Vim 是一個具有很多命令的功能非常強大的編輯器。限于篇幅,在本教程當中 就不詳細介紹了。本教程的設計目標是講述一些必要的基本命令,而掌握好這 些命令&#x…

jquery、javascript實現(get、post兩種方式)跨域解決方法

&#xfeff;&#xfeff;jquery、javascript實現(get、post兩種方式)跨域解決方法一、實現get方式跨域請求數據瀏覽器端<script> $(document).ready(function(){$.ajax({url: "http://www.xxx.cn/index.php",type: "get",dataType: "jsonp&quo…

推薦系統(4)-邏輯回歸LR、POLY2、FM、FFM

邏輯回歸LR、POLY2、FM、FFM1.邏輯回歸LR2.辛普森悖論3.POLY24.FM-20105.FFM6.GBDTLR-20147.LS-PLM-2017《深度學習/推薦系統》讀書筆記1.邏輯回歸LR Logistic Regression – 融合多種特征&#xff0c;通過sigmoid 函數&#xff0c;預測樣本的被點擊的概率。樣本用特征向量x[x…

leetcode125驗證回文串

給定一個字符串&#xff0c;驗證它是否是回文串&#xff0c;只考慮字母和數字字符&#xff0c;可以忽略字母的大小寫。 說明&#xff1a;本題中&#xff0c;我們將空字符串定義為有效的回文串。 示例 1: 輸入: "A man, a plan, a canal: Panama" 輸出: true 示例 …

配置 Elastic Beanstalk 環境負載均衡器以終止 HTTPS

&#xfeff;&#xfeff;配置 Elastic Beanstalk 環境負載均衡器以終止 HTTPS 要更新您的 AWS Elastic Beanstalk 環境以使用 HTTPS&#xff0c;您需要為您的環境中的負載均衡器配置 HTTPS 偵聽器。以下兩種類型的負載均衡器支持 HTTPS 偵聽器&#xff1a;傳統負載均衡器和應用…

AWS 給負載均衡器配置偵聽器并上傳IAM證書

&#xfeff;&#xfeff;1.打開EC2的負載均衡器&#xff1a;添加偵聽器&#xff0c;選擇https&#xff0c;ssl證書需要有一個CA證書&#xff0c;可以去阿里云申請&#xff0c;也可以從亞馬遜獲取&#xff1a;注意&#xff0c;這里的ssl證書要這樣寫其中私有密鑰不是那種xxxxxx…

PaperNotes(19)-Learning Lane Graph Representations for Motion Forecasting

Learning Lane Graph Representations for Motion Forecasting1.ActorNet2.MapNet3.FusionNet4.Prediction Header5.模型參數學習自動駕駛論文閱讀筆記2 Uber–ECCV2020–論文文章代碼 模型的作用&#xff1a;Motion Forecasting &#xff08;這個motion都包括什么呢&#xff…

leetcode41 缺失的第一個正數

給定一個未排序的整數數組&#xff0c;找出其中沒有出現的最小的正整數。 示例 1: 輸入: [1,2,0] 輸出: 3 示例 2: 輸入: [3,4,-1,1] 輸出: 2 示例 3: 輸入: [7,8,9,11,12] 輸出: 1 說明: 你的算法的時間復雜度應為O(n)&#xff0c;并且只能使用常數級別的空間。 思路&am…

Linux(10)-Make編譯,Configure

Make編譯機制,Configure1.Make機制demo1.make編譯demo2.make清理demo3:make 安裝demo4:make 卸載2.configure2.1 Autoconf2.2 軟件的源碼安裝軟件發布的一些基礎知識。gcc, cpp, as, ld–施工隊&#xff0c;底層干活工人make --包工頭&#xff0c;指揮工人工作configure–分析師…

redis排行榜之日排行周排行設計

排行榜功能是一個很普遍的需求。使用 Redis 中有序集合的特性來實現排行榜是又好又快的選擇。 一般排行榜都是有實效性的,比如“用戶積分榜”。如果沒有實效性一直按照總榜來排,可能榜首總是幾個老用戶,對于新用戶來說,那真是太令人沮喪了。 首先,來個“今日積分榜”吧,…

Linux(11)-Ubuntu裝系統

Ubuntu18.04裝系統單系統雙系統啟動項dell 5820進不去bios。單系統 裝過好多次ubuntu系統&#xff0c;每次要重裝之前總是得搜索各種教程。現在總結一份簡略教程如下&#xff0c;以備哪天裝系統之需。 1.官網上下載Ios文件:https://ubuntu.com/download/desktop 2.找一個U盤…

最近準備學習下mongodb(一 Windows安裝篇)

1 先安裝mongodb 的windows版本&#xff0c;Linux的我后期會加上的。 https://www.mongodb.com/dr/fastdl.mongodb.org/win32/mongodb-win32-x86_64-2008plus-ssl-4.0.0-signed.msi/download 2.安裝php擴展插件&#xff1a; https://pecl.php.net/package/mongo 根據自己的…

leetcode139 單詞拆分

給定一個非空字符串 s 和一個包含非空單詞列表的字典 wordDict&#xff0c;判定 s 是否可以被空格拆分為一個或多個在字典中出現的單詞。 說明&#xff1a; 拆分時可以重復使用字典中的單詞。 你可以假設字典中沒有重復的單詞。 示例 1&#xff1a; 輸入: s "leetcode…

Linux(12)-Ubuntu裝機后的基礎應用

Ubuntu裝機ssh服務器 sudo ps -e |grep ssh # 查看ssh 服務安裝情況 ssh-agent--ssh客戶端&#xff0c;連別人&#xff1b; sshd--ssh服務器&#xff0c; 被別人連 sudo apt-get update # 更新軟件源 sudo apt-get install openssh-server # 安裝ssh服務端ssh設置別…

OpenSSL編寫SSL,TLS程序

一、簡介:SSL(Secure Socket Layer)是netscape公司提出的主要用于web的安全通信標準,分為2.0版和3.0版.TLS(Transport Layer Security)是IETF的TLS 工作組在SSL3.0基礎之上提出的安全通信標準,目前版本是1.0,即RFC2246.SSL/TLS提供的安全機制可以保證應用層數據在互聯網絡傳輸不…

PRML(3)--Chapter2(上)-概率分布-二元變量、多項式變量、高斯分布、指數族分布

PRML第二章上-概率估計2.1二元變量2.1.1 beta 分布2.2 多項式變量2.3 高斯分布2.3.1條件高斯分布、2.3.2邊緣高斯分布2.3.3 高斯變量的貝葉斯定理2.3.4 高斯分布的最大似然估計2.3.5 順序估計2.3.6 高斯分布的貝葉斯推斷2.3.7 學生t分布2.3.8周期性變量2.3.9混合高斯分布2.4 指…

leetcode27 移除元素

給定一個數組 nums 和一個值 val&#xff0c;你需要原地移除所有數值等于 val 的元素&#xff0c;返回移除后數組的新長度。 不要使用額外的數組空間&#xff0c;你必須在原地修改輸入數組并在使用 O(1) 額外空間的條件下完成。 元素的順序可以改變。你不需要考慮數組中超出新…

Harris的角點檢測和特征匹配

一.特征檢測&#xff08;提取&#xff09; 基于特征的圖像配準方法是圖像配準中最常見的方法之一。它不是直接利用圖像像素值&#xff0c;二十通過像素值導出的符號特征&#xff08;如特征點、特征線、特征區域&#xff09;來實現圖像配準&#xff0c;因此可以克服利用灰度信息…

開始入坑深度學習(DeepLearning)

現在游戲越來越難做,國家廣電總局審核越來越變態,國家各種打壓游戲,游戲產業也成為教育失敗的背鍋俠,所以本人現在開始做深度學習方向。 深度學習研究的熱潮持續高漲,各種開源深度學習框架也層出不窮,其中包括TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、Leaf、The…