人形強化學習算法工程師(26屆)
(崗位信息已通過jobleap.cn授權,可在csdn發布)
銀河通用機器人?·?北京
收錄時間: 2025年08月11日
職位描述
1. 研發基于深度強化學習的足式機器人運動控制算法,提升機器人在復雜環境下的穩定性與自適應能力;
2. 設計并優化不同環境和任務下的步態規劃算法,涵蓋靜態步態(如爬行、行走)和動態步態(如跑步、跳躍);
3. 開發實時控制算法,使機器人能夠響應傳感器數據,快速調整姿態并進行平衡控制;
4. 設計并實現路徑規劃與導航算法,確保機器人在多變地形中穩定前行,避開障礙物;
5. 在仿真平臺(如MuJoCo、Isaac Gym/Lab等)上進行算法測試與優化,確保算法能夠高效應用于實際機器人;
6. 與傳感器融合與環境感知團隊協作,結合IMU、相機、激光雷達等傳感器數據進行精確的狀態估計和控制;
7. 持續跟蹤并引入國內外前沿研究成果,推動相關技術的更新與應用;
8. 與硬件工程師、機械設計團隊緊密合作,確保算法在實際機器人上的有效實現與部署;
職位要求
該崗位為應屆崗位,面向2025年9月1日 - 2026年12月31日畢業的應屆同學;
若您是社招簡歷,請至社招官網投遞同崗位;
1. 學歷要求:碩士及以上學歷,計算機科學、控制工程、機器人學、人工智能等相關專業;
2. 技能要求: - 深入理解機器人學原理,掌握足式機器人運動學和動力學建模,熟悉正向/逆向運動學(FK/IK)及常用動力學計算庫(如Pinocchio);
- 熟悉常用的強化學習算法(如PPO、SAC、DQN、DDPG等),并有實際應用經驗;
- 精通C++、Python編程,熟悉機器人開發中的主流工具和庫(如MuJoCo、IsaacGym/Sim/Lab等仿真平臺);
- 具備機器人運動控制經驗,熟悉運動控制算法(如PID控制、LQR、MPC)及傳感器數據融合技術;
- 理解并應用深度學習框架(如Pytorch、TensorFlow)進行強化學習模型的訓練與優化;
3. 工作經驗要求: - 具有足式機器人(如四足、二足等)的運動控制和步態規劃經驗;
- 有強化學習、深度學習等相關領域的研究或項目經驗,能夠將算法應用于實際機器人上;
4. 個人素質要求: - 扎實的數學基礎,特別是在優化理論、控制理論和強化學習方面;
- 良好的團隊合作精神與溝通能力,能夠與硬件、傳感器、嵌入式系統等團隊緊密協作;
- 強烈的自我驅動力,能夠快速學習并應用最新技術;
- 較強的動手能力,能夠在實驗室環境下進行調試、驗證和優化;
加分項: - 在復雜地形上實現足式機器人穩定運動的經驗;
- 發表過相關領域的頂級會議論文(如ICRA、IROS、CoRL等);
- 具備多足機器人或雙足機器人控制的深入研究經驗;