1. 論文地址
Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models
2. 中文:
? ??Think in Games:做一個在王者榮耀中會玩和思考的Agent
3. 我記得幾年前,相關文章還是使用dqn算法。玩雅利達小游戲,冒險島,flybird, 單機槍戰。目前llm做到了下一步決策 文字版,感覺還差實時操作英雄,實時決策 + 實時指令?
? ? ?3.1玩游戲拆解步驟即:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? a. 實時理解游戲當前環境,英雄角色,英雄狀態
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? b. 根據當前狀態感知,生成英雄指令?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? c. 指令下發操作英雄
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? d. 再循環a
? ? 3.2 問題:每個步驟的模型處理慢,步驟間的流轉會產生時延
? ? ? ? ? ? ? ? ? ? 后續技術更新是否出現一個聚合llm呢? 一個模型內處理abc降低流轉延遲
? ? ? ? ? ? ? ? ? ? 再有gpu升級迭代 解決每個步驟模型的處理慢問題?
4. 心影隨行的ai游戲陪伴:
心影隨形x百度智能云:發布當日三次擴容,助力逗逗AI達成900萬用戶成就 - 百度智能云千帆社區