星際爭霸作為檢驗AI效果的一個重要“模式生物”,?是驗證AI技術的重要平臺?,尤其在?深度學習?和?強化學習領域。該游戲因其復雜的游戲機制和實時決策要求,為AI研究提供了豐富的測試環境和挑戰。
本博文是記錄自己曾經研究星際爭霸AI時對于數據部分的一點匯總,由于AlphaStar是模仿學習+強化學習的路線(?在 AlphaStar 中,第一步的訓練是在暴雪提供的數據集上進行的有監督學習。據 DeepMind 稱,經過有監督學習,AlphaStar 對暴雪的內置 AI 能保持 95% 上的勝率。接下來很多經過有監督學習的 AlphaStar 進行聯賽 (League),相互對打,在這個過程中使用強化學習不斷提升能力。),于是我先找的數據集,還踩了很多坑……知行合一致體悟,留與后人三兩逕。
相關事件
2017年8月7日,Facebook的AI團隊發布了史上最大的《星際爭霸:母巢之戰》游戲數據集。緊接著10號,Deepmind就和暴雪聯合發布了《星際爭霸2》的游戲數據集與AI訓練平臺SC2LE。
DeepMind and Blizzard open StarCraft II as an AI research environment - Google DeepMind
https://deepmind.google/discover/blog/deepmind-and-blizzard-open-starcraft-ii-as-an-ai-research-environment/
2018年12月10日和19 日AlphaStar 在《星際爭霸2》中先后以 5:0 全勝的戰績擊敗了 2 位國際頂級的人類選手
2019年10月,出了那篇nature
Grandmaster level in StarCraft II using multi-agent reinforcement learning | Nature
https://www.nature.com/articles/s41586-019-1724-z
1.數據集
首先,星際爭霸的數據集分為《星際爭霸1:母巢之戰》(母巢之戰是DLC名)和《星際爭霸2》的!他們是不同的!
2017年8月7日,Facebook 的四名科學家 Zeming Lin,?Jonas Gehring,?Vasil Khalidov,?Gabriel Synnaeve 公布了史上最大的《星際爭霸:母巢之戰》游戲數據集:365GB,包含6萬游戲記錄,15億幀,4.9億玩家操作。
數據集-OpenDataLab
https://opendatalab.com/OpenDataLab/StarData這是Facebook 做的母巢之戰的數據集
?
而到了Deepmind這里,事情就有一點復雜了。他們的對象不是《母巢之戰》,而是更加高級的《星際爭霸2》。Deepmind也給出了游戲數據集,包含6萬5千場暴雪官方回收的匿名游戲數據。未來還會持續增加。
?sc2_datasets——當下我找到的最好的星際2數據集!數據集、使用方式都給研究者準備好了!
數據集下載地址:
SC2ReSet: StarCraft II Esport Replaypack Set
https://zenodo.org/records/5575797
論文地址:(還是篇nature???)
SC2EGSet: StarCraft II Esport Replay and Game-state Dataset
https://www.nature.com/articles/s41597-023-02510-7.pdf
(PDF) SC2EGSet: StarCraft II Esport Replay and Game-state Dataset
https://www.researchgate.net/publication/373767449_SC2EGSet_StarCraft_II_Esport_Replay_and_Game-state_Dataset
幫助手冊
使用樣例- sc2_datasets 1.1.0 Documentation
https://sc2-datasets.readthedocs.io/en/latest/example.html幫助手冊-SC2Reader User Manual — sc2reader 0.7.0-pre documentation
https://sc2reader.readthedocs.io/en/latest/
Spawning——這是最全最實時的星際的生數據集網站!
支持按玩家、比賽時間等(左側條件篩選框)進行篩選!
Spawning Tool: Browse Replays
網站地址:
Spawning Tool: StarCraft 2 Build OrdersSpawning Tool organizes StarCraft 2 build orders, guides, and replays
https://lotv.spawningtool.com/
MCS:?
中科院開源星際爭霸2宏觀運營研究數據集MSC
MSC: A Dataset for Macro-Management in StarCraft II | Papers With Code
https://paperswithcode.com/paper/msc-a-dataset-for-macro-management-in數據集:
MSC Dataset | Papers With Code
https://paperswithcode.com/dataset/msc數據集載入工程
https://github.com/wuhuikai/MSC
https://github.com/wuhuikai/MSC
Sc2ReplayStats
還算好用的星際數據集下載網站,就是必須注冊,還有各種限制……
Sc2ReplayStats - Starcraft 2 Replay Replay Hosting/Training System - Sc2ReplayStats.com
https://sc2replaystats.com/
?
StarCraft II Unplugged: 大規模離線強化學習數據集
https://openreview.net/pdf?id=Np8Pumfoty
https://openreview.net/pdf?id=Np8Pumfoty
?
2.強化學習環境
當初我曾豪情萬丈,覺得已經出現的東西應該很容易就可以復現和改進,結果我發現復雜的整局對戰全使用深度學習并不容易,原來研究人員當初也是用編輯器做的小地圖(mini-games,就幾個兵對戰的那種)來對戰……
2017年的發布還包括了一系列迷你游戲(mini-games),這是一種將游戲分解成更可控的部分的技術,可以用于測試智能體在特定任務中的表現,例如移動視角(camera)、采礦或是選擇操作單位。DeepMind 在博客中表示,希望研究者能夠在這些迷你游戲上測試其技術,同時也為其他研究者提供新的迷你游戲,用以競賽和評估。
3.AI接口
發布了星際爭霸2的人工智能研究環境SC2LE(作為一個高中時玩魔獸地圖編輯器的,我挺想做魔獸AI的,但是沒接口沒法接AI的輸入輸出啊……)
?SC2LE 開放平臺,相對于大家之前做的星際1的平臺,最大的一個優勢是提供了很多端到端的內容操作的API接口,發展出來可以通過接口像人一樣打星際,進行控制。這種接口是在之前的星際1平臺上不提供的。
Blizzard/s2client-proto: StarCraft II Client - protocol definitions used to communicate with StarCraft II.
https://github.com/Blizzard/s2client-proto
PySC2是SC2LE的繼承者,?PySC2 ?是由 DeepMind 開發的 星際爭霸II 學習環境(StarCraft II Learning Environment, SC2LE)的 Python 組件。該項目旨在為機器學習研究者提供一個豐富的環境,用于強化學習(Reinforcement Learning, RL)研究?環境。
google-deepmind/pysc2: StarCraft II Learning Environment
https://github.com/google-deepmind/pysc2
4.策略與數據挖掘
一個維護的星際爭霸AI開發資料庫
SKTBrain/awesome-starcraftAI: A curated list of resources dedicated to StarCraft AI.https://github.com/SKTBrain/awesome-starcraftAI
?《星際爭霸:母巢之戰》的數據挖掘相關代碼。(在調研中發現,星際爭霸的策略主要是“建筑建造順序”與“出兵順序”)StarCraft Brood War Data Mininghttp://nova.wolfwork.com/dataMining.html
?
星際爭霸AI對戰排位平臺:AI Arena
AI Arenahttps://aiarena.net/
星際2對手策略預測的一個論文使用的數據集
UCI Machine Learning RepositoryDiscover datasets around the world!https://archive.ics.uci.edu/dataset/272/skillcraft1+master+table+dataset
研究對手識別時的經典書籍《Plan, Activity, and Intent Recognition》
Plan, Activity, and Intent Recognition Archives - AAAIhttps://aaai.org/proceeding/ws17-13/
Spring是一個free的RTS游戲引擎,只看到一篇英文論文有用它,熱度太低……
https://openreview.net/pdf?id=Np8Pumfotyhttps://openreview.net/pdf?id=Np8Pumfoty
不錯的介紹:
數據集介紹1——游戲數據做評估 - 知乎https://zhuanlan.zhihu.com/p/82557388
其他參考:
AlphaStar 星際首秀,人工智能走向星辰大海-CSDN博客
數據集介紹1——游戲數據做評估 - 知乎https://zhuanlan.zhihu.com/p/82557388
最后,這CSDN編輯器有大bug啊!怎么我一撤銷就少了好多東西啊!!!我只能在歷史瀏覽中找之前看過什么再努力想起來把鏈接加上,不帶文本編輯器這么玩人的!