Brief Guide
項目 | 內容 |
---|---|
這個作業屬于哪個課程 | 北航人工智能實戰課 |
這個作業的要求在哪里 | 第三次作業要求 |
我在這個課程的目標是 | 獲得機器學習相關的完整項目與學習經驗;通過與人工智能行業的大牛們聊天了解行業不同方向的發展以便進行職業規劃;為轉CS積累基礎知識并獲得相關課程的成績 |
這個作業在哪個具體方面幫助我實現目標 | 通過練習黃金點游戲,掌握強化學習的使用 |
作業正文… | 【王俊杰de人工智能實戰課】第7次作業2 |
其他參考文獻… | 微軟AI教育GitHub |
Main Homework
1 黃金點游戲介紹
黃金點游戲是指N個玩家提交各一個(0,100)的數,求這N個數的平均數,再將平均數乘以0.618,與結果最近的同學獲得此輪勝利并獲得積分。然后進入下一輪游戲。在一定輪數的游戲結束后,統計所有玩家的總成績,總成績最高的玩家獲勝。
2 黃金點游戲中的Trick
- 該游戲本質是一個基于時序序列的預測問題。根據已有的所有玩家的出分結果與最后的總結果對于下一輪結果的可能值進行預判,自己提交該結果以獲得此輪勝利。
- 更進一步的策略是,在預測下一輪結果的同時,偶爾隨機的改變自己的出分,以迷惑其他選手,讓其他選手找不到自己的出分規律。(即在時序序列中加入隨機噪聲)
3 我的策略
- 先指定每一輪都輸出同一個數,第二次游戲時輸出另一個數,第三次游戲的時候再換一個數,反復五次。提取每一個玩家(robot)的出分序列,對其進行分析,找出其中一些出分規律特別明顯的玩家(如每輪都隨機,或本輪出分等于上一輪結果,或每輪都出同一個數……)
- 確定一部分玩家的出分策略后,將其的處分策略納入考慮范圍,優化自己的出分。(隨機出分的視為每次都出隨即范圍的均值,其余的按其原有規律)
- 用moving average的方法,對剩余的每一個玩家的出分序列進行移動平均,以此策略優化自己的出分,測試幾次游戲,看一看結果如何。