論文1簡介
標題:Hierarchical Reinforcement Learning for Course Recommendation in MOOCs
作者:Jing Zhang, Bowen Hao, Bo Chen, Cuiping Li, Hong Chen, Jimeng Sun
單位: 中國人民大學教育部數據工程與知識工程重點實驗室、?中國人民大學信息學院
佐治亞理工學院計算科學與工程學院
發表會議:AAAI
發表時間:2019年
論文研究主題歸類:強化學習在推薦系統中應用
1.論文解決什么問題
在以往的基于注意力機制的推薦系統中,當用戶對許多不同的課程都有興趣時,對目標推薦課程有貢獻的課程的影響效果被不同興趣的其他的歷史課程節點影響所干擾,注意力機制表現不佳,因而導致推薦系統誤判。作者使用強化學習方法對推薦課程系統中的原始數據進行噪聲處理,減小噪聲對推薦的影響。
2.是否有公開的數據集及源代碼
數據集來自慕課app后臺的數據,公開了一部分。
源代碼:GitHub-jerryhao66/HRL
3.論文的主要觀點
將用戶資料的修改過程形式化為一個由智能體進行的分層順序決策過程。遵循一個修改策略,執行一個高級任務和一個低級任務來修改資料。在修改了用戶的整個資料之后,代理從環境中獲得一個延遲的獎勵,根據這個獎勵更新其策略。可以將環境視為數據集和前一節介紹的預訓練的基本推薦模型。策略更新后,根據代理修改的資料重新訓練基本推薦模型。