Hierarchical Reinforcement Learning for Course Recommendation in MOOCs論文閱讀

Hierarchical Reinforcement Learning for Course Recommendation in MOOCs論文閱讀

pingmian/2025/8/15 21:07:30/文章來源:https://blog.csdn.net/weixin_45403853/article/details/147058165

論文1簡介

標題：Hierarchical Reinforcement Learning for Course Recommendation in MOOCs

作者：Jing Zhang, Bowen Hao, Bo Chen, Cuiping Li, Hong Chen, Jimeng Sun

單位: 中國人民大學教育部數據工程與知識工程重點實驗室、?中國人民大學信息學院

佐治亞理工學院計算科學與工程學院

發表會議：AAAI

發表時間：2019年

論文研究主題歸類：強化學習在推薦系統中應用

1.論文解決什么問題

在以往的基于注意力機制的推薦系統中，當用戶對許多不同的課程都有興趣時，對目標推薦課程有貢獻的課程的影響效果被不同興趣的其他的歷史課程節點影響所干擾，注意力機制表現不佳，因而導致推薦系統誤判。作者使用強化學習方法對推薦課程系統中的原始數據進行噪聲處理，減小噪聲對推薦的影響。

2.是否有公開的數據集及源代碼

數據集來自慕課app后臺的數據，公開了一部分。

源代碼：GitHub-jerryhao66/HRL

3.論文的主要觀點

將用戶資料的修改過程形式化為一個由智能體進行的分層順序決策過程。遵循一個修改策略，執行一個高級任務和一個低級任務來修改資料。在修改了用戶的整個資料之后，代理從環境中獲得一個延遲的獎勵，根據這個獎勵更新其策略。可以將環境視為數據集和前一節介紹的預訓練的基本推薦模型。策略更新后，根據代理修改的資料重新訓練基本推薦模型。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/76339.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/76339.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/76339.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

零基礎學Git

零基礎學Git

大家好！最近跟著網上的課程看了一下git的課，淺淺地學了一下，以下內容為作為一個小白初識git的學習歷程和學習筆記！！！ 1.Git概述 1.1什么是Git? 分布式版本控制系統（DVCS）&#x…

閱讀更多...

算法模版

算法模版

cin cout加快讀取速度： ios::sync_with_stdio(false); 高精度*高精度 vector<int> mul(vector<int>& a, vector<int>& b) {vector<int>c(b.size()a.size()5,0);for (int i 0; i < a.size(); i) {for (int j 0; j < b.si…

閱讀更多...

4185 費馬小定理求逆元

4185 費馬小定理求逆元

4185 費馬小定理求逆元 ??難度：簡單 🌟考點：費馬小定理 📖 📚 import java.util.Scanner; import java.util.Arrays;public class Main {static int[][] a;public static void main(String[] args) {Scanner sc …

閱讀更多...

【SQL】常見SQL 行列轉換的方法匯總 - 精華版

【SQL】常見SQL 行列轉換的方法匯總 - 精華版

【SQL】常見SQL 行列轉換的方法匯總 - 精華版一、引言二、SQL常見的行列轉換對比1. 行轉列 Pivoting1.1 ??CASE WHEN 聚合函數??1.2 ??IF 聚合函數??1.3 ??PIVOT操作符?? 2.列轉行 Unpivoting2.1 UNION ALL??2.2 ??EXPLODE函數（Hive/Spark&#…

閱讀更多...

操作系統 4.3-生磁盤的使用

操作系統 4.3-生磁盤的使用

磁盤的物理組成盤面： 磁盤由多個盤面組成，每個盤面上都有數據存儲的區域。磁道： 每個盤面上都有若干個同心圓，這些同心圓稱為磁道。磁道是數據存儲的路徑。扇區： 磁道被進一步劃分為若干個扇區，扇區…

閱讀更多...

PT抽ETM如何包含power信息

PT抽ETM如何包含power信息

在primetime中，可以使用extract_model -power指令使ETM包含power的信息。需要注意的是，需要先設置set power_enable_analysis為true。例如得到有power信息的ETM指令如下（示例）： set power_enable_analysis true ex…

閱讀更多...

Linux服務器網卡深度解析：從ifconfig輸出到生產環境性能調優實戰

Linux服務器網卡深度解析：從ifconfig輸出到生產環境性能調優實戰

Linux服務器網卡深度解析：從ifconfig輸出到生產環境性能調優實戰 Linux服務器網卡深度解析：從ifconfig輸出到生產環境性能調優實戰一、背景二、生產環境的服務器部署情況三、拆解一個真實的 ifconfig 輸出1、先看 MAC 地址2、再看設備的 interrupt 和 me…

閱讀更多...

996引擎-源碼學習：PureMVC Lua 中的 Facade 類

996引擎-源碼學習：PureMVC Lua 中的 Facade 類

996引擎-源碼學習：PureMVC Lua 中的 Facade 類 1. 核心概念1.1 外觀模式1.2 多例模式2. 關鍵組件NotificationController:ModelView3. 主要功能4. 初始化流程5. 通信機制6. 生命周期管理1. Facade 初始化流程圖2. 發送通知時序圖中介者 PlayerBestRingLayerMediatorOpenLayer …

閱讀更多...

鏈式多分支規則樹模型的應用

鏈式多分支規則樹模型的應用

目錄開始調用初始化歡迎關注我的博客！26屆java選手，一起加油💘💦👨?🎓😄😂 引入最近在學習一個項目中的鏈式多分枝規則樹模型的使用，模型如下： 如圖所…

閱讀更多...

GitLab之搭建（Building GitLab）

GitLab之搭建（Building GitLab）

GitLab之搭建 “ 在企業開發過程中，GitLab憑借其強大的版本管理、CI/CD集成和項目管理功能，成為許多團隊的首選工具。本文將探討GitLab的基礎介紹、搭建過程、權限管理、代碼審查以及團隊知識管理等方面。通過詳細的步驟和實用的技巧，旨在幫…

閱讀更多...

藍橋杯小藍的操作（一維差分）

藍橋杯小藍的操作（一維差分）

問題描述一個數組 aa 中共包含 nn 個數，問最少多少次操作，可以讓 aa 數組所有數都變成 11 。操作的內容是：每次操作可以任選一個區間使得區間內的所有數字減 11 。數據保證一定有解。輸入格式第一行一個整數 nn 表示有 nn 個整數。 …

閱讀更多...

C# net CMS相關開源軟件技術選型可行性分析

C# net CMS相關開源軟件技術選型可行性分析

C# net CMS相關開源軟件技術選型可行性分析 OrchardCMS(微軟主導) https://github.com/OrchardCMS/OrchardCore https://docs.orchardcore.net/en/latest/ BSD Umbraco-CMS（丹麥） https://github.com/umbraco/Umbraco-CMS https://docs.umbraco.com/…

閱讀更多...

程序化廣告行業（77/89）：融資、并購與上市全景洞察

程序化廣告行業（77/89）：融資、并購與上市全景洞察

程序化廣告行業（77/89）：融資、并購與上市全景洞察大家好呀！一直以來，我都希望能和大家一起在技術知識的海洋里暢游、學習進步。前面我們已經了解了程序化廣告行業的發展態勢、PC端和移動端投放差異以及行業融資的大致…

閱讀更多...

【解決方法】VMware 此平臺不支持虛擬化Intel VT-x/EPT

【解決方法】VMware 此平臺不支持虛擬化Intel VT-x/EPT

目錄 1. 引言2. 問題描述3. 解決方法3.1 方法一（臨時）3.2 方法二（此方法非常離譜，永久有效） 4. 🤑鼓勵一下5. 求關注6. 我的其他文章推薦 1. 引言收集同學們遇到的各種VMware安裝、使用過程中遇到的問題&a…

閱讀更多...

項目學習總結001

項目學習總結001

1. 策略模式和工廠模式 https://mp.weixin.qq.com/s/RG-h7r69JyKUlBZylJJIFQ 在軟件開發中也常常遇到類似的情況，實現某一個功能有多個途徑，此時可以使用一種設計模式來使得系統可以靈活地選擇解決途徑，也能夠方便地增加新的解決途徑。這就是…

閱讀更多...

OpenHarmony 5.0版本視頻硬件編解碼適配

OpenHarmony 5.0版本視頻硬件編解碼適配

一、簡介 Codec HDI（Hardware Device Interface）對上層媒體服務提供視頻編解碼的驅動能力接口，主要功能有獲取組件編解碼能力，創建、銷毀編解碼器對象，啟停編解碼器操作，編解碼處理等。 Codec HDI 2.0接口…

閱讀更多...

深度解析基于 Web Search MCP的Deep Research 實現邏輯

深度解析基于 Web Search MCP的Deep Research 實現邏輯

寫在前面大型語言模型（LLM）已成為我們獲取信息、生成內容的重要工具。但它們的知識大多截止于訓練數據的時間點，對于需要實時信息、跨領域知識整合、多角度觀點比較的深度研究 (Deep Research) 任務，它們往往力有不逮。如何讓 LLM 突破自身知識的局限，像人類研究員一樣，…

閱讀更多...

鴻蒙案例---生肖抽卡

鴻蒙案例---生肖抽卡

案例源碼： Zodiac_cards: 鴻蒙生肖抽獎卡片效果演示初始布局 1. Badge 角標組件此處為語雀內容卡片，點擊鏈接查看：https://www.yuque.com/kevin-nzthp/lvl039/rccg0o4pkp3v6nua 2. Grid 布局 // 定義接口 interface ImageCount {url:…

閱讀更多...

基于RV1126開發板實現自學習圖像分類方案

基于RV1126開發板實現自學習圖像分類方案

1. 方案簡介自學習：在識別前對物體圖片進行模型學習，訓練完成后通過算法分類得出圖像的模型ID。方案設計邏輯流程圖，方案代碼分為分為兩個業務流程，主體代碼負責抓取、合成圖像，算法代碼負責訓練和檢測功能。 2. 快速…

閱讀更多...

cat命令查看文件行數

cat命令查看文件行數

在Linux和Unix-like操作系統中，cat命令主要用于查看文件內容，而不是直接用來查看文件行數。如果你想要查看一個文件的行數，可以使用以下幾種方法： 方法1：使用wc命令 wc（word count）命令可以用…

閱讀更多...

最新文章