協同過濾與矩陣分解講解(PPT)

總覽

你好啊
協同過濾算法,就是一種完全依賴用戶和物品之間行為關系的推薦算法。
從字面理解,協同大家的反饋、評價和意見一起對海量的信息進行過濾,從中篩選出用戶可能感興趣的信息。


知識概括

在這里插入圖片描述
從這幾個方面進行分析。


一、基于用戶的協同過濾

在這里插入圖片描述
顯示能夠直接看出用戶的偏好,
隱式需要自己動手挖掘數據,如果方法不夠準確,可能找的會有問題。

在這里插入圖片描述
從這個圖中可以看出,用戶一與用戶三都喜歡APP1,
這兩位用戶的興趣可能是一樣的,可以做出推測,用戶3可能是喜歡app3的

在這里插入圖片描述稀疏是說通常商品非常多,用戶購買的只是其中極小一部分

計算講的是用戶和物品的矩陣會非常龐大,此外還有增量數據的同步問題。人們的興趣一直在變,去同步這種變化的數據就是一種計算問題。
冷啟動是指新用戶到來,本身沒有和其他用戶有關聯,這種情況該如何推薦

二、基于物品的協同過濾

測試,這是圖片描述,好像沒事特別
在推薦中,如果用物品1和物品3經常一起出現,也就是說用戶購買1的時候也大概率會買3,
那么出現新用戶3喜歡物品1,同時也用戶3推薦物品3.
在這里插入圖片描述

更流行,現階段各大網站基本都是用戶較多,
商品(種類)比用戶少的多商品屬性通常比較固定,特征獲取容易,而且基本不會改變
即便上架了新商品,它自身也有各種標簽,不會像用戶一樣是張白紙
應用場景更適合當下各種網站,APP(實時的除外,例如新聞)的、


三、矩陣分解

在這里插入圖片描述
如果有100w的用戶,1個億的產品,這兩個組合一個矩陣,數據量太大,計算分析困難。

怎么樣能通過一種方法降低這個計算復雜度,將最終目標實現,就是矩陣分解要做的事情。
在這里插入圖片描述
這是用戶歌曲之間的行為數據,1代表聽過個,0代表沒有聽過。
可以看出是比較稀疏的矩陣,目標是預測空白值是多少。
如果直接算的話,計算效率比較低
在這里插入圖片描述
原始矩陣是100w10w,
拆分為兩個矩陣:100w
3 與 3*10w兩個矩陣,這兩個矩陣就相對小很多,
這個3是隱向量,
在這里插入圖片描述
最后可以分解成這樣的矩陣,
這里的三個特征,就是隱向量,其實就是特征的高維表達,很難去解釋。

這里的民謠、兒歌,是為了方便理解,這樣寫出來的。但其實沒有辦法解釋,如右下角所示。
優化好小矩陣中的數值,最終合并成一個大表。
在這里插入圖片描述
如圖中所示,通過不斷調整參數,最后得到一個計算機能理解的特征,
就是隱向量的一般含義。
在這里插入圖片描述
這是最終的表格

在這里插入圖片描述
使用矩陣分解,希望還原后的矩陣,和原來是越相似越好。
rui 相當于原來的大矩陣,xy就是分解出來的兩個小矩陣,希望他們之間的差異越來越小。

在這里插入圖片描述
默認為1,rui當前的指標,比如點擊次數,阿爾法相當于是系數,就是權重的設置。
行為越多,置信度的值會越來越大。
置信度的值越大,表示預測的越準確。

需要PPT的私聊

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/163891.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/163891.shtml
英文地址,請注明出處:http://en.pswp.cn/news/163891.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

6個PPT素材網站,讓你快速做出好看的PPT

找PPT模板一定要收藏好這6個網站,能讓你快速做出好看的PPT,重點十可以免費下載,趕緊收藏! 1、菜鳥圖庫 https://www.sucai999.com/search/ppt/0_0_0_1.html?vNTYwNDUx 菜鳥圖庫網有非常豐富的免費素材,像設計類、辦公…

力扣labuladong——一刷day48

提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔 文章目錄 前言一、力扣1602. 找到二叉樹中最近的右側節點二、力扣437. 路徑總和 III三、力扣560. 和為 K 的子數組 前言 二叉樹的遞歸分為「遍歷」和「分解問題」兩種思維模式…

第7章-使用統計方法進行變量有效性測試-7.4.2-多元線性回歸

目錄 多元線性回歸模型 總體回歸函數 樣本回歸函數 線性回歸模型的假定 普通最小二乘法(Ordinary Least Squares,OLS) 擬合優度指標 F檢驗 回歸系數的t檢驗 Python中構建多元線性回歸模型 數據理解 數據讀取 數據清洗 相關分析 …

想考教師編制專業不對口怎么辦?

很多人在想要步入教師行業時,會遇到一個問題:專業不對口。這種情況可能會讓你感到困惑和沮喪,但不要氣餒,因為有很多方法可以讓你實現自己的夢想。 可以通過提高自己的教育水平和能力來彌補專業不對口的缺陷。你可以通過參加教師資…

品牌小紅書koc投放策略分享,純干貨!

作為中國具有影響力的時尚美妝社交平臺,小紅書與其充滿活力的用戶群體成為品牌尋找優質KOC合作的理想平臺。本文伯樂網絡傳媒將探討品牌如何利用小紅書的KOC投放策略,實現更廣泛的市場覆蓋和更有效的品牌營銷。 一、明確目標受眾與KOC合作需求 在開始策…

containerd Snapshots功能解析

containerd Snapshots功能解析 snapshot是containerd的一個核心功能,用于創建和管理容器的文件系統。 本篇containerd版本為v1.7.9。 本文以 ctr i pull命令為例,分析containerd的snapshot “創建” 相關的功能。 ctr命令 ctr image相關命令的實現在cmd…

《人件》讀書筆記

文章目錄 一、書名和作者二、書籍概覽2.1 主要論點和結構2.2 目標讀者和應用場景 三、核心觀點與主題3.1 管理團隊主題3.2 改善工作環境主題3.3 正確的人主題3.4 團隊項目管理主題 四、亮點與啟發4.1 最有影響的觀點4.2 對個人專業發展的啟示 五、批評與局限性5.1 可能存在爭議…

leetcode (力扣) 97. 交錯字符串(動態規劃)

文章目錄 題目描述思路分析完整代碼 題目描述 給定三個字符串 s1、s2、s3,請你幫忙驗證 s3 是否是由 s1 和 s2 交錯 組成的。 兩個字符串 s 和 t 交錯 的定義與過程如下,其中每個字符串都會被分割成若干 非空 子字符串: s s1 s2 … sn t …

數據庫——查詢連續的月份

一、GP或PGSQL with recursive t(n) as (select date(2023-01-01) union all select n1 from t where n < now()) select to_char(n, yyyy-mm) as ny from t group by ny order by ny 二、Hive select add_months(FROM_UNIXTIME(unix_timestamp(SUBSTR(start_date, 1, 7…

rdf-file:組件內置協議(SP、DE、FUND、FUND_INDEX)

Rdf-File根據協議布局模板和數據定義模板,來進行文件的解析與生成。通過協議布局和數據定義模板&#xff0c;能夠明確計算出頭尾占用的行數&#xff0c;這樣可以更精確的分離出head&#xff0c;body&#xff0c;tail。 目前組件實現的協議布局模板可以分為如下兩大類&#xff…

【深度學習實驗】圖像處理(一):Python Imaging Library(PIL)庫:圖像讀取、寫入、復制、粘貼、幾何變換、圖像增強、圖像濾波

文章目錄 一、實驗介紹二、實驗環境1. 配置虛擬環境2. 庫版本介紹 三、實驗內容0. 安裝 PIL 庫1. 圖像讀取和寫入a. 圖像讀取b. 圖像寫入c. 構建新圖像 2. 圖像復制粘貼a. 圖像復制b. 圖像局部復制c. 圖像粘貼 3. 幾何變換a. 圖像調整大小b. 圖像旋轉c. 圖像翻轉 4. 圖像增強a.…

cocos creator中AStar算法實例

引擎版本 —— cocos creator2.3.4

高端貓罐頭有哪些?精選的5款優質的貓罐頭推薦!

很多鏟屎官看貓貓吃貓糧吃膩了&#xff0c;或者貓貓平時不喜歡喝水&#xff0c;又或者看貓貓太瘦了就想入手幾款貓罐頭但是又愁于不會選擇&#xff0c;而且現在貓罐頭風這么大不知道選什么好~ 作為一個開寵物店7年的店長&#xff0c;對于貓咪的飲食健康我一直都很重視&#xff…

數據結構與算法編程題16

已知長度為n的線性表A&#xff0c;請寫一時間復雜度為O(n)、空間復雜度為O(1)的算法&#xff0c;該算法刪除線性表中所有值為item的數據元素。 item 3 數組下標 i 0 1 2 3 4 5 6 7 8 順序表&#xff1a; 1 2 3 4 3 3 5 3 7 #include <iostream> using namespace std;typ…

Linux常用基礎命令及重要目錄,配置文件功能介紹

目錄 一&#xff0c;Linux常用必備基礎命令 1&#xff0c;網絡類命令 2&#xff0c;文件目錄類命令 3&#xff0c;操作類命令 4&#xff0c;關機重啟命令 5&#xff0c;幫助命令 6&#xff0c;查看顯示類命令 7&#xff0c;命令常用快捷鍵 二&#xff0c;Linux重要目錄…

文獻閱讀的六個步驟

對于科研人員來說&#xff0c;文獻閱讀是一項重要的任務&#xff0c;當然要找對方法和步驟&#xff0c;可以按照這些步驟來哦。 1、確定研究問題和目標&#xff1a;在開始閱讀外文文獻之前&#xff0c;明確您的研究問題和目標。這將幫助您更好地理解作者所說的話以及他們提出的…

windows版本的grafana如何離線安裝插件

本文以安裝clickhouse的插件為例&#xff0c;記錄下如何離線安裝插件 1 下載插件 ClickHouse plugin for Grafana | Grafana Labs 2 找到grafana的配置文件 打開編輯&#xff0c;搜索plugin關鍵字&#xff0c;修改plugin的加載目錄 目錄不存在&#xff0c;手動創建&#xff0…

【Python】Vscode解決Python中制表符和空格混用導致的縮進問題

【Python】Vscode解決Python中制表符和空格混用導致的縮進問題 文章目錄 【Python】Vscode解決Python中制表符和空格混用導致的縮進問題1. 問題來源2. 解決Reference 1. 問題來源 在python中使用縮進來進行代碼塊的分區&#xff0c;通常來說python的一個縮進包含4個空格&#…

軟件測試崗位與職業發展

一、軟件測試崗位有哪些&#xff1f; 在企業中&#xff0c;軟件測試領域的幾個典型的職位有&#xff1a;功能測試工程師&#xff08;也叫手工測試&#xff09;、自動化測試工程師、性能測試工程師、測試開發等。 1、功能測試&#xff08;手工測試&#xff09;工程師 主要工作內…

2023年“福建省工業互聯網+智能制造創新大賽”開啟報名

11月22日&#xff0c;由福建省總工會、福建省大數據集團有限公司共同舉辦的2023年“福建省工業互聯網智能制造創新大賽”啟動報名。 大賽積極響應《福建省總工會等八部門關于廣泛深入開展勞動和技能競賽為新發展階段新福建建設建工立業的意見》&#xff08;閩工〔2022〕70號&am…