數據挖掘的相關知識例子

一、貝葉斯

貝葉斯定理由英國數學家貝葉斯 ( Thomas Bayes 1702-1761 ) 發展,用來描述兩個條件概率之間的關系,比如 P(A|B) 和 P(B|A)。按照乘法法則,可以立刻導出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可變形為:P(B|A) = P(A|B)*P(B) / P(A)。

例1:一座別墅在過去的 20 年里一共發生過 2 次被盜,別墅的主人有一條狗,狗平均每周晚上叫 3 次,在盜賊入侵時狗叫的概率被估計為 0.9,問題是:在狗叫的時候發生入侵的概率是多少?我們假設 A 事件為狗在晚上叫,B 為盜賊入侵,則以天為單位統計,P(A) = 3/7,P(B) = 2/(20*365) = 2/7300,P(A|B) = 0.9,按照公式很容易得出結果:P(B|A) = 0.9*(2/7300) / (3/7) = 0.00058


例2,現分別有 A、B 兩個容器,在容器 A 里分別有 7 個紅球和 3 個白球,在容器 B 里有 1 個紅球和 9 個白球,現已知從這兩個容器里任意抽出了一個球,問這個球是紅球且來自容器 A 的概率是多少?假設已經抽出紅球為事件 B,選中容器 A 為事件 A,則有:P(B) = 8/20,P(A) = 1/2,P(B|A) = 7/10,按照公式,則有:P(A|B) = (7/10)*(1/2) / (8/20) = 0.875貝葉斯公式為利用搜集到的信息對原有判斷進行修正提供了有效手段。在采樣之前,經濟主體對各種假設有一個判斷(先驗概率),關于先驗概率的分布,通常可根據經濟主體的經驗判斷確定(當無任何信息時,一般假設各先驗概率相同),較復雜精確的可利用包括最大熵技術或邊際分布密度以及相互信息原理等方法來確定先驗概率分布。

例3
貝葉斯法則的舉例分析
可以將貝葉斯法則的分析思路表達如下。
挑戰者B不知道原壟斷者A是屬于高阻撓成本類型還是低阻撓成本類型,但B知道,如果A屬于高阻撓成本類型,B進入市場時A進行阻撓的概率是20%(此時A為了保持壟斷帶來的高利潤,不計成本地拼命阻撓);如果A屬于低阻撓成本類型,B進入市場時A進行阻撓的概率是100%。
博弈開始時,B認為A屬于高阻撓成本企業的概率為70%,因此,B估計自己在進入市場時,受到A阻撓的概率為:
0.7×0.2+0.3×1=0.44
0.44是在B給定A所屬類型的先驗概率下,A可能采取阻撓行為的概率。
當B進入市場時,A確實進行阻撓。使用貝葉斯法則,根據阻撓這一可以觀察到的行為,B認為A屬于高阻撓成本企業的概率變成A屬于高成本企業的概率=0.7(A屬于高成本企業的先驗概率)×0.2(高成本企業對新進入市場的企業進行阻撓的概率)÷0.44=0.32
根據這一新的概率,B估計自己在進入市場時,受到A阻撓的概率為:
0.32×0.2+0.68×1=0.744
如果B再一次進入市場時,A又進行了阻撓。使用貝葉斯法則,根據再次阻撓這一可觀察到的行為,B認為A屬于高阻撓成本企業的概率變成。
A屬于高成本企業的概率=0.32(A屬于高成本企業的先驗概率)×0.2(高成本企業對新進入市場的企業進行阻撓的概率)÷0.744=0.086
這樣,根據A一次又一次的阻撓行為,B對A所屬類型的判斷逐步發生變化,越來越傾向于將A判斷為低阻撓成本企業了。
以上例子表明,在不完全信息動態博弈中,參與人所采取的行為具有傳遞信息的作用。盡管A企業有可能是高成本企業,但A企業連續進行的市場進入阻撓,給B企業以A企業是低阻撓成本企業的印象,從而使得B企業停止了進入地市場的行動。
應該指出的是,傳遞信息的行為是需要成本的。假如這種行為沒有成本,誰都可以效仿,那么,這種行為就達不到傳遞信息的目的。只有在行為需要相當大的成本,因而別人不敢輕易效仿時,這種行為才能起到傳遞信息的作用。
傳遞信息所支付的成本是由信息的不完全性造成的。但不能因此就說不完全信息就一定是壞事。研究表明,在重復次數有限的囚徒困境博弈中,不完全信息可以導致博弈雙方的合作。理由是:當信息不完全時,參與人為了獲得合作帶來的長期利益,不愿過早暴露自己的本性。這就是說,在一種長期的關系中,一個人干好事還是干壞事,常常不取決于他的本性是好是壞,而在很大程度上取決于其他人在多大程度上認為他是好人。如果其他人不知道自己的真實面目,一個壞人也會為了掩蓋自己而在相當長的時期內做好事。[2]?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/387370.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/387370.shtml
英文地址,請注明出處:http://en.pswp.cn/news/387370.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

3.3 1!到n!的和

求1! 2! ... n! 的結果。 輸入樣例&#xff1a; 3 6 輸出樣例 9 873 #include<iostream> #include<fstream> using namespace std;int main() {ifstream cin("test.txt");//向OJ提交時&#xff0c;注釋此句int num;while (cin >> num){int…

[幣嚴區塊鏈]以太坊(ETH)Dapp開發入門教程之寵物商店領養游戲

閱讀本文前&#xff0c;你應該對以太坊、智能合約有所了解&#xff0c;如果你還不了解&#xff0c;建議你先看以太坊是什么 除此之外&#xff0c;你最好還了解一些HTML及JavaScript知識。 本文通過實例教大家來開發去中心化應用&#xff0c;應用效果如圖: 項目背景 Pete有一個…

怎么通俗易懂地解釋貝葉斯網絡和它的應用?

作者&#xff1a;小杰鏈接&#xff1a;https://www.zhihu.com/question/28006799/answer/38996563來源&#xff1a;知乎著作權歸作者所有。商業轉載請聯系作者獲得授權&#xff0c;非商業轉載請注明出處。英語原文&#xff1a;http://www.norsys.com/tutorials/netica/secA/tut…

3.4 等比數列

已知q與n&#xff0c;求等比數列之和&#xff1a;1 q q^2 ... q^n 輸入樣例&#xff1a; 6 0.3 5 1.3 輸出樣例&#xff1a; 1.428 12.756 #include<iostream> #include<fstream> #include<cmath> using namespace std;int main() {ifstream cin(…

SVM分類算法的基本理論問題

1.引言   隨著網絡技術的飛速發展和普及&#xff0c;進入了信息大爆炸的時代。信息無處不在&#xff0c;給我們的學習生活帶來了諸多便捷&#xff0c;由于堪稱海量的信息量&#xff0c;我們從中獲取有用的信息變得困難&#xff0c;解決這一難題就是要對這些大量的信息進行分…

3.5 斐波那契數

求第n項的斐波那契數。 1 1 2 3 5 8 ... 輸入樣例&#xff1a; 6 10 輸出樣例&#xff1a; 8 55 #include<iostream> #include<fstream> #include<cmath> using namespace std;int main() {ifstream cin("test.txt");//向OJ提交時&#xff…

決策樹案例理解

小王是一家著名高爾夫俱樂部的經理。但是他被雇員數量問題搞得心情十分不好。某些天好像所有人都來玩高爾夫&#xff0c;以至于所有員工都忙的團團轉還是應付不過來&#xff0c;而有些天不知道什么原因卻一個人也不來&#xff0c;俱樂部為雇員數量浪費了不少資金。 小王的目的是…

3.6 最大公約數

輸入樣例&#xff1a; 6 5 18 22 輸出樣例&#xff1a; 1 6 #include<iostream> #include<fstream> #include<cmath> using namespace std;int main() {ifstream cin("test.txt");//向OJ提交時&#xff0c;注釋此句int m, n;while (cin >&…

劍指offer-反轉鏈表

反轉鏈表 一、題目描述 輸入一個鏈表&#xff0c;反轉鏈表后&#xff0c;輸出新鏈表的表頭。 &#xff08;看過答案和測試之后&#xff0c;題目隱藏條件是要求鏈表是不帶頭結點的&#xff09; 二、題目思路 就是用三個指針&#xff0c;head、pre、next&#xff0c;head之前都是…

3.7 最小公倍數

先各自除以最大公約數&#xff0c;然后將兩個結果和最大公約數相乘&#xff0c;即為最小公倍數。 輸入樣例&#xff1a; 6 5 18 12 輸出樣例&#xff1a; 30 36 #include<iostream> #include<fstream> using namespace std;int gcd(int, int);int main() {ifs…

聚類、K-Means、例子、細節

聚類#####今天說聚類&#xff0c;但是必須要先理解聚類和分類的區別&#xff0c;很多業務人員在日常分析時候不是很嚴謹&#xff0c;混為一談&#xff0c;其實二者有本質的區別。分類其實是從特定的數據中挖掘模式&#xff0c;作出判斷的過程。比如Gmail郵箱里有垃圾郵件分類器…

圖的廣度優先遍歷

#include <iostream> #include <vector> #include <queue> using namespace std;const int MAXV 1000; const int INF 1000000000; //下標代表點,數組元素代表連接的點 //圖的鄰接表 vector<int> Adj[MAXV]; //頂點數 int n;//DFS 如果頂點i已經被…

3.8 平均數

求若干整數的平均數&#xff0c;結果保留三位小數。 輸入樣例&#xff1a;第一個數字代表數據個數 3 6 5 18 4 1 2 3 4 輸出樣例&#xff1a; 9.667 2.500 #include<iostream> #include<fstream> using namespace std;int main() {ifstream cin("test.t…

從決策樹學習談到貝葉斯分類算法、EM、HMM

引言 最近在面試中(點擊查看&#xff1a;我的個人簡歷&#xff0c;求職意向&#xff0c;擇司標準)&#xff0c;除了基礎 & 算法 & 項目之外&#xff0c;經常被問到或被要求介紹和描述下自己所知道的幾種分類或聚類算法(當然&#xff0c;這完全不代表你將來的面試中會遇…

gdb調試的基本使用

GDB調試 啟動程序準備調試 GDB yourpram 或者 先輸入GDB 然后輸入 file yourpram然后使用run或者r命令開始程序的執行,也可以使用 run parameter將參數傳遞給該程序參數列表  命令 命令縮寫 命令說明 list l 顯示多行源代碼 break b 設置斷點,程序運行到斷點的位置會停…

3.9 對稱三位素數

素數&#xff1a;只能被1和自身整除 判斷一個數是否是素數&#xff1a;判斷從2到sqrt(n)的整數中是否有其約數 判斷一個數是否是三位素數。 輸入樣例&#xff1a; 11 101 272 輸出樣例&#xff1a; No Yes No #include<iostream> #include<fstream> #incl…

決策樹的過擬合問題

決策樹的過擬合問題決策樹是一種分類器&#xff0c;通過ID3&#xff0c;C4.5和CART等算法可以通過訓練數據構建一個決策樹。但是&#xff0c;算法生成的決策樹非常詳細并且龐大&#xff0c;每個屬性都被詳細地加以考慮&#xff0c;決策樹的樹葉節點所覆蓋的訓練樣本都是“純”的…

計算機網絡與協議

計算機網絡&#xff1a; TCP/IP中只要是能夠設定IP地址的計算機就成為主機 網絡按其規模可分為&#xff1a; WAN&#xff08;廣域網&#xff09;&#xff1a;覆蓋多個遠距離區域的遠程網絡 MAN&#xff08;城域網&#xff09;&#xff1a;比廣域網小一級&#xff0c;連接整個城…

3.10 十進制轉換為二進制

將十進制整數轉換成二進制數 對于每個n&#xff0c;以11位的寬度右對齊輸出n值&#xff0c;然后輸出"-->"&#xff0c;然后輸出二進制數。 輸入樣例&#xff1a; 2 0 -12 1 輸出樣例&#xff1a; 2-->10 0-->0 -12-->-1100 1-->1 #include<…

對線性回歸、邏輯回歸、各種回歸的概念學習

回歸問題的條件/前提&#xff1a; 1&#xff09; 收集的數據 2&#xff09; 假設的模型&#xff0c;即一個函數&#xff0c;這個函數里含有未知的參數&#xff0c;通過學習&#xff0c;可以估計出參數。然后利用這個模型去預測/分類新的數據。 1. 線性回歸 假設 特征 和 結果 都…