
初級或中級算法崗面試題主要有四類:數理統計基礎、機器學習模型原理、編程能力、項目經驗。項目經驗因人而異,所以僅總結前三個方面的基礎知識,分享給朋友。(高級或資深算法崗面試內容不在本文范圍內)
1.大數定律
弱大數定律:獨立同分布的n個隨機變量,當n充分大時,n個隨機變量的均值依概率收斂于數學期望值,即可以用均值代替數學期望值。
伯努利大數定理:獨立重復試驗次數足夠大時,事件A發生的頻率收斂于概率。注:以上為口頭簡述,非標準化的數學表述。
2.中心極限定理
n個獨立同分布的隨機變量,當n充分大時,其均值服從正態分布。注:以上為口頭簡述,非標準化的數學表述。
3.條件概率/分布律(乘法公式)
P(A|B)=P(AB)/P(B),演化式P(A|B)*P(B)=P(B|A)*P(A)
4.全概率公式
P(A)= P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn),其中A為樣本空間的事件,B1、B2、B3…Bn為樣本空間的一個劃分。
5.貝葉斯公式
P(Bi|A)= P(A|Bi)*P(Bi)/[P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn)],其中A為樣本空間的事件,B1、B2、B3…Bn為樣本空間的一個劃分。
6. 常見三大正態抽樣分布



7. 參數檢驗(總體分布已知的情況下,對參數取值的檢驗)




8. 非參數檢驗(總體分布形式未知情況下的檢驗)


(3) 偏度、峰度檢驗

9. 置信區間




注:單側置信區間省略
10. 模型擬合優度



(4)A/Btest Score
(5)殘差檢驗:一般要求殘差分布接近正態分布。
寫在最后:原理和思想很重要,一定要理解透徹!!!
“數學算法的世界”專注數據分析、數據科學技能傳播,后期會陸續推出數據分析、數據科學面試題匯總系列文章,敬請關注!

往期回顧
在數據分析/科學中的競爭力如何?一張圖幫你讀懂數據科學需要掌握的技能
抖音日活3.2億,可能有 3.3億用戶在同一天內使用抖音嗎?(泊松分布的Python實現)
常見數據分析(Python)面試題(一)
什么影響了你的工資?方差分析告訴你
我放棄了國企工作,轉行做了數據分析