數學基礎
一、數據分析
二、概率論
三、線性代數及矩陣
l 數學基礎 1)常數e2)導數3)梯度
4)Taylor5)gini系數6)信息熵與組合數
1)概率論基礎2)古典模型3)常見概率分布 4)大數定理和中心極限定理5)協方差(矩陣)和相關系數 6)最大似然估計和最大后驗估計
1)線性空間及線性變換2)矩陣的基本概念練3) 狀態轉移矩陣4)特征向量5)矩陣的相關乘法6)矩陣的QR分解 7)對稱矩陣、正交矩陣、正定矩陣8)矩陣的SVD分解9)矩陣的求導 10)數據白化及其應用
Python 基礎
1)Python 環境安裝 2)Anaconda3)PyCharm
1)變量 2)數據類型 3)列表 4)元組 5)字典 6)控制語句 7)循環語句 8)函數 9)類對象
1)numpy:
用 Numpy 創建數組并查看其屬性 Numpy 的 基本運算 Numpy 的基本函數索引,
l 學習大綱
階段 | 主講內容 | 技術要點 |
階段 | 主講內容 | 技術要點 |
一、環境搭建
二、Python 基礎語法
Python 基礎
三、Python 常用庫
四、Python 機器學習 模塊
切片和迭代形狀操作深拷貝廣播法則
2)pandas:
Series 的創建和基本的操作 DataFrame 的創建 和基本的操作 Panel 的創建和基本的操作用
Pandas 常用函數查看和操作數據
3)scipy:
基本可以代替 Matlab 的工具包,方便、易于使用、 專為科學和工程設計的 Python 工具包. 它包括統計,優化,整合,線性代數模塊,傅里葉變換, 信號和圖像處理,常微分方程求解器等 4)matplotlib:
Python 中最著名的繪圖系統 散點圖,折線圖,條形圖,直方圖,餅狀圖, 箱形圖的繪制 坐標軸的調整,添加文字注釋,區域填充, 及特殊圖形 patches 的使用
5)seaborn:
在 matplotlib 的基礎上進行了更高級
API 的封裝,從而使得作圖變得更加容易。
6)time
Python 時間模塊常用函數
Scikit-Learn
階段 | 主講內容 | 技術要點 |
機器學習
一、機器學習 二、數據預處理 三、線性回歸算法 四、KNN K近鄰算法
五、邏輯回歸算法 六、梯度下降算法 七、牛頓法與擬牛頓法
八、決策樹算法
九、Bagging集成算法 十、Adaboost算法 十一、GBDT算法
十二、XGboost和lightGBM算法
十三、支持向量機
十四、聚類算法
1)機器學習概述2)定義問題
1)特征抽取2)特征轉換3)歸一化
1)線性回歸2)Ridge嶺回歸3)Lasso回歸4)Elastic Net算法
1)KNN算法原理2)KNN算法應用
1)sigmoid函數2)邏輯回歸的損失函數3)邏輯回歸的優化 4)邏輯回歸的多分類問題5)Softmax回歸多分類
1)批量梯度下降2)隨機梯度下降3)mini-batch梯度下降 1)牛頓法求函數根2)牛頓法求解函數最優化問題
3)擬牛頓法—L-BFGS 1)決策樹的簡介2)CART、ID-3、C4.53)gini系數
4)信息增益5)信息增益率6)葉子節點的表達7)回歸樹 8)預剪枝和后剪
1)bootstrap2)隨機森林
1)Adaboost算法流程2)Adaboost算法損失函數優化
1)函數空間梯度下降2)GBM框架3)GBDT算法解決回歸問題
1)目標函數的建立2)子樹的分裂條件3) 子樹葉子節點的表達 4)與傳統GBDT的比較
1)線性可分支持向量機2)軟間隔支持向量機3)核函數方法 4)SMO算法5)SVM回歸SVR和分類SVC
1)各種相似度距離測度方法2)K-Means算法 3)K-Means算法優缺點4)密度聚類5)層級聚類6)譜聚類
十五、PCA主成分分析算法 十六、LDA降維 十七、MDS降維算法 十八、ISO-map降維算法 十九、LLE算法
二十、SVD奇異值分解算法
二十一、ALS矩陣分解算法 二十二、FM 因子分解機
二十三、樸素貝葉斯算法 二十四、貝葉斯網絡
二十五、隱馬爾可夫模型
二十六、最大熵模型
二十七、EM算法 二十八、條件隨機場
1) 方差最大化投影2) 矩陣的特征值與特征向量3) PCA降維 1) LDA投影標準2) LDA降維算法
1) 基于空間距離保持的方法2) MDS算法原理
1) 近似測地距離的計算2) 最短路徑距離算法3) ISO-map算法原理 1) 數據點的局部線性關系2) LLE算法原理
1) 方陣的特征值分解2) 矩陣的奇異值分解3) 左右奇異向量 4) 推薦系統應用
1) 矩陣分解的另一種方式2) 評估近似矩陣的方法 3) ALS矩陣分解
1) FM模型介紹2) FM算法詳解 1)樸素貝葉斯2)文本分類上的應用
1) 有向概率圖模型2) 生成模型
3) 貝葉斯網絡聯合分布的表達4) 貝葉斯網絡性質
1)隱馬可夫模型的基本概念2)概率計算問題 3)前向/后向算法4)維特比算法
1) 隨機變量的熵、聯合熵、相對熵、互信息 2) 最大熵原理3)最大熵模型的學習 4)最大似然估計5)模型學習的最優化算法
1)EM算法原理及收斂性 2)EM算法在高斯混合模型學習中的應用
1)條件隨機場的定義與形式2)條件隨機場的學習方法
二十九、PLSA 主題模型
三十、LDA主題模型
三十一、神經網絡
1) LSA潛語義分析2) PLSA的模型拓撲 3) EM算法應用于PLSA模型訓練
1)LDA主題模型概述2)共軛先驗分布 3)狄利克雷分布4)Laplace平滑5)Gibbs采樣詳解 6)LDA與詞向量Word2Vec效果比較
1) 前向傳播2) 反向傳播3) 激活函數 4) 梯度彌散/消失5) 參數初始化
6) 多層感知機
大數據機器學習
1)Spark 分布式安裝 2)Spark 核心算子操作 1)Spark 核心模塊剖析 2)PySpark
階段 | 主講內容 | 技術要點 |
大數據機器學 習
一、Spark 入門 二、Spark 進階
三、Spark MLlib 模塊 四、Spark ML 模塊 五、Spark SQL 模塊 六、Spark Streaming 模塊 七、案例
1)PageRank2)交通路況預測 3)股票預測
深度學習
階段 | 主講內容 | 技術要點 |
深度學習
一、 深度學習Tensorflow基礎 二、 深度神經網絡DNN
三、 卷積神經網絡CNN
四、 循環神經網絡RNN 五、 自編碼器AutoEncoder 六、 對抗生成網絡 GAN 七、 Tensorflow框架進階
八、 Word2Vec詞向量算法
1)TensorFlow框架特性與安裝2)Tensorflow編程基礎 1) Tensorflow深度神經網絡實現
1)Tensorflow卷積神經網絡實現 2)Tensorflow實現經典AlexNet模型 3)Tensorflow實現經典VGG模型
1) BasicRNNCell2) GRU單元3) LSTM單元 1) Tensorflow 自編碼網絡實現
1) 深度卷積生成網絡DCGAN 1)Tensorflow源代碼解析2)Tensorboard可視化 1) CBOW模式2) Skip-Gram模式
3) Tensorflow實現Word2Vec詞向量算法 1)Keras簡介及Keras中的數據處理
2)Keras中的模型3)Keras中的重要對象4)Keras中的網絡層構造
1)Softmax Regression識別手寫數字 2)CNN卷積神經網絡做圖片分類 3)機器自動寫文章 4)Tensorflow中用DCGAN生成圖像 5)情感分析
機器學習
九、 Keras框架
十、 案例
階段 | 項目名稱 | 項目描述 |
項目簡介 使用數據來自某互聯網平臺手機助手,項目目標通過機器學習所學 知識挖掘平臺手機用戶喜好,給用戶準確推薦手機軟件,類似 360 手機助手、華為手機助手、百度手機助手推薦功能, 做到實時個性化推薦
項目一 推薦系統 項目特色 架構完善綜合大項目,從前到后貫穿,利用分布式文件系統
項目二
用戶畫像
存儲用戶行為數據,使用 Spark 程序進行數據分析,利用分 布式 SQL 來進行數據清洗,特征抽取,python 腳本構建訓 練集,利用分布式機器學習算法訓練模型,線上 Web 來調用 使用模型
項目簡介 用戶畫像是真實用戶的虛擬代表,是建立在一系列真實數據之 上的目標用戶模型。通過用戶調研去了解用戶,根據他們的目 標、行為和觀點的差異,將他們區分為不同的類型,然后每種類 型中抽取出典型特征,賦予名字、照片、一些人口統計學要素、 場景等描述,就形成了一個人物原型。通過人物原型,可以給 用戶更加精準的搜索和推薦結果。
項目特色 根據用戶歷史瀏覽數據,對用戶進行行為分析,精準建模。 通過用戶模型,可以對用戶進行精準推薦,精準投放廣告。
項目簡介 黑色素瘤,又稱惡性黑色素瘤,是來源于黑色素細胞的一類 惡性腫瘤,常見于皮膚,亦見于黏膜、眼脈絡膜等部位。 黑色素瘤是皮膚腫瘤中惡性程度最高的瘤種,容易出現遠 處轉移。該疾病如果早期治療,患者可以完全康復。可見 早期診斷和治療因而顯得尤為重要。我們開發一款 app,
項目三
皮膚癌檢測
項目四
自動聊天機器人
面向手機用戶,你可以隨時用 app 開個攝像頭讓機器醫生幫我們看 一看,這是不是皮膚癌的早期癥狀。
項目特色
面向手機用戶,操作方便,利用深度學習高級框架 Keras 進行開發,
項目簡介 聊天機器人是一個用來模擬人類對話或聊天的程序。聊天機器人主要 應用場景包括智能客服、虛擬機器人、智能手表、智能車載和智能家 居。我們開發一款基于深度學習的中文聊天機器人,可在中文語義理 解方面達到較高的準確率。
項目特色 基于深度學習的中文聊天機器人,項目涵蓋了中文分詞,語義分析, 命名實體識別等中文 NLP 技術。
項目簡介 目標檢測,工業界關注的主要是人臉,人,車這些對監控、交通 等領域非常重要的目標。
我們將所有的方法都概括成:候選窗口 + 分類 or 回歸。人在識 別物體的時候,第一次可能只是知道這是一個單獨的物體,也知道 bounding box,但是不知道類別;當人類通過其他渠道學習到類 別的時候,下一次就能夠識別了;目標檢測也是如此,我們不可能 標注所有的物體的類別,我們將這種快速學習的機制引入。 項目特色 基于深度學習,使語意信息和分割結合,為目標檢測提供信息, 進行目標檢測。
項目簡介
智能人臉識別基于深度學習以及以 GPU 為核心的異構并行計算 架構,接入高清網絡攝像機,實現高質量的人臉特征提取、人臉 自動抓拍、自動識別、自動比對等功能。
項目特色
項目五
深度學習目標檢測
項 目 六
人臉識別項目
代
項 目 七
對視頻監控中出現的人臉進行自動檢測,進行目標庫檢索,輸出 在目標庫中檢索出與該人臉圖片相似度高的對應的目標庫人員的 詳細信息。
項目簡介 所謂圖像風格遷移,是指利用算法學習著名畫作的風格,然后再把 這種風格應用到另外一張圖片上的技術。著名的圖像處理應用 Prisma 是利用風格遷移技術,將普通用戶的照片自動變換為具有 藝術家的風格的圖片。
圖像風格遷移 項目特色 不僅講解了原始圖像風格遷移的基本原理,其中內容損失、風格
損失兩種損失函數的定義尤為關鍵。接著講解了快速圖像風格遷 移的原理,并實現快速圖像風格遷移,并對項目一些實現細節 進行研究,掌握風格遷移這一領域的思想與 TensorFlow 種 相應的實現方法。
項目簡介 機器翻譯是指用機器將一種語言自動翻譯成另外一種語言的技術。 傳統機器翻譯采取基于規則或基于詞組統計規律的方法。隨著深度 學習技術的發展,神經網絡機器翻譯首先將源句子向量化,轉化 成計算機可以“理解”的形式,再生成另一種語言的譯文,更貼
機器翻譯引擎構建 合原意也更符合語法規范的翻譯。各大商業公司都開始使用神 經網絡機器翻譯代替原來的機器翻譯系統。
項目特色
利用 RNN 網絡結構:Encoder-Decoder(也叫 Seq2Seq),并且 引入它的重要改進—注意力機制,接著構建兩個神經網絡翻譯模型