1、intro
自然語言處理雖然我們過去取得了很大的進展,但是實際上還是停留在感知層面。
計算機視覺領域,因為圖片里面都是像素,像素很難用符號學來解釋,所以計算機視覺大部分是用概率模型或機器學習來做。
深度學習它是機器學習的一種,但是它是能做計算機視覺、自然語言處理等等
2、深度學習在應用上的突破
上圖表示,從10年到17年,圖片分類錯誤率顯著下降的一個發展情況圖,2012年有一個比較大的下降,是因為這是深度學習的開始,接下來5年,深度學習的發展已經將圖片分類的誤差降到非常非常低的一個水平了。
物體檢測是說,通過機器去找某一個物體在圖片的哪一個位置,而物體分割是指,每一個像素到底是屬于這個飛機還是這個人,這是特別深層次的一個應用。
這里是給出像素風格,然后把原始圖片轉換成給定風格的修正圖片。
這里是人臉合成,人類是很難識別出這些人是真的還是假的,但這些臉的確都是假的()。
這里提到的GPT3,
這里是Tesla的無人駕駛技術
最后詳細介紹一個案例:廣告點擊
左邊這個圖是在搜索框里搜baby toy,下面會彈出很多廣告,這就是一個問題:
給出一行文字描述,下面要彈出哪些廣告內容?
之后可以根據廣告的點擊率和競價去把廣告進行一個重新排序,排序高的放在前面。
里面最重要的就是一個機器學習模型:特征提取和模型預測
QA:
1.模型的可解釋性一直是機器學習和深度學習非常關心的,因為大家都知道這是一個黑盒模型,你訓練了一個模型,你不知道它為什么工作或者為什么不工作,對于深度學習來講這一塊做的是不好的,對于機器學習來講,我們對簡單的模型有一些理解,但是變得很深的時候我們是放棄這一塊的。為什么有效和可解釋性是兩個事情,所有模型提出來的時候我們都會說為什么有效,但是可解釋性是另一塊,這涉及人是不是理解這個模型,就是它什么時候不工作,在什么地方會出現偏差等等,后面講模型的時候會講到可解釋性的內容,比如什么時候要用到空間信息,什么時候要用到時間信息balabala
2.領域專家可以認為是甲方,是提需求的一方,而數據科學家是乙方。
3.我們這個課程是基于PyTorch,mset(這里我不懂+沒有聽清)安裝了GPU版本需要把CPU版本卸載
4.深度學習模型我們可以用數學來表示,但是我們用數學來解釋一個模型為什么工作為什么不工作,這個我們是解決的不好的。
5.符號學適用于推演,目前來說比如GNN圖神經網絡,可以做一些比較復雜的推理的過程,目前在模型夠復雜的情況下,確實可以做一些推理的工作
7.Mac可以做PyTorch,但是僅僅可以跑CPU,復雜任務不太能跑。
9.如何尋找自己領域的paper:(現在其實可以通過AI去找paper)后面會分享自己的做法