今天,很多人的目光都被ChatGPT吸引,其實,人工智能的范圍很大,遠不止ChatGPT或者其他自然語言的處理工具。所以說不管ChatGPT的結果如何,人工智能依然是未來。
那么在ChatGPT之外,還有沒有什么值得關注的人工智能技術和應用呢?有的。這一講,我們就說說這個問題。
一、第一個就是多任務人工智能
也就是除了我們現在熟知的ChatGPT之外,還有另一項人工智能技術——多任務的人工智能。
這兩項技術是兩種不同的技術路線:GPT是所謂以數量實現質量的代表,用英語的說法就是“brute force”,翻譯成中文就是“簡單粗暴”,大數據,大計算量;而多任務的人工智能則是以質量取代數量。在這里人其實就是多任務的智能生物。
今天,幾乎所有人工智能的成果都來自于以數量實現質量。數據、計算能力和數學模型,是當今人工智能的基礎,ChatGPT便是如此。
但是,今天的人工智能也有兩個大問題:
第一個問題,每個系統只能完成一件特定的事情,你無法讓ChatGPT下棋,也無法讓AlphaGo回答問題。因此,雖然這些人工智能系統能把一件事做好,但換一件事就不行了。
第二個問題,由于今天的人工智能是采用以量取勝的方法實現的,當數量達不到時,質量就無從談起。你要是只讓智能攝像頭看某個人的一張照片,它通常是無法識別這個人的。但是,人通常只看一眼,就會有印象。
這些問題,在多任務的人工智能系統中是不存在的。那么,怎樣才能實現一個多任務的人工智能系統呢?它需要有四個條件:
1.知其然還要知其所以然;
2.具有對身邊事物的好奇;
3.具有常識;
4.處理信息的能耗降低幾個數量級。
1. 首先說第一個,什么叫“知其然還要知其所以然”。
就比如ChatGPT能夠給出一個問題的答案,AlphaGo能夠給出已知的最好行棋步驟,但是它們并不清楚為什么給出這些答案。這就是知其然而不知其所以然。這樣一來,機器在下棋時獲得的經驗就不能幫助它理解語言,或者積攢其他經驗。而人卻不同,人在下棋時會悟出很多做事的道理。因此,人的智能是多任務的,而機器不是。
想要做到知其所以然,需要真正的理解知識。還是以自然語言處理為例,不能只是通過大量學習看到了所有的語言學現象,還需要真正對語言有所理解。
如果有這么一句話:“獎杯放不進包里,因為它太大了。”它的意思很好理解。
但是,如果我們說:“獎杯放不進包里,因為它太小了。”
其實也說得通。因為根據上下文的語義信息,它在這里指的是包,包太小了。但計算機這時就會糊涂。
2. 其次是第二個條件,具有對身邊事物的好奇心,這其實是指主動學習。
一個人走到大街上會東張西望,他的好奇心會讓他看到很多東西,甚至增長知識。但是今天的人工智能,對于任務以外的事情,它是毫無好奇心的。
舉例來講:當你做一件事非常順利或者非常耗時的時候,你會去琢磨為什么。做得太順利或者太不順利,都可能是做錯了,你會主動回去檢查。這就是好奇心。但是ChatGPT不會,它算了半天沒算出來,是不會考慮自己在知識上有欠缺,或者算法上有Bug的。沒有好奇心,就無法積攢普遍意義上的經驗。
3. 多任務的人工智能系統的第三個實現條件是,它要有常識。
今天,你讓人工智能系統畫一張“在陽光明媚的春天里,在草地上奔跑的狗的照片”,它能畫,但是畫得沒有意境,非常直接,這是因為它不理解“在陽光明媚的春天里”是什么意思。
當然,更要命的是,如果你讓它畫一張“在陽光明媚的春天里,在草地上奔跑的海豚的照片”,它很可能會把狗換成海豚交給你,因為它不具有海豚無法上岸的常識。沒有常識,就很難完成復雜任務,比如讓機器人去給你買菜。
4. 最后是第四個條件,想要實現多任務的人工智能系統,處理信息的能耗必須降低幾個數量級。
很多人都有一個問題,既然今天人工智能在很多領域做得比人好,我們把它們集成起來,是否能得到一個多任務的人工智能系統呢?
其實,多任務指的不是幾個系統的簡單拼接,而是讓執行各個任務的算法在內部打通,這件事目前還沒有做到。即便是把多個人工智能系統拼接起來,這個系統的運行成本也會極高,因為它每做一件事都極為耗費資源。這個資源既包括計算資源,也包括數據,還包括其他資源,比如傳感器等。
作為一種多任務的智能動物,人的學習和思考在能量利用上是非常高效的。人腦有百萬億個神經元連接,而人的壽命一般不超過90年,也就是30億秒,在30億秒時間里,對百萬億個神經元連接完成訓練,這是非常高效的。
雖然計算機的速度比人快,但是訓練一個只有幾萬個連接的深度人工神經網絡就需要幾萬秒,效率低了很多。如果再把神經網絡的規模增加十倍,訓練的時間需要增加成百上千倍。
訓練人腦這樣一個系統,能耗是難以想象的。今天,要想把各種人工智能系統整合成一個,計算的能耗必須幾個數量級,甚至幾十個數量級地下降。這也是很多人認為,今天的深度學習不可能產生多任務人工智能的原因之一。
二、生物和醫學應用
好,說完了人工智能行業一條值得關注的技術路線,我們再看一個值得關注的應用領域,也就是深度學習在生物和醫學上的應用。
迄今為止,這方面最有意義的一項成果是DeepMind公司(Google的子公司)做的AlphaFold(深度學習的人工智能),也就是用深度學習解構蛋白質的結構,研究蛋白質的折疊問題。
我們知道,人的生命是靠新陳代謝完成的,而新陳代謝是由基因控制蛋白質的合成實現的。如果蛋白質的合成出了問題,人就會生病。而幾乎所有和衰老有關的疾病,都和蛋白質的合成有關。因此,研究清楚這個問題,是解決衰老的關鍵。
但是,蛋白質是一種非常復雜的有機分子,由很多氨基酸組成的鏈構成,而且這個結構還是三維的。今天,人類發現了很多種蛋白質,但是無法搞清楚它們的結構。解決這個問題是極具挑戰性的。
每年,全世界都有科學家試圖通過X射線晶體學、電子顯微鏡和核磁共振等成像技術分析蛋白質的結構。這些技術既昂貴又費時。
在過去的60多年里,人類大約只解構了千分之一的蛋白質。換句話說,現在已知的和生命有關的蛋白質超過2億種,而人類只解構了17萬種。前面說過,如果能預測蛋白質的結構,將極大地促進生命科學的研究。顯然,光靠人力做這件事,我們是等不及的。
從很多年前開始,計算機科學家就同生物學家們合作,用計算機來解決蛋白質結構預測的問題,但只在很小的、簡單的蛋白質上獲得了成功。
2020年,DeepMind的AlphaFold就做到了“違反化學規則的數量接近于0”的好成績。這是什么意思呢?
氨基酸在合成蛋白質的時候,需要符合化學規則,不符合化學規則的蛋白質結構是不存在的。而深度學習預測的蛋白質結構可能會有錯誤,導致一些結構違反了化學規則。因此,通常人們會使用有多少預測違反了化學規則來判斷解構蛋白質的準確性。目前,和人已經解構的結果對比,AlphaFold解構蛋白質的準確率高達70%。
這項成果的意義非常大,它可以改變生物學和制藥學的發展,一旦成功,對人類的福祉有很大的幫助。
因此,在很多從事人工智能研究的學者們看來,這種事情比做一些人工智能的玩具有意義得多。
最后,借這個機會,我來談談我們是否需要防范人工智能。
前一陣,蓋茨和馬斯克都建議,警惕甚至限制開發ChatGPT這樣的技術。我覺得,這種擔心為時尚早。
打一個比方,這就好比我們要造一架飛機,今天我們連空氣動力學的原理都還沒有完全搞清楚,只能做一個滑翔機,但是卻開始擔心它掉下來撞死人。事實上,我們今天要擔心的,是那些人工智能背后的公司和控制它們的人。
總結:在ChatGPT之外,還有一些值得關注的人工智能技術和應用:
1、多任務人工智能:GPT-3是所謂以數量實現質量的代表,而多任務的人工智能則是以質量取代數量。
2、生物和醫學應用:深度學習在生物和醫學上的應用是人工智能行業一個值得關注的應用領域。