聊聊ChatGPT的本質

這是鼎叔的第九十八篇原創文章。行業大牛和剛畢業的小白,都可以進來聊聊。

階段性總結下我對ChatGPT的基礎理解,算是一篇學習思考筆記吧。其中難免有很多不準確的,或過于簡略的地方,將來再迭代學習。

OpenAI做ChatGPT的底層邏輯

一句話描述,就是大力出奇跡。為什么會產生這種結果呢?

這要從AI發展的兩大流派說起,就是符號主義和連接主義。前者基于邏輯推理的智能模擬方式,通過專家對于符號的深入研究來完善邏輯推理。這種方式的最大局限性是在真實場景中要考慮的邏輯推理過于復雜了,想達到用戶的高滿意度極其困難。

連接主義就是從腦神經的結構受到啟發,主要神經元數量足夠多,訓練的輸入量足夠龐大,訓練出來的神經元連接效果就有可能達到人類思考的水平。人的大腦形成認知,就是某些神經元的鏈接輸出被固化了。

OpenAI在這個方面下的賭注成功了,海量參數、極其龐大的訓練文本和巨大算力,最終產生了涌現的進化效果,復雜常識的理解能力急劇提升。垂直小模型的推理難題被輕松解決。

一夜之間很多老AI人覺得以往的研究白干了,但是新模型的前景又讓從業人員無比興奮。

ChatGPT訓練成功的要素

個人觀點,這是非專業初學者更應該努力理解的:ChatGPT訓練成功,主要做對了哪幾件事(除了“大”),繼承了什么好的遺產。

1 預訓練。

ChatGPT對互聯網上的海量信息進行了無監督學習,這些龐大的已有信息顯然絕大部分都沒有被人工標注過,也不可避免夾帶了大量低質量的信息,包括網絡上常見的陰謀論,偏見等。

ChatGPT從未標注數據中自動推導出預訓練數據,使預訓練變得更有擴展性。

預訓練也是遷移學習在深度學習中實現的主要方法,通過在替代性任務上訓練模型,然后將其適配到下游任務中,實現了跨任務的知識遷移。

2 RLHF 基于人類反饋的強化學習

RLHF解決的核心問題是,讓大模型生成內容和人類的常識、認知、需求和價值觀保持一致。

OpenAI團隊首先從海量數據集中,搜集包含有“問題”和“答案”的數據對,然后用它們來訓練一個獎勵模型,當輸入文本的質量越高(即更符合人類評價標準),獎勵分數越高。最后讓大語言模型能夠根據這個獎勵模型給出的獎勵分數來自我生成更高質量的回答。

這個技術方案依然面對大量倫理監管和局限性挑戰,還在不斷演進中。

3 模型微調。

多數組織其實是無法滿足預訓練和微調基礎模型的計算要求的,以共生為關聯和標準模型訓練,會產生虛假關聯和東拼西湊的合成結果。

每家公司不可能都從頭訓練一個自己的大模型,要想在自己服務接口中提供大模型能力,推理成本是必須考慮的要素,微調相對來說就是一個更優的方案。輕量級的微調模型也能夠針對每個用戶的數據進行訓練,同時滿足數據安全的需求。

4 Transformer和自注意力機制

ChatGPT的技術基礎就是谷歌的Transformer深度學習模型。傳統的自然語言處理模型難以進行并行計算,導致長文本處理時性能下降非常明顯。

Transformer模型是基于自注意力機制來構建的,包含編碼器和解碼器兩個部分,前者負責將輸入序列轉換為定長的向量表示,后者將向量解碼為輸出序列,自注意力機制能夠建立長距離的依賴關系,即使經過多輪對話,還能夠保持對前文指代的正確理解。Transformer的并行計算能力讓它在長序列處理時具有更高的效率。

5 Token機制

Token是ChatGPT這種大語言模型最重要的概念。Token就是文本處理的最小單位,英文中就是一個單詞,中文中就是一個分詞。輸入的每個token都會對應一個唯一的數字ID,以便讓模型進行編碼和解碼。

對于包含了數億甚至數十億參數的大模型,要實現高效的訓練和推理,模型的輸入必須進行限制,長文本就會基于Token進行分割。這種表示形式既有利于大模型的處理,也有利于通過token之間關系的學習來獲取更多語義信息。

最近爆火的視頻生成大模型Sora,也使用了類似的概念-最小視頻單位Patch。當微觀學習尺度是統一的,不管什么尺寸、分辨率和幀率的輸入視頻都可以統一進行學習和輸出。

ChatGPT的商業機會

商業機會按產業細分類型,可以分為這幾類受益領域:

1 提供AI算力的公司,提供定制化,合理計費的算力服務。

2 提供上游數據服務的公司,包括對數據進行查詢、轉換、標注和治理。

3 提供中間算法定制模型的公司和研究機構。具備真正基礎大模型研發能力的公司非常少,但是提供垂直能力封裝的、體驗強化的中間模型,還是很有市場的,但這塊需要有足夠強的垂直行業能力或者客戶服務嗅覺,或者建設活躍的AI交流社區。

4 提供熱門應用拓展能力的公司。這樣的公司有兩類,一類是在某類應用上已經有先發優勢,有大量的忠實用戶,然后把大模型能力引入到特定的用戶場景,成功地形成口碑效應,增加了付費意愿。

還有一類創業型公司,快速利用大模型的能力提供嘗鮮產品,利用自己的“快”趕在大公司的前面,在應用場景上截胡用戶。這類公司的員工非常少,非常精,容易獲得高估值,對同類“老”公司帶來不少威脅。這類公司的核心靈活打法就是瘋狂地采集免費訓練數據,趁平臺大公司反擊之前訓練好基礎模型,拉到初期的用戶群,因為員工極少,發展驚人,能進一步擴大估值和融資。

ChatGPT目前的局限

實時性不足,肯定是現階段ChatGPT的主要問題。大模型是基于已有海量內容的預訓練來升級的,時效性暫時還有很大的短板。

創造力有限。ChatGPT能夠自我優化內容質量,根據用戶興趣進行調整,但生成內容依然缺乏原創性,也缺乏可控制的個性化內容。長此以往會降低使用者的熱情和工作能力,部分使用者會依賴大模型工具,自身能力會退化。

全新任務的遷移能力不佳。ChatGPT能夠連貫地輸出有邏輯性的文本,但它在理解語境和情感時可能會受到數據偏差和模型偏移的影響,導致在新的場景任務中表現不佳。大模型學習掌握了一定的語言規律和人類的思維方式,但在創造文本時存在語法邏輯瑕疵,需要后期糾正。

人類文明的思維復雜性是在多維度的,體現了其多樣性,這遠不是讓計算機求解問題這么單純直接。

ChatGPT重塑溝通效率

ChatGPT帶來的自然語言表達效率空前提升,給我們的啟發是,可以利用ChatGPT把需要大量溝通的業務重做一遍。

對于溝通表達可能比較弱的工程師,ChatGPT可能是幫助工程師對外溝通的利器,工程師可以按心目中的標準訓練特定產品,讓非技術人員和該產品先行互動,節約自己的人工溝通時間。

這也是鼎叔在團隊敏捷實踐中引入大模型解決手段的初衷。技術人員和非技術人員不一定都能不厭其煩地面對面交流,理解對方意圖的初級AI可能是不錯的預溝通橋梁。

還有一類溝通困難場景,是因為某一方(客戶或者員工)比較羞澀,尷尬。借助ChatGPT問答,不用操心自己的隱私暴露,比如心理/生理問題的咨詢服務。

此外,教育界對于ChatGPT在學校的使用會嚴防死守,但它確實可以大幅提高老師的日常效率,節約大量批改作業和教學雜活的時間,同時為學生的個性化教育帶來了可能性。

ChatGPT的進化方向

一 和搜索技術更好的整合,比如RAG技術。搜索技術和ChatGPT看起來有相似性,但也有很多本質的不同。

搜索引擎由搜索器,索引器,檢索器,用戶接口組成,搜索產品對于結果的實時性要求高。但搜索產品的結果體驗始終不佳,滿屏的搜索結果還夾雜著大量廣告,讓普通用戶無從選擇。

ChatGPT的體驗是革命性的,讓用戶眼前一亮,并且能夠順利地聊下去,得益于長效的注意力機制,前后連貫的推理和互動,讓用戶活躍度暴漲。

兩者互相印證,互為補充,可以大幅提升大模型答案的實時性,還可以降低回答的幻覺率。

二 和知識圖譜更好的結合。這點有待更多學習。

三 多模態的發展。四大模態(文本,音頻,圖片,視頻)的商業機會在互相滲透,虎視眈眈,對用戶而言分界線并不明顯,多模態提供了更多強者通吃的機會。

四 AI倫理有關的技術管理體系。

大模型的數據標注訓練,本身就存在人為錯誤可能,如果被惡意標注,會產生極大偏離主流價值觀的結果。

惡意引入大量的“特殊語料”或者加大其權重,也可以起到扭曲價值觀的目的。

不怕一眼假的幻覺,就怕看不出真假的幻覺,把產品快速被調教成“壞人”。

可以想見,AI倫理的破壞者手段更加隱蔽,難以追查,這也對管理制度和體系化能力提出了更高要求。

因為大模型本身的不可解釋性,黑產團伙也可能操縱訓練數據集,生成他們想要的對抗樣本。

五 具身智能。就像最近OpenAI和機器人公司合作,在短短時間就給機器人進行了認知賦能,機器人本身精準的控制力,又能把AI指令和行動近乎完美的融合在一起。

圖片

六 AI Agents群體智能,ChatGPT是其中當仁不讓的大腦。

大模型實體是由不同公司,不同資源和不同技能團隊負責的,在AGI(通用人工智能)真正成熟之前,每個大模型產品都有自己擅長的垂直能力和不擅長的短板。

當我們要輸出一個用戶滿意的智能方案,完全可以調用多個不同的大模型實體來完成,它們就叫Agents。

比如一個自動生成的金融報告平臺,會需要擅長寫報告的agent,擅長分析商業數據的agent,擅長繪制金融圖片的agent,以及擅長做風險和收益分析的agent,這四個agent在后臺共同協作,前臺由ChatGPT直接和用戶對話和反饋。

圖片

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/16013.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/16013.shtml
英文地址,請注明出處:http://en.pswp.cn/web/16013.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

GitLab的原理及應用詳解(六)

本系列文章簡介: 隨著軟件開發的不斷進步和發展,版本控制系統成為了現代軟件開發過程中不可或缺的一部分。而GitLab作為其中一種流行的版本控制工具,在軟件開發領域享有廣泛的應用。GitLab不僅提供了強大的版本控制功能,還集成了項…

如何利用線程池實現互聯網驗證碼保護服務

如何利用線程池實現互聯網驗證碼保護服務 1、業務背景與實現思路2、代碼實操1、業務背景與實現思路 首先介紹一下業務背景,假設我們的系統是一個短視頻播放網站,每個新加入的用戶都需要注冊賬號并綁定手機號。為了驗證用戶手機的正確性,我們的系統會發送一條驗證碼到用戶注…

HBase到底是列式存儲還是行式存儲?

行存和列存 在行存儲的數據庫系統中,一行中的所有字段值都是連續存儲的;在基于行存儲的表中,即使只需要讀取指定列時,也需要先將對應行的數據讀取到內存,再過濾目標列,這樣會導致過多的磁盤IO、內存和時間…

隊列——鏈式存儲

核心思路: 1、首先定義隊列結點,包含數據域和指針域;然后定義鏈式隊列,包含隊列節點類型的隊頭和隊尾指針。 2、初始化:     帶頭結點:給頭結點分配內存,然后隊頭和隊尾指針指向頭結點&…

每日一題 字符串排序

目錄 1.前言 2.題目解析 3.算法原理 4.代碼實現 1.前言 在編程練習中,字符串的全排列問題是一個經典的算法問題。通過對字符串進行全排列,可以得到該字符串的所有可能的排列組合。本文將探討如何對含有重復字符的字符串進行全排列,并且解決…

K8s的kubectl的基本操作

K8s的kubectl的基本操作 K8s基本信息的查看 查看版本信息 kubectl versio查看資源對象簡寫 kubectl api-resources查看集群信息 kubectl cluster-info配置kubectl自動補全 source <(kubectl completion bash)查看master節點狀態 kubectl get cs查看命名空間 kubectl…

10.js預解析

就是在代碼執行之前&#xff0c;對代碼進行通讀解釋 只解析兩個內容&#xff1a; &#xff08;1&#xff09;對var聲明的變量 &#xff08;2&#xff09;聲明式函數 &#xff08;1&#xff09;對var聲明的變量進行提前聲明&#xff0c;但不賦值 var x console.log(x) //undefi…

【找出第 K 大的異或坐標值】python

4層循環暴力超時 class Solution:def kthLargestValue(self, matrix: List[List[int]], k: int) -> int:nums[]for a in range(len(matrix)):for b in range(len(matrix[0])):num0for i in range(a1):for j in range(b1):num^matrix[i][j]nums.append(num)nums.sort()retu…

web安全滲透測試十大常規項(一):web滲透測試之CSRF跨站請求偽造

滲透測試之CSRF跨站請求偽造 CSRF跨站請求偽造 CSRF跨站請求偽造

類的內存對齊位段位圖布隆過濾器哈希切割一致性哈希

文章目錄 一、類的內存對齊1.1規則1.2原因 二、位段2.1介紹2.2內存分配問題2.3跨平臺問題2.4使用的注意事項 三、位圖的應用3.1 給40億個不重復的無符號整數&#xff0c;找給定的一個數。&#xff08;int的范圍可以到達42億多&#xff09;3.2 給定100億個整數&#xff0c;設計算…

Golang實現文件復制

方法&#xff1a;三種 package zdpgo_fileimport ("errors""io""os" )// CopyFile 使用io.Copy進行文件的復制&#xff0c;同時也會復制文件的所有權限 // param src 復制文件 // param des 目標文件 // return error 錯誤信息 func CopyFile(s…

2024年弘連網絡FIC大會競賽題線下決賽題

總結&#xff1a; FIC決賽的時候&#xff0c;很多小問題沒發現&#xff0c;在pve平臺做題確實很方便。 這套題目復盤完&#xff0c;服務器這塊的知識確實收獲了很多&#xff0c;對pve集群平臺和網絡拓撲也有了一定的認識&#xff0c;感謝各位大佬悉心指導。 接下來&#xff0…

【FPGA】Verilog:奇校驗位生成器的實現(Odd Parity bit generator)

解釋奇數奇偶校驗位生成器和檢查器的仿真結果及過程。 真值表和卡洛圖: Odd Parity Bit Generator A B C

怎么在pyqt中顯示matplotlib的繪圖?

想要在pyqt中顯示matplotlib的繪圖&#xff0c;在繪圖時&#xff0c;其實不必使用以下語句&#xff1a; matplotlib.use("Qt5Agg") # 聲明使用QT5最關鍵的語句是&#xff1a; from matplotlib.backends.backend_qt5agg import FigureCanvasQTAggFigureCanvasQTAgg…

學 Python 具體能干什么?

Python 是一種功能強大、用途廣泛的編程語言&#xff0c;因其簡潔易讀的語法和豐富的庫生態系統而備受歡迎。學習 Python后&#xff0c;你可以從事以下幾方面的工作&#xff1a; 1. Web 開發 Python 有很多流行的 Web 框架&#xff0c;如&#xff1a; Django&#xff1a;一個…

Android studio的Gradle出問題

Gradle sync failed: Plugin [id: com.android.application, version: 7.1.1, apply: false] was not found in any of the following sources: 在src里面的build.gradle中 plugins { id ‘com.android.application’ } 的上面加上 buildscript {repositories {jcenter()}depen…

從 0 開始實現一個網頁聊天室 (小型項目)

實現功能 用戶注冊和登錄好友列表展示會話列表展示: 顯示當前正在進行哪些會話 (單聊 / 群聊) , 選中好友列表中的某個好友, 會生成對應的會話實時通信, A給B發送消息, B的聊天界面 / 會話界面能立刻顯示新的消息 TODO: 添加好友功能用戶頭像顯示傳輸圖片 / 表情包歷史消息搜…

禪道密碼正確但是登錄異常處理

禪道密碼正確&#xff0c;但是登錄提示密碼錯誤的異常處理 排查內容 # 1、服務器異常&#xff0c;存儲空間、數據庫異常 # 2、服務異常&#xff0c;文件丟失等異常問題定位 # 1、df -h 排查服務器存儲空間 # 2、根據my.php排查數據庫連接是否正常 # 3、修改my.pho,debugtrue…

探索切片索引:列表反轉的藝術

新書上架~&#x1f447;全國包郵奧~ python實用小工具開發教程http://pythontoolsteach.com/3 歡迎關注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目錄 一、引言&#xff1a;列表反轉的挑戰 二、切片索引的基本概念 三、切片索引實現列表反轉 …

程序員副業賺錢的底層邏輯

賺錢就像玩拼圖游戲&#xff0c;要懂得把面包屑組裝成為一面包 分享一點心得&#xff1a;你會發現賺錢的商機其實就像個拼圖游戲&#xff0c;有很多面包屑、很多碎片&#xff0c;真的、假的、有價值的、誤導的&#xff0c;都散落在各處。 你需要一一拾取&#xff0c;一一甄別…