一、NLP通向智能之路
1.1 圖靈測試
1.1.1 提出背景
由計算機科學家阿蘭?圖靈于 1950 年提出,是早期衡量機器智能水平的重要概念。
1.1.2 提出目的
- 判斷機器是否能表現出與人類相當的智能行為。
1.1.3 測試原理
- 場景設定:測試中存在一位人類測試者,以及一個被放置在“不可視房間”中的對象(可能是機器或人類)。
- 互動方式:人類測試者通過文本對話等非視覺方式與房間中的對象交流,無法直接觀察對方的真實身份。
- 判斷標準:若人類測試者在對話結束后,無法準確分辨與自己交流的對象是機器還是真人,則該機器被判定為 “通過圖靈測試”。
1.1.4 測試結論
通過圖靈測試的機器,在傳統定義中會被認為 “擁有人工智能”,即其智能表現達到了與人類難以區分的程度。這一測試為早期人工智能的研究提供了具象化的評判標準,盡管隨著技術發展,其局限性逐漸顯現,但仍是人工智能發展史上的重要里程碑。
1.2 三種智能層次
1.2.1 運算智能
- 定義:讓計算機擁有快速計算和記憶存儲能力。
- 相關技術:
- 硬件加速器:例如 GPU(圖形處理單元)、TPU(張量處理單元)、ASICs(應用特定集成電路)等。
- 并行計算:多核處理器、分布式系統、超線程技術等。
- 高效算法:如 FFT(快速傅里葉變換)、Strassen算法(快速矩陣乘法)等。
- 內存和存儲技術:如 SSD、RAM、以及新型存儲技術如 3D XPoint。
1.2.2 感知智能
- 定義:讓計算機系統具備感知外部環境的能力。
- 相關技術:
- 計算機視覺:包括以卷積神經網絡(CNN)和圖像處理在內的一系列內容,應用于圖像識別、目標檢測、圖像分割等。
- 語音識別:技術包括遞歸神經網絡(RNN)、長短時記憶網絡(LSTM)、聲譜圖等。
- 觸覺技術:例如電容觸摸屏、壓力感應器等。
- 其它傳感器技術:如雷達、激光雷達(LiDAR)、紅外線傳感器、攝像頭、麥克風、氣味檢測傳感器等。
1.2.3 認知智能
- 定義:讓計算機系統具備類似于人類認知和思維能力的能力。
- 相關技術:
- 自然語言處理:如 RNN、transformer、BERT、GPT架構、語義分析、情感分析等。
- 增強學習:技術包括 Q-learning、Deep Q Networks (DQN)、蒙特卡洛樹搜索(MCTS)等。
- 知識圖譜:結合大量數據,構建對象之間的關系,支持更復雜的查詢和推理。
- 邏輯推理和符號計算:如專家系統、規則引擎、SAT solvers 等。
- 模擬人類思維的框架和算法:例如認知架構(如 SOAR 和 ACT-R)。
1.3 人機同頻交流
1.3.1 社會共識
無論是圖靈測試的設計方式,還是GPT爆火引發的AI浪潮都說明——在人工智能發展的過程當中,深度學習學者們、甚至整個人類社會都無意識地達成了一種高度的共識:認知智能是智能的終極體現,人機同頻的交流是智能被實現的象征,無論一個人工智能算法有多強大的能力。
1.3.2 三大核心要求
- 普適性地理解人類
- 讓人類理解
- 與人類順暢交流
1.4 自然語言處理
1.4.1 語言
??人類 90% 的信息獲取與交流依賴語言,且語言承載著邏輯、情感、知識、智慧,是社會構建與文明傳承的基礎。
1.4.2 定義
??作為研究計算機認知、理解、生成人類語言,并依托語言完成交流與特定任務的學科,它是計算機實現 “與人類同頻” 的核心路徑。
1.4.3 地位
??自然語言處理的發展直接關系到人工智能能否真正具備 “智能”,因此在學術與工業領域均占據極其重要的地位。
1.4.4 學術界
- 學術會議熱度攀升:NLP 領域的經典會議 ACL 和 NAACL 中,被接受的論文數量與比率逐年增長,反映出領域研究的蓬勃活力。
- 跨領域滲透顯著:得益于語言與其他信息形式的強融合性,NLP 架構被廣泛借鑒到多個領域,催生了眾多突破性成果:
- 計算機視覺領域,非卷積架構 ViT(Vision Transformer)憑借借鑒 NLP 的 Transformer 結構,在圖像領域展現出強大能力。
- 自動駕駛領域,谷歌大腦 2023 年 3 月發表的《LEAST-TO-MOST PROMPTING》論文顯示,大語言模型結合提示工程,在高難度導航數據集 SCAN 上的預測精度從約 50% 提升至 99%。
- 學術成果占比領先:2023 年 3 月發布的 “機器學習 / 深度學習領域年度百佳論文” 中,專注 NLP 或依賴 NLP 技術的論文占比達 2/3,覆蓋生成式語言模型、預訓練技術、大語言模型、語音技術、圖文模型等多個方向。
1.4.5 工業界
- NLP技術的工業化普及:NLP技術已深度融入各類實用場景,成為眾多產品與服務的核心支撐:
- 從搜索引擎的精準檢索、推薦系統的個性化內容推送,到語音助手的交互響應、聊天機器人的智能對話,再到自動摘要的信息提煉、情感分析的用戶態度洞察——這些高頻應用的底層邏輯均依賴NLP技術。
- 實際上,在PC端或移動設備中,幾乎所有涉及文本交互或語音溝通的產品與服務,都離不開NLP技術的賦能,其已成為連接人機交互的“隱形基礎設施”。
- NLP技術的爆發式擴散:自大語言模型誕生后,NLP技術的工業化應用呈現爆發式增長:
- 2023年世界人工智能大會上,軟件展區幾乎被大語言模型相關的軟件及應用程序全面覆蓋,直觀展現了NLP技術在產業端的熱度。
- 從前沿科技企業到互聯網巨頭,全行業均在積極布局自有大模型產品,推動NLP技術從基礎能力向垂直場景的深度滲透,進一步鞏固了其在工業界的核心地位。
二、大模型引發行業劇變
2.1 三大發展階段
2.1.1 探索階段:2011~2015(前Transformer時代)
- 時代背景:在AlphaGo和卷積網絡掀起第三次人工智能革命之前,NLP領域主要依賴人工規則和知識庫構建非常精細的“規則類語言模型”,當人工智能浪潮來臨后,NLP轉向使用統計學模型、深度學習模型和大規模語料庫。
- 重要目標:研發語言模型、找出能夠處理語言數據的算法。
- 重要技術:
- 隱馬爾可夫模型(HMM)
- 條件隨機場(CRF)
- 支持向量機(SVM)
- 循環神經網絡(RNN)
- 長短期記憶網絡(LSTM)
2.1.2 提升階段:2015~2020(Transformer時代)
- 時代背景:2015年谷歌將自注意力機制發揚光大、提出了Transformer架構,在未來的幾年中,基于transformer的BERT、GPT等語言模型相繼誕生。
- 重要目標:大幅提升語言模型在自然語言理解和生成方面的能力。
- 重要應用:
- 搜索引擎
- 推薦系統
- 自動翻譯
- 智能助手
2.1.3 應用階段:2020-至今(大模型時代)
- 時代背景:2020年秋天、GPT3.0所寫的小軟文在社交媒體上爆火,這個總參數量超出1750w、每運行1s就要消耗100w美元的大語言模型(Large Language Models,LLMs)為NLP領域開啟了一個全新的階段。
- 重要目標:
- 模型研發:雖然GPT系列大模型的原理并未開源,但GPT的成功無疑為“如何提升語言模型表現”指出了一條明路。在GPT的啟發下,海內外各大科技企業正在研發基于BERT、基于GPT或基于Transformer其他組合方式的大模型,國內一線大模型ChatGLM系列就是基于BERT和GPT的融合理念開發的中文大模型。同時,大模型研發和訓練技術、如生物反饋式強化學習(RLFH)、近端策略優化(PPO)、獎勵權重策略(Reward-based Weighting)、DeepSpeed訓練引擎等發展迅速,勢不可擋。雖然現在已不是NLP理論發展的高峰,但毫無疑問,大模型算法研發與訓練依然是NLP最前沿的研究方向之一。
- 成本降低:大模型吞吃大量語料、訓練成本極高,要將大模型應用到具體商業場景、還需進一步研究和訓練。因此降低大模型應用成本的預訓練、微調、大規模語料庫構建等技術正蓬勃發展!自2020年以來已誕生十余種可行的微調方法和自動語料生成方法,如有監督微調(SFT)、低階自適應微調方法LoRA、提示詞前綴微調方法Prefix Tuning、輕量級Prefix微調Prompt Tuning、百倍效率提升的微調方法P-Tuning V2、以及自適應預算分配微調方法AdaLoRA等。這些方法催生了GPT4.0和大量語言方面落地應用,已經大大改變了NLP的研究和應用格局。
- 技術變現:
- 大語言模型的性能十分強大、足以很好地支持各類NLP方面服務。
- 大語言模型使用自然語言與消費者交互,可以大幅降低新產品的使用門檻,還可以與圖像、語音等領域強勢聯動、形成多模態的產品。
2.2 大模型產品
- ChatGPT
- 跨語言代碼編譯工具Cursor
- Github官方代碼編寫工具CopilotX
- 一鍵生成PPT內容的Gamma AI
- office全家桶中配置的Copilot
- Photoshop中配置的fill features
- 廣泛生成圖像的MidJourney和Stable Diffusion
- 大模型APP研發范式LangChain
三、NLP帶來危險與機遇
3.1 GPT的重大突破
GPT的誕生引發社會轟動,其代表了大模型技術和預訓練模型在自然語言處理領域的關鍵突破,被比爾·蓋茨(“與個人電腦或互聯網同樣重要”)、黃仁勛(“AI領域的iPhone,是更偉大事物的開始”)等行業領袖高度評價。
GPT不僅提升了人機交互的能力,還為智能助手、虛擬智能人物和其他領域的創新應用打開了新的可能性。隨著大模型的進一步發展和應用,有理由期待GPT以及類似的技術在未來帶來更多令人驚嘆的創新和進步。
3.2 行業結構的變化趨勢
整體行業呈欣欣向榮態勢,但結構將發生顯著變化:
- 核心技術發生轉移,大模型技術成為核心方向
- 論文發表難度上升,理論研究門檻提高
3.3 從業者的機遇與挑戰
- 就業市場:不會爆發針對NLP從業者的大規模失業潮(因多數從業者并非聚焦理論研究)。
- 轉型需求:NLP從業者需主動適應技術變革,面臨轉型壓力。
- 人才趨勢:掌握大模型技術的NLP從業者將成為行業搶手人才。
- 具體領域:
- 參與大模型的研發與優化,探索更高效的模型結構和訓練方法。
- 開發創新NLP應用,提升人類語言交互的智能性與效率。
- 涉足多模態、具身智能、人類行為模擬等前沿研究,推動NLP技術邊界拓展。
微語錄:我的天空里沒有太陽,總是黑夜,但并不暗,因為有東西代替了太陽。——東野圭吾