EP01:【NLP 第二彈】自然語言處理概述

一、NLP通向智能之路

1.1 圖靈測試

1.1.1 提出背景

由計算機科學家阿蘭?圖靈于 1950 年提出,是早期衡量機器智能水平的重要概念。

1.1.2 提出目的

  • 判斷機器是否能表現出與人類相當的智能行為。

1.1.3 測試原理

  1. 場景設定:測試中存在一位人類測試者,以及一個被放置在“不可視房間”中的對象(可能是機器或人類)。
  2. 互動方式:人類測試者通過文本對話等非視覺方式與房間中的對象交流,無法直接觀察對方的真實身份。
  3. 判斷標準:若人類測試者在對話結束后,無法準確分辨與自己交流的對象是機器還是真人,則該機器被判定為 “通過圖靈測試”。

1.1.4 測試結論

通過圖靈測試的機器,在傳統定義中會被認為 “擁有人工智能”,即其智能表現達到了與人類難以區分的程度。這一測試為早期人工智能的研究提供了具象化的評判標準,盡管隨著技術發展,其局限性逐漸顯現,但仍是人工智能發展史上的重要里程碑。

1.2 三種智能層次

1.2.1 運算智能

  1. 定義:讓計算機擁有快速計算和記憶存儲能力。
  2. 相關技術:
    • 硬件加速器:例如 GPU(圖形處理單元)、TPU(張量處理單元)、ASICs(應用特定集成電路)等。
    • 并行計算:多核處理器、分布式系統、超線程技術等。
    • 高效算法:如 FFT(快速傅里葉變換)、Strassen算法(快速矩陣乘法)等。
    • 內存和存儲技術:如 SSD、RAM、以及新型存儲技術如 3D XPoint。

1.2.2 感知智能

  1. 定義:讓計算機系統具備感知外部環境的能力。
  2. 相關技術:
    • 計算機視覺:包括以卷積神經網絡(CNN)和圖像處理在內的一系列內容,應用于圖像識別、目標檢測、圖像分割等。
    • 語音識別:技術包括遞歸神經網絡(RNN)、長短時記憶網絡(LSTM)、聲譜圖等。
    • 觸覺技術:例如電容觸摸屏、壓力感應器等。
    • 其它傳感器技術:如雷達、激光雷達(LiDAR)、紅外線傳感器、攝像頭、麥克風、氣味檢測傳感器等。

1.2.3 認知智能

  1. 定義:讓計算機系統具備類似于人類認知和思維能力的能力。
  2. 相關技術:
    • 自然語言處理:如 RNN、transformer、BERT、GPT架構、語義分析、情感分析等。
    • 增強學習:技術包括 Q-learning、Deep Q Networks (DQN)、蒙特卡洛樹搜索(MCTS)等。
    • 知識圖譜:結合大量數據,構建對象之間的關系,支持更復雜的查詢和推理。
    • 邏輯推理和符號計算:如專家系統、規則引擎、SAT solvers 等。
    • 模擬人類思維的框架和算法:例如認知架構(如 SOAR 和 ACT-R)。

1.3 人機同頻交流

1.3.1 社會共識

無論是圖靈測試的設計方式,還是GPT爆火引發的AI浪潮都說明——在人工智能發展的過程當中,深度學習學者們、甚至整個人類社會都無意識地達成了一種高度的共識:認知智能是智能的終極體現,人機同頻的交流是智能被實現的象征,無論一個人工智能算法有多強大的能力。

1.3.2 三大核心要求

  • 普適性地理解人類
  • 讓人類理解
  • 與人類順暢交流

1.4 自然語言處理

1.4.1 語言

??人類 90% 的信息獲取與交流依賴語言,且語言承載著邏輯、情感、知識、智慧,是社會構建與文明傳承的基礎。

1.4.2 定義

??作為研究計算機認知、理解、生成人類語言,并依托語言完成交流與特定任務的學科,它是計算機實現 “與人類同頻” 的核心路徑。

1.4.3 地位

??自然語言處理的發展直接關系到人工智能能否真正具備 “智能”,因此在學術與工業領域均占據極其重要的地位。

1.4.4 學術界

  1. 學術會議熱度攀升:NLP 領域的經典會議 ACL 和 NAACL 中,被接受的論文數量與比率逐年增長,反映出領域研究的蓬勃活力。
  2. 跨領域滲透顯著:得益于語言與其他信息形式的強融合性,NLP 架構被廣泛借鑒到多個領域,催生了眾多突破性成果:
    • 計算機視覺領域,非卷積架構 ViT(Vision Transformer)憑借借鑒 NLP 的 Transformer 結構,在圖像領域展現出強大能力。
    • 自動駕駛領域,谷歌大腦 2023 年 3 月發表的《LEAST-TO-MOST PROMPTING》論文顯示,大語言模型結合提示工程,在高難度導航數據集 SCAN 上的預測精度從約 50% 提升至 99%。
  3. 學術成果占比領先:2023 年 3 月發布的 “機器學習 / 深度學習領域年度百佳論文” 中,專注 NLP 或依賴 NLP 技術的論文占比達 2/3,覆蓋生成式語言模型、預訓練技術、大語言模型、語音技術、圖文模型等多個方向。

1.4.5 工業界

  1. NLP技術的工業化普及:NLP技術已深度融入各類實用場景,成為眾多產品與服務的核心支撐:
    • 從搜索引擎的精準檢索、推薦系統的個性化內容推送,到語音助手的交互響應、聊天機器人的智能對話,再到自動摘要的信息提煉、情感分析的用戶態度洞察——這些高頻應用的底層邏輯均依賴NLP技術。
    • 實際上,在PC端或移動設備中,幾乎所有涉及文本交互或語音溝通的產品與服務,都離不開NLP技術的賦能,其已成為連接人機交互的“隱形基礎設施”。
  2. NLP技術的爆發式擴散:自大語言模型誕生后,NLP技術的工業化應用呈現爆發式增長:
    • 2023年世界人工智能大會上,軟件展區幾乎被大語言模型相關的軟件及應用程序全面覆蓋,直觀展現了NLP技術在產業端的熱度。
    • 從前沿科技企業到互聯網巨頭,全行業均在積極布局自有大模型產品,推動NLP技術從基礎能力向垂直場景的深度滲透,進一步鞏固了其在工業界的核心地位。

二、大模型引發行業劇變

2.1 三大發展階段

2.1.1 探索階段:2011~2015(前Transformer時代)

  1. 時代背景:在AlphaGo和卷積網絡掀起第三次人工智能革命之前,NLP領域主要依賴人工規則和知識庫構建非常精細的“規則類語言模型”,當人工智能浪潮來臨后,NLP轉向使用統計學模型、深度學習模型和大規模語料庫。
  2. 重要目標:研發語言模型、找出能夠處理語言數據的算法
  3. 重要技術:
    • 隱馬爾可夫模型(HMM)
    • 條件隨機場(CRF)
    • 支持向量機(SVM)
    • 循環神經網絡(RNN)
    • 長短期記憶網絡(LSTM)

2.1.2 提升階段:2015~2020(Transformer時代)

  1. 時代背景:2015年谷歌將自注意力機制發揚光大、提出了Transformer架構,在未來的幾年中,基于transformer的BERT、GPT等語言模型相繼誕生。
  2. 重要目標:大幅提升語言模型在自然語言理解和生成方面的能力
  3. 重要應用:
    • 搜索引擎
    • 推薦系統
    • 自動翻譯
    • 智能助手

2.1.3 應用階段:2020-至今(大模型時代)

  1. 時代背景:2020年秋天、GPT3.0所寫的小軟文在社交媒體上爆火,這個總參數量超出1750w、每運行1s就要消耗100w美元的大語言模型(Large Language Models,LLMs)為NLP領域開啟了一個全新的階段。
  2. 重要目標:
    • 模型研發:雖然GPT系列大模型的原理并未開源,但GPT的成功無疑為“如何提升語言模型表現”指出了一條明路。在GPT的啟發下,海內外各大科技企業正在研發基于BERT、基于GPT或基于Transformer其他組合方式的大模型,國內一線大模型ChatGLM系列就是基于BERT和GPT的融合理念開發的中文大模型。同時,大模型研發和訓練技術、如生物反饋式強化學習(RLFH)、近端策略優化(PPO)、獎勵權重策略(Reward-based Weighting)、DeepSpeed訓練引擎等發展迅速,勢不可擋。雖然現在已不是NLP理論發展的高峰,但毫無疑問,大模型算法研發與訓練依然是NLP最前沿的研究方向之一。
    • 成本降低:大模型吞吃大量語料、訓練成本極高,要將大模型應用到具體商業場景、還需進一步研究和訓練。因此降低大模型應用成本的預訓練、微調、大規模語料庫構建等技術正蓬勃發展!自2020年以來已誕生十余種可行的微調方法和自動語料生成方法,如有監督微調(SFT)、低階自適應微調方法LoRA、提示詞前綴微調方法Prefix Tuning、輕量級Prefix微調Prompt Tuning、百倍效率提升的微調方法P-Tuning V2、以及自適應預算分配微調方法AdaLoRA等。這些方法催生了GPT4.0和大量語言方面落地應用,已經大大改變了NLP的研究和應用格局。
    • 技術變現
      • 大語言模型的性能十分強大、足以很好地支持各類NLP方面服務。
      • 大語言模型使用自然語言與消費者交互,可以大幅降低新產品的使用門檻,還可以與圖像、語音等領域強勢聯動、形成多模態的產品。

2.2 大模型產品

  • ChatGPT
  • 跨語言代碼編譯工具Cursor
  • Github官方代碼編寫工具CopilotX
  • 一鍵生成PPT內容的Gamma AI
  • office全家桶中配置的Copilot
  • Photoshop中配置的fill features
  • 廣泛生成圖像的MidJourney和Stable Diffusion
  • 大模型APP研發范式LangChain

三、NLP帶來危險與機遇

3.1 GPT的重大突破

GPT的誕生引發社會轟動,其代表了大模型技術和預訓練模型在自然語言處理領域的關鍵突破,被比爾·蓋茨(“與個人電腦或互聯網同樣重要”)、黃仁勛(“AI領域的iPhone,是更偉大事物的開始”)等行業領袖高度評價。

GPT不僅提升了人機交互的能力,還為智能助手、虛擬智能人物和其他領域的創新應用打開了新的可能性。隨著大模型的進一步發展和應用,有理由期待GPT以及類似的技術在未來帶來更多令人驚嘆的創新和進步。

3.2 行業結構的變化趨勢

整體行業呈欣欣向榮態勢,但結構將發生顯著變化:

  • 核心技術發生轉移,大模型技術成為核心方向
  • 論文發表難度上升,理論研究門檻提高

3.3 從業者的機遇與挑戰

  1. 就業市場:不會爆發針對NLP從業者的大規模失業潮(因多數從業者并非聚焦理論研究)。
  2. 轉型需求:NLP從業者需主動適應技術變革,面臨轉型壓力。
  3. 人才趨勢:掌握大模型技術的NLP從業者將成為行業搶手人才。
  4. 具體領域:
    • 參與大模型的研發與優化,探索更高效的模型結構和訓練方法。
    • 開發創新NLP應用,提升人類語言交互的智能性與效率。
    • 涉足多模態、具身智能、人類行為模擬等前沿研究,推動NLP技術邊界拓展。

微語錄:我的天空里沒有太陽,總是黑夜,但并不暗,因為有東西代替了太陽。——東野圭吾

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/89132.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/89132.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/89132.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Ansible 查看PostgreSQL的版本

Ansible的基礎知識就不說了直接貼劇本- name: Check PostgreSQL versionhosts: db_serversbecome: yesvars:ansible_python_interpreter: /usr/bin/python3db_name: postgresdb_user: postgresdb_password: your_passwordtasks:- name: Install psycopg2ansible.builtin.packag…

【視覺SLAM筆記】第9章 后端1

一、理論1. 狀態估計的概率解釋我們來深入探討一下視覺SLAM中狀態估計的概率解釋。這可以說是理解現代SLAM算法(尤其是后端優化)的基石1. 問題的核心:不確定性SLAM(同步定位與建圖)的本質是在一個未知環境中&#xff0…

(數據結構)復雜度

基本概念說明 數據結構 定義:數據結構(Data Structure)是計算機存儲、組織數據的方式,指相互之間存在?種或多種特定關系的數據元素的集合。沒有?種單?的數據結構對所有用途都有用(要考慮適配、效率問題,在不同情況下使用合適的…

玩轉Docker | 使用Docker部署bender個人導航頁工具

玩轉Docker | 使用Docker部署bender個人導航頁工具 前言 一、bender介紹 Bender 簡介 Bender 的主要特點 二、系統要求 環境要求 環境檢查 Docker版本檢查 檢查操作系統版本 三、部署bender服務 下載bender鏡像 編輯部署文件 創建容器 檢查容器狀態 檢查服務端口 安全設置 四、…

解決了困擾我的upload靶場無法解析phtml等后綴的問題

本文章為解決困擾我的 upload 靶場無法解析 phtml 問題 ? 這個問題直接讓我過不了Upload-Pass-03這一關,一直卡著。 ? 痛太痛了 ,為什么無法解析上傳之后的 phtml 后綴文件!這塊兒折磨了博主一天多,太不容易了,查找…

Leetcode百題斬-二分搜索

二分搜索也是一個很有趣的專題,被做過的題中,剛好一個Easy,一個Medium和一個Hard,剛好可以看看,二分搜索的三個難度等級都是啥樣的。 124. Binary Tree Maximum Path Sum[Hard](詳見二叉樹專題)…

【IDEA】格式化代碼工具配置

格式化代碼快捷鍵: CtrlAltL格式代碼的時候不會再方法名與參數中間添加空格默認不勾選的情況下:代碼樣例:勾選之后的樣例:選擇不勾選,IDEA默認情況下就是不勾選的狀態忽略加載文件有些非必要加載到開發工具中的文件我們…

驅動開發(3)|rk356x驅動GPIO基礎應用之點亮led燈

點亮LED燈看似是一個基礎的操作,但實際上,許多高級應用也依賴于高低電平的切換。例如,脈沖寬度調制(PWM)信號可以用來精確控制電機的轉速,通過改變脈沖的頻率和占空比,實現對電機的精確調節&…

手動搭建PHP環境:步步為營,解鎖Web開發

目錄一、引言二、準備工作2.1 明確所需軟件2.2 下載軟件三、Windows 系統搭建步驟3.1 安裝 Apache 服務器3.2 安裝 PHP3.3 集成 Apache 與 PHP3.4 安裝 MySQL3.5 配置 PHP 連接 MySQL四、Linux 系統搭建步驟(以 Ubuntu 為例)4.1 更新系統4.2 安裝 Apache…

DrissionPage:一款讓網頁自動化更簡單的 Python 庫

在網頁自動化領域,Selenium 和 Playwright 早已是開發者耳熟能詳的工具。但今天要給大家介紹一款更輕量、更易用的 Python 庫 ——DrissionPage。它以 "融合 selenium 和 requests 優勢" 為核心設計理念,既能像 requests 一樣高效處理靜態網頁…

理解Grafana中`X-Scope-OrgID`的作用與配置

X-Scope-OrgID的作用 該HTTP Header用于標識Loki日志數據的所屬租戶(組織)。在多租戶模式下,Loki通過此Header隔離不同團隊或用戶的數據,確保查詢和存儲的獨立性。數據隔離: 租戶A的日志標記為X-Scope-OrgID: team-a&a…

【PycharmPyqt designer桌面程序設計】

在 main.py 中調用 Qt Designer 生成的 windows.py(假設它是 PySide2 版)。 只要把兩個文件放在同一目錄即可直接運行。 ──────────────────── 1?? windows.py(Qt Designer 生成,已轉碼) # -*-…

Unity Android Logcat插件 輸出日志中文亂碼解決

背景之前安卓真機調試看日志,一直用的是Android Studio自帶的adb命令進行看日志,不太方便,改用Unity自帶的安卓日志插件時,存在中文日志亂碼問題。插件安裝基于Unity6000.1.11版本:Window -> Package Management -&…

Halcon雙相機單標定板標定實現拼圖

1.Halcon圖像拼接算法在之前的文章里也寫過,主要是硬拼接和特征點拼接兩種方式,今天增加另一種拼接圖像的方式。應用場景是多個相機聯合一起拍大尺寸的物體,并且相機視野之間存在重疊區域。通過在同一個標定板上面標定,計算兩個相…

動物世界一語乾坤韻芳華 人工智能應用大學畢業論文 -仙界AI——仙盟創夢IDE

提示詞在一個奇幻的童話森林里,所有的動物都像人類一樣直立行走,穿著各種搞怪的衣服。 一只戴著超大眼鏡、穿著背帶褲的烏龜,正一本正經地站在一個蘑菇舞臺上,拿著一根樹枝當作麥克風,準備唱歌。它的眼鏡總是往下滑&am…

SpringBoot(原理篇)

大家好,這里是 盛碼筆記。 本篇我們來聊一聊 Spring Boot 的“魔法”是如何實現的。你可能已經用過 Spring Boot 快速搭建項目,但有沒有想過:為什么只需要引入幾個 starter,Spring Boot 就能自動配置好整個應用環境? …

數據結構:棧(區間問題)

碼蹄集OJ-小碼哥的棧 #include<bits/stdc.h> using namespace std; #define int long long const int N1e67; struct MOOE {int ll,rr; }; stack<MOOE>st; signed main( ) {ios::sync_with_stdio(false);cin.tie(nullptr);int n;cin>>n;while(n--){int opt…

Vue 中 data、watch、created 和 methods

以下是 Vue 中 data、watch、created 和 methods 的詳細解釋&#xff0c;結合常見使用場景和示例&#xff1a;1. data&#xff1a;響應式數據容器 作用&#xff1a;定義組件的響應式數據&#xff08;狀態&#xff09;&#xff0c;當數據變化時&#xff0c;視圖自動更新。特點&a…

精密模具冷卻孔內輪廓檢測方法探究 —— 激光頻率梳 3D 輪廓檢測

引言精密模具冷卻孔的內輪廓精度直接影響注塑成型效率與制品質量。冷卻孔具有深徑比大&#xff08;可達 25:1&#xff09;、結構復雜&#xff08;多為螺旋形或異形&#xff09;、表面質量要求高&#xff08;Ra≤0.2μm&#xff09;等特點&#xff0c;傳統檢測方法難以滿足其高精…

Vue單文件組件與腳手架工程化開發

一、Vue與VueComponent原型關系解析1. 原型鏈關系圖解在Vue中&#xff0c;組件實例(VueComponent)與Vue實例之間存在特殊的原型鏈關系&#xff1a;VueComponent.prototype.__proto__ Vue.prototype這種設計使得所有組件都能訪問Vue原型上定義的方法和屬性。2. 原理驗證示例// …