【筆記】大模型業務場景流程綜述

前言

大模型是指具有大規模參數和復雜計算結構的深度學習模型,這些模型通常由眾多神經網絡構建而成,擁有數十億甚至數千億個參數。本章將圍繞大模型概念及特點展開,介紹模型算法的分類、典型大模型及應用、大模型訓練流程和大模型業務流程。

目標

學完本課程后,您將能夠:

了解大模型應用發展。

了解大模型特點和主流大模型應用。

了解大模型業務流程。

目錄

1.AI應用發展現狀

2.大模型分類和特點

3.主流大模型介紹

4.大模型應用

5.大模型訓練及推理流程介紹

6.大模型業務流程

1.AI應用發展現狀

AI應用發展

當前AI應用進入大模型時代,智能化水平有了質的飛躍。從自然語言處理到圖像識別,從自動駕駛到醫療健康,大模型技術的應用正在不斷地提高我們對AI的認知和期待。

于此同時,各類算法和技術也在日新月異地發展。深度學習、強化學習等算法和開發框架、工具的不斷優化和完善,是的AI在處理復雜問題時更加高效和準確。

思考1

AI帶來了哪些改變?

AI可以適用于哪些行業?

大模型時代的AI應用有哪些變化?

大模型AI應用如何開發?

未來的AI應用會走向何方?

思考2

你是一位架構師,現在你將主導團隊AI應用的開發,你會如何進行開發,又會思考哪些問題?

模型那么多,選哪個?大模型還是小模型?

該為微調和推理準備多少算力?

應用上線時,模型應該怎么部署?

要是模型在回答時亂說話怎么辦?

如何保證模型上線后的安全問題?

。。。。。。

AI應用發展歷程

從 感知理解世界(分析數據,給出建議),到 生成創造世界(合成數據,創造結果)。

AI重點事件里程碑:

1956年達特茅斯會議

1997年深藍戰勝人類

2015年視覺識別超過人類

2018年文本理解超越人類

2020年AlphaFold

2022年Stable Diffusion ChatGPT

AI產業發展“三疊浪”:

符號主義

安防-智能客服-無人駕駛-。。。。。。

AIGC

AI技術里程碑:

控制論、專家系統、機器學習

深度學習、CV/NLP、AI4S

Stable Diffusion GPT-4

由小到大

算法:參數量膨脹,單位由Million到Billion

數據:訓練數據增加,單個模型訓練數據集可多達萬億token

算力:算力規模提升至EFLOPs

AlexNET-VGG-ResNet-ELMO-Transformer-ViT-GPT-LLaMA-GLM-...

大模型 VS 小模型
小模型 大模型
學習能力上限低 學習能力強
不同任務需要不同模型 一個模型解決多個任務
訓練數據上限低 訓練數據上限高
單一多模態數據 多模態能力強
Few-shot能力差 Few-shot能力強

使用AI模型獲取數據中的知識 -》“知識”學習的更好

服務器/云側AI應用

隨著AI模型的不斷膨脹(網絡深度、參數量),所需要的算力也是成倍的增加,當前大模型大多數為云側應用,如盤古、ChatGPT、文心一言等

優點:算力相對充足、擴展性強

缺點:數據安全問題、網絡延遲、計算中心維護復雜

AI端邊應用

AI邊緣側應用:攝像頭、開發板等。

AI移動端應用:平板、手機等。

ChatGPT等AIGC應用一直以來都伴隨著強烈的隱私安全爭議,但如果完全在短側運行,就能夠完全避免這一問題。

相比傳統的PC或者服務器,移動終端最大的挑戰就是如何平衡好體驗和能耗。

批注:

在部署深度學習模型時,推理效率是一個關鍵考慮因素。目前,AI技術運用在越來越多的邊緣設備中,例如,智能手機,智能手環,VR眼鏡,Atlas200等等,由于邊緣設備資源的限制,我們需要考慮到模型的大小、推理的速度,并且在很多情況下還需要考慮耗電量,因此模型大小和計算效率成為一個主要考慮因素。

華為終端BG AI與智能全場景業務部總裁賈永利解釋,一方面,大語言模型具備泛化能力,能夠幫助手機智能助手提升理解能力。另一方面,大模型Plug-in的插件能力,可以在手機內部打通各應用之間的壁壘,借助工具拓展能力。

算力挑戰

集群是必然選擇

算力的“需”比“供”大200倍+

大模型算力需求指數級膨脹,750倍每2年

硬件算力供給僅線性增長,3倍每2年

萬級參數時代:2015~2018

典型模型:參數:ResNet-50   2500萬

計算需求:百TF級平臺 1張GPU卡

網絡需求:無互聯網

存儲需求:GB級存取-服務器硬盤

億級參數時代:2018~2022

典型模型:參數:GPT-1   1.7億

計算需求:PF級平臺單服務器,8卡(百TF*10倍)

網絡需求:節點內卡間互聯

存儲需求:TB級存取-服務器硬盤

萬億級參數時代:2023~

典型模型:參數:GPT-4   1-1.7萬億

計算需求:EF級平臺AI集群,~萬卡(PF*1000倍)

網絡需求:超節點+網絡互聯(節點內卡間互聯*100倍)

存儲需求:PB級存取-高并發多級存儲

集群系統創新,加速中國AI創新

批注:

大模型對于算力的需求是呈指數級膨脹式增長的,而硬件算力的供給能力是呈線性增長的,因此,目前對于算力的需求量要比硬件算力供給量高出200倍以上。

那么,同時伴隨著模型參數的不斷增長,在萬億參數時代下的模型訓練中,不僅需要大算力,同時對于網絡、存儲的協同訴求也與日劇增。

所以,單機的服務器已經不能夠滿足萬億參數時代下的大模型訓練,只有通過AI集群的方式,才能夠更好的滿足大規模分布式訓練場景訴求。

因此,集群是大規模時代下的必然選擇,集群系統的創新,也必然會加速中國AI的創新。

算力需求

根據業界論文理論推算,端到端訓練AI大模型的理論時間為E_t = 8 * T * p / (n * X)。其中E_t為端到端訓練理論時間,T為訓練數據的token數量,P為模型參數量,n為AI硬件卡數,X為每塊卡的有效算力。

參數量P(B) 訓練階段 數據量T(B tokens) 卡數n 訓練時長(天)
175(e.g. GPT3) 預訓練 3500 8192 49
二次訓練 100 2048 5.5
65(e.g. LLaMA) 預訓練 1300 2048 27
二次訓練 100 512 8
13(e.g. LLaMA) 預訓練 1000 256 34
二次訓練 100 128 7

批注:

以GPT3為例,參數量175B(750億)規模下,在預訓練階段,數據量35000億,使用8192張卡,其訓練時長為49天。

華為AI算力底座支持國內外主流開源大模型,實測性能持平業界最佳

國內唯一已完成訓練千億參數大模型的技術路線,訓練效率10倍領先其他國產友商

2.大模型分類和特點

大模型分類
大語言模型發展史

2017,Transformer誕生

2018,Google推出Bert

2018,OpenAI推出GPT

2019,OpenAi推出GPT2

2020,OpenAI推出GPT3

2022,OpenAI推出ChatGPT

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/94562.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/94562.shtml
英文地址,請注明出處:http://en.pswp.cn/web/94562.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【兩數相互求余等于輸入兩數】2022-10-20

緣由關于#c#的問題:這個應該按照怎么個思路來寫:想老半天莫得思路想法-編程語言-CSDN問答 void 兩數相互求余等于輸入兩數() {//緣由https://ask.csdn.net/questions/7813625int a 0, b 0, x 0, y 0;cin >> a >> b;if (a > b)x a, y…

Linux系統調優

目錄 1.CPU 負載查看 1.1.使用 uptime 查看系統負載 1.2.使用 top 按 CPU 使用率排序 1.3.使用 ps 查看 CPU 使用最多的進程 1.4.使用 mpstat 查看 CPU 詳細狀態 1.5.查看 /proc/meminfo 獲取詳細內存信息 2查看內存運行狀態 2.1.使用 free 查看內存使用 1.CPU 負載查看…

AtCoder Beginner Contest 420

比賽鏈接如下: AtCoder Beginner Contest 420 - AtCoder A - What month is it? Problem Statement You are given integers X and Y between 1 and 12, inclusive. Find what month it will be Y months after month X (for example, month 1 is January). Cons…

Python算法-貪心算法(Greedy Algorithm)

Python算法:貪心算法(Greedy Algorithm)深度解析 引言 貪心算法(Greedy Algorithm)是計算機科學中最基礎的算法設計思想之一,其核心在于通過局部最優選擇逐步構建全局最優解。盡管它并不總能保證得到絕對最…

告別臃腫與廣告:精選9款安卓電視桌面Launcher,還你清爽高效體驗 (2025版)

[實測] 9款優秀安卓電視桌面Launcher推薦:告別原生臃腫,重塑清爽TV體驗 引言:當前智能電視桌面的痛點 目前市面上許多智能電視或電視盒子的原生桌面(Launcher)系統,為了商業推廣和內容聚合,往…

Docker Desktop緊急修復CVSS9.3高危容器逃逸漏洞

Docker公司修復了Windows和macOS版Docker Desktop應用程序中的一個高危漏洞(CVE-2025-9074,CVSS評分9.3),攻擊者可能利用該漏洞突破容器隔離限制。漏洞技術細節根據Docker官方文檔披露,惡意容器能夠訪問Docker引擎并在…

攜程旅游的 AI 網關落地實踐

原創 董藝荃 Higress 2025年08月21日 16:32 陜西本文整理自攜程旅游研發總監董藝荃在2025中國可信云大會上的分享,董藝荃 GitHub ID CH3CHO,同時也是 Higress 的 Maintainer。分享內容分為以下4部分。01 大規模應用 AI 技術過程中遇到了哪些問題02 網關…

CloudBase云開發MCP + CodeBuddy IDE:打造智能化全棧理財助手的完整實踐

CloudBase云開發MCP CodeBuddy IDE:打造智能化全棧理財助手的完整實踐 🌟 Hello,我是摘星! 🌈 在彩虹般絢爛的技術棧中,我是那個永不停歇的色彩收集者。 🦋 每一個優化都是我培育的花朵&#x…

ESP8266學習

一,連接Wifi1.Esp8266連接手機熱點ATATRST ATCWMODE1 ATCWJAP"ESP8266","123456789"手機查看連接信息2.Esp8266連接手機熱點進入透傳模式ATATRST ATCWMODE1 ATCWJAP"ESP8266","123456789"ATCIPMUX0 ATCIPSTART"TCP&qu…

Mac安裝mitmproxy及操作對監控的請求

在 macOS 上安裝和配置 mitmproxy 是一個相對簡單的過程,可以使用常見的包管理工具如 Homebrew 或直接通過 Python 的包管理工具 pip。以下是詳細的安裝步驟: 方法一:使用 Homebrew 安裝 Homebrew 是 macOS 上流行的包管理工具。它可以快速安…

c++ 數據結構-堆、優先隊列 小總結

之前學習了一些堆、優先隊列的知識點,在此做一個小總結。堆(Heap)堆(Heap)是一種特殊的完全二叉樹數據結構,具有以下重要特性:結構特性堆是一棵完全二叉樹,即除了最后一層外&#xf…

編寫Linux下usb設備驅動方法:probe函數中要進行的工作

一. 簡介 前一篇文章簡單學習了 Linux下usb設備驅動實現流程,文章如下: 編寫Linux下usb設備驅動方法:usb設備驅動實現流程-CSDN博客 本文來學習一下 usb設備驅動的 probe函數要完成的任務。 當usb主控制器檢測到設備與 驅動相匹配時&…

動態規劃:為什么暴力算法會有重復子問題

第一步:先明確 “子問題” 和 “重復子問題” 的定義 在算法中,“子問題” 不是泛指 “小一點的問題”,而是具有明確 “狀態參數” 的、可獨立求解的問題單元。 狀態參數:描述子問題核心信息的變量(比如 01 背包中的 “…

【網絡】添加路由時,via和dev參數作用、直連路由

文章目錄概述1、帶via1.1 添加路由前的初始狀態1.2. 執行添加路由的命令1.3. 添加路由后的狀態2、不帶 via (使用設備接口),直連3、帶via還是不帶via ?4、dev xx的作用4.1 命令中帶via時,建議不帶 dev eth0 (讓系統自動判斷)4.2 命令中帶via&#xff0c…

云原生---企業級Kubernetes

一、Kubernetes介紹 1.簡介 kubernetes的本質是一組服務器集群,它可以在集群的每個節點上運行特定的程序,來對節點中的容器進行管理。目的是實現資源管理的自動化,主要提供了如下的主要功能: 自我修復:一旦某一個容器…

無人機三維路徑規劃首選算法:RRT_

無人機三維路徑規劃首選算法:RRT* 要判斷哪種算法更適合無人機三維路徑規劃,需先明確無人機三維路徑規劃的核心需求,再結合各算法的底層邏輯與特性進行匹配。以下先梳理核心需求,再逐一分析算法特性,最終通過對比得出結…

CentOS 7 服務器初始化:從 0 到 1 的安全高效配置指南

前言 對于運維或開發人員而言,新到手的 CentOS 7 服務器絕非 “開箱即用”—— 默認的國外軟件源下載緩慢、系統缺乏基礎工具、防火墻未做安全配置,這些問題都會影響后續使用效率與服務器安全性。本文整理了 CentOS 7 服務器初始化的全套實操方案&#…

32.Attention-注意力機制

不是所有的信息都是有用的,或者說重要的。我們應該把注意力放在他該在的地方。 在人工智能領域,注意力機制被廣泛應用。他可以幫助模型關注與當前任務相關的特征,而忽略不重要的特征,以提高準確率。注意力機制本質:即通…

如何設計 “用戶共創型” IP 成長社群模型??

“用戶共創型” IP 成長社群的核心,是從 “IP 單向輸出” 轉向 “IP 與用戶共生”,讓用戶從 “被動接收者” 變為 “主動參與者”,通過 “需求共建、內容共造、價值共享” 形成閉環,既強化用戶歸屬感,又為 IP 注入持續…

Windows 命令行:mkdir 命令

專欄導航 上一篇:Windows 命令行:dir 命令 回到目錄 下一篇:MFC 第一章概述 本節前言 本節,我們來講解一個常見的命令,mkdir 命令。 學習本節知識,需要你首先懂得如何打開一個命令行界面,…