從0開始學習大模型--Day01--大模型是什么

初識大模型

在平時遇到問題時,我們總是習慣性地去運用各種搜索引擎如百度、知乎、CSDN等平臺去搜索答案,但由于搜索到的內容質量參差不齊,檢索到的內容只是單純地根據關鍵字給出內容,往往看了幾個網頁都找不到答案;而如果我們將問題輸入大模型,因其擁有非常龐大且高質量的知識儲備,比我們直接用搜索引擎找答案方便很多,同時還能識別你所輸入問題的細節,比如“不想用某種方法”這類文本的語句,輸入大模型后所找到的答案會避開所說的方法。

大模型的演變

人工智能按照技術實現可以分為多個子領域:

人工智能

人工智能是一個廣泛涉及計算機科學、數據分析、統計學、機器工程、語言學、神經科學、哲學和心理學等多個領域,說白了就是可以把我們所學習的各種領域的知識在應用時量化,并更好地結合去給出答案。

機器學習

機器學習可分為監督學習(指導分類)、無監督學習(主動聚類)和強化學習(試錯),前面兩者區別在于是否用帶有標簽的數據進行訓練,而后者則是通過反饋機制讓機器自己平衡探索新方法和利用已有經驗,最大化獎勵次數。

深度學習

深度學習是機器學習的一個分支,主要使用神經網絡模型(有多個隱藏層組成),對數據進行學習和表示。

通過對大量數據的學習,自動提取出數據的特征,從而實現圖像識別、語音識別、自然語言處理等任務,比如在學習分辨水果過程中,會自動從復雜的信號如視覺、嗅覺等中提取層次化的特征,從而達到識別的目的。

生成式人工智能(AIGC)

生成式人工智能是深度學習中快速增長的子集,其使用了大模型提供支持,在大量原始、未標記的數據基礎上對深度學習模型進行預訓練,使得機器能夠“理解”語言甚至圖像,并能夠根據需求生成內容。

大模型的使用與訓練

使用

我們只需要根據我們的問題向大模型提出需求,就能獲得詳細的回答,但要注意所提出問題的關鍵詞和方式需要嚴謹地按照問題來,往往幾個字的區別,大模型所理解的意思和給出的答案的方向是截然不同的。

訓練

大模型的訓練大體分為預訓練、SFT(監督微調)以及RLHF(基于人類反饋的強化學習)。

預訓練:先學習底層的處理能力和知識,類似于我們在小學到高中的經歷,這些經歷讓我們形成了對事物的認知以及擁有了最基本的處理事情的能力和學習能力;比如我們像大模型詢問“埃菲爾鐵塔在哪個國家”,其會根據看過的關聯類似語句的語料中搜索答案,可能會因為有一個排比詩歌的一句話是“埃菲爾鐵塔在哪個國家,東方明珠在哪個國家”而輸出“東方明珠在哪個國家”而不是“法國”;

監督微調:相比較預訓練,區別在于選擇了一個特定的方向或領域去學習所需的知識點和能力,類似于在大學里我們學習某種專業知識以及對應的動手能力。在這個階段,如果再像大模型提問“埃菲爾鐵塔在哪個國家”,他會根據學習過的人類對話的語料以及垂直領域知識,按照人類的意圖來回答這個問題,即大概率回答“法國”,但并不一定符合我們認知中的一些偏好,可能會有一些過激或者涉及到種族歧視等的言論;

基于人類反饋的強化學習:就像表面的說法一樣,需要根據外界的反饋來判斷是否要這么做,類似于在工作時作為一個新人小白,在遇到問題或開始培訓時請教已經工作了很久的前輩或專家的經驗。在這個階段中,大模型會根據同一個問題給出不同的回答,人類會對這些回答進行打分,大模型會基于這些分數學習到如何輸出分數最高的回答,使回答更符合偏好。

大模型的特點和分類

特點

1、規模和參數量大:大模型通過其龐大的規模來捕獲復雜的數據模式,使得其能理解和生成極其豐富的信息;

2、適應性和靈活性強:能過通過微調或少樣本學習高效地遷移到各種下游任務,有極強的跨域能力;

3、廣泛數據集的訓練:使用大量多樣化的數據進行訓練,以學習廣泛的知識表示,能夠掌握語言、圖像等數據的通用特征;

4、計算資源需求大:巨大的規模帶來了高昂的計算和資源需求,包括但不限于數據存儲、訓練空間、能量消耗和硬件設施

分類

1、大語言模型:專注于自然語言處理(NLP),旨在處理語言、文章、對話等自然語言文本。它們通常基于深度學習架構(如Transformer模型)經過大規模文本數據集訓練而成,能夠捕捉語言的復雜性,包括語法、語義、語境以及蘊含的文化和社會知識。語言大模型典型應用包括文本生成、問答系統、文本分類、機器翻譯、對話系統等;

2、多模態模型(計算機視覺模型、音頻處理模型等):多模態大模型能夠同時處理和理解來自不同感知通道(如文本、圖像、音頻、視頻等)的數據,并在這些模態之間建立關聯和交互。它們能夠整合不同類型的輸入信息,進行跨模態推理、生成和理解任務。多模態大模型的應用涵蓋視覺問答、圖像描述生成、跨模態檢索:多媒體內容理解等領域。

學習來源于B站教程:【基礎篇】04.大模型的工作流程_嗶哩嗶哩_bilibili

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79748.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79748.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79748.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【AI大模型】SpringBoot整合Spring AI 核心組件使用詳解

目錄 一、前言 二、Spring AI介紹 2.1 Spring AI介紹 2.2 Spring AI主要特點 2.3 Spring AI核心組件 2.4 Spring AI應用場景 2.5 Spring AI優勢 2.5.1 與 Spring 生態無縫集成 2.5.2 模塊化設計 2.5.3 簡化 AI 集成 2.5.4 支持云原生和分布式計算 2.5.5 安全性保障…

洛谷 P9007 [入門賽 #9] 最澄澈的空與海 (Hard Version)

這道題可不入門。 [Problem Discription] \color{blue}{\texttt{[Problem Discription]}} [Problem Discription] 給定 n n n,求有多少組 ( x , y , z ) (x,y,z) (x,y,z) 滿足: x ? y z n ! x-\dfrac{y}{z}n! x?zy?n! x ? y z n ! n \dfrac{x-y…

PostgreSQL 的 pg_stat_file 函數

PostgreSQL 的 pg_stat_file 函數 pg_stat_file 是 PostgreSQL 提供的一個系統管理函數,用于獲取文件系統上文件的元數據信息。這個函數對于數據庫管理員進行文件級別的監控和診斷非常有用。 一 函數基本語法 pg_stat_file(filename text [, missing_ok boolean …

關于麒麟服務器實現docker-compose服務開機自啟

我本地服務器環境是麒麟V10版本: 首先確定docker-compose服務絕對路徑命令: which docker-compose我這里輸出是:/usr/bin/docker-compose 編輯服務文件: sudo vim /etc/systemd/system/docker-compose-webup.service[Unit] Desc…

基于 jQuery 實現復選框全選與選中項查詢功能

在 Web 開發中,復選框是常見的交互元素,尤其是在涉及批量操作、數據篩選等場景時,全選功能和選中項查詢功能顯得尤為重要。本文將介紹如何使用 HTML、CSS 和 jQuery 實現一個具備全選、反選以及選中項查詢功能的復選框組,幫助開發…

AfuseKt2.4.2 | 支持阿里云盤、Alist等平臺視頻播放,具備自動海報墻刮削功能的強大播放器

AfuseKt是一款功能強大的安卓端在線視頻播放器,支持播放阿里云盤、Alist、WebDAV等平臺的視頻內容。它具備自動海報墻刮削功能,能自動生成影片信息和海報墻,提供良好的視覺體驗。此外,它還支持倍速播放、字幕、音軌切換等多種實用…

Netlink在SONiC中的應用

Netlink在SONiC中的應用 Netlink介紹 Netlink 是 Linux 內核態程序與用戶空間程序之間進行通信的機制之一,原本是用于傳遞網絡協議棧中的各種控制消息。它采用和套接字(socket)編程接口相同的形式,常用于配置內核網絡子系統&…

語音合成之十一 提升TTS語音合成效果:低質量數據清洗、增強與數據擴增

低質量數據清洗、增強與數據擴增 1. 引言:TTS的基石——數據質量2. 基礎:TTS數據準備工作流2.1 規劃:定義藍圖2.2 執行:從原始數據到訓練就緒格式2.3 最佳實踐與可復現性 3. 攻克缺陷:低質量語音數據的清洗與增強3.2 手…

Java IO流分類與記憶方法

Java IO流分類與記憶方法 在Java IO流體系中,理解節點流和包裝流的區別是掌握IO編程的關鍵。 一、核心分類標準 1. 節點流(Node Stream) 直接對接數據源:直接連接物理IO設備(文件、網絡、內存等)基礎功能:提供最基礎的讀寫能力命名特征:通常包含數據源類型名稱(如Fi…

架構師如何構建個人IP:職業規劃與業務戰略的雙重提升

在數字化時代,軟件架構師的角色已從單純的技術專家轉變為兼具技術領導力和業務影響力的復合型人才。如何構建個人IP,提升行業影響力,成為架構師職業發展的關鍵課題。本文從個人認知、業務戰略、架構決策、產品思維四個維度,探討架…

vscode運行python的快捷鍵

以下是一些在 VS Code 中運行 Python 代碼的常用快捷鍵: 運行 Python 文件 Windows/Linux :Ctrl F5。此快捷鍵會直接運行當前打開的 Python 文件,不會自動進入調試模式。若之前有配置過終端,一般會使用配置好的終端來運行&…

使用OpenCV 和 Dlib 實現疲勞檢測

文章目錄 引言1.相關技術介紹2. 系統原理2.1 眼睛縱橫比(EAR)算法2.2 系統工作流程 3.代碼解析3.1 關鍵函數說明3.2 主循環邏輯 4.實際應用效果5.參數調優建議6.總結 引言 疲勞駕駛是交通事故的主要原因之一。本文將介紹如何使用Python和計算機視覺技術構建一個實時疲勞駕駛檢…

VBA實現后入先出(LIFO)庫存統計

先入先出(FIFO)比較容易理解,買入早的優先賣出。與之對應的是后人先出(LIFO),就是優先賣出最近買入的,例如:第8行賣出2K,當天還沒有買入記錄,只能找前一天的買…

Python中的客戶端和服務端交互的基本內容

目錄 網絡協議 網絡的通信方式 需要安裝的組件和需要導入的包模塊 安裝的組件 導入包模塊 如何創建客戶端 如何創建服務端 網絡協議 IPV4:是互聯網協議的第四版,也是目前廣泛使用的網絡協議。它使用32位地址格式,理論上可以提供約43億…

【硬核攻堅】告別CUDA OOM!DeepSeek部署顯存瓶頸終極解決方案:三大策略高效落地

目錄 引言:大模型落地的“甜蜜”與“煩惱”DeepSeek剖析:為何它如此“吃”顯存?CUDA OOM的“幽靈”:現象、根因與診斷破局之道:三大策略馴服顯存“猛獸” 策略一:模型量化 - 給模型“瘦身”的藝術策略二:動態優化 - 榨干硬件潛能策略三:分布式擴展 - 集群的力量實戰演練…

JavaSE核心知識點01基礎語法01-01(關鍵字、標識符、變量)

🤟致敬讀者 🟩感謝閱讀🟦笑口常開🟪生日快樂?早點睡覺 📘博主相關 🟧博主信息🟨博客首頁🟫專欄推薦🟥活動信息 文章目錄 JavaSE核心知識點01基礎語法01-01&#xff0…

【最新Python包管理工具UV的介紹和安裝】

介紹 uv是一個非常快的 Python 包安裝程序和 pip 解析器,用 Rust 編寫,設計為pip-tools的直接替代品。 以下是官網給出的UV與其他包管理工具解決依賴(左)和安裝包(右)的對比圖。 可以看出UV是一個極快的 P…

麒麟、UOS系統在線打開word文件并提取修訂痕跡

麒麟、UOS系統在線打開word文件并提取修訂痕跡 查看本示例演示效果(Windows版) 查看本示例演示效果(國產版)本示例關鍵代碼的編寫位置,請參考“開始 - 快速上手”里您所使用的開發語言框架的最簡集成代碼 注意 本文中…

【SpringAI+阿里云百煉】AI對話4個Demo

基于SpringAI和阿里云百煉平臺,實現了四個AI對話的小Demo 小團團對話機器人哄哄模擬器培訓班智能客服仿ChatPDF 筆記如下:語雀知識筆記《SpringAI》

【數據結構】單鏈表的增刪查改

本文是小編鞏固自身而作,如有錯誤,歡迎指出! 1.鏈表的概念 概念:鏈表是?種物理存儲結構上?連續、?順序的存儲結構,數據元素的邏輯順序是通過鏈表中的 指針鏈接次序實現的。 和之前的順序表不同,順序一般…