【小白AI教程】大模型知識掃盲通識

目錄

一、究竟什么是大模型

二、大模型的兩大分支

2.1 在線大模型

2.2 開源大模型

2.3 大模型的應用

利用行業知識重新訓練AI大模型

利用行業知識對AI大模型進行微調

利用行業知識建立知識庫

三、Reasoning 大模型

3.1 基本概述

3.2 核心概念

3.3 技術實現

3.4 應用場景

3.5 總結


一、究竟什么是大模型

說了這么多大模型重要的因素,那么究竟什么是大模型?我們如何通俗的理解大模型這項偉大的AI技術呢?

我們可以把大模型類比生活場景中的各種“模具”:我們在生活中會使用到很多模具,比如制作雪糕的模具、蛋糕模具、愛心煎蛋的心形模具等等。我們是可以使用這些模具來更加簡單便捷且快速地完成最終要制作的成品。

如果將其映射到數學上,就像是我們聽到過的數學建模:比如,一位老師想計算班級100位同學的期末總成績,那么根據學校本學期的要求,考試成績占總成績的70%,平成成績占總成績的30%,那么老師們只需要找到其中的運算規律就可以指定一個通用的模型來快速計算每一個學生的總成績:總成績y = (考試成績x1 * 0.7) + (平時成績x2 * 0.3),其中該方程式就是模型的算法,而0.7和0.3這個權重占比就是模型的參數。

大模型:LLM(Large Language Model)是指具有大量參數和復雜結構的機器學習模型。這些模型可以應用于處理大規模的數據和復雜的問題。“大模型”中的“大”是指模型的參數量非常大(百億千億級別)。相對來講,參數量越大,則大模型的綜合能力就越強。

二、大模型的兩大分支

2.1 在線大模型

大模型本身是部署在云端,用戶可以通過網絡調用云端大模型相關的接口進行在線使用大模型相關的功能。

因此,在線大模型具備如下優勢:在線模型普遍性能更強、使用的技術門檻和硬件門檻更低、配套模型生態和服務更加完善;

但是其弊端也同時存在:首先是數據安全問題,因為使用線上大模型必須通過網絡進行數據傳輸,需要將本都數據傳輸給在線大模型,才可以基于大模型本身的能力對數據進行分析、處理和其他操作。但是一旦企業生產資料聯網,就肯呢個會帶來數據安全隱患,無法保障內容真實可信等諸多痛點的發生。還有就是,在線大模型的企業應用會產生長期的費用,在線大模型會根據調用次數或者按量進行計費,如果一旦使用頻率和規避較大,則會產生較高的費用。最后一點就是在線大模型無法很好的定制化,也就是無法從訓練語料進行定制化訓練。

2.2 開源大模型

開源大模型是可以在本地設備上進行部署和使用的。相比與在線大模型,開源大模型可以使?更多微調框架進?模型微調,微調空間更?,更有可能快速完成定制化?模型訓練;此外,數據可以直接本地訓練模型,?需在線提交數據進?在線模型微調,數據安全也將更有保障;

但是,一般大模型的參數量級都會比較大,動不動就是幾十億、幾百億、幾千億的量級。因此本地部署,需要提供較高配置的硬件設備,該設備相對費用也不會太低。好在這是一次投資即可終身使用。

2.3 大模型的應用

隨著人工智能技術的不斷發展,AI大模型已經成為垂直行業應用的熱點。

然而,AI大模型雖然功能強大,但在垂直行業應用中存在一些突出的問題,如缺乏特定行業領域的專有知識,尤其是深度知識、私有知識、保密知識等;還有就是輸出內容很難精確控制;常常會出現幻覺(一本正經地胡說八道)等問題。

為解決這些問題,有三種在垂直行業中應用AI大模型的方法,包括重新訓練、微調和知識庫檢索。

?

利用行業知識重新訓練AI大模型

由于通用AI大模型缺乏行業專有知識,重新訓練AI大模型成為一種可行的解決方案。

該方法的基本思想是,將行業相關的數據集和專業知識用于重新訓練AI大模型,使其擁有行業特定的理解和知識。這樣,AI大模型在垂直行業中的應用就能更好地理解和處理相關的任務和問題。

例如,在醫療領域中應用AI大模型時,可以利用醫學文獻、診斷報告和臨床數據等專業知識進行模型的重新訓練,使其具備醫學背景和專業判斷能力。

因此,重新訓練大模型可以提高AI模型在特定領域中的準確性和專業性,并降低產生幻覺的可能性。不過,重新訓練需要大量的數據,且對算力要求較高,對人力資源、算力費用和時間成本要求都非常高。

利用行業知識對AI大模型進行微調

除了重新訓練,微調是另一種常用的方法來應用AI大模型于垂直行業。

微調是指在通用AI大模型的基礎上,通過在特定的行業數據集上進行再次訓練,調整模型的部分參數,以適應特定行業的需求。這種方法相比于重新訓練,既可以保留通用AI大模型的原生能力,又能增加對行業問題的理解能力。例如,在金融領域中,可以利用金融數據和交易信息微調模型,以實現更準確和適應特定金融市場應用場景的預測和建議。

微調是在通用AI大模型的基礎上,通過針對特定行業場景進行精細調整來實現更好的適應性。微調相對于重新訓練而言,時間和資源消耗較少。

利用行業知識建立知識庫

當AI大模型無法提供準確答案或輸出時,可以利用行業知識建立知識庫模型,充分融合AI大模型的通用知識和知識庫的專有知識,使得大模型可以提供更有針對性的輸出。

例如,在法律咨詢領域,當AI大模型遇到具體法律案例時,可以將相關法律條款和判例作為知識庫模型的輸出,促進AI大模型產生更準確的法律意見或建議。

通過建立行業知識庫和企業私有知識庫模型,不僅可以提高輸出內容的準確性,而且可以大大降低幻覺問題影響。但知識庫模型的效果與知識庫的質量和覆蓋度密切相關。此外,不斷更新、維護和擴充知識庫也是一項重要的任務。

三、Reasoning 大模型

3.1 基本概述

Reasoning大模型特指 ”推理大模型“(Reasoning Large Language Model)是專門設計用于處理需要復雜推理任務的大型語言模型。

3.2 核心概念

推理特指的是什么呢?如何理解模型的推理能力呢?

  • 推理能力的定義:推理是指根據已知的信息和知識,通過邏輯推導得出新的結論或答案的過程。對于大模型而言,推理能力使其能夠處理不僅僅是簡單的事實查詢,還包括解決復雜的問題、進行邏輯推斷、數學計算、理解代碼等需要多步思考和分析的任務。

  • 與常規大模型的區別:常規的大模型主要側重于對大量文本數據的學習和理解,以便生成流暢、自然的文本回應,但它們通常直接輸出最終的答案,而不展示中間的推理過程。而推理大模型在回答問題前,會先將問題拆解為更小的步驟,即推理步驟或思維鏈(Chain of Thought, CoT),然后將這些推理過程和最終答案一起輸出,使人們能夠看到模型的思考過程和邏輯推導路徑。
    ?

3.3 技術實現

要使得模型具備強大的推理能力,可以從如下3點(架構基礎、訓練方法和提示工程)進行技術實現:

  • 架構基礎

    • 推理大模型通常基于Transformer架構構建,這種架構能夠有效地處理長序列數據,并且在自注意力機制的幫助下,可以捕捉到輸入數據中的復雜依賴關系,為推理提供了良好的基礎。

      自注意力機制(Self-Attention Mechanism)是Transformer架構中的一個核心部分。簡單來說,自注意力機制就像是給模型裝上了一雙“慧眼”,讓它能夠同時關注輸入數據中的所有部分,并自動判斷哪些部分更加重要。這樣,模型就能更好地理解數據的整體結構和內在聯系。

      想象一下你在閱讀一篇文章。當你讀到文章中的一個詞時,你的大腦會不自覺地回憶起與這個詞相關的其他詞或句子,幫助你更好地理解當前的內容。這就是一種注意力機制。
      ?
      在推理大模型中,自注意力機制的工作方式類似。當模型處理一個句子時,它會檢查句子中的每個詞,并通過比較這些詞之間的關系來確定它們的重要性。例如,在處理句子“我喜歡在公園里散步”時,模型會發現“我”和“喜歡”之間有很強的關聯,因為“我”是動作的執行者;同樣,“散步”和“公園”之間也有緊密的聯系,因為“散步”通常發生在“公園”里。通過這種方式,模型能夠捕捉到句子中的復雜依賴關系,從而更準確地理解其含義。
      ?
      因此,自注意力機制使得推理大模型能夠更有效地處理長序列數據,并在自然語言處理、語音識別等領域展現出強大的性能。
  • 訓練方法

    推理模型的訓練需要基于(預訓練、微調和強化學習)來進行,以確保模型具備強大的推理能力

    • 預訓練:模型首先在大規模的無標注文本數據上進行預訓練,學習語言的基本結構和模式,獲得廣泛的語言知識和世界知識。這一階段的數據量通常非常大,以涵蓋盡可能多的語言現象和信息。

    • 微調:在預訓練的基礎上,使用特定領域或有標注的數據對模型進行微調,以優化其在特定任務上的性能和輸出風格。例如,對于推理任務,可能會使用包含推理鏈的數據集進行微調,讓模型學習如何生成合理的推理步驟。

    • 強化學習:部分推理大模型還會采用強化學習技術,通過獎勵模型來評估模型輸出的質量和準確性,并根據獎勵信號不斷調整模型的參數,以提高模型的推理能力。

      想象一下,一個孩子(模型)剛開始學習解決問題時,他可能會嘗試不同的方法(動作),而每次嘗試后,他會根據結果得到一些反饋(獎勵信號)。如果某種方法得到了好結果(比如解決了問題或者得到了表揚),那么孩子就更有可能在下次遇到類似問題時再次使用這種方法。這就是強化學習的基本思想:通過“試錯”和“延遲回報”來不斷學習和改進。
  • 提示工程

    • 提示工程是提高推理大模型性能的重要手段之一。通過精心設計輸入提示,引導模型按照預期的方式生成推理步驟和答案。例如,在提示中明確要求模型“一步步思考”“詳細解釋推理過程”等,可以幫助模型生成更符合要求的回答。

?

3.4 應用場景

  • 學術研究:幫助研究人員解決復雜的學術問題,如數學證明、科學理論推導等,提供新的研究思路和方法。

  • 教育領域:輔助學生學習,解答學科相關的問題,提供詳細的解題步驟和解釋,培養學生的邏輯思維和解決問題的能力。

  • 商業決策:為企業提供數據分析、市場預測、風險評估等方面的支持,幫助企業做出更明智的決策。

  • 智能客服:更準確地回答用戶的問題,提供更詳細、專業的解決方案,提高客戶服務的質量和效率。

?

3.5 總結

總的來說,推理大模型通過獨特的技術實現和廣泛的應用場景,展現出了強大的能力和潛力。隨著技術的不斷進步和應用需求的不斷提高,推理大模型將在未來發揮更加重要的作用。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/84674.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/84674.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/84674.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

測試 Gemini Pro 2.5

好的,我已經明白了您的需求。您希望: 增大概覽消息(Toast)的尺寸:使其更加醒目。消息持久性:當在用戶中心內部切換不同標簽頁(例如從“個人信息”切換到“安全設置”)時&#xff0c…

大模型——MCP 深度解析

MCP 深度解析 套用一句關于幺半群的名言:"MCP 是一種開放協議,用于標準化應用程序向 LLM 提供上下文的方式,問題何在?"但即使花數小時閱讀 MCP 的定義并實操示例,仍難以清晰把握其具體運作流程:LLM 負責什么?MCP 服務器做什么?MCP 客戶端的角色是什么?數據…

使用 scikit-learn 庫對烏克蘭沖突事件數據集進行多維度分類分析

使用scikit-learn庫對烏克蘭沖突事件數據集進行多維度分類分析 背景 在現代沖突研究中,對沖突事件進行多維度分析和可視化可以幫助我們更好地理解沖突的模式、趨勢和影響因素。本次作業將使用開源沖突數據,構建一個完整的機器學習分類流程,…

工作流 x 深度學習:揭秘藍耘元生代如何用 ComfyUI 玩轉 AI 開發

目錄 一、從 “代碼噩夢” 到 “積木游戲”:我與工作流的初次碰撞 二、深度學習:復雜而迷人的 “數字迷宮” (一)深度學習的神秘面紗 (二)深度學習的發展歷程 (三)深度學習面臨…

《軟件工程》第 14 章 - 持續集成

在軟件工程的開發流程中,持續集成是保障代碼質量與開發效率的關鍵環節。本章將圍繞持續集成的各個方面展開詳細講解,結合 Java 代碼示例與可視化圖表,幫助讀者深入理解并實踐相關知識。 14.1 持續集成概述 14.1.1 持續集成的相關概念 持續集…

1992-2021年各省工業增加值數據(無缺失)

1992-2021年各省工業增加值數據(無缺失) 1、時間:1992-2021年 2、來源:國家統計局、統計年鑒 3、指標:工業增加值 4、范圍:31省 5、缺失情況:無缺失 6、指標說明:工業增加值是…

Android15 Camera Hal設置logLevel控制日志輸出

這里說明三個內容 Camera Hal Demo默認使用的也是Android原生日志接口(例如:ALOGD, ALOGV),為什么logLevel設置為V級別,但是通過ALOGV打印的日志不輸出,不生效Camera Hal Demo在不修改ALOGX接口使用的情況…

C++:設計模式--工廠模式

更多內容:XiaoJ的知識星球 目錄 1.簡單工廠模式1.1 簡單工廠1.2 實現步驟1.3 實現代碼1.4 優缺點 2.工廠模式2.1 工廠模式2.2 實現步驟2.3 實現代碼2.4 優缺點 3.抽象工廠模式3.1 抽象工廠模式3.2 實現步驟3.3 實現代碼3.4 優缺點 1.簡單工廠模式 . 1.1 簡單工廠 …

【DSP筆記】掌握數字世界的律動:時域離散信號與系統基礎

掌握數字世界的律動:時域離散信號與系統基礎 想象一下,你用手機拍了一張照片,或者聽了一首MP3歌曲。這些圖片和聲音,原本都是連續變化的模擬信號,但為什么它們能被你的手機存儲和處理呢?秘密就在于“數字化…

織夢dedecms上傳附件不自動改名的辦法

織夢dedecms的系統在上傳附件后,會將文件自動改名字,那怎么樣才能讓附件上傳后不自動改名字呢,讓附件上傳后不自動改名字(中文名的附件將會改成拼音文件名稱),現在說一下方法吧: 我們打開網站目錄下include\dialog\se…

https下git拉取gitlab倉庫源碼

git init 創建倉庫 參考下面創建公私秘鑰對 GitLab配置ssh key - 阿豪聊干貨 - 博客園 Your identification has been saved in /home/xxx/.ssh/id_ed25519 Your public key has been saved in /home/xxx/.ssh/id_ed25519.pub 然后查看對應公鑰,復制 cat ~/.ss…

Mybatis使用update更新值為null時不生效問題解決

1.出現的問題 前端修改數據時把屬性內容刪除然后進行保存,默認傳的null,后端更新時屬性值為null, 然后調用updateById進行更新時發現該屬性還是原來的值: update方法不會對屬性null的進行更新 2.原因 mybatis-plus FieldStrat…

JAVA 學習日志

$2 周期小結 #8 工作匯報 數學建模部分 前三天的主要精力用在電工杯數學建模大賽上了,雖然這是Java學習筆記 當是還是總結一下吧 首先是任務分工方面 需要三個人都會python基礎語法 然后一起寫論文 ,就是需要邊建模邊寫論文 ,然后在 后續…

Java網絡編程性能優化

1.網絡編程性能優化基礎 1. 性能關鍵指標 指標 描述 優化目標 響應時間 從請求到響應的總時間 降低到毫秒級 吞吐量 單位時間內處理的請求數量 提高到每秒數千至數萬請求 并發用戶數 系統同時處理的用戶數量 支持數千至數萬并發連接 資源利用率 CPU、內存、網絡帶…

react native搭建項目

React Native 項目搭建指南 React Native 是一個使用 JavaScript 和 React 構建跨平臺移動應用的框架。以下是搭建 React Native 項目的詳細步驟: 1. 環境準備 安裝 Node.js 下載并安裝 Node.js (推薦 LTS 版本) 安裝 Java Development Kit (JDK) 對于 Androi…

Redis 容器啟動失敗Fatal error loading the DB, check server logs. Exiting.的解決方法

? 問題分析:Redis 容器啟動失敗 根據提供的 Redis 啟動日志,關鍵信息如下: 🔍 模塊加載情況 模塊名稱狀態備注RedisCompat? 成功search? 成功RediSearch 模塊timeseries? 成功RedisTimeSeries 模塊ReJSON? 成功bf? 成功R…

chrome打不開axure設計的軟件產品原型問題解決辦法

1、打開原型文件夾,進入到其中的如下目錄中:resources->chrome->axure-chrome-extension.crx,找到 Axure RP Extension for Chrome插件。 2、axure-chrome-extension.crx文件修改擴展名.rar,并解壓到文件夾 axure-chrome-ex…

Java 各版本核心新特性的詳細說明

一、Java 8(2014)—— 函數式編程的里程碑 1. Lambda 表達式 作用:簡化匿名內部類,支持函數式編程。示例:// 傳統匿名內部類 Runnable r1 new Runnable() {Overridepublic void run() {System.out.println("He…

【md2html python 將 Markdown 文本轉換為 HTML】

測試md文本 md_text """ # title## subtitle\python print("Hello, World!") \- item 1| Header 1 | Header 2 | |----------|----------| | Row 1 Col 1 | Row 1 Col 2 |- item 2> This is a blockquote.### SubsubtitleThis is a paragraph wi…

Prompt Engineering 提示工程介紹與使用/調試技巧

1. 介紹 Prompt Engineering 是一種人工智能(AI)技術,它通過設計和改進 AI 的 prompt 來提高 AI 的表現。Prompt Engineering 的目標是創建高度有效和可控的 AI 系統,使其能夠準確、可靠地執行特定任務。 如果你從來沒有使用過Pr…