【小白也能看的懂】想要玩轉AI大模型,這4招你得知道

前言

對于大部分人來說,能夠靈活使用AI工具,并對自己每個常用的AI工具優劣勢很清楚,就已經足夠了。不過,畢竟AI發展實在太快,多了解一些相關的知識點,以全局的視角去看AI,可以避免管中窺豹,宏觀和微觀來回切換,就不容易掉隊。

所以分享一下大模型的4種層次的運用模式。從易到難,分別是提示詞工程(Prompt Engineering),檢索增強生成(RAG),微調(Fine-tuning),預訓練(Pre-training)4個方式(這4個方式也是AI新手到高手的成長路線)。

圖片image

提示詞工程

提示詞工程(Prompt Engineering)是一種技術,它涉及精心設計問題或指令(即“提示詞”),以引導人工智能(AI)模型生成特定類型的輸出。這種方法的核心在于通過精確的語言輸入來激發AI的潛能,使其能夠提供更加準確、相關或創造性的回答。

圖片image

舉例:
  1. 內容創作

    • 假設你想要AI幫你寫一篇關于“時間管理”的博客文章。你可以設計一個提示詞,如:“寫一篇關于時間管理的指南,面向忙碌的專業人士,語言風格要鼓舞人心,包含實用的技巧和案例研究。”
  2. 代碼生成

    • 如果你是一個軟件開發者,需要生成一個特定的函數來解析JSON數據,你可以給AI一個提示詞,例如:“生成一個Python函數,該函數接受一個JSON字符串作為輸入,并返回解析后的數據字典。”
  3. 語言翻譯

    • 想要將一段文本從英語翻譯成法語,你可以使用提示詞:“將以下英文文本翻譯成法語:‘Welcome to our new website!’”
  4. 問題解答

    • 當你向AI提出一個復雜問題時,比如“解釋量子糾纏是什么?”你可以設計一個提示詞,讓它以易于理解的方式回答:“請用簡單的語言解釋量子糾纏的概念,并提供日常生活中的類比。”
  5. 藝術創作

    • 如果你想利用AI來創作一幅畫,可以給出一個藝術風格的提示詞,如:“創作一幅描繪夏日海灘的油畫,風格要類似于梵高的《星夜》。”

這些例子里,提示詞相對比較簡單,如果想系統的學習提示詞,網上也有很多資料可以學,可以參考這個:

https://zhuanlan.zhihu.com/p/671241020

RAG(檢索增強生成)

RAG是一種通過知識庫外掛的形式,讓問題回復更精準的技術。

圖片image

邏輯闡述

比如你在用一些大模型對話機器人時,這些回復是從大的數據集中生成答案,但有些你自己的獨有問題,并不一定能找到答案。比如公司會有自己獨有的資料庫或者檔案。這個時候,借助RAG,可以支持把你獨有的知識庫存儲到向量數據庫(這個不清楚的話,可以問AI哈),然后包裝成一個應用,AI就變成了你自己獨有的一個智能的“信息助手”,它不僅記住了很多你喂給ta的東西,還能在需要時快速查找更多相關資料,然后結合這些信息給出一個全面的答案。

流程:

  1. 像搜索引擎一樣檢索:當你問一個問題時,RAG技術會像使用搜索引擎一樣,在你提供的各種資料中快速找到最相關的信息。
  2. 像老員工一樣經驗豐富:找到信息后,它會像有經驗的員工那樣,結合已有的知識和新找到的信息,給你一個更全面的答復。
  3. 生成回答:最后,它會把整合后的信息以回答的形式呈現給你,就像一個知識淵博且反應迅速的同事。

舉例:

假設你是一個剛入職場2年的市場營銷專員,需要準備一個新產品的推廣方案,但你不確定從何開始。

  1. 提出問題:你問AI助手:“我們新產品的推廣方案應該包括哪些要素?”
  2. 檢索信息:AI助手會在你的公司內部資料庫、市場研究報告、以往的成功案例等資料中檢索,找到與新產品推廣相關的策略和數據。
  3. 生成回答:然后,AI助手會結合這些資料和你之前參與的項目經驗,給出一個包含關鍵要素、市場定位、目標受眾分析、預期效果評估等的推廣方案建議。

圖片比如平時把文檔發給kimi,就是一個RAG小場景,可以不斷追問文檔里的信息。

一些親民的RAG工具,比如Dify(https://cloud.dify.ai/),FastGPT(https://fastgpt.in/)等都比較容易上手。

通過RAG技術,你得到的不僅僅是一些基本的推廣建議,而是一個結合了公司內部資料和市場數據的定制化方案,幫助你更有效地完成工作。

精調(也叫微調)

圖片image

微調大模型(Fine-tuning Large Models)是機器學習和人工智能領域中的一個概念,它指的是在預訓練的大型機器學習模型的基礎上,通過進一步的訓練來適應特定的任務或數據集的過程。**背后改變的是大模型的參數。**當預訓練模型需要應用于具體的、特定的任務時(如特定領域的文本分類、情感分析等),由于這些任務的數據量可能較小,直接使用預訓練模型可能無法達到最佳效果。微調就是通過在特定任務的數據上繼續訓練模型,使模型更好地適應這些數據的特征。

舉例:

假設你是一個有5年工作經驗的軟件工程師,現在你的團隊需要開發一個聊天機器人,用于客戶服務。你們選擇了一個預訓練的大型語言模型作為基礎,這個模型已經在互聯網上的大量文本數據上訓練過,能夠理解多種語言和上下文。

但是,這個通用模型可能并不了解你們公司產品的具體信息和客戶服務的特定語境。這時,你們可以對模型進行微調:

  • 收集數據:首先,你們需要收集與客戶服務相關的對話記錄、產品手冊、常見問題解答等數據。
  • 微調過程:然后,使用這些特定領域的數據對預訓練模型進行再訓練,調整模型的參數,使其更好地理解你們公司產品的術語和客戶需求。
  • 測試與部署:微調完成后,進行測試以確保模型的表現符合預期,然后將其部署到客戶服務平臺上。

具體使用場景:

  1. 客戶服務:如上例所述,聊天機器人可以用于回答客戶咨詢,提供產品信息,處理常見問題等。
  2. 醫療咨詢:在醫療領域,微調模型可以用于理解病人的癥狀描述,并提供初步的醫療建議。
  3. 法律分析:法律行業可以利用微調模型來分析法律文檔,提供案例研究和法律條文的查詢服務。
  4. 內容推薦:在新聞或電商平臺,微調模型可以根據用戶的歷史行為和偏好,推薦相關新聞或商品。
  5. 情感分析:在社交媒體管理中,微調模型可以分析用戶評論的情感傾向,幫助企業了解公眾對品牌或產品的看法。

預訓練

預訓練模型這個事情不是我們普通人能做的,簡單了解下即可。

大概意思就是前3個方式都滿足不了的時候,才會使用這個,但成本很高,很多公司也做不了。

圖片image

預訓練模型(Pre-trained Models)是深度學習中的一種模型訓練策略,它涉及到在大量數據上訓練一個通用模型,以便捕捉和學習語言、圖像或其他類型數據的內在結構和特征。這種模型通常在特定任務之前就已經訓練好,因此被稱為“預訓練”。

解釋:

  1. 大規模數據集訓練:預訓練模型使用的數據集規模通常非常龐大,比如數以億計的網頁、書籍、新聞文章等,這些數據構成了模型訓練的基礎。
  2. 通用特征學習:在預訓練階段,模型學習到的是數據的通用特征,如語言模型中的詞序、語法結構、語義信息等,或者圖像模型中的顏色、形狀、紋理等視覺特征。
  3. 遷移學習(Transfer Learning):預訓練模型是遷移學習的一個典型應用,即將在大規模數據集上學到的知識遷移到特定領域的任務上。
  4. 參數凍結與微調:在微調階段,模型的大部分參數(如底層的權重和偏置)通常被凍結,只有頂層的一小部分參數會被調整,以適應新任務。
  5. 模型架構:預訓練模型通常基于深度神經網絡,如循環神經網絡(RNN)、長短期記憶網絡(LSTM)、Transformer等,這些架構能夠處理序列數據并捕捉長距離依賴關系。

小結

以上這些只是使用大模型的技術方法,在實際場景中,客戶需要的是解決方案,通常是多個方式一起配合。比較常見的配合就是提示詞工程+RAG,涉及到本地部署,可能會用到微調。

除了這些方法,還有調換大模型,或者借助多模態大模型解決具體需求場景,后面我們接著聊。

學習AI就是多玩,多實踐,共勉。

如何學習大模型 AI ?

由于新崗位的生產效率,要優于被取代崗位的生產效率,所以實際上整個社會的生產效率是提升的。

但是具體到個人,只能說是:

“最先掌握AI的人,將會比較晚掌握AI的人有競爭優勢”。

這句話,放在計算機、互聯網、移動互聯網的開局時期,都是一樣的道理。

我在一線互聯網企業工作十余年里,指導過不少同行后輩。幫助很多人得到了學習和成長。

我意識到有很多經驗和知識值得分享給大家,也可以通過我們的能力和經驗解答大家在人工智能學習中的很多困惑,所以在工作繁忙的情況下還是堅持各種整理和分享。但苦于知識傳播途徑有限,很多互聯網行業朋友無法獲得正確的資料得到學習提升,故此將并將重要的AI大模型資料包括AI大模型入門學習思維導圖、精品AI大模型學習書籍手冊、視頻教程、實戰學習等錄播視頻免費分享出來。

在這里插入圖片描述

第一階段(10天):初階應用

該階段讓大家對大模型 AI有一個最前沿的認識,對大模型 AI 的理解超過 95% 的人,可以在相關討論時發表高級、不跟風、又接地氣的見解,別人只會和 AI 聊天,而你能調教 AI,并能用代碼將大模型和業務銜接。

  • 大模型 AI 能干什么?
  • 大模型是怎樣獲得「智能」的?
  • 用好 AI 的核心心法
  • 大模型應用業務架構
  • 大模型應用技術架構
  • 代碼示例:向 GPT-3.5 灌入新知識
  • 提示工程的意義和核心思想
  • Prompt 典型構成
  • 指令調優方法論
  • 思維鏈和思維樹
  • Prompt 攻擊和防范

第二階段(30天):高階應用

該階段我們正式進入大模型 AI 進階實戰學習,學會構造私有知識庫,擴展 AI 的能力。快速開發一個完整的基于 agent 對話機器人。掌握功能最強的大模型開發框架,抓住最新的技術進展,適合 Python 和 JavaScript 程序員。

  • 為什么要做 RAG
  • 搭建一個簡單的 ChatPDF
  • 檢索的基礎概念
  • 什么是向量表示(Embeddings)
  • 向量數據庫與向量檢索
  • 基于向量檢索的 RAG
  • 搭建 RAG 系統的擴展知識
  • 混合檢索與 RAG-Fusion 簡介
  • 向量模型本地部署

第三階段(30天):模型訓練

恭喜你,如果學到這里,你基本可以找到一份大模型 AI相關的工作,自己也能訓練 GPT 了!通過微調,訓練自己的垂直大模型,能獨立訓練開源多模態大模型,掌握更多技術方案。

到此為止,大概2個月的時間。你已經成為了一名“AI小子”。那么你還想往下探索嗎?

  • 為什么要做 RAG
  • 什么是模型
  • 什么是模型訓練
  • 求解器 & 損失函數簡介
  • 小實驗2:手寫一個簡單的神經網絡并訓練它
  • 什么是訓練/預訓練/微調/輕量化微調
  • Transformer結構簡介
  • 輕量化微調
  • 實驗數據集的構建

第四階段(20天):商業閉環

對全球大模型從性能、吞吐量、成本等方面有一定的認知,可以在云端和本地等多種環境下部署大模型,找到適合自己的項目/創業方向,做一名被 AI 武裝的產品經理。

  • 硬件選型
  • 帶你了解全球大模型
  • 使用國產大模型服務
  • 搭建 OpenAI 代理
  • 熱身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地計算機運行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何優雅地在阿里云私有部署開源大模型
  • 部署一套開源 LLM 項目
  • 內容安全
  • 互聯網信息服務算法備案

學習是一個過程,只要學習就會有挑戰。天道酬勤,你越努力,就會成為越優秀的自己。

如果你能在15天內完成所有的任務,那你堪稱天才。然而,如果你能完成 60-70% 的內容,你就已經開始具備成為一名大模型 AI 的正確特征了。

這份完整版的大模型 AI 學習資料已經上傳CSDN,朋友們如果需要可以微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/44905.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/44905.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/44905.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

編程語言現狀:深入剖析與未來展望

編程語言現狀:深入剖析與未來展望 在數字化時代的浪潮中,編程語言作為信息科技領域的基石,正經歷著前所未有的變革與發展。本文將從四個方面、五個方面、六個方面和七個方面,深入剖析編程語言的現狀,并展望其未來的發…

【錯題集-編程題】買賣股票的最好時機(四)(動態規劃)

力扣對應題目鏈接:188. 買賣股票的最佳時機 IV - 力扣(LeetCode) 牛客對應題目鏈接:買賣股票的最好時機(四)_牛客題霸_牛客網 (nowcoder.com) 一、分析題目 1、狀態表示 為了更加清晰的區分買入和賣出,我們換成有股…

【鴻蒙學習筆記】通過用戶首選項實現數據持久化

官方文檔:通過用戶首選項實現數據持久化 目錄標題 使用場景第1步:源碼第2步:啟動模擬器第3步:啟動entry第6步:操作樣例2 使用場景 Preferences會將該數據緩存在內存中,當用戶讀取的時候,能夠快…

springboot對象參數賦值變化

java springboot 項目, 通過接口修改Person類 name值, 在別的類中,注入Person類 Resource Person person, 為什么拿不到 接口修改的 name的值,是Person類 不同的對象造成的 嗎 參數對象和注入對象區別 Person類&…

云WAF | 云waf基礎知識詳解

隨著數字時代的到來,網絡安全問題越來越突出, Web應用防火墻(WAF)是保障 Web應用安全的一道重要防線。在云計算環境下,云環路由云平臺(WAF)的出現,其融合了 WAF的能力和云計算的靈活…

【Linux】IP地址與主機名

文章目錄 1.IP地址2.特殊IP地址3.主機名4.域名解析 1.IP地址 每一臺聯網的電腦都會有一個地址,用于和其它計算機進行通訊 IP地址主要有2個版本,V4版本和V6版本 IPv4版本的地址格式是:a.b.c.d,其中abcd表示0~255的數字,如192.168.…

PS 2024【最新】中文白嫖版!,安裝教程,圖文步驟

文章目錄 軟件介紹軟件下載安裝步驟 軟件介紹 Photoshop,簡稱“PS” Adobe Photoshop,簡稱“PS”,是由Adobe Systems開發和發行的圖像處理軟件。Photoshop主要處理以像素所構成的數字圖像。使用其眾多的編修與繪圖工具,可以有效地…

利用AI快速上手新項目:開發者的高效指南

使用AI幫助開發者熟悉新的項目 在現代軟件開發中,開發者經常需要快速熟悉一個新的項目。項目可能包含復雜的結構和大量的文件,這對新手開發者來說無疑是一項挑戰。幸運的是,借助AI技術,我們可以更加高效地了解項目結構&#xff0…

道路運輸企業管理人員安全考核試題(附答案)

1、【多選題】《道路旅客運輸企業安全管理規范》規定,客運企業應當制定車輛動態監控操作規程。操作規程的內容包括( )。(ABCD) A、衛星定位裝置、視頻監控裝置、動態監控平臺設備的檢修和維護要求 B、動態監控信息采集、分析、處理規范和流程 C、違法違規信息統…

探索Facebook在人工智能領域的最新進展

在當今快速發展的科技領域中,人工智能(AI)作為一項關鍵技術,正在逐步改變著社交媒體的面貌。作為全球最大的社交平臺之一,Facebook積極探索和應用人工智能,以提升用戶體驗、增強平臺安全性并推動技術創新。…

Nodejs 第八十四章(ElasticSearch搜索)

ElasticSearch基本用法在之前的篇章介紹過了 這里不在過多闡述 模擬假數據 安裝庫 faker-js/faker 模擬假數據的一個庫非常好用支持中文使用中文 locale: [zh_CN], 設置即可生成名字,郵箱,手機號,id,年齡,性別生成完成…

ATT 和 GATT:數據表示和交換

背景介紹 BLE的通信和以太網,wifi有個重大的不同是:BLE通信的設備往往有特定的功能。且這個功能不會在運行中發生變化。 因此藍牙設備通信的時候,只能訪問預先定義好的(也就是配置文件profile)的功能。 那profile里寫…

批量制作word表格

問題背景 將excel表中的成績內容制作為成績單,每頁對應一個學員的成績,方便打印 代碼實現 ## 導入包 import pandas as pd from docx import Document from docx.enum.text import WD_ALIGN_PARAGRAPH,WD_LINE_SPACING# 讀取 Excel 內容 df pd.read_e…

APP接入聚合廣告SDK會影響上架應用市場嗎?

SDK是移動互聯網的基本技術接入方式,而廣告聚合SDK僅是實現廣告請求返回的功能,所以本身不會有任何問題,而各家應用市場會對具體的廣告展現方式等會有不同的要求,開發者可以根據具體的市場需要要求廣告平臺來配合進行相關設置即可…

精通 mysqldumpslow:深度分析 MySQL 慢查詢日志

引言 在數據庫管理與優化的領域中,慢查詢日志是識別性能瓶頸的金礦。mysqldumpslow 工具是挖掘這座金礦的利器,它幫助我們分析 MySQL 慢查詢日志并提取關鍵信息。本文將詳細介紹 mysqldumpslow 的核心選項,并通過實例展示如何使用這些選項來…

IP 地址:優化網絡游戲

IP地址和網絡游戲 在現代網絡游戲中,IP地址不僅用于服務器分配,還能針對性進行玩家匹配與優化網絡延遲。本文將探討IP地址在網絡游戲中的具體應用。 *服務器分配* 全球服務器分布: 網絡游戲需要在全球范圍內提供快速、穩定的連接&#xff…

筆記

https://qoj.ac/problem/8008 不難發現, 隨機到某些位置,之后最短路 先O(nm)預處理出能到的點, 考慮最小的隨機位置 首先,我們將求和式進行展開: ∑ j 1 ∞ j ( n ? i n ) j ? 1 i n \s…

libcoap3對接華為云平臺

文章目錄 前言一、平臺注冊二、引入源碼庫1.libcoap倉庫編譯2.分析網絡報文3.案例代碼4.編譯&運行 總結 前言 通過libcoap3開源代碼庫對接華為云平臺,本文章將討論加密與不加密的方式對接華為云平臺。 一、平臺注冊 首先,你需要在華為云平臺上創建…

文華財經盤立方博易大師boll布林帶指標公式源碼

TT:TIME>850&&TIME<1150; MID:MA(CLOSE,26);//求N個周期的收盤價均線&#xff0c;稱為布林通道中軌 TMP2:STD(CLOSE,26);//求M個周期內的收盤價的標準差 TOP:MID2*TMP2;//布林通道上軌 BOTTOM:MID-2*TMP2;//布林通道下軌 A:EVERY(ISDOWN,2)&&TT&&…

【鴻蒙學習筆記】使用axios進行HTTP數據請求

官方文檔&#xff1a;網絡管理開發概述 目錄標題 訪問淘寶公開接口&#xff08;測試數據&#xff09;第1步&#xff1a;module.json5 配置網絡授權第2步&#xff1a;下載axios第3步&#xff1a;源碼第4步&#xff1a;啟動模擬器第5步&#xff1a;啟動entry第6步&#xff1a;操…