前言
對于大部分人來說,能夠靈活使用AI工具,并對自己每個常用的AI工具優劣勢很清楚,就已經足夠了。不過,畢竟AI發展實在太快,多了解一些相關的知識點,以全局的視角去看AI,可以避免管中窺豹,宏觀和微觀來回切換,就不容易掉隊。
所以分享一下大模型的4種層次的運用模式。從易到難,分別是提示詞工程(Prompt Engineering),檢索增強生成(RAG),微調(Fine-tuning),預訓練(Pre-training)4個方式(這4個方式也是AI新手到高手的成長路線)。
image
提示詞工程
提示詞工程(Prompt Engineering)是一種技術,它涉及精心設計問題或指令(即“提示詞”),以引導人工智能(AI)模型生成特定類型的輸出。這種方法的核心在于通過精確的語言輸入來激發AI的潛能,使其能夠提供更加準確、相關或創造性的回答。
image
舉例:
-
內容創作:
-
- 假設你想要AI幫你寫一篇關于“時間管理”的博客文章。你可以設計一個提示詞,如:“寫一篇關于時間管理的指南,面向忙碌的專業人士,語言風格要鼓舞人心,包含實用的技巧和案例研究。”
-
代碼生成:
-
- 如果你是一個軟件開發者,需要生成一個特定的函數來解析JSON數據,你可以給AI一個提示詞,例如:“生成一個Python函數,該函數接受一個JSON字符串作為輸入,并返回解析后的數據字典。”
-
語言翻譯:
-
- 想要將一段文本從英語翻譯成法語,你可以使用提示詞:“將以下英文文本翻譯成法語:‘Welcome to our new website!’”
-
問題解答:
-
- 當你向AI提出一個復雜問題時,比如“解釋量子糾纏是什么?”你可以設計一個提示詞,讓它以易于理解的方式回答:“請用簡單的語言解釋量子糾纏的概念,并提供日常生活中的類比。”
-
藝術創作:
-
- 如果你想利用AI來創作一幅畫,可以給出一個藝術風格的提示詞,如:“創作一幅描繪夏日海灘的油畫,風格要類似于梵高的《星夜》。”
這些例子里,提示詞相對比較簡單,如果想系統的學習提示詞,網上也有很多資料可以學,可以參考這個:
https://zhuanlan.zhihu.com/p/671241020
RAG(檢索增強生成)
RAG是一種通過知識庫外掛的形式,讓問題回復更精準的技術。
image
邏輯闡述
比如你在用一些大模型對話機器人時,這些回復是從大的數據集中生成答案,但有些你自己的獨有問題,并不一定能找到答案。比如公司會有自己獨有的資料庫或者檔案。這個時候,借助RAG,可以支持把你獨有的知識庫存儲到向量數據庫(這個不清楚的話,可以問AI哈),然后包裝成一個應用,AI就變成了你自己獨有的一個智能的“信息助手”,它不僅記住了很多你喂給ta的東西,還能在需要時快速查找更多相關資料,然后結合這些信息給出一個全面的答案。
流程:
- 像搜索引擎一樣檢索:當你問一個問題時,RAG技術會像使用搜索引擎一樣,在你提供的各種資料中快速找到最相關的信息。
- 像老員工一樣經驗豐富:找到信息后,它會像有經驗的員工那樣,結合已有的知識和新找到的信息,給你一個更全面的答復。
- 生成回答:最后,它會把整合后的信息以回答的形式呈現給你,就像一個知識淵博且反應迅速的同事。
舉例:
假設你是一個剛入職場2年的市場營銷專員,需要準備一個新產品的推廣方案,但你不確定從何開始。
- 提出問題:你問AI助手:“我們新產品的推廣方案應該包括哪些要素?”
- 檢索信息:AI助手會在你的公司內部資料庫、市場研究報告、以往的成功案例等資料中檢索,找到與新產品推廣相關的策略和數據。
- 生成回答:然后,AI助手會結合這些資料和你之前參與的項目經驗,給出一個包含關鍵要素、市場定位、目標受眾分析、預期效果評估等的推廣方案建議。
比如平時把文檔發給kimi,就是一個RAG小場景,可以不斷追問文檔里的信息。
一些親民的RAG工具,比如Dify(https://cloud.dify.ai/),FastGPT(https://fastgpt.in/)等都比較容易上手。
通過RAG技術,你得到的不僅僅是一些基本的推廣建議,而是一個結合了公司內部資料和市場數據的定制化方案,幫助你更有效地完成工作。
精調(也叫微調)
image
微調大模型(Fine-tuning Large Models)是機器學習和人工智能領域中的一個概念,它指的是在預訓練的大型機器學習模型的基礎上,通過進一步的訓練來適應特定的任務或數據集的過程。**背后改變的是大模型的參數。**當預訓練模型需要應用于具體的、特定的任務時(如特定領域的文本分類、情感分析等),由于這些任務的數據量可能較小,直接使用預訓練模型可能無法達到最佳效果。微調就是通過在特定任務的數據上繼續訓練模型,使模型更好地適應這些數據的特征。
舉例:
假設你是一個有5年工作經驗的軟件工程師,現在你的團隊需要開發一個聊天機器人,用于客戶服務。你們選擇了一個預訓練的大型語言模型作為基礎,這個模型已經在互聯網上的大量文本數據上訓練過,能夠理解多種語言和上下文。
但是,這個通用模型可能并不了解你們公司產品的具體信息和客戶服務的特定語境。這時,你們可以對模型進行微調:
- 收集數據:首先,你們需要收集與客戶服務相關的對話記錄、產品手冊、常見問題解答等數據。
- 微調過程:然后,使用這些特定領域的數據對預訓練模型進行再訓練,調整模型的參數,使其更好地理解你們公司產品的術語和客戶需求。
- 測試與部署:微調完成后,進行測試以確保模型的表現符合預期,然后將其部署到客戶服務平臺上。
具體使用場景:
- 客戶服務:如上例所述,聊天機器人可以用于回答客戶咨詢,提供產品信息,處理常見問題等。
- 醫療咨詢:在醫療領域,微調模型可以用于理解病人的癥狀描述,并提供初步的醫療建議。
- 法律分析:法律行業可以利用微調模型來分析法律文檔,提供案例研究和法律條文的查詢服務。
- 內容推薦:在新聞或電商平臺,微調模型可以根據用戶的歷史行為和偏好,推薦相關新聞或商品。
- 情感分析:在社交媒體管理中,微調模型可以分析用戶評論的情感傾向,幫助企業了解公眾對品牌或產品的看法。
預訓練
預訓練模型這個事情不是我們普通人能做的,簡單了解下即可。
大概意思就是前3個方式都滿足不了的時候,才會使用這個,但成本很高,很多公司也做不了。
image
預訓練模型(Pre-trained Models)是深度學習中的一種模型訓練策略,它涉及到在大量數據上訓練一個通用模型,以便捕捉和學習語言、圖像或其他類型數據的內在結構和特征。這種模型通常在特定任務之前就已經訓練好,因此被稱為“預訓練”。
解釋:
- 大規模數據集訓練:預訓練模型使用的數據集規模通常非常龐大,比如數以億計的網頁、書籍、新聞文章等,這些數據構成了模型訓練的基礎。
- 通用特征學習:在預訓練階段,模型學習到的是數據的通用特征,如語言模型中的詞序、語法結構、語義信息等,或者圖像模型中的顏色、形狀、紋理等視覺特征。
- 遷移學習(Transfer Learning):預訓練模型是遷移學習的一個典型應用,即將在大規模數據集上學到的知識遷移到特定領域的任務上。
- 參數凍結與微調:在微調階段,模型的大部分參數(如底層的權重和偏置)通常被凍結,只有頂層的一小部分參數會被調整,以適應新任務。
- 模型架構:預訓練模型通常基于深度神經網絡,如循環神經網絡(RNN)、長短期記憶網絡(LSTM)、Transformer等,這些架構能夠處理序列數據并捕捉長距離依賴關系。
小結
以上這些只是使用大模型的技術方法,在實際場景中,客戶需要的是解決方案,通常是多個方式一起配合。比較常見的配合就是提示詞工程+RAG,涉及到本地部署,可能會用到微調。
除了這些方法,還有調換大模型,或者借助多模態大模型解決具體需求場景,后面我們接著聊。
學習AI就是多玩,多實踐,共勉。
如何學習大模型 AI ?
由于新崗位的生產效率,要優于被取代崗位的生產效率,所以實際上整個社會的生產效率是提升的。
但是具體到個人,只能說是:
“最先掌握AI的人,將會比較晚掌握AI的人有競爭優勢”。
這句話,放在計算機、互聯網、移動互聯網的開局時期,都是一樣的道理。
我在一線互聯網企業工作十余年里,指導過不少同行后輩。幫助很多人得到了學習和成長。
我意識到有很多經驗和知識值得分享給大家,也可以通過我們的能力和經驗解答大家在人工智能學習中的很多困惑,所以在工作繁忙的情況下還是堅持各種整理和分享。但苦于知識傳播途徑有限,很多互聯網行業朋友無法獲得正確的資料得到學習提升,故此將并將重要的AI大模型資料包括AI大模型入門學習思維導圖、精品AI大模型學習書籍手冊、視頻教程、實戰學習等錄播視頻免費分享出來。
第一階段(10天):初階應用
該階段讓大家對大模型 AI有一個最前沿的認識,對大模型 AI 的理解超過 95% 的人,可以在相關討論時發表高級、不跟風、又接地氣的見解,別人只會和 AI 聊天,而你能調教 AI,并能用代碼將大模型和業務銜接。
- 大模型 AI 能干什么?
- 大模型是怎樣獲得「智能」的?
- 用好 AI 的核心心法
- 大模型應用業務架構
- 大模型應用技術架構
- 代碼示例:向 GPT-3.5 灌入新知識
- 提示工程的意義和核心思想
- Prompt 典型構成
- 指令調優方法論
- 思維鏈和思維樹
- Prompt 攻擊和防范
- …
第二階段(30天):高階應用
該階段我們正式進入大模型 AI 進階實戰學習,學會構造私有知識庫,擴展 AI 的能力。快速開發一個完整的基于 agent 對話機器人。掌握功能最強的大模型開發框架,抓住最新的技術進展,適合 Python 和 JavaScript 程序員。
- 為什么要做 RAG
- 搭建一個簡單的 ChatPDF
- 檢索的基礎概念
- 什么是向量表示(Embeddings)
- 向量數據庫與向量檢索
- 基于向量檢索的 RAG
- 搭建 RAG 系統的擴展知識
- 混合檢索與 RAG-Fusion 簡介
- 向量模型本地部署
- …
第三階段(30天):模型訓練
恭喜你,如果學到這里,你基本可以找到一份大模型 AI相關的工作,自己也能訓練 GPT 了!通過微調,訓練自己的垂直大模型,能獨立訓練開源多模態大模型,掌握更多技術方案。
到此為止,大概2個月的時間。你已經成為了一名“AI小子”。那么你還想往下探索嗎?
- 為什么要做 RAG
- 什么是模型
- 什么是模型訓練
- 求解器 & 損失函數簡介
- 小實驗2:手寫一個簡單的神經網絡并訓練它
- 什么是訓練/預訓練/微調/輕量化微調
- Transformer結構簡介
- 輕量化微調
- 實驗數據集的構建
- …
第四階段(20天):商業閉環
對全球大模型從性能、吞吐量、成本等方面有一定的認知,可以在云端和本地等多種環境下部署大模型,找到適合自己的項目/創業方向,做一名被 AI 武裝的產品經理。
- 硬件選型
- 帶你了解全球大模型
- 使用國產大模型服務
- 搭建 OpenAI 代理
- 熱身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地計算機運行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何優雅地在阿里云私有部署開源大模型
- 部署一套開源 LLM 項目
- 內容安全
- 互聯網信息服務算法備案
- …
學習是一個過程,只要學習就會有挑戰。天道酬勤,你越努力,就會成為越優秀的自己。
如果你能在15天內完成所有的任務,那你堪稱天才。然而,如果你能完成 60-70% 的內容,你就已經開始具備成為一名大模型 AI 的正確特征了。
這份完整版的大模型 AI 學習資料已經上傳CSDN,朋友們如果需要可以微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費
】
