《書生·浦語大模型實戰營》第一課 學習筆記:書生·浦語大模型全鏈路開源體系

文章大綱

  • 1. 簡介與背景
    • 智能聊天機器人與大語言模型
    • 目前的開源智能聊天機器人與云上運行模式
  • 2. InternLM2 大模型 簡介
  • 3. 視頻筆記:書生·浦語大模型全鏈路開源體系
    • 內容要點
    • 從模型到應用典型流程
    • 全鏈路開源體系
  • 4. 論文筆記:InternLM2 Technical Report
    • 簡介
    • 軟硬件基礎設施 Infrastructure
    • 預訓練方法 Pre-train
    • 對齊 Alignment
    • 評價與分析 Evaluation and analysis
    • 數據收集與整理
  • 其他學習內容
    • RAG綜述
    • LLM 帶給世界的改變!
  • 參考文獻
    • 課程資源
    • 論文
    • 其他參考


1. 簡介與背景

一直比較關注LLM 相關內容的業界進展,所以特定來參加這個訓練營《書生·浦語大模型實戰營》,動手學習LLM,看看大模型生態鏈中具體的最佳實踐(Best Practice),很早的時候GPT3.5 時代,我只是注意到了他的發布,之前的聊天機器人還是這么個架構

智能聊天機器人與大語言模型

在這里插入圖片描述
在這里插入圖片描述
ChatGPT在效果強大的GPT 3.5大規模語言模型(LLM,Large Language Model)基礎上,引入“人工標注數據+強化學習”(RLHF,Reinforcement Learning from Human Feedback ,這里的人工反饋其實就是人工標注數據)來不斷Fine-tune預訓練語言模型,主要目的是讓LLM模型學會理解人類的命令指令的含義(比如給我寫一段小作文生成類問題、知識回答類問題、頭腦風暴類問題等不同類型的命令),以及讓LLM學會判斷對于給定的prompt輸入指令(用戶的問題),什么樣的答案是優質的(富含信息、內容豐富、對用戶有幫助、無害、不包含歧視信息等多種標準)。

ChatGPT 使用來自人類反饋的強化學習進行訓練,這種方法通過人類干預來增強機器學習以獲得更好的效果。在訓練過程中,人類訓練者扮演著用戶和人工智能助手的角色,并通過近端策略優化算法進行微調。

目前的開源智能聊天機器人與云上運行模式

在人工智能飛速發展的時代,大模型已經成為引領創新和突破的大力推動者。但開發和應用大模型可不是一件容易的事情,需要我們掌握一堆技巧和方法。所以,這次實戰營的目標就是讓大家能夠高效地學習,玩轉大模型的微調、部署和評測全套工具。


2. InternLM2 大模型 簡介

官網:https://internlm.intern-ai.org.cn/
GitHub: https://github.com/InternLM
InternLM2 技術報告【英文版】:https://arxiv.org/pdf/2403.17297.pdf

3. 視頻筆記:書生·浦語大模型全鏈路開源體系

內容要點

  1. 大模型成為發展通用人工智能的重要途徑
  2. 從2023年七月InternLM全面開源到,2024年1月17日開源InternLM2,半年版本一更新

書生浦語 2.0 (InternLM2) 的主要亮點

  • 超長上下文200k
  • 綜合性能全面提升
  • 優秀的對話和創作體驗
  • 工具調用能力整體升級
  • 突出的數理能力和實用的數據分析能力

從模型到應用典型流程

在這里插入圖片描述

全鏈路開源體系

在這里插入圖片描述
從實際商業項目的調研來看

  • XTuner微調是剛需,特別是LoRA這種低成本微調,能和RAG連續覆蓋場景和成本,在一定范圍內,預計避免隨著數據規模增加出現成本激增的情況
  • LMDeploy部署是剛需,從過去二十多年的商業項目經驗來看,客戶對于部署這類非直接需求的費用比較敏感
  • OpenCompass評測是剛需,實際商業項目不需要全方位評測,更多的可能是針對商業項目的需求編寫評測集,保障微調達到預期效果
  • Lagent和AgentLego是剛需,實際商業項目中需要針對存量數據進行定制開發

在這里插入圖片描述
在這里插入圖片描述

4. 論文筆記:InternLM2 Technical Report

論文地址

  • https://arxiv.org/pdf/2403.17297.pdf

官方翻譯

  • https://mp.weixin.qq.com/s/IUUj_CWUJPdrhLq1XAR-KA

中文翻譯參考

  • https://hub.baai.ac.cn/view/36639

簡介

軟硬件基礎設施 Infrastructure

預訓練方法 Pre-train

對齊 Alignment

評價與分析 Evaluation and analysis

數據收集與整理

典型網頁內容獲取工具:https://trafilatura.readthedocs.io/en/latest/

在這里插入圖片描述

在這里插入圖片描述

網上的c++ 代碼確實太多了,所以你應該多利用AI幫忙寫c++代碼
在這里插入圖片描述

其他學習內容

RAG綜述

https://arxiv.org/pdf/2402.19473.pdf

Retrieval-Augmented Generation for AI-Generated Content A Survey

在這里插入圖片描述

LLM 帶給世界的改變!

以下觀點來源于 《動手學自然語言處理》書籍首發直播

  1. 通過NLP 任務統一了大部分AI 任務
  2. 定義問題,解決問題的周期加快
  3. 未來能與AI 協作的能力是最重要的能力!

參考文獻

課程資源

學員手冊

  • https://aicarrier.feishu.cn/wiki/KamPwGy0SiArQbklScZcSpVNnTb

算力平臺

  • https://studio.intern-ai.org.cn/

課程文檔

  • https://github.com/InternLM/Tutorial/tree/camp2

課程視頻

  • https://www.bilibili.com/video/BV1Vx421X72D/

代碼倉庫

  • https://github.com/InternLM/Tutorial/tree/camp2

論文

其他參考

胡老師博客:

  • 第一課
  • https://blog.csdn.net/hu_zhenghui/article/details/138811450

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/14936.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/14936.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/14936.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于Java的地震震中附近城市分析實戰

目錄 前言 一、空間數據說明 1、空間查詢 二、Java后臺開發 1、模型層設計與實現 2、控制層設計與實現 三、Leaflet地圖開發 1、地震震中位置展示 2、附近城市展示 3、成果展示 總結 前言 隨著全球氣候變化和地殼活動的不斷演變,地震作為一種自然災害&…

第十三節:帶你梳理Vue2 : watch偵聽器

官方解釋:> 觀察 Vue 實例變化的一個表達式或計算屬性函數。回調函數得到的參數為新值和舊值。表達式只接受監督的鍵路徑。對于更復雜的表達式&#xff0c;用一個函數取代<br/>## 1. 偵聽器的基本使用偵聽器可以監聽data對象屬性或者計算屬性的變化watch是觀察屬性的…

現代C++ 如何使用 Lambda 使代碼更具表現力、更容易理解?

使用 Lambda 使代碼更具表現力 一、Lambda VS. 仿函數二、總結 一、Lambda VS. 仿函數 Lambda 是 C11 中最引人注目的語言特性之一。它是一個強大的工具&#xff0c;但必須正確使用才能使代碼更具表現力&#xff0c;而不是更難理解。 首先&#xff0c;要明確的是&#xff0c;…

向npm發布自己寫的vue組件,使用vite創建項目

向npm發布自己寫的vue組件&#xff0c;使用vite創建項目 創建項目 pnpm create vite輸入項目名稱 由于我的組件是基于 ant-design-vue和vue的&#xff0c;需要解析.vue文件&#xff0c;我又安裝了下面4個。 然后執行 pnpm i安裝依賴 vite.config.ts import { defineC…

防范TOCTOU競態條件攻擊

防范TOCTOU競態條件攻擊 在軟件開發過程中&#xff0c;我們常常會遇到需要在使用資源之前檢查其狀態的情況。然而&#xff0c;如果資源的狀態在檢查和使用之間發生了變化&#xff0c;那么檢查的結果可能會失效&#xff0c;導致軟件在資源處于非正常狀態時執行無效操作。這種時…

[datawhale202405]從零手搓大模型實戰:TinyAgent

結論速遞 TinyAgent項目實現了一個簡單的Agent智能體&#xff0c;主要是實現了ReAct策略&#xff08;推理調用工具的能力&#xff09;&#xff0c;及封裝了一個Tool。 項目實現有一定的疏漏。為了正確運行代碼&#xff0c;本次對代碼Agent部分進行了簡單修改&#xff08;完善…

windows安裝rocketmq

1.下載連接 https://rocketmq.apache.org/download/ 2.解壓到D盤下&#xff08;其他位置也可以&#xff09; 3.配置環境變量 需要有jdk環境 新建ROCKETMQ_HOME&#xff0c;剛剛解壓的位置 編輯Path&#xff0c;新增%ROCKETMQ_HOME%\bin 4.啟動mqnameserver 進入安裝bin目錄下…

ERC314協議

314協議功能詳解 這兩天花時間研究了一下314協議&#xff0c;總體感覺還不錯&#xff0c;有創新。 功能亮點 314協議作為一種創新的代幣標準&#xff0c;致力于降低用戶交易成本與簡化授權流程&#xff0c;通過“轉賬即交易”模式革新傳統Swap體驗。此協議簡化了買賣代幣的過程…

什么是react

React 是一個用于構建用戶界面的 JavaScript 庫&#xff0c;由 Facebook&#xff08;現在的 Meta&#xff09;開發和維護。它首次發布于2013年&#xff0c;并迅速成為最受歡迎的前端庫之一。React 的主要目標是提供一種高效、靈活的方式來構建用戶界面&#xff0c;特別是在大型…

gc和gccgo編譯器

Go 語言有兩個主要的編譯器&#xff0c;分別是 Go 編譯器&#xff08;通常簡稱為 gc&#xff09;和 GCCGO。它們之間有一些重要的異同點&#xff1a; gc 編譯器&#xff1a; gc 是 Go 語言的官方編譯器&#xff0c;由 Go 語言的開發團隊維護。它是 Go 語言最常用的編譯器&#…

PHP代碼審計前期準備

1 php代碼審計的意義 1.1 什么是代碼審計 就是獲取目標的代碼&#xff0c;這個目標可以是一個網站&#xff0c;也可以是一個手機app 1.2 黑盒測試與白盒測試的區別 在代碼審計中黑盒和白盒的主要區別就在于是否可以拿到源代碼&#xff0c;黑盒是拿不到源代碼的&#xff0c;…

交叉編譯——

什么是交叉編譯 交叉編譯 是在一個平臺上生成臨海一個平臺可執行代碼. eg.在windows上面編寫C51代碼&#xff0c;并編譯生成可執行代碼。如xx.hex 我們在Ubuntu上編寫樹莓派的代碼&#xff0c;并編譯成可執行代碼。a.out. 是在樹莓派上運行&#xff0c;不在Ubuntu Linux上面運…

便攜式iv測試儀特點

TH-PV30便攜式IV測試儀是一種用于測量半導體器件電學特性的設備&#xff0c;它具有體積小、重量輕、便于攜帶等特點&#xff0c;廣泛應用于半導體行業、科研實驗室以及教育領域。 該測試儀的工作原理基于四探針法&#xff0c;通過在半導體器件表面放置四個金屬探針&#xff0c…

【vs2022】安裝copilot和reshaper

直接安裝新版vs 17.10 自帶集成的copilot支持安裝resharper 可以跳過市場里的reshper安裝好后依然可以直接使用vs。 resharper 2024.1.2 市場里還是i老版本&#xff1a; copilot 不兼容,這個是之前市場安裝的版本 官方建議用vs intall 安裝 安裝 GitHub Copilot GitHub.Co…

詳解http協議

什么是HTTP協議 定義 Http協議即超文本傳送協議 (HTTP-Hypertext transfer protocol) 。 它定義了瀏覽器&#xff08;即萬維網客戶進程&#xff09;怎樣向萬維網服務器請求萬維網文檔&#xff0c;以及服務器怎樣把文檔傳送給瀏覽器。從層次的角度看&#xff0c;HTTP是面向&am…

第四十一天 | 62.不同路徑 63.不同路徑|| 343.整數拆分 96.不同的二叉搜索樹

題目&#xff1a;62.不同路徑 1.二維dp數組dp[i][j]含義&#xff1a;到達&#xff08;i&#xff0c;j&#xff09;位置有dp[i][j]種方法。 2.動態轉移方程&#xff1a;dp[i][j] dp[i - 1][j] dp[i][j - 1] 3.初始化&#xff1a;dp[0][j] 1, dp[i][0] 1 &#xff08;第一…

Vue3設置緩存:storage.ts

在vue文件使用&#xff1a; import { Local,Session } from //utils/storage; // Local if (!Local.get(字段名)) Local.set(字段名, 字段的值);// Session Session.getToken()storage.ts文件&#xff1a; import Cookies from js-cookie;/*** window.localStorage 瀏覽器永…

uniapp 安卓 Pc端真機瀏覽器調試

下載插件:真機模擬瀏覽器 1. 安裝, 每次啟用時使用usb 線連接電腦, 并且打開手機或者POS (調試設備)開發者模式, 比如我的是pos 機 則在系統設置中找到版本號,點擊多次就會觸發開發者模式 2.打開真機模擬軟件,打開后會打開一個瀏覽器,如果想要模擬google的瀏覽器則 在瀏覽器地…

精準鍵位提示,鍵盤盲打輕松入門

在說明精準鍵位提示之前&#xff0c;我們先來看一張圖&#xff1a; 這是一張標準的基準鍵位圖&#xff0c;也就是打字時我們雙手的8個手指放在基準鍵位上&#xff0c;在打不同的字母時&#xff0c;我們的手指以基準鍵位為中心&#xff0c;或上、或下、或左、或右&#xff0c;在…

202109青少年軟件編程(Python)等級考試試卷(四級)

第 1 題 【單選題】 執行如下 Python 代碼后, 結果是?( ) def inverse(s,n=0): while s:n = n * 10 + s % 10s = s // 10return nprint