《書生·浦語大模型實戰營》第一課學習筆記：書生·浦語大模型全鏈路開源體系

文章大綱

1. 簡介與背景
- 智能聊天機器人與大語言模型
- 目前的開源智能聊天機器人與云上運行模式
2. InternLM2 大模型簡介
3. 視頻筆記：書生·浦語大模型全鏈路開源體系
- 內容要點
- 從模型到應用典型流程
- 全鏈路開源體系
4. 論文筆記:InternLM2 Technical Report
- 簡介
- 軟硬件基礎設施 Infrastructure
- 預訓練方法 Pre-train
- 對齊 Alignment
- 評價與分析 Evaluation and analysis
- 數據收集與整理
其他學習內容
- RAG綜述
- LLM 帶給世界的改變！
參考文獻
- 課程資源
- 論文
- 其他參考

1. 簡介與背景

一直比較關注LLM 相關內容的業界進展，所以特定來參加這個訓練營《書生·浦語大模型實戰營》，動手學習LLM，看看大模型生態鏈中具體的最佳實踐(Best Practice)，很早的時候GPT3.5 時代，我只是注意到了他的發布，之前的聊天機器人還是這么個架構

智能聊天機器人與大語言模型

在這里插入圖片描述

ChatGPT在效果強大的GPT 3.5大規模語言模型（LLM，Large Language Model）基礎上，引入“人工標注數據+強化學習”（RLHF，Reinforcement Learning from Human Feedback ，這里的人工反饋其實就是人工標注數據）來不斷Fine-tune預訓練語言模型，主要目的是讓LLM模型學會理解人類的命令指令的含義（比如給我寫一段小作文生成類問題、知識回答類問題、頭腦風暴類問題等不同類型的命令），以及讓LLM學會判斷對于給定的prompt輸入指令（用戶的問題），什么樣的答案是優質的（富含信息、內容豐富、對用戶有幫助、無害、不包含歧視信息等多種標準）。

ChatGPT 使用來自人類反饋的強化學習進行訓練，這種方法通過人類干預來增強機器學習以獲得更好的效果。在訓練過程中，人類訓練者扮演著用戶和人工智能助手的角色，并通過近端策略優化算法進行微調。

目前的開源智能聊天機器人與云上運行模式

在人工智能飛速發展的時代，大模型已經成為引領創新和突破的大力推動者。但開發和應用大模型可不是一件容易的事情，需要我們掌握一堆技巧和方法。所以，這次實戰營的目標就是讓大家能夠高效地學習，玩轉大模型的微調、部署和評測全套工具。

2. InternLM2 大模型簡介

官網：https://internlm.intern-ai.org.cn/
GitHub: https://github.com/InternLM
InternLM2 技術報告【英文版】：https://arxiv.org/pdf/2403.17297.pdf

3. 視頻筆記：書生·浦語大模型全鏈路開源體系

內容要點

大模型成為發展通用人工智能的重要途徑
從2023年七月InternLM全面開源到，2024年1月17日開源InternLM2，半年版本一更新

書生浦語 2.0 (InternLM2) 的主要亮點

超長上下文200k
綜合性能全面提升
優秀的對話和創作體驗
工具調用能力整體升級
突出的數理能力和實用的數據分析能力

從模型到應用典型流程

在這里插入圖片描述

全鏈路開源體系

在這里插入圖片描述
從實際商業項目的調研來看

XTuner微調是剛需，特別是LoRA這種低成本微調，能和RAG連續覆蓋場景和成本，在一定范圍內，預計避免隨著數據規模增加出現成本激增的情況
LMDeploy部署是剛需，從過去二十多年的商業項目經驗來看，客戶對于部署這類非直接需求的費用比較敏感
OpenCompass評測是剛需，實際商業項目不需要全方位評測，更多的可能是針對商業項目的需求編寫評測集，保障微調達到預期效果
Lagent和AgentLego是剛需，實際商業項目中需要針對存量數據進行定制開發

在這里插入圖片描述

4. 論文筆記:InternLM2 Technical Report

論文地址

https://arxiv.org/pdf/2403.17297.pdf

官方翻譯

https://mp.weixin.qq.com/s/IUUj_CWUJPdrhLq1XAR-KA

中文翻譯參考

https://hub.baai.ac.cn/view/36639

簡介

軟硬件基礎設施 Infrastructure

預訓練方法 Pre-train

對齊 Alignment

評價與分析 Evaluation and analysis

數據收集與整理

典型網頁內容獲取工具：https://trafilatura.readthedocs.io/en/latest/

在這里插入圖片描述

網上的c++ 代碼確實太多了，所以你應該多利用AI幫忙寫c++代碼
在這里插入圖片描述

其他學習內容

RAG綜述

https://arxiv.org/pdf/2402.19473.pdf

Retrieval-Augmented Generation for AI-Generated Content A Survey

在這里插入圖片描述

LLM 帶給世界的改變！

以下觀點來源于《動手學自然語言處理》書籍首發直播

通過NLP 任務統一了大部分AI 任務
定義問題，解決問題的周期加快
未來能與AI 協作的能力是最重要的能力！

參考文獻

課程資源

學員手冊

https://aicarrier.feishu.cn/wiki/KamPwGy0SiArQbklScZcSpVNnTb

算力平臺

https://studio.intern-ai.org.cn/

課程文檔

https://github.com/InternLM/Tutorial/tree/camp2

課程視頻

https://www.bilibili.com/video/BV1Vx421X72D/

代碼倉庫

https://github.com/InternLM/Tutorial/tree/camp2

論文

其他參考

胡老師博客：

第一課
https://blog.csdn.net/hu_zhenghui/article/details/138811450

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/14936.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/14936.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/14936.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！