中國開源 AI 大模型之光-InternLM2

中國開源 AI 大模型之光-InternLM2

diannao/2025/9/15 20:42:35/文章來源:https://blog.csdn.net/yangguangqizhi/article/details/138922244

????????今天給大家帶來 AI 大模型領域的國產之光 - InternLM2，在10B量級開源大模型領域取得了全球 Top 3 的成績，僅次于 Meta 發布的 Llama-3，在國內則是第一名的存在！

簡介

??? InternLM2是由上海人工智能實驗室和商湯科技聯合研發的一款大型語言模型（LLM），它在多個基準測試中展現出卓越的性能，尤其在長文本處理和開放式主觀評估方面。以下是InternLM2的幾個關鍵特點：

長文本處理能力：InternLM2特別設計了長上下文處理能力，能夠處理長達200k個令牌的文本，這使得它在處理長篇幅內容時表現出色。
開源和免費商用：InternLM2模型及其全鏈條開源工具體系面向公眾全面開源，并且可以免費商用，這促進了其在學術和工業界的廣泛應用。
多階段訓練：模型的訓練包括預訓練、監督微調（SFT）和基于人類反饋的強化學習（RLHF）。這些階段確保了模型在遵循指令和符合人類價值觀方面的性能。
技術創新：InternLM2采用了分組查詢注意力（GQA）技術來減少長序列推斷時的內存占用，并通過位置編碼外推技術進一步提升了模型的上下文長度處理能力。
性能提升：通過條件在線RLHF（COOL RLHF）技術，InternLM2能夠協調多樣但可能沖突的偏好，并通過多輪Proximal Policy Optimization（PPO）來減少獎勵作弊問題。
社區貢獻：InternLM2的貢獻不僅在于其高性能，還在于提供了全面的數據準備指南和創新的RLHF訓練技術，為社區提供了深入理解和進一步研究的基礎。
模型規模：InternLM2發布了不同規模的模型，包括18億、70億和200億參數的版本，以適應不同的研究和應用需求。

分類

按照模型大小分類

7B：為輕量級的研究和應用提供了一個輕便但性能不俗的模型

20B：模型的綜合性能更為強勁，可有效支持更加復雜的使用場景

按照模型命名分類

InternLM2-Base：高質量和具有很強可塑性的模型基座，是模型進行深度領域適配的高質量起點

InternLM2：在Base基礎上，在多個能力方向進行了強化，在評測中成績優異，同時保持了很好的通用語言能力，是我們推薦的在大部分應用中考慮選用的優秀基座

InternLM2-Chat：在Base基礎上，經過SFT和RLHF，面向對話交互進行了優化，具有很好的指令遵循，共情聊天和調用工具等能力

技術生態

訓練&評測數據

模型微調

模型評測

模型部署

AI 智能體

????接下來的文章將詳細講解如何用 internLM2 訓練我們自己的 chatGPT，感興趣的可以點贊收藏關注！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/12994.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/12994.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/12994.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

最大子序列的分數

最大子序列的分數

題目鏈接最大子序列的分數題目描述注意點 n nums1.length nums2.length從nums1和nums2中選一個長度為k的子序列對應的下標對nums1中下標對應元素求和，乘以nums2中下標對應元素的最小值得到子序列的分數0 < nums1[i], nums2[j] < 1000001 < k < …

閱讀更多...

Leecode熱題100---560：和為k的子數組個數

Leecode熱題100---560：和為k的子數組個數

題目： 給你一個整數數組 nums 和一個整數 k ，請你統計并返回該數組中和為 k 的子數組的個數。子數組是數組中元素的連續非空序列。 C： #include<iostream> #include<vector> using namespace std; class Solution { public:…

閱讀更多...

AI作畫算法詳解：原理、應用與未來發展

AI作畫算法詳解：原理、應用與未來發展

隨著人工智能技術的不斷發展，AI作畫逐漸成為了一個熱門話題。AI作畫，即利用人工智能算法生成繪畫作品，不僅僅是技術的展示，更是藝術與科技結合的創新體現。本文將深入探討AI作畫的核心算法原理，并通過實例幫助讀者更好…

閱讀更多...

多步預測系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合

多步預測系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合

● 環境框架：python 3.9 pytorch 1.8 及其以上版本均可運行 ● 使用對象：論文需求、畢業設計需求者 ● 代碼保證：代碼注釋詳細、即拿即可跑通。往期精彩內容： 時序預測：LSTM、ARIMA、Holt-Winters、SARIMA模型的分…

閱讀更多...

數據結構篇3—《龍門客“棧”》

數據結構篇3—《龍門客“棧”》

文章目錄 🚩前言1、棧的概念2、棧的實現框架3、棧的代碼實現3.1、棧的初始化和銷毀3.2、入棧\出棧\返回棧頂元素\元素個數\判空3.3、棧定義注意事項 4、棧的應用實例——《括號匹配問題》 🚩前言前面記錄了關于順序表和鏈表的數據結構，這一篇…

閱讀更多...

【CF1965A】Everything Nim

【CF1965A】Everything Nim

題目鏈接前置trick： 使用vector去重： vector<int> a(n);for(int i0;i<n;i) cin>>a[i];sort(a.begin(),a.end());a.erase(unique(a.begin(),a.end()),a.end());na.size();題意： 有 n n n堆石子，第 i i i堆有 a i a…

閱讀更多...

【企業宣傳片】拍攝思維提升，專業影視質感核心揭密，一課搞定

【企業宣傳片】拍攝思維提升，專業影視質感核心揭密，一課搞定

課程下載：【企業宣傳片】拍攝-課程網盤鏈接提取碼下載.txt資源-CSDN文庫更多資源下載：關注我。課程介紹大量案例分析宣傳片拍攝的痛點要點根據案例告訴你解決方案，講透概念改變你對企業宣傳片的思維層級與認知歸納總結對比不同案…

閱讀更多...

C++語法｜類直接包含與自身類型相同的成員變量？

C++語法｜類直接包含與自身類型相同的成員變量？

在C中，一個類不能直接包含與自身類型相同的成員變量。這是因為類的大小需要在編譯時確定，而一個包含自身類型的成員變量會導致遞歸定義，從而無法確定類的大小。文章目錄示例代碼（非法定義）解決辦法1.使用指針2.使用智…

閱讀更多...

k8s 二進制安裝優化架構之部署負載均衡，加入master02

k8s 二進制安裝優化架構之部署負載均衡，加入master02

目錄一實驗環境二部署 CoreDNS 1，所有node加載coredns.tar 鏡像 2，在 master01 節點部署 CoreDNS 3， DNS 解析測試 4， 報錯分析 5，重新 DNS 解析測試三 master02 節點部署 1&#xff0…

閱讀更多...

AI學習指南數學工具篇-PCA的應用場景

AI學習指南數學工具篇-PCA的應用場景

AI學習指南數學工具篇-PCA的應用場景在人工智能領域，數據處理是非常重要的一環。對于大量高維數據，我們往往需要進行數據降維來減少計算復雜度，同時利用可視化工具對數據進行分析和理解。主成分分析（Principal Component Analys…

閱讀更多...

C++ 利用標準庫多字節轉寬字節字符

C++ 利用標準庫多字節轉寬字節字符

在 C/C 之中，通常建議使用：mbstowcs （C語言函數庫）來實現多字節字符轉寬字節字符，這是因為如果使用。 std::wstring_convert<std::codecvt_utf8<wchar_t>> 模板來實現，它可能導致程序崩潰的風險…

閱讀更多...

【利用數組處理批量數據-譚浩強配套】（適合專升本、考研）

【利用數組處理批量數據-譚浩強配套】（適合專升本、考研）

無償分享學習資料，需要的小伙伴評論區或私信dd。。。無償分享學習資料，需要的小伙伴評論區或私信dd。。。無償分享學習資料，需要的小伙伴評論區或私信dd。。。完整資料如下：純干貨、純干貨、純干貨！！…

閱讀更多...

點云成圖原理

點云成圖原理

點成圖（Point Cloud）是指由一組離散的點構成的圖形，它們在空間中沒有任何連接關系。點成圖通常是由激光雷達、相機或其他傳感器獲取的三維數據，用于表示現實世界中的物體或場景。三角成圖（Triangulation）…

閱讀更多...

element ui Tree樹形控件

element ui Tree樹形控件

lazy 是否懶加載子節點，需與 load 方法結合使用 boolean 默認為falseload 加載子樹數據的方法，僅當 lazy 屬性為true 時生效 function(node, resolve)使用懶加載load不需要再使用data，利用resolve返回值即可注意：第一層的數據要寫…

閱讀更多...

PMR-440N7Q韓國施耐德三和相序繼電器EOCR-PMR

PMR-440N7Q韓國施耐德三和相序繼電器EOCR-PMR

韓國施耐德三和EOCR繼電器PMR-440N7Q PMR-440-N 直流電動機保護器:DCL、DOCR-S/H 欠電流繼電器:EUCR-3C 交流電壓繼電器:EOVR、EVR-PD、EVR-FD、EUVR 韓國三和EOCR電動機保護器:EOCR-SS、EOCR-SS1/SS2、EOCR-AR、EOCR-ST、EOCR-SP、EOCR-SP1/SP2、EOCR-SE、EOCR-SE2/SE PMR-44…

閱讀更多...

GIT基礎02 多機器協作等命令

GIT基礎02 多機器協作等命令

前言首先我們知道git給我們提供了分支管理的功能我們一般使用master分支作為線上環境,master分支一般是一個穩定的分支我們通常是會創建一個其他分支進行開發,這樣不會影響線上的機器運行如果沒有git提供這樣的分支功能,就無法做到這一套了指令學習假設軟件出現問題咋辦…

閱讀更多...

LBSS138LT1G 絲印J1 SOT-23 N溝道 50V/200mA 貼片MOSFET

LBSS138LT1G 絲印J1 SOT-23 N溝道 50V/200mA 貼片MOSFET

LBSS138LT1G的應用領域廣泛，主要因為它是一種N溝道金屬氧化物半導體場效應晶體管（MOSFET），具有低電荷、快速開關速度和高阻斷特性。以下是一些典型的應用領域： 1. 消費電子產品：LBSS138LT1G常用于電視、音響…

閱讀更多...

debian apt 更改阿里源

debian apt 更改阿里源

1. 備份文件 cp /etc/apt/sources.list /etc/apt/sources.list.bak 2. 更改 sources.list文件內容為： deb http://mirrors.aliyun.com/debian/ buster main non-free contrib deb-src http://mirrors.aliyun.com/debian/ buster main non-free contrib deb htt…

閱讀更多...

QT狀態機1-三態循環狀態機

QT狀態機1-三態循環狀態機

#include "MainWindow.h" #include "ui_MainWindow.h"MainWindow::MainWindow(QWidget *parent): QMainWindow(parent)

閱讀更多...

【C -＞ Cpp】由C邁向Cpp （6）：靜態、友元和內部類

【C -＞ Cpp】由C邁向Cpp （6）：靜態、友元和內部類

標題：【C -＞ Cpp】由C邁向Cpp （6）：靜態、友元和內部類水墨不寫bug （圖片來源于網絡） 目錄 （一）靜態成員 （二）友元 （三&#xff09…

閱讀更多...

最新文章