突發!馬斯克3140億參數Grok開源!Grok原理大公開!

BIG NEWS: 全球最大開源大模型!馬斯克Grok-1參數量3410億,正式開源!!!

說到做到,馬斯克xAI的Grok,果然如期開源了!

就在剛剛,馬斯克的AI創企xAI正式發布了此前備受期待大模型Grok-1,其參數量達到了3140億,遠超OpenAI GPT-3.5的1750億。

PS:如果你要升級為GPT-4的話,可以參考這篇教程:[ChatGPT Plus升級]進行訂閱升級也很簡單方便。

這是迄今參數量最大的開源大語言模型,遵照Apache 2.0協議開放模型權重和架構。

Grok-1

目前,xAI關于Grok-1沒有透露更多信息。

官網放出的信息如下——

  • 基礎模型在大量文本數據上訓練,未針對任何特定任務進行微調。
  • 314B參數的MoE,有25%的權重在給定token上處于激活狀態。
  • 2023年10月,xAI使用JAX和Rust之上的自定義訓練堆棧從頭開始訓練。
  • 截至到目前為止,,Grok在Github上就狂攬了6k星,620個Fork。

3140億的參數,讓Grok-1成為迄今參數量最大的開源LLM,是Llama 2的4倍。

全球首個最大模型開源

這次xAI開源Grok-1,遵守的是Apache-2.0許可證,因此,用戶可以自由使用、修改和分發軟件。

存儲庫包含了用于加載和運行Grok-1開源權重模型的JAX示例代碼。

由于模型較大,參數達到了314B參數,因此需要具有足夠GPU內存的計算機,才能使用示例代碼測試模型。

一般人估計是很難在個人PC上運行起來。

斯坦福研究者Andrew Kean Gao瀏覽了model.py介紹了更多Grok的架構信息,3140億參數沒有更多附加條款。

8個混合專家(2個活躍專家),860B活躍參數。它使用旋轉嵌入,而不是固定位置嵌入。

  • tokenizer詞匯量:131,072(于GPT-4類似)相當于2^17

  • 嵌入大小:6144(48*128)

  • Transformer層:64(每一層都有一個解碼層:多頭注意塊和密度塊)

  • 鍵值大小:128

最后大家可以直接看Andrew Kean Gao針對Grok-1的總結版圖。

開源爭霸

AI社區已經沸騰了!

連OpenAI的員工,都表示了自己對Grok的強烈興趣。

PS:LFG:LFG 的意思是“Let’s Fxxking Go”,大致意思是“沖沖沖”,經常用來形容社區對某個事件非常興奮。

英偉達高級科學家Jim Fan表示,「有史以來最大的開源大模型,由世界級團隊訓練,通過磁力鏈Apache 2.0發布。

xAI表示,Grok的設計靈感來源于《銀河系漫游指南》,它能夠回答幾乎所有問題,助力人類不分背景或政治立場地追求理解和知識。

Grok最初的版本Grok-0擁有330億參數,緊接著xAI推出了經過數次改進的Grok-1,為X上的Grok聊天機器人提供支持。

根據xAI公布的數據,在GSM8K、HumanEval和MMLU等一系列基準測試中,Grok-1的表現超過了Llama-2-70B和GPT-3.5,雖然跟GPT-4還差得遠。

但此次xAI并沒有放出Grok-1的具體測試成績,其與OpenAI即將發布的GPT-5的大模型王者之戰,必將成為業內關注的焦點。

總結

科技巨頭之間AI之間的大規模競爭,爭相發布各種最厲害最前沿的大語言模型,然后最終受益的卻還是我們普通個人。就想前幾年的手機競爭,廠商們都在制作各種旗艦機型,所以后面就有了越來越大的手機,屏幕越來越高清,攝像頭的像素越來越大,手機攝像頭也越來越多。

除了了解這些最前沿的科技之外,我們還可以思考如何更好地將這些技術應用在我們日常的工作和生活之中。

如何學習AI大模型?

我在一線互聯網企業工作十余年里,指導過不少同行后輩。幫助很多人得到了學習和成長。

我意識到有很多經驗和知識值得分享給大家,也可以通過我們的能力和經驗解答大家在人工智能學習中的很多困惑,所以在工作繁忙的情況下還是堅持各種整理和分享。但苦于知識傳播途徑有限,很多互聯網行業朋友無法獲得正確的資料得到學習提升,故此將并將重要的AI大模型資料包括AI大模型入門學習思維導圖、精品AI大模型學習書籍手冊、視頻教程、實戰學習等錄播視頻免費分享出來。

在這里插入圖片描述

第一階段: 從大模型系統設計入手,講解大模型的主要方法;

第二階段: 在通過大模型提示詞工程從Prompts角度入手更好發揮模型的作用;

第三階段: 大模型平臺應用開發借助阿里云PAI平臺構建電商領域虛擬試衣系統;

第四階段: 大模型知識庫應用開發以LangChain框架為例,構建物流行業咨詢智能問答系統;

第五階段: 大模型微調開發借助以大健康、新零售、新媒體領域構建適合當前領域大模型;

第六階段: 以SD多模態大模型為主,搭建了文生圖小程序案例;

第七階段: 以大模型平臺應用與開發為主,通過星火大模型,文心大模型等成熟大模型構建大模型行業應用。

在這里插入圖片描述

👉學會后的收獲:👈
? 基于大模型全棧工程實現(前端、后端、產品經理、設計、數據分析等),通過這門課可獲得不同能力;

? 能夠利用大模型解決相關實際項目需求: 大數據時代,越來越多的企業和機構需要處理海量數據,利用大模型技術可以更好地處理這些數據,提高數據分析和決策的準確性。因此,掌握大模型應用開發技能,可以讓程序員更好地應對實際項目需求;

? 基于大模型和企業數據AI應用開發,實現大模型理論、掌握GPU算力、硬件、LangChain開發框架和項目實戰技能, 學會Fine-tuning垂直訓練大模型(數據準備、數據蒸餾、大模型部署)一站式掌握;

? 能夠完成時下熱門大模型垂直領域模型訓練能力,提高程序員的編碼能力: 大模型應用開發需要掌握機器學習算法、深度學習框架等技術,這些技術的掌握可以提高程序員的編碼能力和分析能力,讓程序員更加熟練地編寫高質量的代碼。

在這里插入圖片描述

1.AI大模型學習路線圖
2.100套AI大模型商業化落地方案
3.100集大模型視頻教程
4.200本大模型PDF書籍
5.LLM面試題合集
6.AI產品經理資源合集

👉獲取方式:
😝有需要的小伙伴,可以保存圖片到wx掃描二v碼免費領取【保證100%免費】🆓

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/42352.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/42352.shtml
英文地址,請注明出處:http://en.pswp.cn/web/42352.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

硅紀元視角 | 虛擬神經科學的突破:AI「賽博老鼠」誕生

在數字化浪潮的推動下,人工智能(AI)正成為塑造未來的關鍵力量。硅紀元視角欄目緊跟AI科技的最新發展,捕捉行業動態;提供深入的新聞解讀,助您洞悉技術背后的邏輯;匯聚行業專家的見解,…

企業需要什么樣的MES?

MES(英文全稱:Manufacturing Execution System),即制造執行系統,是面向車間生產的管理系統。它位于上層計劃管理系統(如ERP)與底層工業控制(如PCS層)之間,是制…

【Linux】:服務器用戶的登陸、刪除、密碼修改

用Xshell登錄云服務器。 1.登錄云服務器 先打開Xshell。彈出的界面點。 在終端上輸入命令ssh usernameip_address,其中username為要登錄的用戶名,ip_address為Linux系統的IP地址或主機名。 然后輸入密碼進行登錄。 具體如下: 找到新建會話…

Windows與time.windows.com同步time出錯(手把手操作)

今天我來針對Windows講解Time同步 時間問題 計算機的時間不同,過快或者過慢。(可以和自己的手機時間進行對比,手機的時間進行同步的頻率會比計算機更快,因此更精準)計算機time過快和過慢,會導致使用過程中…

想實現隨時隨地遠程訪問?解析可道云teamOS內網穿透功能

在數字化時代,無論是個人還是企業,都面臨著數據共享與遠程訪問的迫切需求。 比如我有時會需要在家中加班,急需訪問公司內網中的某個關鍵文件。 然而,由于公網與內網的天然隔閡,這些需求往往難以實現。這時&#xff0c…

代碼隨想錄 鏈表章節總結

移除鏈表元素 && 設計鏈表 學會設置虛擬頭結點 翻轉鏈表 leetcode 206 https://leetcode.cn/problems/reverse-linked-list/description/ 方法一:非遞歸新開鏈表 頭插法:創建一個新的鏈表,遍歷舊鏈表,按順序在新鏈表使…

AIGC | 在機器學習工作站安裝NVIDIA CUDA? 并行計算平臺和編程模型

[ 知識是人生的燈塔,只有不斷學習,才能照亮前行的道路 ] 0x02.初識與安裝 CUDA 并行計算平臺和編程模型 什么是 CUDA? CUDA(Compute Unified Device Architecture)是英偉達(NVIDIA)推出的并行計算平臺和編…

idea提交代碼或更新代碼一直提示token然后登陸失敗無法提交或者更新代碼

最近因為換了電腦需要對開發環境做配置, 遇到了這個問題, 應該是因為我們用到了gitlab,默認的最新的idea會有gitlab插件 強制錄入gitlab的token,如果gitlab不支持token的驗證那么問題就來了 , 不管怎么操作都無法提交或…

FPGA之術語

FPGA之術語 IOSTANDARDDIFF_SSTL12:LVCMOS33:sys_clk_p/n:rst_n:UART時鐘JTAG:GPIOONFIPCIe IOSTANDARD 在電子工程領域,DIFF_SSTL12和LVCMOS33是兩種不同的電氣標準,用于定義信號的電壓級別和特性。 IOSTANDARD是一個在FPGA(現場可編程門陣…

Spring MVC深入理解之源碼實現

1、SpringMVC的理解 1)談談對Spring MVC的了解 MVC 是模型(Model)、視圖(View)、控制器(Controller)的簡寫,其核心思想是通過將業務邏輯、數據、顯示分離來組織代碼。 Model:數據模型,JavaBean的類,用來進行數據封裝…

【cocos2dx】【iOS工程】如何保存用戶在游戲內的繪畫數據,并將數據以圖像形式展示在預覽界面

【cocos2dx】【iOS工程】如何保存用戶在應用內的操作數據,并將數據以圖像形式展示在預覽界面 設備/引擎:Mac(11.6)/Mac Mini 開發工具:Xcode(15.0.1) 開發需求:如何保存用戶在應用…

富格林:抓住正規穩健出金思路

富格林指出,凡事要學會抓住正規思路避繁就簡,才會順利達到終點。在現貨黃金市場中,投資者必須學會抓對正規趨勢,才是走向盈利出金的根本保障。以下是富格林投資總結的幾個觀點和建議,希望能幫助投資者實現穩健出金。 …

算法基礎之分治法

算法原理 對于一個規模為 n n n 的子問題,若該問題可以容易地解決則直接解決,否則將其分解為 k k k 個規模較小的子問題,這些子問題相互獨立且與原問題形式相同。遞歸地解決這些子問題,然后將各子問題的解合并得到原問題的解&a…

單鏈表詳解(2)

三、函數定義 查找節點 //查找結點 SLTNode* SLTNodeFind(SLTNode* phead, SLTDataType x) {assert(phead);SLTNode* pcur phead;while (pcur){if (pcur->data x){return pcur;}pcur pcur->next;}return NULL; } 查找節點我們是通過看數據域來查找的,查…

Arm64 基礎指令集介紹

按照字母排序順序: ● ADC:帶進位加法。 ● ADCS:帶進位加法,設置標志位。 ● ADD (extended register):擴展寄存器加法。 ● ADD (immediate):立即數加法。 ● ADD (shifted register):移位寄存…

【MySQL05】【 undo 日志】

文章目錄 一、前言二、undo 日志(回滾日志)1. 事務 id2. undo 日志格式2.1 INSERT 對應的 undo 日志2.2 DELETE 對應的 undo 日志2.3 UPDATE 對應的 undo 日志2.3.1 不更新主鍵2.3.2 更新主鍵 2.3 增刪改操作對二級索引的影響2.4 roll_pointer 3. FIL_PA…

Windows 網絡重置

netsh int ip reset 命令是用于重置 Windows 操作系統中的網絡設置和配置的命令。 在網絡故障排除、修復網絡連接問題以及清除可能存在的網絡配置沖突時非常有用。 命令詳解: netsh: 用于配置各種網絡設置 int: 用于管理網絡接口 ip: 用于管理網絡接口的 IP 配…

layui項目中的layui.define、layui.config以及layui.use的使用

第一步:創建一個layuiTest項目,結構如下 第二步:新建一個test.js,利用layui.define定義一個模塊test,并向外暴露該模塊,該模塊里面有兩個方法method1和method2. 第三步:新建一個test.html,在該頁面引入layui.js&#x…

基于FPGA的LDPC編譯碼算法設計基礎知識

基于FPGA的LDPC編譯碼算法設計基礎知識 數字電路(數電)知識模擬電路(模電)知識1. 放大器1.1. 晶體管放大器1.2. 運算放大器1.3. 管子放大器(真空管放大器)微處理器/單片機知識其他相關知識 基于FPGA的算法設…

neo4j 圖數據庫:Cypher 查詢語言、醫學知識圖譜

neo4j 圖數據庫:Cypher 查詢語言、醫學知識圖譜 Cypher 查詢語言創建數據查詢數據查詢并返回所有節點查詢并返回所有帶有特定標簽的節點查詢特定屬性的節點及其所有關系和關系的另一端節點查詢從名為“小明”的節點到名為“小紅”的節點的路徑 更新數據更新一個節點…