Grok 4作戰圖刷爆全網,80%華人橫掃硅谷!清華上交校友領銜,95后站C位

來源 | 新智元

短短兩年,馬斯克Grok 4的橫空出世,讓xAI團隊一舉站上AI之巔。

圖片

昨日一小時發布會,Grok 4讓所有人大開眼界,直接刷爆了AIME 2025、人類最后的考試(HLE)兩大基準。

這是狂堆20萬GPU才換來的驚人成果,更具體講,Grok 4算力飆漲了100倍。

圖片

xAI團隊成員自豪地表示,「Scaling強化學習才是正確的路」!

圖片

而如今,硅谷大佬的目光不再只是AI模型的發布,其背后的頂尖團隊才是關注的C位。

尤其是,在當前瘋狂搶人大戰之際,小扎又在瞄準下一波候選人了。

圖片

也就是同一時間,xAI員工Daniel曬出了Grok 4團隊作戰圖迅速刷屏。

一眼望去,80%的面孔幾乎都是華人學者。

圖片

圖片

斯坦福博士畢業,現xAI研究員Xuechen Li感慨道,一小群頂尖人才在極致專注下的爆發力,竟能在極短時間內取得如此巨大的成就」!

圖片

圖片

Grok 4發布會之后的狂歡

接下來,一起盤點Grok 4身后的頂配華人天團都有誰?

圖片

Grok 4背后天團,華人占比驚人

先來看,能夠坐鎮發布會,緊挨馬斯克的兩位華人學者。

他們也算是xAI對外公開的老熟人了,上次Grok 3直播同樣坐在了老馬的身旁。

圖片

Grok 4發布會上,圖片最右邊是Jimmy Ba,多倫多大學計算機科學助理教授,AI大佬Hinton的學生,創始團隊一員。

圖片

另一位是xAI聯創吳懷宇(Tony Wu),多倫多大學博士,妥妥的95后,也曾是AlphaGeometry、AlphaStar核心開發者。

圖片

其他華人學者還包括:

Greg Yang(楊格)

楊格是xAI創始成員之一。

他本碩就讀于哈佛大學數學系,導師是數學家丘成桐,并于2018年榮獲摩根獎(Morgan Prize)榮譽獎。

在加入xAI之前,他曾是微軟的高級研究員,負責AI理論研究。

圖片

Zihang?Dai(戴子航)

戴子航本科畢業于清華大學計算機科學系,師從著名計算機視覺專家朱松純開展研究。

此外,他還獲得了CMU碩士和博士學位。

他曾是前谷歌大腦研究員,在自然語言處理(NLP)領域擁有深厚的積累,尤其擅長Transformer架構的優化與創新。

圖片

Guodong Zhang(張國棟)

張國棟于2017年獲得了浙江大學學士學位,并于2022年獲得了多倫多大學博士學位。

博士畢業后,他曾加入谷歌DeepMind任研究科學家。

圖片

Shengyang Sun

Shengyang Sun在xAI領導AI專家團隊。

他于2022年獲得了多倫多大學計算機博士學位,于2017年獲得了清華學士學位。

入職xAI之前,他曾在英偉達就職1年多,任高級研究科學家;在亞馬遜擔任過應用機器學習科學家。

圖片

Bill Yuchen Lin(林禹臣)

林禹臣現任xAI研究員兼華盛頓大學(UW)客座助理教授,專注于LLM對齊、AI智能體訓練、推理及多模態大模型。

他于2022年獲得了南加州大學博士學位。他還曾拿下了上海交通大學IEEE榮譽班的學士學位,在校期間獲校級優秀畢業論文獎。

圖片

Xuechen Li

Xuechen Li分別獲得了斯坦福大學計算機科學系的碩士和博士學位,在此之前,還曾拿到多倫多大學學士學位。

公開資料顯示,他還曾就讀于北京四中。

在加入xAI之前,他曾在谷歌任學生研究員,并在微軟實習了四個月。

圖片

Tianle(Tim)Li

Tianle(Tim)Li在xAI專注于Grok模型的后訓練工作。

在此之前,他曾獲得了UC伯克利EECS學士學位,并參與了著名的LMArena競技平臺的研發。

圖片

Haotian Liu

Haotian Liu是Grok-1.5V、Grok-2、Grok-3的核心開發者。

他于2024年獲得了威斯康星大學麥迪遜分校獲得博士學位,師從Yong Jae Lee教授。

在此之前,他還曾獲得了浙江大學獲得學士學位,并拿到了優秀畢業生的稱號。

圖片

Lianmin Zheng

Lianmin Zheng曾獲得了UC伯克利完成了博士學位,導師是Ion Stoica和Joseph E. Gonzalez教授。他本科就讀于上海交通大學ACM班。

值得一提的是,他曾和團隊共同創立了非營利組織LMSYS.org,致力于推進開源大語言模型研究。

圖片

Jiacheng Hong

Jiacheng Hong于2012年獲得了CMU碩士學位,本科曾就讀于上海交通大學。

入職xAI之前,他曾在Pinterest任職12年,擔任工程主管。

圖片

Qian Huang

Qian Huang本科就讀于康奈爾大學數學和計算機科學系,目前仍是斯坦福大學博士生(2027年畢業),同時也是xAI技術員之一。

圖片

Yiwen Yuan

Yiwen Yuan曾獲得了CMU計算機科學計算機系學士和碩士學位。

目前,她在xAI是一名技術員,曾在一家Kumo.AI初創任技術主管。

圖片

Su Yan

Su Yan本科畢業于華北電力大學計算機系,并于2017年獲得了南加州大學計算機碩士學位。

他的個人職業經歷非常豐富,曾在Airbnb擔任高級軟件工程師、在TikTok任技術主管。

圖片

Yikang Shen

Yikang Shen曾獲得了北京航空航天大學計算機學士和碩士學位,還獲得了蒙特利爾大學計算機博士學位。

此前,他在IBM任研究科學家,專注于打造下一代更高效的大模型。

圖片

Wenhan Xiong

Wenhan Xiong曾獲得了中國科學技術大學學士學位和UCSB的博士學位。

畢業后,他便加入了Meta GenAI團隊任AI研究科學家,是 Llama2/3、CodeLlama的核心作者。

圖片

還有一位研究員Yifei Zhou甚至暫停了UC伯克利博士學位,也要加入xAI參與最先進模型

圖片

此外,xAI團隊中參與Grok 4華人成員還有,Yuchen He、Tianyi Zhang、Xinlei Chen、Jihui Yang等等。

圖片

剛剛,馬斯克點評:xAI辦公室氛圍很nice!

圖片

圖片

一夜登頂,xAI首次奪魁!

除了xAI官方發布的數據,獨立評測機構Artificial Analysis也在第一時間公布了對Grok 4模型的全方位基準測試結果。

最引人注目的是,Grok 4在「Artificial Analysis智能指數」中以73分的成績拔得頭籌,顯著超越了一眾頂級模型。

包括OpenAI o3(70分)、谷歌Gemini 2.5 Pro(70分)、Anthropic Claude 4 Opus(64分)和DeepSeek R1 0528(68分)。

圖片

細分能力表現如下:

  • 代碼與數學能力制霸:在「編碼指數」(LiveCodeBench & SciCode) 和「數學指數」(AIME24 & MATH-500) 兩大關鍵領域中均排名第一

圖片

圖片

  • 刷新高難度測試紀錄

    • 在GPQA Diamond測試中取得了88%的歷史最高分,大幅刷新了Gemini 2.5 Pro此前84%的紀錄

    • 在「人類最后的考試」中以24%的成績創下歷史新高,超越了Gemini 2.5 Pro的21%

  • 多項全能:在MMLU-Pro和AIME 2024兩項測試中,分別取得了87%和94%的最高分

圖片

  • 速度:每秒輸出75個token。慢于o3(188 token/s)和Gemini 2.5 Pro(142 token/s),但快于Claude 4 Opus(66 token/s)

  • 上下文窗口:256k token。低于Gemini 2.5 Pro的100萬token(1m),但優于Claude 4 Sonnet/Opus(200k) 和o3(200k)

  • 其他關鍵特性

    • 支持文本和圖像輸入(多模態能力)

    • 支持函數調用和結構化輸出

圖片

最后,在定價方面,Grok 4延續了Grok 3的策略,即每百萬輸入/輸出token分別為3美元/15美元。

這一價位與Claude 4 Sonnet持平,但高于Gemini 2.5 Pro(1.25美元/10美元)和近期降價后的o3(2美元/8美元)。

圖片

不過,根據知名大佬「karminski-牙醫」的實測,Grok 4的代碼基準結果,有過擬合的嫌疑。

不管是已經用到包漿的「七邊形小球彈跳」測試,還是剛做出來的「拆煙囪」測試,Grok 4的表現都不如舊版DeepSeek R1。

甚至,生成的代碼還得靠Claude debug之后,才能跑……

圖片

,時長00:54

圖片

,時長00:31

參考資料:

https://x.com/LiTianleli/status/1943445775981404598

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/914161.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/914161.shtml
英文地址,請注明出處:http://en.pswp.cn/news/914161.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI大模型(七)Langchain核心模塊與實戰(二)

Langchain核心模塊與實戰(二)Langchian向量數據庫檢索Langchian構建向量數據庫和檢索器批量搜索返回與之相似度最高的第一個檢索器和模型結合得到非籠統的答案LangChain構建代理通過代理去調用Langchain構建RAG的對話應用包含歷史記錄的對話生成Langchia…

Flutter基礎(前端教程①-容器和控件位置)

一個紅色背景的 Container垂直排列的 Column 布局中央的 ElevatedButton按鈕下方的白色文本import package:flutter/material.dart;void main() {runApp(const MyApp()); }class MyApp extends StatelessWidget {const MyApp({Key? key}) : super(key: key);overrideWidget bu…

CSS flex

目錄 flex-box和flex-item 主軸和副軸 ?編輯 flex-box的屬性 flex-direction flex-wrap flex-flow justify-content ?編輯?align-items align-content flex-item的屬性 flex-basis flex-grow flex-shrink flex flex-box和flex-item 當把一個塊級元素的displ…

【JMeter】執行系統命令

步驟如下: 添加JSP233 Sampler:右擊線程組>添加>取樣器>JSR223 Sampler2.填寫腳本,執行后查看日志。res "ipconfig".execute().text log.info(res)res "python -c \"print(11)\"".execute().text l…

AI Agent開發學習系列 - langchain之memory(1):內存中的短時記憶

內存中的短時記憶,在 LangChain 中通常指 ConversationBufferMemory 這類“對話緩沖記憶”工具。它的作用是:在內存中保存最近的對話歷史,讓大模型能理解上下文,實現連續對話。 對話緩沖記憶”工具 主要特點 只保留最近的對話內容…

uniapp實現微信小程序端圖片保存到相冊

效果圖展示 安裝插件海報畫板導入到項目里面&#xff0c;在頁面直接使用 <template><view><button click"saveToAlbum" class"save-button">保存到相冊</button><image :src"path" mode"widthFix" v-if&qu…

Java生產帶文字、帶邊框的二維碼

Java 生成帶文字、帶邊框的二維碼1、Java 生成帶文字的二維碼1.1、導入jar包1.2、普通單一的二維碼1.2.1、代碼示例1.2.2、效果1.3、帶文字的二維碼1.&#xff13;.&#xff11;、代碼示例1.3.2、效果2、帶邊框的二維碼2.1、代碼示例2.2、帶邊框的二維碼效果 1、Java 生成帶文字…

ARM單片機啟動流程(三)(棧空間綜合理解及相關實際應用)

文章目錄1、引出棧空間問題2、解決問題2.1、RAM空間2.2、RAM空間具體分布2.3、關于棧空間的使用2.4、棧溢出2.5、變量的消亡2.6、回到關鍵字static2.7、合法性的判斷1、引出棧空間問題 從static關鍵字引出該部分內容。 為什么能從static引出來&#xff1f; 在使用該關鍵字的…

【RK3568+PG2L50H開發板實驗例程】FPGA部分 | 鍵控LED實驗

本原創文章由深圳市小眼睛科技有限公司創作&#xff0c;版權歸本公司所有&#xff0c;如需轉載&#xff0c;需授權并注明出處&#xff08;www.meyesemi.com) 1.實驗簡介 實驗目的&#xff1a; 從創建工程到編寫代碼&#xff0c;完成引腳約束&#xff0c;最后生成 bit 流下載到…

【Python練習】039. 編寫一個函數,反轉一個單鏈表

039. 編寫一個函數,反轉一個單鏈表 039. 編寫一個函數,反轉一個單鏈表方法 1:迭代實現運行結果代碼解釋方法 2:遞歸實現運行結果代碼解釋選擇方法迭代法與遞歸法的區別039. 編寫一個函數,反轉一個單鏈表 在 Python 中,可以通過迭代或遞歸的方式反轉一個單鏈表。 方法 1…

BERT代碼簡單筆記

參考視頻&#xff1a;BERT代碼(源碼)從零解讀【Pytorch-手把手教你從零實現一個BERT源碼模型】_嗶哩嗶哩_bilibili 一、BertTokenizer BertTokenizer 是基于 WordPiece 算法的 BERT 分詞器&#xff0c;繼承自 PreTrainedTokenizer。 繼承的PretrainedTokenizer&#xff0c;具…

PID控制算法理論學習基礎——單級PID控制

這是一篇我在學習PID控制算法的過程中的學習記錄。在一開始學習PID的時候&#xff0c;我也看了市面上許多的資料&#xff0c;好的資料固然有&#xff0c;但是更多的是不知所云。&#xff08;有的是寫的太過深奧&#xff0c;有的則是照搬挪用&#xff0c;對原理則一問三不知&…

【Elasticsearch】function_score與rescore

它們倆都是用來“**干涉評分**”的&#xff0c;但**工作階段不同、性能開銷不同、能做的事也不同**。一句話總結&#xff1a;> **function_score** 在 **第一次算分** 時就動手腳&#xff1b; > **rescore** 在 **拿到 Top-N 結果后** 再“重新打分”。下面把“能干嘛”…

無廣告純凈體驗 WPS2016 精簡版:移除聯網模塊 + 非核心組件,古董電腦也能跑

各位辦公小能手們&#xff01;今天給你們介紹一款超神的辦公軟件——WPS2016精簡版&#xff01;它有多小呢&#xff1f;才33MB&#xff0c;簡直就是軟件界的小不點兒&#xff01;別看它個頭小&#xff0c;功能可一點兒都不含糊&#xff0c;文字、表格、演示這三大功能它全都有。…

《PyWin32:Python與Windows的橋梁,解鎖系統自動化新姿勢》

什么是 PyWin32在 Windows 平臺的 Python 開發領域中&#xff0c;PyWin32 是一個舉足輕重的庫&#xff0c;它為 Python 開發者打開了一扇直接通往 Windows 操作系統底層功能的大門。簡單來說&#xff0c;PyWin32 是用于 Python 訪問 Windows API&#xff08;Application Progra…

vite如何生成gzip,并在服務器上如何設置開啟

1. 安裝插件npm install vite-plugin-compression -D2. 在 vite.config.ts 中配置TypeScriptimport { defineConfig } from vite import compression from vite-plugin-compressionexport default defineConfig({plugins: [compression({algorithm: gzip,ext: .gz,threshold: 1…

1068萬預算!中國足協大模型項目招標,用AI技術驅動足球革命

中國足協啟動國際足聯“前進計劃”下的大數據模型項目&#xff0c;預算1068萬元。該項目將建立足球大數據分析平臺&#xff0c;利用AI技術為國家隊、青少年足球、業余球員及教練員裁判員提供精準數據分析服務&#xff0c;旨在通過科技手段提升中國足球競技水平。 中國足球迎來數…

AI產品經理面試寶典第12天:AI產品經理的思維與轉型路徑面試題與答法

多樣化思維:如何跳出單一框架解題? 面試官:AI產品常面臨復雜場景,請舉例說明你如何運用多樣化思維解決問題? 你的回答:我會從三個維度展開:多角度拆解需求本質,多層級融合思維模式,多變量尋找最優解。比如設計兒童教育機器人時,不僅考慮功能實現(技術層),還融入情…

vscode.window對象講解

一、vscode.window 核心架構圖 #mermaid-svg-fyCxPz1vVhkf96nE {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-fyCxPz1vVhkf96nE .error-icon{fill:#552222;}#mermaid-svg-fyCxPz1vVhkf96nE .error-text{fill:#5522…

為什么一個 @Transactional 注解就能開啟事務?揭秘 Spring AOP 的底層魔法

你是否也曾深陷在各種“額外”邏輯的泥潭&#xff0c;為了給一個核心業務方法增加日志、權限校驗或緩存&#xff0c;而不得不將這些非核心代碼硬塞進業務類中&#xff0c;導致代碼臃腫、職責不清&#xff1f;是時候用代理設計模式 (Proxy Design Pattern) 來解脫了&#xff01;…