解讀 | 阿里通義千問模型全尺寸開源 “誠意滿滿“背后的名與利



大家好,我是極智視界,歡迎關注我的公眾號,獲取我的更多前沿科技分享

邀您加入我的知識星球「極智視界」,星球內有超多好玩的項目實戰源碼和資源下載,鏈接:https://t.zsxq.com/0aiNxERDq

12 月 1 日阿里開源了 72B 和 18B 大模型以及音頻大模型 Qwen-Audio,再加上之前八月份、九月份開源的 7B 和 14B 大模型,號稱是 "全尺寸開源"。我也去 Github 上瞅了一眼,通義應該確實是 "兜庫底" 了,所有規格的模型都開源了。

對于這個事情,我的第一反應是:難得啊,對于阿里這種技術相對封閉的公司來說。但是仔細想想,目前對于大模型來說,開不開源真的很重要嗎?其實是需要打個問號的,除非你 OpenAI 的 GPT-4 開源,不然業界應該很難激起過多的浪花,因為大家都見多不怪了。現在對于大模型真正卡脖子地方是在 "算力" 和 "數據" 上,而不在 "算法" 上。以前是這三駕馬車都很重要,然后算法可能會更加重要一些。但是現在大模型時代則不太一樣,特別是在美國芯片禁令的情況下,主要矛盾已經明顯傾向于對于算力的需求上。現在國內很多大模型從算法實現角度,都可以用 "套殼" LLaMA 來達到 "自研大模型" 商業化的目的,這個時候你通義開不開源其實并不太重要。而說到 "套殼",就又是另外一個有意思的話題了,這里不過多展開。

現在主要矛盾點在于我要有足夠的算力、足夠高質量的數據來進行微調甚至是從頭訓練。對于很多大模型廠商來說,區別只是在我選 LLaMA 來微調還是選通義大模型來微調,而相信大多還是會選 LLaMA。這其實可以類比到手機領域,安卓大家都可以用,很多時候有安卓就夠了,你鴻蒙開源對于小米、對于 vivo 的操作系統研發意義大嗎,我小米會把自己手機操作系統切到基于鴻蒙的嗎 (可能確實有參考意義,比如對于小米澎湃 OS 的研發,但是對于大多數廠商來說還是用安卓就夠夠的了),大家更加在意的是能夠擁有性能更加好的芯片、算力更加好的處理器,比如前段時間經常上熱搜的全大核天璣 9300,這才是核心競爭力。

雖然 (是反轉沒錯了),在大家有 LLaMA 可選的情況下,通義的開源意義確實不大。但是開源總能贏得好名聲,這點毋庸置疑,何況通義開源了自己全規格的模型,其開源的 70B 大模型也是目前開源大模型中最大規模的,可以說 "誠意滿滿",對于博一個好名聲應該是不難的,這是 ""。

然后咱們來說說 "",通義大模型是開源了,大家要用、要微調得要有算力吧,算力哪里來,答案就是阿里云,你品,你細品。來,繼續分析,阿里還有個號稱國產 HaggingFace 的魔塔 ModelScope,要用開源的通義你就得上魔塔,而魔塔部署在哪里呢,魔塔的算力來源于哪里呢,答案依舊是阿里云,你品,你細品。阿里的這招太 "精明" 了,真的是既想要名也想要利啊

從這個角度來說,其實在 12 月 1 日阿里宣布全量開源通義前問大模型的時候,阿里已經徹底換賽道了,已經是不想跟大家玩大模型了,已經不再是 "百模大戰" 中的一員了。未來,"百模大戰" 肯定會繼續,而阿里更加聰明,燒錢去做大模型,效果嘛打不過 GPT-4,落地商業化嘛又難,競爭對手又像瘋了一樣的涌進來,換個賽道,躺著掙錢它不香嘛。這大概率也是在學英偉達、特別是在學 AWS。提供付費算力,這才是大模型時代正確的掙錢的方式啊,這些才是大模型時代掙麻了的企業啊。繼續給阿里支招,繼續開源數據集,讓大家在阿里云上訓練(燒錢)徹底沒有技術上的障礙,而變成一個愿不愿意花錢的問題。

阿里云,是懂計算的。計算無法計算的價值,數錢數到手抽筋


【極智視界】

《解讀 | 阿里通義千問模型全尺寸開源 "誠意滿滿"背后的名與利》

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/209928.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/209928.shtml
英文地址,請注明出處:http://en.pswp.cn/news/209928.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于Web和深度學習的辣椒檢測產量預測系統

1.研究背景與意義 項目參考AAAI Association for the Advancement of Artificial Intelligence 研究背景與意義 辣椒是一種重要的經濟作物,被廣泛種植和消費。然而,辣椒的產量預測一直是農業生產中的重要問題。準確地預測辣椒的產量可以幫助農民合理安…

第10節:Vue3 論點

如何在UniApp中使用Vue3框架創建論點&#xff1a; <template> <view> <text>{{ segments[currentSegment].content }}</text> </view> </template> <script> import { ref, computed } from vue; export default { setup…

高項備考葵花寶典-項目進度管理輸入、輸出、工具和技術(下,很詳細考試必過)

項目進度管理的目標是使項目按時完成。有效的進度管理是項目管理成功的關鍵之一&#xff0c;進度問題在項目生命周期內引起的沖突最多。 小型項目中&#xff0c;定義活動、排列活動順序、估算活動持續時間及制定進度模型形成進度計劃等過程的聯系非常密切&#xff0c;可以視為一…

【論文筆記】FSD V2: Improving Fully Sparse 3D Object Detection with Virtual Voxels

原文鏈接&#xff1a;https://arxiv.org/abs/2308.03755 1. 引言 完全稀疏檢測器在基于激光雷達的3D目標檢測中有較高的效率和有效性&#xff0c;特別是對于長距離場景而言。 但是&#xff0c;由于點云的稀疏性&#xff0c;完全稀疏檢測器面臨的一大困難是中心特征丟失&…

vFW搭建IRF

正文共&#xff1a;2328字 40圖&#xff0c;預估閱讀時間&#xff1a;5 分鐘 IRF&#xff08;Intelligent Resilient Framework&#xff0c;智能彈性架構&#xff09;技術通過將多臺設備連接在一起&#xff0c;虛擬化成一臺設備&#xff0c;集成多臺設備的硬件資源和軟件處理能…

C++如何通過調用ffmpeg接口對H265文件進行編碼和解碼

要對H265文件進行編碼和解碼&#xff0c;需要使用FFmpeg庫提供的相關API。以下是一個簡單的C程序&#xff0c;演示如何使用FFmpeg進行H265文件的編碼和解碼&#xff1a; 編碼&#xff1a; #include <cstdlib> #include <cstdio> #include <cstring> #inclu…

兩個月軟考-高項上岸

文章目錄 前言結緣軟考功虧一簣有始有終2個月計劃資料部分計劃截圖 總結 前言 我們看小說或者電視劇電影都會看到這樣的情節&#xff0c;主角一開始錦衣玉食&#xff0c;突然家道中落&#xff0c;啥都沒了&#xff0c;主角再一路奮起重新找回了屬于自己的一切&#xff1b;還有…

Vue項目中實現瀏覽器標簽頁名字的動態修改

修改router/index.js文件 路由條目下面添加meta屬性 meta:{title:DevOps運維平臺 }示例 使用Vue的全局守衛函數beforeEach&#xff0c;在路由切換前動態修改瀏覽器標簽頁名字 router.beforeEach((to,from,next) > {document.title to.meta.titlenext() })

Error: Cannot find module ‘E:\Workspace_zwf\mall\build\webpack.dev.conf.js‘

執行&#xff1a;npm run dev E:\Workspace_zwf\zengwenfeng-master>npm run dev> mall-app-web1.0.0 dev E:\Workspace_zwf\zengwenfeng-master > webpack-dev-server --inline --progress --config build/webpack.dev.conf.jsinternal/modules/cjs/loader.js:983thr…

[筆記]ARMv7/ARMv8 交叉編譯器下載

開發 Cortex-A7、Cortex-A72 或其他 ARM 架構 profile 芯片時&#xff0c;經常需要下載對應架構的交叉編譯器&#xff0c;所以寫這篇筆記&#xff0c;用于記錄一下交叉編譯器下載流程&#xff0c;免得搞忘。 編譯環境&#xff1a;ubuntu 虛擬機 下載地址 我們可以從 ARM 官網…

09 視頻分片上傳Minio和播放

文章目錄 一、流程設計1. 分片上傳實現思路2. 文件分片上傳流程3. 視頻播放流程 二、代碼實現1. 后端代碼2. 文件上傳前端代碼3. 視頻播放前端代碼 一、流程設計 1. 分片上傳實現思路 2. 文件分片上傳流程 3. 視頻播放流程 二、代碼實現 1. 后端代碼 pom.xml <dependenc…

多線程案例-單例模式

單例模式 設計模式的概念 設計模式好比象棋中的"棋譜".紅方當頭炮,黑方馬來跳.針對紅方的一些走法,黑方應招的時候有一些固定的套路.按照套路來走局勢就不會吃虧. 軟件開發中也有很多常見的"問題場景".針對這些問題的場景,大佬們總結出了一些固定的套路.按…

vue實現可拖拽列表

直接上代碼 <!-- vue實現可拖拽列表 --> <template><div><button click"logcolig">打印數據</button><TransitionGroup name"list" tag"div" class"container"><divclass"item"v-f…

常見請求頭與響應頭你了解哪些?

常見的 HTTP 請求頭和響應頭包括&#xff1a; 常見的請求頭&#xff1a; User-Agent&#xff1a;標識客戶端代理信息&#xff0c;通常用于識別用戶使用的瀏覽器或設備類型。 Accept&#xff1a;指示客戶端可以接受的內容類型&#xff0c;例如 text/html, application/json 等…

深度學習記錄--激活函數

激活函數的種類 對于激活函數的選擇&#xff0c;通常有以下幾種 sigmoid&#xff0c;tanh&#xff0c;ReLU&#xff0c;leaky ReLU 激活函數的選擇 之前logistic回歸一直使用的激活函數都是sigmoid函數&#xff0c;但一般來說&#xff0c;tanh函數是比sigmoid函數更加好的選…

【Python】 生成二維碼

創建了一個使用 python 創建二維碼的程序。 下面是生成的程序的圖像。 功能描述 輸入網址&#xff08;URL&#xff09;。 輸入二維碼的名稱。 當單擊 QR 碼生成按鈕時&#xff0c;將使用 QRname 中輸入的字符將 QR 碼生成為圖像。 程序代碼 import qrcode import tkinterd…

java泛型:泛型類,泛型方法

今日記錄我的泛型使用&#xff0c;供后期查閱。 主要包含泛型類&#xff0c;泛型屬性&#xff0c;泛型方法&#xff0c;靜態方法中使用泛型。 public class GenericOperationResultRep<T> {private boolean success; // 是否操作成功。true&#xff0c;成功&#xff1b;f…

Oracle的錯誤信息幫助:Error Help

今天看手冊時&#xff0c;發現上面有個提示&#xff1a; Error messages are now available in Error Help. 點擊 View Error Help&#xff0c;顯示如下&#xff0c;其實就是oerr命令的圖形化版本&#xff1a; 點擊Database Error Message Index&#xff0c;以下界面等同于命令…

[Kadane算法,前綴和思想]元素和最大的子矩陣

元素和最大的子矩陣 題目描述 輸入一個n級方陣&#xff0c;請找到此矩陣的一個子矩陣&#xff0c;此子矩陣的各個元素的和是所有子矩陣中最大的&#xff0c;輸出這個子矩陣及這個最大的和。 關于輸入 首先輸入方陣的級數n&#xff0c; 然后輸入方陣中各個元素。 關于輸出 …

車載藍牙音樂流程簡單分析

關鍵類&#xff1a; /packages/apps/Bluetooth/src/com/android/bluetooth/avrcpcontroller/AvrcpControllerStateMachine.java /packages/apps/Bluetooth/src/com/android/bluetooth/avrcpcontroller/AvrcpControllerService.java 一、音樂播放狀態 CPP中通過JNI接口將接從…