阿里巴巴通義實驗室周暢:讓大模型率先在PC上“跑起來”

12月7日,以“AI新生態 智啟新元年”為主題的首屆AI PC產業創新論壇在北京聯想集團總部舉辦。阿里巴巴-通義實驗室、通義千問大模型負責人周暢受邀出席分享關于端側大模型的技術進展,以及終端設備與AI結合的發展前景。

周暢表示,大模型技術的快速迭代已經讓其具備理解世界的基本能力,接下則需要想辦法讓大模型能力在各種環境和場景下被充分使用起來。“讓大模型在PC等終端設備上跑起來,正是普惠終端用戶的第一步,阿里巴巴-通義實驗室將與聯想集團攜手合作,在AI PC生態領域共同探索端云協同的解決方案,為個人和企業提供更加精準的AI服務。”

(阿里巴巴-通義實驗室,通義千問大模型負責人周暢)

“我們看《流浪地球2》《鋼鐵俠》這類科幻片的時候,可能人人都會幻想自己要有一個人工智能助手。自ChatGPT出現后,特別是今年,AI發展特別快,很多功能都開始從幻想慢慢變成現實。”他說,開發者社區現在也非常關注大模型在端側的具體表現。

而從端側落地出發,在周暢看來需要做好兩件事。第一,模型水平的提升。端側通用AI助手需要能夠理解用戶的語言語義、并具備圖像理解能力,同時也要能夠使用各種常用軟件的API,即可以使用各種各樣的工具來幫助用戶完成任何事情,這需要不斷提升模型的水平。第二,發揮這類助手的能力,既可以通過端云協同結合云側模型的強大功能,也可以通過在端側靈活便捷的部署,使得大模型能力在離線的狀態下也能使用。

他介紹說,從8月份到10月份,通義千問已陸續開放從18億到720億參數的語言模型,并達到千億參數模型全尺寸、全模態開源。阿里云希望通過開源不同尺寸的模型,助力業界大模型的生態發展,也希望通過全尺寸的開源來助力模型的落地。

經過壓縮和微調的AI模型適合在端側進行部署。“當前,端側的開發者群體比較關心的是主流7B或14B這類小尺寸模型的表現和云端大模型的差異。”周暢稱,端側助手關心的核心能力是工具使用,而通義千問小尺寸系列的語言模型,在推出時就非常重視這類能力的優化。

其數據顯示,18億參數的通義千問小模型在簡單工具的使用上,可以達到大模型85%的水平,70億和140億的模型在這方面的表現與720億大模型可以十分接近。毫無疑問,通義千問模型的實測為AI大模型的端側應用鋪平了道路,將加速AI能力的普及。

針對模型的任務分解和工具調用能力,周暢在論壇上分享了一系列演示案例,來說明通用大模型已經能夠勝任在離線的PC等終端上運行,并可對基礎數字、圖標、公式以及圖片等內容進行輕度處理。

識別數字、圖表等能力,對于AI PC的發展十分重要,周暢進一步強調。聯想前不久率先對外展示的全球首款AI PC及其高水準的能力,進一步印證了在AI普惠的道路上,AI PC將成為首選終端。

值得一提的是,在AI PC產業創新論壇上發布的業內首份《AI PC產業(中國)白皮書》,已經將AI PC產業生態范圍參與方擴大到了5個,包括用戶、終端廠商、AI技術(模型)廠商、應用廠商和算力(芯片)廠商。其中,AI技術(模型)廠商是新引入者。

面對即將開啟的AI PC元年,周暢認為,端云協同發展的解決方案在未來擁有巨大想象空間。人工智能已經在云端跑了許久,而未來應是云端大模型和端側大模型的雙向奔赴,AI PC的時代已經來臨。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/208379.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/208379.shtml
英文地址,請注明出處:http://en.pswp.cn/news/208379.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Python百寶箱】Python與移動應用開發:框架對比與交互全指南

一站式指南:如何用Python打造移動應用的完美體驗 前言 隨著移動應用市場的不斷擴大,開發者們尋求更便捷、靈活的方式來構建跨平臺的應用。本文將帶領讀者深入探討Python在移動應用開發中的應用,聚焦于幾個主要框架,并詳細介紹它…

Python django-xadmin:構建強大的 Django 后臺管理系統

概要 Django作為一款強大的Web框架,其后臺管理系統提供了便捷的數據管理和操作方式。而 django-xadmin 則為Django的后臺管理系統提供了更加強大的功能和靈活的定制選項。在本文中,我們將深入研究如何使用django-xadmin,并通過詳細的示例代碼…

企業博客SEO:優化SOP,助您提升搜索引擎可見性

企業博客是互聯網時代企業與用戶溝通的重要渠道之一,引流成本也比較低。然而,依然有企業會處在3種狀態: 1. 有博客,但內容更新不積極或擱置 2. 有博客,但內容散亂 3. 根本就沒有博客 如果是這幾種狀態,…

Java網絡編程-深入理解BIO、NIO

深入理解BIO與NIO BIO BIO 為 Blocked-IO(阻塞 IO),在 JDK1.4 之前建立網絡連接時,只能使用 BIO 使用 BIO 時,服務端會對客戶端的每個請求都建立一個線程進行處理,客戶端向服務端發送請求后,…

3接上篇 我的自定義GPTs的改進優化 與物理世界連接成功 GPTs的創建與使用定義和執行特定任務的功能模塊 通過API與外部系統或服務的交互

https://blog.csdn.net/chenhao0568/article/details/134875067?spm1001.2014.3001.5502 從服務器日志里看到請求多了一個“location” 23.102.140.123 - - [08/Dec/2023:14:02:20 0800] "GET /getWeather.php?location&locationNewYork HTTP/1.1" 200 337 &…

2024年甘肅省職業院校技能大賽信息安全管理與評估賽項一階段樣題一

2024年甘肅省職業院校技能大賽高職學生組電子與信息大類信息安全管理與評估賽項樣題一 競賽需要完成三個階段的任務,分別完成三個模塊,總分共計 1000分。三個模塊內容和分值分別是: 1.第一階段:模塊一 網絡平臺搭建與設備安全防…

【K8S】微服務不香了?單體化改造悄然興起!!

微服務一直以來是服務治理的基本盤之一,落地到云原生上,往往是每個 K8s pods 部署一個服務,獨立迭代、獨立運維。 但是在快速部署的時候,有時候,我們可能需要一些宏服務的優勢。有沒有一種方法,能夠 “既要又要” 呢?本文基于 tRPC-Go 服務,提出并最終實踐了一種經驗證…

從互聯網到云計算再到 AI 原生,百度智能云數據庫的演進

1 數據庫行業發展概述 如果說今年科技圈什么最火,我估計大家會毫不猶豫選擇 ChatGPT。ChatGPT 是 2022 年 11 月 30 日由 OpenAI 發布的聊天應用。它創造了有史以來用戶增長最快的紀錄:自 11 月 30 日發布起,5 天就擁有了 100 萬活躍用戶&am…

靜態HTTP和動態HTTP的混合使用:最佳實踐

在當今的互聯網環境中,靜態HTTP和動態HTTP各有其優勢和局限。靜態HTTP具有速度快、安全性高和易于維護的特點,而動態HTTP則能夠實現動態交互和處理大量動態數據。為了充分利用兩者的優勢,越來越多的網站開始采用靜態HTTP和動態HTTP混合使用的…

計算機的存儲規則

計算機存儲 計算機采用二進制來存儲數據和程序 原因主要有: (1) 物理上容易實現 (2) 運算規則非常簡單 (3) 可靠性強 (4) 易于實現邏輯運算和邏輯判斷 計算機中存儲器的分類及特點 根據存儲器在計算機系統中所起的作用 分為內存儲器和外存儲器 (1) 內存用來…

大數據畢業設計之前端02:架構布局和aside的設計

前言 上一篇主要講了我學習前端的一個經歷,以及為什么選擇BuildAdmin作為深入前端學習的原因.同事也大致聊了一下學習前端需要使用哪些技術棧。 本篇文章來拆解一下BuildAdmin的前端代碼結構,和布局實現的細節。 前端代碼結構 必須先了解項目的結構&…

leetcode每日一題37

92.反轉鏈表II 這道題需要1.找到位置left 2.在位置left開始,一前一后兩個指針反轉鏈表,代碼同206.反轉鏈表,直到后一個指針指向right 3.把反轉后的頭節點鏈接到left-1后面,把反轉后的鏈表尾節點指向right1位置的節點 因為可能會反…

數據結構——二叉樹的鏈式結構

個人主頁:日刷百題 系列專欄:〖C語言小游戲〗〖Linux〗〖數據結構〗 〖C語言〗 🌎歡迎各位→點贊👍收藏??留言📝 ? 一、二叉樹的創建 這里我們使用先序遍歷的思想來創建二叉樹,這里的內容對于剛接觸二…

iClient3D 加載天地圖服務

1 對國家天地圖,通過TiandituImageryProvider影像服務提供者加載地圖; var TiandituimageryLayernew Cesium.TiandituImageryProvider({ mapStyle: Cesium.TiandituMapsStyle[value],token: "4a00a1dc5387b8ed8adba3374bd87e5e"})viewer.imag…

nginx 的概念、高并發處理及詳細參數配置

NGINX是一個開源的高性能Web服務器,負載均衡器和反向代理服務器。它特別適用于高并發的Web應用,能夠有效地處理數千并發連接,同時具備低資源消耗和高性能的特點。在這里,我將重點介紹NGINX的高并發處理能力和參數配置。 高并發處…

云原生(Cloud Native)——概念,技術,背景,優缺點,實踐例子

云原生(Cloud Native)是一種構建和運行應用程序的方法,這些應用程序充分利用云計算的優勢。云原生應用程序通常設計為在現代、動態的環境中運行,如公共云、私有云和混合云。這種方法強調微服務架構、容器化、自動化、易于管理和可…

QT 信號與槽 connect 三種寫法

先看下示例: QPushButton *btn new QPushButton;// 方式一:老式寫法connect(btn, SIGNAL(clicked()), this, SLOT(close()));// 方式二:Qt5后新寫法connect(btn, &QPushButton::clicked, this, &MainWindow::close);// 方式三&#…

Word插件-好用的插件-一鍵設置字體--大珩助手

常用字體 整理了論文、公文常用字體 整理了常用的論文字體,可一鍵設置當前節或選擇的文字的字體 字體設置 包含字體選擇、字體顏色 特殊格式 包含首字下沉、段落分欄、統一寬度、雙行合一、上標切換、下標切換、轉為全角、轉為半角、挖詞填空、當前日期、大寫金…

LabVIEW開發遠程結構健康監測系統

LabVIEW開發遠程結構健康監測系統 工程師依賴于振動監測來評估建筑物、橋梁和其他大型結構的完整性。傳統的振動監測工具在數據收集上存在限制,無法長時間收集高保真波形。隨著內存存儲、處理器速度和寬帶無線通信技術的進步,出現了對能夠長時間收集并實…

Navicat 技術指引 | 適用于 GaussDB 分布式的查詢功能

Navicat Premium(16.3.3 Windows 版或以上)正式支持 GaussDB 分布式數據庫。GaussDB 分布式模式更適合對系統可用性和數據處理能力要求較高的場景。Navicat 工具不僅提供可視化數據查看和編輯功能,還提供強大的高階功能(如模型、結…