【AI熱點】小型語言模型(SLM)的崛起:如何在AI時代中找到你的“左膀右臂”?

人工智能模型的演變

多年來,谷歌等科技巨頭和OpenAI等初創公司,一直在不遺余力地利用海量在線數據,打造更大、更昂貴的人工智能(AI)模型。這些大型語言模型(LLM)被廣泛應用于ChatGPT等聊天機器人中,幫助用戶處理各種各樣的任務,從編寫代碼、規劃行程,到創作詩歌等。

自ChatGPT面世以來,AI模型便在變大、變強之路上“狂奔”。但喧囂過后,科技公司也越來越關注更小、更精簡的小型語言模型(SLM)。他們認為,這些小巧玲瓏的模型不僅“術業有專攻”,而且部署成本更低廉、更節能。

未來,這些規模不一的AI模型將協同工作,成為人類的左膀右臂。

在這里插入圖片描述

小型語言模型的優勢

小型語言模型在簡單的專業領域可能更有優勢。

隨著AI技術突飛猛進,AI模型的“塊頭”與日俱增。ChatGPT的締造者OpenAI去年夸耀稱,其GPT-4模型擁有約2萬億個參數。參數表示AI模型的大小,一般參數越多,AI模型的能力越強,龐大的參數量使GPT-4成為迄今最強大的AI模型之一,能回答從天體物理學到動物學等多領域包羅萬象的問題。

但是,如果某家公司只想借助AI模型解決特定領域(如醫學)的問題,或者一家廣告公司只需一款AI模型來分析消費者行為,以便他們更精準地推送廣告,GPT-4這類模型就有點“大材小用”了,SLM反而更能滿足用戶們的要求。

美國《福布斯》雙周刊網站在11月的報道中,將SLM稱為AI領域的“下一個大事件”。

微軟公司生成式AI副總裁塞巴斯蒂安·布貝克表示,雖然SLM的參數量目前并沒有統一標準,但大約在3億到40億個之間,小巧到可以安裝在智能手機上。

專家聲稱,SLM更勝任簡單的任務,如總結和索引文檔、搜索內部數據庫等。

法國初創公司LightOn的負責人勞倫特·都德認為,與LLM相比,SLM擁有諸多優勢:首先,這些模型的反應速度更快,能同時響應更多查詢,回復更多用戶;其次,SLM部署成本更低,能源消耗也更少。

都德解釋道,目前很多LLM需要大量服務器來進行訓練,然后處理查詢。這些服務器由尖端芯片組成,需要大量電力來運行,并進行冷卻。而訓練SLM所需芯片更少,運行耗費的能源也更少,這使其更便宜、更節能。

SLM還可直接安裝在設備上,在不依賴數據中心的情況下運行,這能進一步確保數據的安全性。《福布斯》表示,SLM能以最少的計算資源執行各種任務,使其成為移動設備、邊緣設備等的理想選擇。

在這里插入圖片描述

AI模型掀起“極簡風”

谷歌、微軟、元宇宙平臺公司以及OpenAI等公司聞風而動,推出了各種SLM。

去年12月底,微軟公司正式發布了只有27億個參數的語言模型Phi-2。微軟研究院在其X平臺官方賬號上表示,Phi-2的性能優于現有其他SLM,且能在筆記本電腦或移動設備上運行。今年4月,微軟又推出了只有38億個參數的Phi-3系列模型。

今年8月,微軟公司再接再厲,推出了最新的Phi-3.5-mini-instruct。這款SLM為高效、先進的自然語言處理任務量身打造。9月,英偉達公司開源了Nemotron-Mini-4B-Instruct。該公司表示,這款SLM特別適合邊緣計算和設備端的應用。報道稱,這兩款SLM在計算資源使用和功能表現之間實現了良好平衡。在某些方面,其性能甚至可媲美LLM。

OpenAI也不甘示弱。今年7月,OpenAI公司發布了GPT-4o mini,稱其是該公司最智能和最實惠的SLM。

此外,亞馬遜公司還允許在其云平臺上使用各種規模的AI模型。

其他公司也紛紛開發更適合自身需求的SLM。例如,美國制藥巨頭默克公司正與波士頓咨詢集團(BCG)合作開發一款SLM,旨在探究某些疾病對基因的影響。這將是一款參數介于幾億到幾十億之間的AI模型。

大小模型作用互補

雖然SLM在效率等方面具有獨特優勢,但LLM在解決復雜問題、提供更廣泛的數據訪問方面仍然具有極大優勢。

展望未來,LLM和SLM兩種模型將“是朋友而非對手”,它們之間的協作交流將成為主流趨勢。

當遇到用戶提出的某個問題時,一款SLM會“一馬當先”,理解這個問題,再根據問題的復雜性,將相關信息發送給幾個大小不一的AI模型。這些模型“群策群力”“并肩攜手”為用戶解決難題。

目前市面上的AI模型要么太大、太貴,要么處理速度太慢。兩者合作,或是最佳解決方案。

對此你怎么看?

【CodeMoss】集成13個種AI模型(GPT4、o1等)、提示詞助手100+、支持Open API調用、自定義助手、文件上傳等強大功能,助您提升工作效率!

點擊訪問CodeMoss >>> https://pc.aihao123.cn/index.html#/page/login?invite=1141439&fromChannel=1_Moss1218

請添加圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/63381.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/63381.shtml
英文地址,請注明出處:http://en.pswp.cn/web/63381.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【昇騰】NPU ID:物理ID、邏輯ID、芯片映射關系

起因: https://www.hiascend.com/document/detail/zh/Atlas%20200I%20A2/23.0.0/re/npu/npusmi_013.html npu-smi info -l查詢所有NPU設備: [naienotebook-npu-bd130045-55bbffd786-lr6t8 DCNN]$ npu-smi info -lTotal Count : 1NPU…

Elasticsearch-DSL高級查詢操作

一、禁用元數據和過濾數據 1、禁用元數據_source GET product/_search {"_source": false, "query": {"match_all": {}} }查詢結果不顯示元數據 禁用之前: {"took" : 0,"timed_out" : false,"_shards" : {&quo…

基于Spring Boot的體育商品推薦系統

一、系統背景與目的 隨著電子商務的快速發展和人們健康意識的提高,體育商品市場呈現出蓬勃發展的態勢。然而,傳統的體育商品銷售方式存在商品種類繁多、用戶選擇困難、個性化需求無法滿足等問題。為了解決這些問題,基于Spring Boot的體育商品…

【Java Nio Netty】基于TCP的簡單Netty自定義協議實現(萬字,全篇例子)

基于TCP的簡單Netty自定義協議實現(萬字,全篇例子) 前言 有一陣子沒寫博客了,最近在學習Netty寫一個實時聊天軟件,一個高性能異步事件驅動的網絡應用框架,我們常用的SpringBoot一般基于Http協議&#xff0…

【2025最新計算機畢業設計】基于SSM校園歌手賽事管理系統【提供源碼+答辯PPT+文檔+項目部署】

作者簡介:?CSDN新星計劃導師、Java領域優質創作者、掘金/華為云/阿里云/InfoQ等平臺優質作者、專注于Java技術領域和學生畢業項目實戰,高校老師/講師/同行前輩交流。? 主要內容:🌟Java項目、Python項目、前端項目、PHP、ASP.NET、人工智能…

Visual Studio 使用 GitHub Copilot 協助調試

🎀🎀🎀【AI輔助編程系列】🎀🎀🎀 Visual Studio 使用 GitHub Copilot 與 IntelliCode 輔助編碼Visual Studio 安裝和管理 GitHub CopilotVisual Studio 使用 GitHub Copilot 擴展Visual Studio 使用 GitHu…

了解ARM的千兆以太網——RK3588

1. 簡介 本文并不重點講解調試內容,重點了解以太網在ARM設計中的框架以及在設備樹以及驅動的一個整體框架。了解作為一個驅動開發人員當拿到一款未開發過的ARM板卡應該怎么去把網卡配置使用起來。 2. 基礎知識介紹 在嵌入式ARM中實現以太網的解決方案通常有以下兩種…

Springboot家政服務管理系統

摘 要 科技進步的飛速發展引起人們日常生活的巨大變化,電子信息技術的飛速發展使得電子信息技術的各個領域的應用水平得到普及和應用。信息時代的到來已成為不可阻擋的時尚潮流,人類發展的歷史正進入一個新時代。在現實運用中,應用軟件的工作…

DC-9筆記

靶機信息 官網:DC: 9 ~ VulnHub 只有一個flag,官網上沒給其他提示 信息收集 nmap 192.168.66.2-254nmap 192.168.66.146 -A -p-開放了80端口,22端口是filtered的,被過濾? NMAP 六種端口狀態解讀_nmap filtered-CSDN博客 那來看看http服務吧 http(80) 頁腳是空白的,插件也…

STM32-筆記3-驅動蜂鳴器

1、復制03項目,重命名為04項目 打開04項目的Drivers/BSP/led文件夾,把led文件夾更改為beep文件夾,改文件夾內部的.c和.h文件更改為beep.c和beep.h文件,如下圖所示。 2、打開工程文件 出現彈窗,顯示找不到xx文件&#…

PHP開發日志 ━━ 基礎知識:四種不同的變量返回方式該如何調用

最近在給框架升級,其中涉及到古早的緩存系統升級,現在準備區分類型為混合、變量和普通文件,那么變量用什么形式存儲到緩存才能給后續開發帶來便利和通用性呢?于是就涉及到了本文的php基礎知識。 好吧,又是一個無用的知…

概率論得學習和整理30: 用EXCEL 描述泊松分布 poisson distribution

目錄 1 泊松分布的基本內容 1.1 泊松分布的關鍵點 1.1.1 屬于離散分布 1.1.2 泊松分布的特點:每個子區間內概率相等 , λ就是平均概率 1.2 核心參數 1.3 pmf公式 1.4 期望和方差 2 例1:用EXCEL計算泊松分布的概率 3 比較λ不同值時…

Java中的垃圾收集器

文章目錄 1. 理解不同類型的垃圾收集器1.1 Serial 收集器1.2 Parallel (吞吐量) 收集器1.3 CMS (Concurrent Mark-Sweep) 收集器1.4 G1 (Garbage First) 收集器1.5 ZGC 和 Shenandoah GC1.6 Epsilon GC1.7 ParNew 收集器1.8 Zing (Azul Systems) 2. 優化垃圾收集器的選擇和配置…

測試工程師八股文05|功能測試、業務測試

一、基礎概念 1、軟件測試分類 1??按照軟件產生的階段劃分 單元測試:針對程序源代碼進行測試【開發自測】集成測試:針對模塊之間功能交互進行測試系統測試:對整個系統(功能、非功能)進行全面測試驗收測試&#xff…

圖(dfs與bfs)算法2

進度:15/100 原題1: 給你一棵二叉樹的根節點 root ,翻轉這棵二叉樹,并返回其根節點。 (力扣的圖) 原題2: 給定二叉樹的根節點 root ,返回所有左葉子之和。 原題3: 給…

《鴻蒙開發-答案之書》字符串占位符格式化

《鴻蒙開發-答案之書》字符串占位符格式化 先在string.json定義: {"name":"message_arrive","value":"We will arrive at %s."}使用,它有兩種使用方式: 方式一: Text($r(app.string.…

Redis bitmaps 使用

應用場景: 記錄id為 1 的用戶,2024年12月簽到情況,并統計; 記錄 1號簽到 zxys-redis:0>setbit 1:202412 1 1 記錄 2號簽到 zxys-redis:0>setbit 1:202412 2 1 記錄 3號未簽到 zxys-redis:0>setbit 1:202412 3 0 …

【微服務】SpringBoot 整合Redis Stack 構建本地向量數據庫相似性查詢

目錄 一、前言 二、向量數據庫介紹 2.1 什么是向量數據庫 2.2 向量數據庫特點 2.3 向量數據庫使用場景 三、常用的向量數據庫解決方案 3.1 Milvus 3.1.1 Milvus是什么 3.1.2 Milvus主要特點 3.2 Faiss 3.2.1 Faiss是什么 3.2.2 Faiss主要特點 3.3 Pinecone 3.3.1 …

【數據庫】大二數據庫復習范圍 (快速版)幫助你快速復習數據庫

第一章 1. 信息=數據+語義 2:數據庫管理系統(database management system, DBMS) 3. 數據庫系統(database system, DBS)由數據庫、數據庫用戶、計算機硬件系統和計算機軟件系統等幾部分組成 4. 數據模型按應用層次可分為概念模型、邏輯模型和物理模型。 5.每個二維表…

FMIKit-Simulink 常見問題解決方案

將解壓后的文件夾添加到 MATLAB 路徑中: addpath(fullfile(pwd, FMIKit-Simulink-3.1));初始化 FMIKit: FMIKit.initialize(); 設置求解器rtwsfcnfmi.tlc、或grtfmi.tlc再CtrlB即可。 幫助文檔可查看導出FUM和導入FMU。 FMIKit-Simulink-3.1\html\index…