科普:極簡的AI亂戰江湖

本文無圖。

大模型

?2022年2月,?文生圖應用的鼻祖Midjourney上線。

?2022年8月,?開源版的Midjourney,也就是Stable Diffusion上線。

2022年11月30日?,OpenAI正式發布ChatGPT-3.5。

此后,不斷有【大模型】面世,例如國內的文心一言、通義千問、訊飛星火、智譜清言、DeepSeek等,國外的LlaMa、Gemini等。

一點小常識:

  • 【量化】:在各類開源平臺下載大模型時,有時會看到FP32、FP16、TF32、BF16等字眼,它們表示大模型的量化精度,通俗的解釋是用整數代替浮點數,以提高模型運算速度、減少存儲空間。

  • 【蒸餾】:就是把已經充分訓練過的大模型的知識,讓“小模型”來學習,類似于“小人國”。從而改善運行效率,減少運行開銷。

  • 【微調】:這里的微調更多是指優化的意思。有兩種方案:一種是基于LoRA的矩陣分解(可以把它比喻成用加法代替乘法,降低冗余但又不影響結果)的方式,另一種是基于Embedding的嵌入方式(可以把它理解為給大模型加個外G)。

  • 【評測】:為了避免大模型一本正經地胡說八道,就需要一些評價指標來保證執行結果的正確性和合理性,目前比較有名的大模型專業評測機構包括國外的MMLU和國內的OpenCompass、FlagEval。

智能體

如果把大模型比作大腦的話,那么【智能體】就等于是給大腦加上了耳朵和嘴巴:有專門用來寫作的智能體,有專門用來編程的智能體,還有專門用來問診的智能體,這些都和行業有關。

當智能體多了以后,人們發現如果將他們“串聯”或“并聯”起來,就可以組成功能更強大的應用,于是就出現了【工作流】。

為了解決大模型無法克服的“幻覺”問題,人們再次給它加了一層外G,叫做【RAG】,相當于是讓大模型遇到不懂的問題時去查查字典。

為了滿足文、圖、音頻、視頻等互相轉化的能力,出現了【多模態】大模型。

前陣子比較火的Manus本質上也是智能體 + 工作流 + RAG + 多模態的【多智能體】混搭,并且賦予了它獨立訪問網絡,調用各種應用接口的能力。例如查詢天氣、航班、搜索網絡內容。它的創新點在于以一種非常直觀的形式將每一步的執行過程給展示了出來,并且任務分解的顆粒度合適,所以執行結果比較符合人們的期望。

社區

國外的大模型開發者們為了互相交流學習,整了一個叫做Hugging Face的社區,這里聚集了很多個人或組織訓練好的免費大模型。

阿里的Model Scope則是國內版的Hugging Face,類似的還有其他的一些。

但它們基本上只提供大模型的上傳、下載和托管,為了能夠實現在線調用大模型,又出現了OpenRouter(國外)和硅基流動(國內)這種能夠部署和調用大模型算力的平臺。本質上,它們就是個中介代理(類似于鏈家),既提供中介服務,也提供“自營”的房源(大模型算力)出租。

除了Hugging Face、Model Scope、OpenRouter和硅基流動,還有一種介于本地部署和網頁應用之間的大模型部署方式,這就是ollama和xinference,它們以類似于Docker的方式將大模型下載到本地,再通過它們暴露的端口來調用大模型的能力。

工具

在智能體里面,有做的非常出色的,比較有代表性的是早期的Kimi、豆包和扣子。

但是工程師們并不滿足于此,他們自己動手對接各種大模型接口,然后將這些接口封裝起來,形成了可以進行二次開發的大模型應用產品,其中最有代表性就是低代碼平臺Dify和更高級的開發框架LangChain,后起之秀CrewAI則是完全基于多智能體的應用開發組件。

而在開發側,出現了Claude、Cursor、Trae這種原生的AI開發IDE(一種集成開發工具),它們不再只是插件,而是一種全新的AI開發范式。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/80555.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/80555.shtml
英文地址,請注明出處:http://en.pswp.cn/web/80555.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CSS- 4.5 css + div 布局 簡易網易云音樂 官網布置實例

本系列可作為前端學習系列的筆記,代碼的運行環境是在HBuilder中,小編會將代碼復制下來,大家復制下來就可以練習了,方便大家學習。 HTML系列文章 已經收錄在前端專欄,有需要的寶寶們可以點擊前端專欄查看! 點…

【滑動窗口】LeetCode 1004題解 | 最大連續1的個數 Ⅲ

最大連續1的個數 Ⅲ 一、題目鏈接二、題目三、題目解析四、算法原理解法一:暴力枚舉 zero計數器解法二:滑動窗口 五、編寫代碼六、時空復雜度 一、題目鏈接 最大連續1的個數 Ⅲ 二、題目 三、題目解析 注意題目中說的是最多k次,在一個數組…

PyTorch音頻處理技術及應用研究:從特征提取到相似度分析

文章目錄 音頻處理技術及應用音頻處理技術音視頻摘要技術音頻識別及應用 梅爾頻率倒譜系數音頻特征爾頻率倒譜系數簡介及參數提取過程音頻處理快速傅里葉變換(FFT)能量譜處理離散余弦轉換 練習案例:音頻建模加載音頻數據源波形變換的類型繪制波形頻譜圖波形Mu-Law 編…

鴻蒙OSUniApp 實現的語音輸入與語音識別功能#三方框架 #Uniapp

UniApp 實現的語音輸入與語音識別功能 最近在開發跨平臺應用時,客戶要求添加語音輸入功能以提升用戶體驗。經過一番調研和實踐,我成功在UniApp項目中實現了語音輸入與識別功能,現將過程和方法分享出來,希望對有類似需求的開發者有…

2025年衛星遙感行業最新發展趨勢深度分析

一、國內發展趨勢:政策引領與技術突破雙輪驅動 (一)政策體系持續完善,頂層設計深化行業發展 國家級戰略與標準體系構建 中國政府將衛星遙感產業納入“十四五”規劃核心戰略,明確構建“通導遙”一體化空間基礎設施。20…

SIP協議棧--osip源碼梳理

文章目錄 osiposip主體結構體code main函數 狀態機轉化結構體code狀態轉換 sip事務結構體code osip_dialog結構體code 創建并發送200 OK響應 osip_message結構體code osip_eventcode 打印接收到的SIP消息 osip OSIP(Open Source Implementation of SIP)…

Linux之Yum源與Nginx服務篇

1.Yum源知識理論總結概括 Yum源概述 Yum 源 即軟件倉庫的標識,里面承載著軟件包集合 Yum源組成 包含模塊 【OS】、【everything】、【EPOL】、【debuginfo】、【source】、【update-source】 【os】:簡稱operator system 它內部包含操作系統的核心組件&#x…

從單體架構到微服務:架構演進之路

引言:當“大貨車”遇上“集裝箱運輸” 在軟件開發領域,單體架構曾像一輛載滿貨物的大貨車,將所有功能打包在一個應用中。但隨著業務復雜度飆升,這輛“大貨車”逐漸陷入泥潭:啟動慢如蝸牛、故障波及全局、升級如履薄冰……

AM32電調學習解讀九:ESC上電啟動關閉全流程波形分析

這是第九篇,前面的文章把各個模塊的實現都介紹了一輪,本章是從運行的角度結合波形圖,把整個流程走一遍。 先看下一運行的配置,我把一些配置關閉了,這樣跑起來會好分析一些,不同配置跑起來效果會有差異。使用…

全球寵物經濟新周期下的亞馬遜跨境采購策略革新——寵物用品賽道成本優化三維路徑

在全球"孤獨經濟"與"銀發經濟"雙輪驅動下,寵物用品市場正經歷結構性增長。Euromonitor數據顯示,2023年全球市場規模突破1520億美元,其中中國供應鏈貢獻度達38%,跨境電商出口增速連續三年超25%。在亞馬遜流量紅…

reshape/view/permute的原理

在pytorch中,Tensor的存儲是行主序的,也就是意味著最后一個維度的元素的存儲時連續的,reshape和view并不改變元素存儲的內存,僅僅改變訪問的間隔,下面舉例說明; 比如一個23的Tensor在內存中的存儲是連續的&…

upload-labs靶場通關詳解:第11關

一、分析源代碼 $is_upload false; $msg null; if (isset($_POST[submit])) {if (file_exists(UPLOAD_PATH)) {$deny_ext array("php","php5","php4","php3","php2","html","htm","phtml"…

L1-7 最短字母串【保姆級詳細講解】

請你設計一個程序,該程序接受起始字母和目標字母作為輸入,通過在字母表中向前或向后移動來計算兩個給定字母之間的最短路徑。然后,程序會沿著最短路徑打印出從起始字母到目標字母的所有字母。例如,如果輸入“c”和“k”作為起始字…

項目QT+ffmpeg+rtsp(三)——延遲巨低的項目+雙屏顯示

文章目錄 前言雙屏顯示widget.cppwidget.h前言 對于復現情況,分為兩種情況 第一種,對于我而言,是直接解壓后,就能直接運行了 第二種,對于師兄而言,需要你構建debug后,會產生這個文件夾,執行的時候,地址應該在這,我猜的,這里面沒有dll,exe程序就找不到dll這些庫,你…

ansible進階06

復雜的循環結構 循環基礎 [studentworktest myansible]$ cat users.yml --- - name: create usershosts: serveratasks:- name: create some usersuser:name: "{{item}}"password: "{{123456|password_hash(sha512)}}"state: presentloop:- zhangsan- li…

Go 模塊版本管理

Go 模塊版本管理指南 1、創建帶注釋的 Git 標簽 基本命令 # 創建帶注釋的標簽 git tag -a v1.0.0 -m "Release version 1.0.0 - initial stable release" -a:創建帶注釋的標簽 -m:添加標簽注釋信息 # 推送標簽到遠程倉庫 git push origin v…

Java—— IO流 第一期

什么是IO流 存儲和讀取數據的解決方案 I:input O:output 流:像水流一樣傳輸數據 IO流的作用 用于讀寫數據(本地文件,網絡) IO流的分類 按照流向分類 輸出流:程序 --> 文件 輸入流:文件 --> 程序 按照…

物聯網安全技術的最新進展與挑戰

隨著物聯網(IoT)技術的飛速發展,越來越多的設備被連接到互聯網,從智能家居設備到工業控制系統,物聯網正在深刻改變我們的生活和生產方式。然而,物聯網的安全問題也日益凸顯,成為制約其發展的關鍵…

【深度學習基礎】損失函數與優化算法詳解:從理論到實踐

【深度學習基礎】損失函數與優化算法詳解:從理論到實踐 一、引言 1. 損失函數與優化算法在深度學習中的核心作用 在深度學習中,模型訓練的本質是通過不斷調整參數,使模型輸出盡可能接近真實值。這一過程的核心驅動力是損失函數(…

mvc-review

review: 1.Servlet生命周期中初始化方法:init(),init(config) public void init(ServletConfig config) throws ServletException { this.config config; this.init(); } 因此,如果我們需要…