AI Compass前沿速覽:可靈創意工坊、字節Coze StudioCoze Loop、通義萬相2.2 、智譜GLM-4.5、騰訊混元3D世界模型開源

AI Compass前沿速覽:可靈創意工坊、字節Coze Studio&Coze Loop、通義萬相2.2 、智譜GLM-4.5、騰訊混元3D世界模型開源

AI-Compass 致力于構建最全面、最實用、最前沿的AI技術學習和實踐生態,通過六大核心模塊的系統化組織,為不同層次的學習者和開發者提供從完整學習路徑。

  • github地址:AI-Compass👈:https://github.com/tingaicompass/AI-Compass
  • gitee地址:AI-Compass👈:https://gitee.com/tingaicompass/ai-compass

🌟 如果本項目對您有所幫助,請為我們點亮一顆星!🌟

1.每周大新聞

靈動畫布 – 可靈AI推出的AI創意工作臺

可靈AI有新動態,一是在世界人工智能大會期間發布全新創意工作臺功能“靈動畫布”,二是推出可靈2.1模型。

kuaishou.png

靈動畫布情況
  • 功能特點:支持最多5人協同創作,有一站式創作流程、一鍵導出等功能,具備無限可視化空間、智能創作輔助等優勢。
  • 使用方式:可通過網頁端官網或手機端APP使用,按創建畫布、添加元素等步驟操作。
  • 應用場景:適用于圖像與視頻生成、教學演示動畫、學生創意項目等。
可靈2.1模型亮點

運動質量更高、視頻更美更靈動、指令響應更好,給出了相關圖片及圖生視頻示例。

  • https://app.klingai.com/cn/

SeedEdit 3.0 – 字節跳動推出的圖像編輯模型

SeedEdit 3.0 是字節跳動Seed團隊推出的圖像編輯模型,支持用自然語言指令實現對圖像的快速、高質量編輯。模型依托強大的文生圖模型 Seedream 3.0,能精準理解用戶指令,完成包括風格轉換、細節調整、文字修改、光影變化等多種復雜編輯任務。模型在保留圖像主體和細節方面表現出色,支持高清圖像處理,適用專業設計師、內容創作者和普通用戶,極大地簡化圖像編輯流程,提升創作效率,目前模型已上線火山方舟正式開放。

SeedEdit 3.0的主要功能

  • 精準區域編輯:支持精準鎖定圖像中的特定區域進行修改。
  • 智能文字處理:自動識別并替換圖像中的文字內容,同時匹配原圖的字體、光影和風格,智能填充周圍紋理,確保畫面完整無痕。
  • 光影與氛圍調整:支持將黑夜變為白天、調整逆光、暖色調等光影效果,光影過渡自然,能營造出電影質感的畫面。
  • 風格轉換:支持多種風格轉換,如“毛氈風”“水彩風”“卡通風”等,用戶用一句話指令能切換風格,滿足不同創意需求。
  • 高效操作:用戶用簡單的自然語言指令能完成圖片編輯,無需復雜操作,單張圖片處理時間僅需 10-15 秒,極大地提升創作效率。

項目官網:https://volcenginecn.com/
arXiv技術論文:https://arxiv.org/pdf/2506.05083

SkyRouter – AI部署平臺

SkyRouter 是面向 AI 模型的高性能平臺,借助硬件和軟件端到端優化,實現更快生成速度和更高吞吐量。通過全球分布式網絡,提供低延遲用戶體驗。采用簡單易用 API,無需管理復雜設施,有透明定價模式,適合各類用戶。

主要功能

具備高性能優化、全球分布式網絡、簡單易用 API、透明定價、快速擴展、高穩定性等特點,還有 Playground 環境供用戶測試探索模型。

應用場景

可用于 AI Agent 協作平臺、垂直 AI Agents、物聯網智能中心。

數據表現

能解鎖 150 + 模型,平均月處理 2.2T 令牌,有 100 + 全球供應商,令牌處理速度達 600 每秒。

  • https://www.skyrouter.ai/

Seko-商湯AI短視頻創作Agent

商湯科技推出全球首個創編一體的AI短視頻創作Agent——Seko。

主要功能

可根據用戶創意完成視頻全流程創作,包括策劃與劇本創作、自然語言編輯、角色一致性控制、多模態內容生成等,還提供推薦主體與靈感廣場。

使用方法

訪問官網注冊登錄,輸入創意描述,點擊生成,可編輯調整,最后導出成片。

應用場景

適用于短視頻創作、短劇制作、產品宣傳、角色二創、知識科普等場景,降低創作門檻。

  • https://seko.sensetime.com/explore

AnyVoice – AI聲音克隆平臺

AnyVoice是全球首創的AI聲音克隆平臺,僅需3秒音頻就能克隆出高度逼真聲音,支持英、中、日、韓多語言。操作簡單,無需技術專長,重視用戶隱私。

主要功能

3秒快速克隆聲音,能捕捉說話者細微差別與情感,生成與真人難區分的音頻;支持實時音頻生成,克隆后可立即生成音頻;生成的音頻支持MP3或WAV格式下載。

使用方法

訪問官網https://anyvoice.net ,上傳或錄制3 - 10秒音頻樣本,點擊“生成”,AI幾秒內生成聲音克隆,最后下載音頻。

產品定價

免費版適合個人非商業用途,每次最多200字符,每月1200秒音頻生成,最多創建10個聲音克隆模型;專業版適合商業用途,每次最多1000字符,無限生成,優先生成,可創建無限聲音克隆模型。

應用場景

涵蓋內容創作、廣告營銷、教育與培訓、游戲開發、虛擬助手等領域。

Opal – 谷歌推出的AI工作流生成平臺

谷歌推出實驗性AI工作流生成工具Opal,支持用自然語言和可視化編輯創建、分享AI小應用,無需代碼構建多步驟AI應用。

主要功能

可創建工作流,支持自然語言編輯和可視化編輯,能快速分享應用,還有預建模板庫。

使用方法

目前僅在美國公開測試,需訪問官網注冊登錄,可選擇模板或新建應用,描述邏輯生成工作流,再調整、測試和分享。

應用場景

涵蓋內容創作、數據分析、客戶服務、教育學習、項目管理等領域。

  • https://opal.withgoogle.com/

Agentar-Fin-R1 – 螞蟻數科推出的金融推理大模型

螞蟻數科推出面向金融領域的大型語言模型 Agentar - Fin - R1,基于 Qwen3 基礎模型,有 8B 和 32B 參數版本,通過相關體系和框架優化,在金融及通用推理測試中表現出色。

螞蟻.png

主要功能

具備復雜推理、決策支持、意圖識別等功能,能保障金融系統安全和符合合規要求。

技術原理

采用精細化金融任務標簽體系、多維度可信度保障框架、加權訓練框架、兩階段訓練策略、歸因循環機制等,提出創新評估基準 Finova。

項目地址

arXiv 技術論文:https://arxiv.org/pdf/2507.16802

應用場景

可用于金融智能客服、風險評估與管理、市場趨勢分析、財務報表分析、個性化推薦等。

Qwen-MT – 阿里機器翻譯模型

Qwen - MT是阿里通義千問團隊基于Qwen3架構推出的機器翻譯模型,支持92種語言互譯,覆蓋全球超95%人口。

qwen.png

主要功能
  • 多語言支持:滿足廣泛跨語言需求。
  • 高度定制化:可通過術語干預等功能自定義翻譯風格。
  • 低延遲與低成本:基于輕量級MoE架構,每百萬輸出token的API調用成本低至0.5美元。
  • 高質量翻譯:自動和人工評估表現出色。
技術原理

基于Qwen3架構,用萬億級多語言和翻譯數據訓練,結合強化學習優化,采用輕量級MoE架構,支持定制化功能。

翻譯質量

自動評估中,在多領域翻譯基準測試中顯著優于可比規模模型;人工評估中,在十種主要語言翻譯數據上表現優異。

應用場景

涵蓋跨語言內容創作、企業國際化、教育、法律政務、技術開發等領域。

  • 項目官網:https://qwenlm.github.io/blog/qwen-mt/
  • 在線體驗 Demo:https://huggingface.co/spaces/Qwen/Qwen3-MT-Demo

Runway Aleph – Runway推出的AI視頻編輯模型

Runway Aleph 是 Runway 推出的強大的 AI 視頻編輯模型。能通過簡單的文字指令,快速實現視頻內容的增刪、風格轉換、環境變換和鏡頭運動調整等功能。用戶可以輕松移除視頻中的多余元素,或者將白天場景變為夜晚,將視頻風格從現實變為卡通。Aleph 的核心優勢在于其基于上下文的編輯能力,能理解視頻的敘事邏輯和時空關系,避免常見的編輯錯誤。

  • 內容增刪:能精準識別視頻中的對象,支持添加新元素或移除不需要的內容。比如可以輕松去除玻璃反光或背景中的雜物,也可以在街頭采訪視頻中加入飄落的櫻花。
  • 環境與氛圍變換:用戶可通過文本指令更改視頻中的環境、天氣或季節,像把晴天場景變為雨天,或將白天畫面調整為夜景,賦予視頻全新的敘事氛圍。
  • 風格遷移:支持將視頻風格轉換為卡通、油畫或其他藝術風格,保持畫面內容的一致性,為藝術創作和品牌宣傳提供多樣化選擇。
  • 鏡頭運動遷移:用戶可保留原始視頻的鏡頭運動方式,生成新的內容或視角,特別適合需要動態鏡頭效果的場景,比如模仿原視頻的推拉搖移節奏生成新畫面。
  • 綠幕摳像與燈光優化:內置綠幕摳像功能,無需專業綠幕設備,AI 自動識別主體并摳圖。支持重新打光,可根據場景需求自動調整光線效果。

2.每周項目推薦

Coze Studio – 字節開源的AI Agent開發平臺

簡介

Coze Studio(扣子空間)是一個由字節跳動開發并開源的一站式AI Agent開發平臺。它提供可視化的工具,旨在簡化AI Agent的創建、調試和部署過程,讓用戶無需編寫代碼即可快速構建和發布智能體,并支持將其部署到多種平臺。

核心功能
  • 可視化工作流構建: 提供拖放節點的可視化畫布,用于快速構建和編排復雜的業務邏輯或任務流程。
  • Agent與應用開發: 支持無代碼方式開發AI Agent和應用程序,簡化開發門檻。
  • 資源管理與集成: 統一管理工作流、插件、數據庫、知識庫和變量等資源,并提供豐富的SDKs(如Python、JavaScript、Java) facilitating seamless integration.
  • 多平臺發布: 支持將構建的AI Agent和應用發布到不同的平臺。
  • 專家Agent生態: 提供預設或可定制的領域專家Agent,如用戶研究專家、金融分析助手、輿情分析專家等,滿足特定業務需求。
  • 智能任務拆解與工具調用: Agent能夠自動分析需求,拆解任務,并自主調用外部工具生成完整報告或完成復雜工作。
技術原理

Coze Studio的核心技術原理在于其可視化編程范式模塊化Agent架構。它通過提供圖形化的界面和可拖拽的節點,將復雜的AI邏輯和數據流抽象化,使得用戶能夠以非代碼的方式構建AI Agent的工作流程。平臺底層支持對插件、知識庫、數據庫和變量等多種資源的靈活管理和調用,實現Agent能力的擴展。此外,Coze Studio還提供了多種語言的SDKs,便于開發者通過API接口與平臺進行交互和集成,將AI能力嵌入到現有應用中。其Agent設計理念強調任務的自動化分析與執行,通過內部邏輯編排和外部工具調用,實現復雜任務的自主完成。

Snipaste_2025-07-29_19-29-37.png

應用場景
  • 智能客服與對話機器人: 快速構建企業內部或對外服務的智能客服,實現自動化問答和客戶支持。
  • 數據分析與報告生成: 開發能夠自動分析特定領域數據(如市場調研、金融數據)并生成專業報告的Agent。
  • 內容創作與優化: 用于生成SEO優化文章、營銷文案等內容,提高內容生產效率。
  • 教育與研究助手: 構建輔助學習、資料檢索、論文撰寫等方面的智能助手。
  • 業務流程自動化: 將AI Agent應用于企業內部流程,如自動化任務分配、數據處理、信息匯總等,提升運營效率。
  • 行業專家系統: 針對特定垂直領域(如醫療、法律、金融)開發具備專業知識和能力的AI Agent,提供專業咨詢或輔助決策。

Github倉庫:https://github.com/coze-dev/coze-studio

Coze Loop – 字節Coze推出的AI Agent開發與調試平臺

簡介

CozeLoop 是一個旨在簡化與 Coze 平臺交互的開發工具,通過提供多語言 SDK (如 Python、Go 和 JavaScript) 來幫助開發者構建、管理和監控基于 Coze 平臺的 AI 應用。它專注于提升開發者在處理 AI 交互流程中的效率和可觀測性。

Snipaste_2025-07-29_19-29-11.png

核心功能
  • 報告追蹤 (Report Trace):允許開發者記錄和報告 AI 應用的運行軌跡和關鍵事件,便于調試和性能分析。
  • 獲取和格式化提示詞 (Get and Format Prompt):提供從 CozeLoop 平臺獲取預定義或動態提示詞(Prompt),并根據需要進行格式化的能力,簡化 AI 模型輸入準備工作。
  • 多語言支持:提供 Python、Go、JavaScript 等多種主流編程語言的 SDK,便于不同技術棧的開發者集成。
技術原理

CozeLoop 的技術原理主要基于客戶端-服務端的交互模式。

  • SDK 設計:CozeLoop 為不同編程語言提供了輕量級的客戶端開發工具包(SDK),這些 SDK 封裝了與 CozeLoop 平臺后端服務進行通信的 API 接口。
  • 分布式追蹤 (Distributed Tracing):通過 SDK 提供的 StartSpanSetInput/SetOutput/Finish 等方法,實現對 AI 交互流程中各個環節的追蹤數據采集和上報,類似于 OpenTelemetry 等分布式追蹤系統,用于監控和診斷。
  • API 接口層:SDK 通過 HTTP/RPC 等協議與 CozeLoop 后端服務進行通信,執行如提示詞獲取和追蹤數據上傳等操作。
  • 提示詞管理:后端平臺負責存儲和管理提示詞模板,SDK 負責通過 GetPromptPromptFormat 方法根據業務邏輯獲取并填充變量,生成最終的提示詞。
應用場景
  • AI 應用開發:開發者可以使用 CozeLoop SDK 快速將 AI 能力集成到現有的應用中,如構建智能客服、內容生成、自動化工作流等。

  • AI Agent 監控與調試:通過報告追蹤功能,對復雜的 AI Agent 的決策路徑和執行過程進行可視化監控和故障排查。

  • 提示詞工程管理:集中管理和版本控制提示詞,便于團隊協作和迭代優化 AI 模型的輸入。

  • 跨平臺集成:利用不同語言的 SDK,在多種技術環境中(如后端服務、前端應用、數據分析腳本等)無縫對接 Coze 平臺。

  • Github倉庫:https://github.com/coze-dev/cozeloop

  • 官網地址:https://www.coze.cn/loop

扣子空間-網頁設計功能上線

它旨在提供一個完整的、覆蓋多種場景的設計解決方案,特別是針對招聘頁、活動頁和個人簡歷等具體應用。

核心功能
  • 完整設計解決方案提供: 針對特定頁面(如招聘頁、活動頁、個人簡歷)提供一體化的設計支持。
  • 多場景覆蓋: 能夠適應并應用于多種不同的業務或個人展示場景。
技術原理

鑒于可用信息有限,無法深入解析具體技術原理。但推測其可能依賴于前端設計框架、UI/UX組件庫,以及后端數據處理和內容生成技術,以實現高效且標準化的設計方案輸出。

應用場景
  • 企業招聘: 用于快速生成和優化公司招聘頁面。

  • 市場活動: 輔助設計和部署各類線上或線下活動宣傳頁面。

  • 個人展示: 幫助個人用戶創建專業且富有吸引力的在線簡歷或個人主頁。

  • https://space.coze.cn/?from=landingpage

通義萬相2.2 – 阿里開源AI視頻生成模型

簡介

通義萬相(Tongyi Wanxiang)是阿里云通義旗下的人工智能創意創作平臺。其中,通義萬相2.2(Wan2.2)是阿里巴巴開源的先進AI視頻生成模型,旨在降低創意工作的門檻。該平臺集成了多種AI生成能力,包括視頻和圖像內容的創作。

通義.png

通義1.png

核心功能
  • 文生視頻(Text-to-Video, T2V): 根據文本描述生成視頻內容。
  • 圖生視頻(Image-to-Video, I2V): 根據靜態圖片生成動態視頻。
  • 統一視頻生成(Unified Video Generation, IT2V): 整合文本和圖像輸入進行視頻生成。
  • 圖像生成: 支持文生圖、圖生圖、涂鴉作畫、虛擬模特、個人寫真等多種圖像創作模式。
  • 高級特效與LoRA訓練: 提供增強的圖像/視頻生成效果和更智能的LoRA模型訓練功能。
  • 電影級控制: 首次實現MoE架構的視頻生成模型,具備電影級控制能力。

通義2.png

技術原理

通義萬相2.2基于先進的AI視頻生成模型,采用大規模模型(Large-Scale Video Generative Models)和混合專家架構(MoE-Architecture)來提升視頻生成質量和控制力。其核心技術可能包括深度學習、擴散模型(如Hugging Face上提及的Diffusers)以及復雜的神經網絡結構,以實現從文本或圖像到高質量視頻的轉換。

應用場景
  • 內容創作: 為電影、廣告、短視頻等領域的創作者提供高效的視頻和圖像生成工具,降低制作成本和時間。

  • 數字營銷: 快速生成個性化、吸引人的宣傳視頻和圖片,用于產品推廣和品牌建設。

  • 藝術設計: 輔助藝術家和設計師進行概念驗證和視覺化創作,拓寬創意邊界。

  • 個人娛樂: 滿足普通用戶生成有趣視頻和圖片的個性化需求,如社交媒體分享等。

  • 教育與培訓: 制作教學動畫、演示視頻,提升學習體驗。

  • https://tongyi.aliyun.com/wanxiang/welcome

  • https://github.com/Wan-Video/Wan2.2

  • https://tongyi.aliyun.com/wanxiang

GLM-4.5 –SOTA 模型

簡介

GLM-4.5是智譜AI(Z.ai)推出的一款新一代旗艦級開源大模型,旨在原生融合推理、代碼和智能體(Agent)能力,是業界首款專注于智能體應用的SOTA模型。它在多個評測基準中表現卓越,綜合性能達到開源模型的頂尖水平,尤其在代碼智能體場景中表現優異。

智譜.png

核心功能
  • 推理能力: 提供強大的邏輯推理能力,能夠處理復雜任務并進行深度思考。
  • 代碼生成與理解: 具備出色的代碼智能,支持代碼的生成、理解、調試和優化。
  • 智能體能力: 專為構建和驅動智能體設計,能夠作為核心驅動力,實現自主規劃與執行。
  • 多版本支持: 包含GLM-4.5(3550億參數)和GLM-4.5-Air(1060億參數)等版本,兼顧性能與效率。
  • 混合推理模式: 支持“思考模式”和“非思考模式”,以適應復雜任務與即時響應的不同需求。
技術原理

GLM-4.5采用先進的混合專家(MoE)架構,通過激活部分專家模型來高效處理任務。例如,GLM-4.5擁有3550億總參數和320億激活參數,而GLM-4.5-Air則更為緊湊,擁有1060億總參數和120億激活參數。模型在參數效率上實現了顯著優化,在保持高性能的同時,參數量遠低于同級別模型。其技術棧支持深度思考(Deep Thinking)、流式輸出(Streaming Output)、函數調用(Function Call)、上下文緩存(Context Caching)和結構化輸出(Structured Output)等高級功能,提升了模型的實用性和集成能力。

應用場景
  • AI智能體開發: 作為核心驅動引擎,用于構建具備自主決策、規劃和執行能力的各種智能體應用。

  • 自動化編程與開發輔助: 輔助開發者進行代碼生成、錯誤排查、代碼重構等,提高開發效率。

  • 復雜問題推理: 在金融分析、科學研究、醫療診斷等需要復雜邏輯推理的領域提供智能支持。

  • 企業級AI解決方案: 適用于需要高性能、高效率和高可靠性AI模型的企業級應用場景。

  • 對話系統與智能助手: 提升對話機器人、虛擬助手在理解、響應和執行復雜指令方面的能力。

  • GitHub倉庫:https://github.com/zai-org/GLM-4.5

  • HuggingFace倉庫: https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b

  • ModelScope倉庫:https://modelscope.cn/collections/GLM-45-b8693e2a08984f
    體驗地址:

  • HuggingFace: https://huggingface.co/spaces/zai-org/GLM-4.5-Space

  • ModelScope:https://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo

騰訊混元3D世界模型開源

簡介

Hunyuan3D是騰訊研發的大規模三維生成模型,基于先進的擴散(Diffusion)技術。它能夠通過文本描述或圖像輸入,快速、高效地生成高質量、逼真的3D資產。HunyuanWorld-1.0作為其重要組成部分,更是首個開源的三維世界生成模型,旨在革新3D內容創作流程。

騰訊.png

核心功能
  • 文本到三維生成 (Text-to-3D Generation):依據自然語言描述直接生成多樣化的3D模型,涵蓋物體、角色、環境等。
  • 圖像到三維重建 (Image-to-3D Reconstruction):將2D圖像轉換為具有精確幾何和紋理的高質量3D模型。
  • 高分辨率與高質量輸出 (High-Resolution & High-Quality Output):生成細節豐富、視覺效果出眾的3D資產。
  • 多視圖生成與重建 (Multi-view Generation & Reconstruction):支持從多角度圖像輸入進行3D模型的生成與精細重建。
  • 場景與世界生成 (Scene & World Generation):尤其通過HunyuanWorld-1.0,實現復雜三維場景乃至整個虛擬世界的自動化生成。
技術原理

Hunyuan3D的核心技術是擴散模型 (Diffusion Models),這是一種生成式AI模型,通過逐步去噪過程從隨機噪聲中學習數據分布并生成新樣本。其架構包含:

  • 文本編碼器 (Text Encoders):負責將輸入的文本描述轉換為高維語義特征。
  • 圖像編碼器 (Image Encoders):處理輸入的2D圖像,提取視覺特征。
  • 擴散模型 (Diffusion Models):接收編碼后的文本或圖像特征,通過多步迭代逆向擴散過程,逐步從噪聲中恢復并生成3D的潛在表示。
  • 3D解碼器 (3D Decoders):將擴散模型輸出的3D潛在表示解碼為最終的3D幾何(如網格或體素)和紋理信息,完成從2D/文本到3D的映射。
    整個系統通過大規模3D數據集進行訓練,以確保生成內容的質量和多樣性。
應用場景
  • 游戲開發 (Game Development):快速生成游戲角色、道具、場景環境,顯著提升內容創作效率。
  • 影視動畫制作 (Film & Animation Production):輔助制作復雜的3D場景、特效及角色,降低生產成本和周期。
  • 虛擬現實 (VR) 與增強現實 (AR):為VR/AR應用提供豐富的3D內容庫,構建沉浸式體驗。
  • 數字內容創作 (Digital Content Creation):賦能設計師、藝術家和內容創作者,快速實現3D視覺創意。
  • 元宇宙構建 (Metaverse Construction):大規模生成虛擬世界的3D資產和環境,加速元宇宙生態的建設。
  • 產品設計與可視化 (Product Design & Visualization):將概念圖或文本描述迅速轉化為3D模型進行展示、原型制作和評估。

騰訊混元 3D 世界模型 1.0:

  • 項目主頁:https://3d-models.hunyuan.tencent.com/world/

  • 體驗地址:https://3d.hunyuan.tencent.com/sceneTo3D

  • Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1

  • Github 項目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0

書生浦語-科學多模態大模型Intern-S1

簡介

Intern-S1 是上海人工智能實驗室 (Shanghai AI Laboratory) 開發的 InternLM 系列大型語言模型 (LLM) 中的一員。它旨在提供高質量的語言模型和全棧工具鏈,尤其強調其強大的推理能力和與外部工具的交互能力。

核心功能
  • 工具調用 (Tool Calling):能夠調用外部工具,例如獲取實時信息、執行代碼或調用其他應用程序內的函數,從而擴展模型的能力邊界。
  • 思維模式 (Thinking Mode):默認開啟的思維模式顯著增強了模型的推理能力,使其能夠生成更高質量的響應。此模式可根據需要進行配置。
  • 多模態能力 (Multimodal Capabilities):支持多模態輸入,進一步拓寬了模型的應用范圍。
技術原理

Intern-S1 基于 InternLM 的基礎架構,并在此基礎上進行了優化:

  • 函數調用集成:通過特定的工具調用機制,模型能夠解析用戶意圖并自動選擇、調用外部函數或API,將外部世界的信息和能力整合到其響應生成過程中。
  • FP8 量化:提供 FP8 (8位浮點) 量化版本,這意味著模型在保持較高性能的同時,大幅降低了顯存占用和計算資源需求,提高了推理效率。
  • 高級推理機制:內置“思維模式”,通過引導模型進行類似人類的逐步思考過程,提升其復雜問題的推理和解決能力。
  • 部署靈活性:支持通過 SGLang 和 Ollama 等多種方式進行本地部署,為開發者和研究人員提供了便捷的實驗和應用環境。
應用場景
  • 智能代理 (AI Agents):構建能夠自主獲取最新信息、執行復雜任務或與外部系統交互的智能代理。

  • 代碼輔助與自動化:在軟件開發中,輔助代碼生成、調試,或自動化某些編程任務。

  • 實時信息查詢:結合外部搜索引擎或數據庫,提供即時、準確的信息服務。

  • 復雜問題解決:在需要多步推理和外部工具協助的領域(如科學計算、金融分析)提供解決方案。

  • 大模型研究與開發:作為開放的模型和工具鏈,為研究人員和開發者提供強大的基礎模型和開發平臺,用于探索新的應用和優化。

  • Github倉庫:https://github.com/InternLM/Intern-S1

  • HuggingFace模型庫:https://huggingface.co/internlm/Intern-S1-FP8

  • 官網:https://intern-ai.org.cn/home

Step 3 – 階躍星辰多模態推理模型

簡介

Step 3 是階躍星辰(StepFun AI)發布的新一代基礎大模型,專為推理時代設計。它集高性能與極致成本效益于一體,具備強大的視覺感知和復雜推理能力,旨在成為SOTA(State-of-the-Art)水平的開放生態基礎模型。

核心功能
  • 多模態感知與理解: 具備強大的視覺感知能力,能處理和理解多種模態的信息。
  • 復雜推理: 針對推理時代的需求,擅長進行復雜的邏輯推理。
  • 高性能與高效率: 在保證卓越性能的同時,注重極致的成本效益。
  • 開放生態支持: 作為開放模型,支持開發者和研究人員在其基礎上進行創新。
技術原理

Step 3 采用了先進的MoE(Mixture-of-Experts)架構,這使得模型能夠在大參數量下實現高效的激活參數量,從而平衡性能與計算資源消耗。總參數量達到321B,激活參數量為38B。這種架構有助于模型在不同任務上動態激活最相關的專家網絡,優化資源利用和推理效率。其技術報告進一步詳細闡述了Attention-FFN解耦等優化技術,以實現高吞吐量解碼。

應用場景
  • 智能助理與對話系統: 提供更自然、智能的多模態交互體驗。

  • 視覺內容理解與生成: 應用于圖像識別、視頻分析、內容創作等領域。

  • 復雜問題解決: 在科研、工程、醫療等需要強大推理能力的場景中提供輔助。

  • 開發者工具與平臺: 作為基礎模型,可供開發者在其上構建各類AI應用和服務。

  • https://mp.weixin.qq.com/s/SuAfRxg-GpTz_OIeDzd9-w

  • Github倉庫:https://github.com/stepfun-ai/Step3

Higgs Audio V2 – 開源語音大模型

簡介

Higgs Audio V2是由李沐及其團隊Boson AI開發并開源的語音大模型。它是一個強大的音頻基礎模型,經過超過1000萬小時的音頻數據和多樣化文本數據的預訓練,旨在模擬自然流暢的多人互動場景,并具備生成高質量音頻的能力。

核心功能
  • 多語言對話生成: 能夠生成自然流暢的多語言對話。
  • 自動韻律調整: 自動匹配說話者的韻律和情感。
  • 語音克隆: 具備語音克隆能力,可以復制特定人的聲音。
  • 歌聲合成: 支持歌聲合成功能。
  • 零樣本文本到語音(Zero-shot TTS): 能夠在沒有特定訓練數據的情況下,通過參考文本、參考音頻和目標文本進行文本到語音的轉換。
  • 多人對話生成: 特別優化了模擬多人互動對話場景的能力。
技術原理

Higgs Audio V2采用統一的音頻語言建模方法(unified audio language modeling at scale)。它是一個基于超過1000萬小時的音頻數據和多樣化文本數據進行預訓練的音頻基礎模型。這種大規模的預訓練使其能夠捕捉復雜的語音特征、韻律變化以及多語言和多說話人的交互模式,從而實現自然度高、表現力強的語音生成。模型在多個基準測試中展現出高性能,包括Seed-TTS Eval、Emotional Speech Dataset (ESD)、EmergentTTS-Eval和Multi-speaker Eval。

應用場景
  • 虛擬助手與客服系統: 創建更自然、更具交互性的AI虛擬助手和智能客服。

  • 內容創作: 用于播客、有聲讀物、游戲配音、動畫等領域,快速生成高質量的語音和對話內容。

  • 教育與培訓: 制作多語言教學材料、模擬對話練習,提升學習體驗。

  • 電影與電視制作: 輔助角色配音,實現不同角色間的自然對話,甚至進行歌聲合成。

  • 無障礙輔助: 為有視力障礙的用戶提供文本轉語音服務,或為特定應用提供定制化語音交互。

  • 社交媒體與娛樂: 生成個性化的音頻內容,增強用戶互動體驗,如語音社交、虛擬偶像歌唱等。

  • Github倉庫:https://github.com/boson-ai/higgs-audio

  • 在線體驗Demo:https://huggingface.co/spaces/smola/higgs_audio_v2

OceanBase PowerRAG – 一站式RAG應用開發工具

簡介

OceanBase PowerRAG 是一款由 OceanBase 推出的開箱即用、一站式檢索增強生成(RAG)應用開發工具。它旨在簡化并加速智能應用的開發與上線,打通了RAG應用從數據層、模型層到應用層的全流程,無需復雜的部署和配置,支持將RAG能力無縫集成到各類現有系統中。

核心功能
  • 文檔存儲與拆分: 支持用戶上傳各類文檔(如手冊、郵件、代碼庫等),并自動進行智能文本切分處理,將內容拆分為適合檢索和處理的片段。
  • 向量化嵌入: 將拆分后的文檔片段轉換為向量形式,為后續高效的相似性檢索提供基礎。
  • 向量檢索: 基于向量化嵌入的結果,提供高效的向量檢索能力,能夠快速找到與用戶輸入最相似的文檔片段。
  • 對話(Chat)功能: 支持自然語言交互,用戶通過對話方式提出問題,系統根據檢索到的文檔內容生成精準答案。
  • API 高效調用: 提供強大的API接口,支持與各類系統無縫集成,便于用戶快速構建RAG應用。
技術原理

OceanBase PowerRAG 的核心技術原理是檢索增強生成 (RAG)。它首先通過智能文本切分技術對上傳的文檔進行預處理,將非結構化或半結構化的文本數據轉換為可管理的片段。接著,這些文本片段被向量化嵌入,即轉換為高維向量空間中的數值表示,使得語義相似的文本片段在向量空間中距離更近。當用戶提出查詢時,系統會執行向量檢索,在預先嵌入的知識庫中快速找到與查詢語義最相關的文檔片段。最后,這些檢索到的相關信息會被作為上下文輸入給大型語言模型(LLM),從而生成精準且有依據的答案。整個過程實現了知識庫的動態更新和高效利用,確保了生成內容的準確性和時效性。

應用場景
  • 知識管理: 員工通過自然語言提問,系統檢索企業內部文檔(如手冊、郵件、代碼庫等),生成精準答案,提升工作效率。

  • 企業客服: 根據用戶查詢,系統實時檢索產品文檔、FAQ 或政策,生成具體且上下文相關的回復,提高解決效率并減輕人工客服負擔。

  • 智能問答: 回答用戶開放域問題,通過實時檢索最新或特定知識庫信息,生成準確且有依據的答案。

  • 研究與信息分析: 輔助研究人員快速檢索相關文獻、數據集或新聞,整合信息并生成綜述、分析報告或背景資料,加速調研過程。

  • 專業決策輔助: 在特定領域(如金融、醫療等)為專業人士提供快速、準確的信息支持,輔助決策。

  • 官網:https://www.oceanbase.com/product/powerrag

SuperDesign – 開源AI設計Agent

簡介

SuperDesign是一款開源AI設計Agent,旨在幫助設計師和開發者在集成開發環境(IDE)中直接生成UI原型、組件和線框圖。它通過自然語言輸入驅動設計過程,并能夠并行生成多個設計選項,大幅提升設計迭代效率。

design.png

核心功能
  • AI驅動的UI生成: 能夠根據自然語言描述,自動生成UI原型、組件和線框圖。
  • 多方案并行生成: 支持同時生成并展示多個設計方案,方便用戶進行對比和選擇。
  • IDE集成: 作為IDE(如Cursor, Windsurf)的擴展,允許設計師和開發者在熟悉的工作環境中進行設計操作。
  • 設計迭代與變體創建: 用戶可以輕松地基于現有設計進行分叉(fork)并創建多種變體。
技術原理

SuperDesign的核心技術基于大型語言模型(LLM)和多Agent系統。它可能采用了Qwen3等基礎模型進行開發,通過自然語言處理(NLP)技術解析用戶輸入的設計需求。其“并行生成多個設計選項”的功能,暗示了內部可能運行著多個獨立的AI Agent,每個Agent負責探索不同的設計空間或基于不同的參數生成方案。這種多Agent協作模式結合無限畫布(infinite canva UX)的交互方式,使得設計過程更具探索性和靈活性。項目開源,允許用戶自定義Agent和迭代設計流程。

應用場景
  • 產品原型快速構建: 適用于需要快速驗證設計概念的產品經理和UI/UX設計師。

  • 前端開發輔助: 開發者可以直接在IDE中生成UI組件和布局,加速前端開發流程。

  • 設計探索與創意激發: 通過并行生成多個設計選項,幫助設計師打破思維定式,探索更多可能性。

  • 教育與研究: 作為開源項目,可用于AI設計Agent領域的研究和教學。

  • 項目官網:https://www.superdesign.dev/

  • GitHub倉庫:https://github.com/superdesigndev/superdesign

MonkeyCode – 開源本地AI編程助手

簡介

MonkeyCode 是長亭科技推出的一款企業級智能編程輔助平臺。它專為研發管理設計,支持私有化部署、離線使用,并兼容第三方及本地化大語言模型。MonkeyCode 旨在通過 AI 能力提升研發效率,同時保障代碼質量和數據安全,為企業提供遠超普通AI編程助手的綜合解決方案。

Snipaste_2025-07-29_19-36-57.png

核心功能
  • 智能代碼輔助: 提供代碼補全、自然語言編程等功能,加速開發流程。
  • 代碼安全掃描: 集成代碼安全掃描能力,在編程過程中發現并規避潛在安全風險。
  • 企業級管理面板: 提供強大的管理和審計功能,實現對AI編程行為的嚴格管控和合規性要求。
  • 私有化部署與離線支持: 允許企業將平臺部署在內部環境中,確保代碼和數據的隱私性與安全性,并支持無網絡環境使用。
  • 大模型兼容性: 靈活兼容各類第三方及本地化大語言模型,滿足不同企業的技術棧和定制需求。
技術原理

MonkeyCode 的客戶端插件部分基于 Roo Code 開發,并在此基礎上進行了功能增強與用戶體驗優化。其核心技術原理在于利用先進的 AI 大語言模型(LLM)進行代碼的智能生成、補全、分析與安全檢測。通過私有化部署,確保了企業敏感代碼和數據在本地環境中處理,避免數據外泄風險。平臺通過集成AI模型,能夠實時對編程行為進行分析、輔助和審計,實現高效且安全的軟件開發生命周期管理。

應用場景
  • 高安全需求企業: 適用于對代碼安全、數據隱私有嚴格要求的金融、政務、軍工等行業企業。

  • 內部研發效率提升: 幫助大型企業或研發團隊標準化和加速開發流程,提高整體生產力。

  • 代碼質量管控: 用于對代碼規范性、健壯性和安全性有嚴格要求的場景,通過AI輔助進行質量把控。

  • 離線開發環境: 適用于需要在無互聯網連接或受限網絡環境中進行開發的團隊。

  • 大模型定制與集成: 滿足企業希望將自身訓練的或特定大模型集成到開發工具鏈中的需求。

  • 項目官網:https://monkeycode.docs.baizhi.cloud/welcome

  • GitHub倉庫:https://github.com/chaitin/MonkeyCode

KAT-V1是快手開源的自動思考(AutoThink)大模型

簡介

KAT-V1(Kwaipilot-AutoThink)是快手開源的大型語言模型,旨在解決大型模型推理過程中“過度思考”的問題。該模型擁有40B和200B兩種版本,創新性地融合了思考與非思考能力,使其能夠根據問題的難度自適應地切換推理模式,從而在保持高性能的同時提升效率。其中,40B版本已展現出接近頂尖模型的優異性能。

核心功能
  • 自適應思考模式切換: KAT-V1能夠根據輸入問題的復雜程度,智能地判斷并切換是否需要進行顯式的“思維鏈”(Chain-of-Thought, CoT)推理,或直接給出答案。
  • 緩解過度思考: 通過學習何時進行CoT以及何時直接響應,模型有效避免了不必要的中間推理步驟,提高了推理效率和響應速度。
  • 高性能文本生成: 在數學、代碼生成、常識推理等多個基準測試中,KAT-V1展現出卓越的性能表現。
  • 融合思考與非思考能力: 模型內部集成了兩種處理機制,使其能夠靈活應對不同類型的任務需求。
技術原理

KAT-V1的核心技術原理在于其獨特的“Kwaipilot-AutoThink”架構和兩階段推理范式。

  • Kwaipilot-AutoThink架構: 該架構允許模型學習并控制何時生成顯式的思維鏈(Chain-of-Thought),以及何時直接給出答案。這通常涉及到決策模塊或一種策略學習機制。
  • 兩階段推理范式: 模型首先會評估問題的復雜性和類型,然后決定是否激活CoT推理路徑。對于需要復雜邏輯分解的問題,它會生成詳細的中間步驟;對于簡單或直接的問題,則快速生成結果。
  • CoT與直接回答的動態平衡: 通過在訓練中優化這種平衡,模型旨在減少冗余計算,提升推理效率,同時不犧牲準確性。這可能涉及特定的損失函數設計和訓練策略,以懲罰不必要的CoT生成。
  • 大規模語言模型基礎: 基于400億(40B)和2000億(200B)參數的強大Transformer架構,繼承了大規模預訓練模型的強大語言理解和生成能力。
應用場景
  • 智能問答系統: 能夠更高效、準確地回答用戶提問,尤其是在面對復雜問題時,可提供清晰的推理過程。

  • 代碼輔助開發: 在代碼生成和調試場景中,根據需求提供逐步的解決方案或直接輸出代碼片段。

  • 數學問題求解: 有效處理復雜的數學推理題,通過自適應思考模式提高解題效率和準確率。

  • 通用AI助手: 作為多功能AI助手,在需要不同思考深度的任務中提供靈活、智能的響應。

  • 教育與研究: 作為研究工具,探索大型模型如何更有效地進行推理,并為學生提供帶有解釋的解決方案。

  • HuggingFace模型庫:https://huggingface.co/Kwaipilot/KAT-V1-40B

  • arXiv技術論文:https://arxiv.org/pdf/2507.08297

Agent Lightning – 微軟開源的Agent模型訓練框架

Agent Lightning 是微軟研究團隊推出的靈活可擴展的智能Agent優化框架。框架能無縫集成到任何現有的Agent框架中(如 OpenAI Agents SDK、LangChain 等),基于強化學習等數據驅動技術對代理進行優化,提升其性能和適應性。Agent Lightning 支持多輪交互、多Agent協調和動態上下文管理等復雜場景,提供錯誤監控功能,確保優化過程的穩定性。Agent Lightning 通過解耦Agent開發邏輯與優化邏輯,實現無需修改代理代碼進行模型訓練的目標,為開發者提供強大的工具構建動態、學習型智能Agent

Agent Lightning的技術原理

  • 架構設計:

    1. Lightning Server:管理訓練數據,準備樣本并提供 LLM(語言模型)端點。
    2. Lightning Client:Agent從服務器獲取樣本,處理樣本(涉及與 LLM 交互),將結果(軌跡)返回給服務器。
    3. 非侵入式數據收集:基于 Sidecar 設計,非侵入式地監控 Agent 運行并收集數據(包括執行軌跡、錯誤和獎勵信號)。
  • 強化學習流程:Lightning Server 從任務池中拉取任務并發送給Agent嘗試完成任務。收集的軌跡數據被轉換為標準的轉換元組(state, action, reward, next_state),用在訓練。用強化學習算法(如 GRPO)更新模型,形成緊密的反饋循環。

  • 解耦與靈活性:通過中間層將Agent框架與 RL 訓練系統解耦,支持無縫集成和擴展。能使用多種優化方法(如提示調整、模型選擇等),計劃支持更多優化后端(如 LLaMA-Factory)和代理框架(如 Semantic Kernel)。

  • 項目官網:https://www.microsoft.com/en-us/research/project/agent-lightning/

  • GitHub倉庫:https://github.com/microsoft/agent-lightning

Eigent – CAMEL-AI推出的多智能體Workforce桌面應用

Eigent 是CAMEL-AI 團隊推出的全球首個桌面端多智能體 Workforce 平臺(Multi-agent Workforce)。平臺基于開源項目 CAMEL 和 OWL 構建,支持用戶自定義專屬的 AI 團隊,實現復雜任務的自動化。Eigent 具備多智能體并行執行、人類能隨時介入(Human-in-the-loop)、靈活接入多種工具、100% 開源和本地部署等特點。Eigent 能將復雜的工作流程轉化為自動化的任務,提升工作效率,同時保障數據隱私和可控性。

Snipaste_2025-07-30_19-34-16.png

  • Eigent的技術原理
    多智能體系統架構:Eigent 的核心是多智能體系統,由多個智能體(Agent)組成,每個智能體都有特定的技能和工具。智能體通過協作完成復雜的任務。
    Task Manager Agent:負責任務的拆解和分配策略。
    Coordinator Agent:負責智能體之間的分工和協作。
    Worker Nodes:具體的執行者,負責完成分配給它們的任務。
    并行處理:Eigent 基于并行處理提升任務執行效率。任務被拆分為多個子任務,子任務能同時由不同的智能體執行,不是傳統的單智能體串行執行方式。
    動態任務拆分與重新規劃:在任務執行過程中根據智能體的狀態和任務的進展動態地拆分任務。如果某個智能體遇到問題或任務失敗,系統自動重新規劃任務,甚至創建新的智能體節點完成任務。

  • 如何使用Eigent

    • 訪問 Eigent 官網:訪問 Eigent 官方網站: https://www.eigent.ai/,根據操作系統選擇下載對應版本。
    • 登錄賬戶:按提示完成注冊和登錄。
    • 創建任務:登錄后,點擊“Create New Task”,輸入任務名稱和描述。
    • 選擇或自定義智能體:選擇預定義的智能體或自定義智能體滿足任務需求。
    • 配置任務參數:根據任務需求,輸入關鍵詞、上傳文件或指定其他參數。
    • 啟動任務:配置完成后,點擊“Start Task”按鈕啟動任務。
    • 監控任務進度:在任務管理界面實時查看任務進度,必要時進行人為干預。
    • 查看任務結果:任務完成后,在任務管理界面查看詳細結果。
  • 項目官網:https://www.eigent.ai/

  • GitHub倉庫:https://github.com/eigent-ai/eigent

3. AI-Compass

AI-Compass 致力于構建最全面、最實用、最前沿的AI技術學習和實踐生態,通過六大核心模塊的系統化組織,為不同層次的學習者和開發者提供從完整學習路徑。

  • github地址:AI-Compass👈:https://github.com/tingaicompass/AI-Compass
  • gitee地址:AI-Compass👈:https://gitee.com/tingaicompass/ai-compass

🌟 如果本項目對您有所幫助,請為我們點亮一顆星!🌟

📋 核心模塊架構:

  • 🧠 基礎知識模塊:涵蓋AI導航工具、Prompt工程、LLM測評、語言模型、多模態模型等核心理論基礎
  • ?? 技術框架模塊:包含Embedding模型、訓練框架、推理部署、評估框架、RLHF等技術棧
  • 🚀 應用實踐模塊:聚焦RAG+workflow、Agent、GraphRAG、MCP+A2A等前沿應用架構
  • 🛠? 產品與工具模塊:整合AI應用、AI產品、競賽資源等實戰內容
  • 🏢 企業開源模塊:匯集華為、騰訊、阿里、百度飛槳、Datawhale等企業級開源資源
  • 🌐 社區與平臺模塊:提供學習平臺、技術文章、社區論壇等生態資源

📚 適用人群:

  • AI初學者:提供系統化的學習路徑和基礎知識體系,快速建立AI技術認知框架
  • 技術開發者:深度技術資源和工程實踐指南,提升AI項目開發和部署能力
  • 產品經理:AI產品設計方法論和市場案例分析,掌握AI產品化策略
  • 研究人員:前沿技術趨勢和學術資源,拓展AI應用研究邊界
  • 企業團隊:完整的AI技術選型和落地方案,加速企業AI轉型進程
  • 求職者:全面的面試準備資源和項目實戰經驗,提升AI領域競爭力

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/91203.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/91203.shtml
英文地址,請注明出處:http://en.pswp.cn/web/91203.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SpringCloud之Gateway

SpringCloud之Gateway 官網地址: https://docs.spring.io/spring-cloud-gateway/docs/current/reference/html/#gateway-request-predicates-factories 1. 什么是gateway Spring Cloud Gateway 是Spring Cloud官方推出的第二代網關框架,定位于取代 Net…

關于獲取某目錄及子目錄下所有文件且不包含隱藏文件

最近比較忙,很少寫blog了!!!關于獲取目錄及子目錄下所有文件是常遇到的功能,一般通過遞歸遍歷實現。而生產場景中,一般是遍歷nas上的目錄,在nas上利用File.listFiles(),在linux系統上無法獲取含…

docker可視化管理工具lazydocker

Lazydocker 是一個用 Go 語言編寫的命令行 Docker 管理工具。它提供了一個簡潔、直觀的終端界面,支持鍵盤和鼠標操作,可通過方向鍵與快捷鍵實時查看和管理容器、鏡像、網絡等資源,大幅簡化了原本復雜的命令行操作,提升操作效率。2…

少林寺用什么數據庫?

📢📢📢📣📣📣 作者:IT邦德 中國DBA聯盟(ACDU)成員,15年DBA工作經驗 Oracle、PostgreSQL ACE CSDN博客專家及B站知名UP主,全網粉絲15萬 擅長主流Oracle、MySQL、PG、高斯及…

C語言---萬能指針(void *)、查找子串(strncmp函數的應用)多維數組(一維數組指針、二維數組指針)、返回指針值函數、關鍵字(const)

一、字符串與指針用字符指針指向一個字符串,可以不定義字符數組,而定義字符指針。用字符指針指向字符串中的字符。不能使用指針去改變不能修改的空間。eg1. 運用指針將 src 的內容拷貝到 dest 中去void Strcpy(char *dest, char *src) {while(*src ! \0)…

Keepalived 實戰

一、高可用集群基礎核心概念與指標集群類型:LB(負載均衡):如 LVS、HAProxy、Nginx,提升吞吐量;HA(高可用):保障核心服務(數據庫、Redis)連續性&am…

窗口函數替代子查詢的復雜查詢簡化技巧

窗口函數通過單次掃描完成分析計算,能大幅簡化子查詢結構并提升性能,尤其在排名、累計計算等場景?15。以下是核心優化技巧:一、排名場景替代方案?部門工資排名?傳統子查詢需自連接和聚合計數:sqlSELECT e1.name, e1.salary, (S…

深度學習:預訓練和warm up的區別

“預訓練(Pre-training)”和“Warm-up(預熱)”是深度學習中常見的兩個訓練策略,它們雖然都在訓練初期起作用,但本質和目的完全不同。一、預訓練(Pre-training)1. 定義預訓練是指&…

Apache Ignite中分布式信號量(Distributed Semaphore)的說明和使用示例

這段內容是關于 Apache Ignite 中 分布式信號量(Distributed Semaphore) 的說明和使用示例。我們來一步步解析,幫助你深入理解它的含義和用途。🔹 一、什么是 Semaphore(信號量)? 在并發編程中&…

怎么提升服務器的防攻擊能力!

提升服務器的防攻擊能力需要從??架構設計、技術防護、運維管理??等多維度入手,覆蓋網絡層、系統層、應用層及數據層的安全防護。以下是具體的策略和實踐方法:??一、基礎安全加固:消除自身漏洞??服務器自身的脆弱性是最常見的攻擊入口…

vscode配置rust環境

1.官網下載vscode,安裝 2.vscode命令行運行: Invoke-WebRequest https://win.rustup.rs/x86_64 -OutFile rustup-init.exe然后: .\rustup-init.exe3.驗證 先配置path: $env:Path ";$env:USERPROFILE\.cargo\bin"查看是…

最新版 HarmonyOS NEXT 開發工具安裝教程:如何在 macOS 系統安裝 DevEco Studio 5.0.3 編輯器?

最新版 HarmonyOS NEXT 開發工具安裝教程:如何在 macOS 系統安裝 DevEco Studio 5.0.3 編輯器? 什么是 DevEco Studio? DevEco Studio 是華為為 HarmonyOS 開發的強大集成開發環境(IDE),專為開發 Harmony…

電商項目統一認證方案設計與實戰

1. 微服務網關整合 OAuth2.0 設計思路分析 網關整合 OAuth2.0 有兩種思路,一種是授權服務器生成令牌, 所有請求統一 在網關層驗證,判斷權限等操作;另一種是由各資源服務處理,網關只做請求 轉發 。 比較常用的是第一種&#xf…

學習Markdown

標題一 標題二 標題三 標題四 標題五 標題六這是一段引用文本直接編寫,段落換行是末尾兩個以上的空格+回車 或者在段落后加一個空行 粗體語法:使用兩個星號 ** 或兩個下劃線 __ 包圍文字:這是粗體文字使用星號 這是__粗體文字__使…

劇本殺系統 App 開發:科技賦能,重塑劇本殺游戲體驗

在科技飛速發展的當下,各個行業都在積極尋求與科技的融合,以實現創新和升級。劇本殺行業也不例外,劇本殺系統 App 的開發正是科技賦能的生動體現,它重塑了傳統的劇本殺游戲體驗,為玩家帶來了全新的感受。劇本殺系統 Ap…

wvp-gb28181-pro 只用jar運行

編譯前端后npm install --global yarnyarn --registryhttps://registry.npmjs.org installyarn run build,生成的前端文件,會在wvp-GB28181-pro\src\main\resources\static,因為是在resources中,打maven打包后會一起打到jar中&…

深度學習(魚書)day06--神經網絡的學習(后兩節)

深度學習(魚書)day06–神經網絡的學習(后兩節)一、梯度 像 這樣的由全部變量的偏導數匯總而成的向量稱為梯度(gradient)。 梯度實現的代碼: def numerical_gradient(f, x):h 1e-4 # 0.0001grad…

學習嵌入式的第三十四天-數據結構-(2025.7.29)數據庫

數據庫基礎概念 數據庫是用于存儲和管理海量數據的應用程序,提供數據增刪改查及統計功能(如最大值、最小值、平均數等)。通過SQL語句操作數據,以表格形式管理存儲。 數據庫分類 關系型數據庫 Oracle(大型&#xff0…

STM32——HAL庫

總:STM32——學習總綱 一、簡介 1.1 CMIS簡介 所有廠家為了市場兼容性推出的標準 arm架構 1.2 HAL庫簡介 1.2.1 各種庫優缺點 二、 STM32 Cube固件包 ST公司為CMSIS 中間層開發的pack,包含HAL。 2.1 獲取方式 ST官網:st.com/content/st_c…

數據結構-圖的相關定義

圖-多對多Graph(V,E),圖(頂點Vertex,邊Edge)圖可以沒有邊,只有一個頂點也叫圖,但是單獨的一條邊,或者一個頂點連一條邊,不能叫圖有向圖:無向圖&am…