AI Repos
1、LLM-RL-Visualized
提供100余張原創架構圖,全面涵蓋了 LLM (大語言模型)、VLM (視覺語言模型) 等大模型技術。內容深度解析了訓練算法(如 RL、RLHF、GRPO、DPO、SFT、CoT 蒸餾等)、效果優化策略(如 RAG、CoT)以及強化學習基礎理論。所有圖表均提供高清晰度 SVG 矢量格式,并附有詳盡的文字解釋。項目旨在為學習者和開發者提供清晰、直觀的指引,幫助其深入理解大模型的核心算法與機制,并鼓勵社區成員參與共建,持續完善內容。
2、PosterCraft
PosterCraft 是一個統一框架,專注于生成高質量美學海報,尤其擅長精確文本渲染、抽象藝術無縫集成、引人注目的布局和風格和諧。該框架通過四個關鍵優化階段(文本渲染優化、高質量海報微調、美學文本強化學習和視覺語言反饋)在訓練工作流中實現卓越性能。項目開源了核心模型權重和四個專門數據集,并提供了易于上手的安裝和生成指南及 Gradio Web UI。PosterCraft 在量化評估中表現出色,旨在推動高質量海報生成技術的發展,并已成功集成至 ComfyUI。
3、acp
Agent Communication Protocol (ACP) 是一個開放協議,旨在解決當前 AI 智能體開發中普遍存在的碎片化問題,實現不同框架、團隊和基礎設施之間智能體、應用和人類的無縫多模態通信與協作。ACP 支持發送和接收富文本、代碼、文件和媒體等多種消息類型,提供實時、后臺及流式響應,并支持智能體發現、長期任務協作和狀態共享。該協議是 BeeAI 平臺的核心技術,并通過 DeepLearning.AI 提供入門課程,同時提供 Python 和 TypeScript SDK,便于開發者快速構建和部署兼容 ACP 的智能體及客戶端。
4、Context-Engineering
Context Engineering 是一個開源項目和實踐手冊,旨在超越傳統的“提示工程”,深入探索如何精妙地填充和優化大型語言模型 (LLM) 的整個上下文窗口。項目將上下文設計視為一門“藝術與科學”,借鑒生物學隱喻(從原子到器官再到神經系統),詳細闡述了少樣本學習、記憶系統、檢索增強生成 (RAG)、控制流以及認知工具與提示編程等核心概念。它強調Token 預算優化、信息持久化與共振,并引入了神經網絡場論和符號機制等前沿研究,提供豐富的代碼示例、指南和可復用模板,旨在幫助開發者構建更健壯、高效和智能的 AI 系統。
AI News
1、南京大學研究突破:大語言模型內源性獎勵機制的理論證明與應用
南京大學周志華教授團隊近日發布重要研究,首次理論證明大語言模型中存在內源性獎勵模型,并可通過強化學習有效提升模型表現。這一發現為獎勵模型的構建提供了新思路,減少了對人類標注數據的依賴,有望降低開發成本并推動AI技術的更廣泛應用。
2、Step-Audio-AQAA開源:端到端語音大模型引領人機交互
Step-Audio團隊開源了Step-Audio-AQAA,這是一款能夠直接從原始音頻輸入生成自然流暢語音輸出的端到端語音大模型。該模型由雙碼本音頻標記器、骨干LLM和神經聲碼器三大核心模塊組成,顯著提升了人機音頻交互的流暢性和自然度。這一技術的推出,不僅為研究者提供了強大的工具,也為未來智能語音應用的發展奠定了堅實的基礎。
3、Cloudflare推出’按爬蟲付費’市場,重塑AI與出版者關系
Cloudflare近日宣布推出’按爬蟲付費’市場,旨在幫助內容出版者更好地控制其內容,并為AI公司提供公平的內容抓取方式。這一創新模式允許網站擁有者設定抓取費率或完全阻止爬蟲,為出版者提供了新的收入來源。此舉響應了新聞出版行業面臨的挑戰,特別是在AI爬蟲抓取頻率激增的背景下。Cloudflare還宣布新建網站默認阻止AI爬蟲,需單獨授權,得到了多家大型出版商的支持。
4、百度AIDAY重磅發布:自研視頻生成模型MuseSteamer與平臺“繪想”
在百度AIDAY科技開放日上,百度商業研發團隊推出了自研視頻生成模型MuseSteamer和視頻產品平臺“繪想”,標志著百度在AIGC領域特別是視頻創作方面的重要進展。這兩項創新成果旨在降低視頻創作門檻,提升內容生產效率,展現了百度在AI技術賦能商業應用方面的持續投入與布局。
5、智譜獲10億元戰略投資,發布GLM-4.1V-Thinking模型及MaaS Agent聚合平臺
浦東創投集團和張江集團聯合向智譜進行10億元戰略投資,首筆交割已完成。智譜CEO張鵬在大會上宣布了兩項新成果:開源發布新一代通用視覺語言模型GLM-4.1V-Thinking,以及上線MaaS Agent聚合平臺’應用空間’。此外,智譜還啟動了數億元的Agent開拓者專項扶持計劃,以促進Agent生態的發展。
6、X平臺革新社交網絡:AI聊天機器人將生成社區筆記,提升信息透明度
社交平臺X(原Twitter)宣布試點新功能,允許AI聊天機器人生成社區筆記,旨在提升信息的準確性與透明度。這一功能源自Twitter的社區筆記系統,經過優化后,AI生成的內容將接受與用戶提交內容相同的審核程序。盡管AI在事實核查中存在爭議,但X平臺計劃利用Grok技術和其他API接口,結合人類審核,以確保內容質量。此功能已引起Meta、TikTok和YouTube等平臺的關注,并可能引領行業新趨勢。
文章內容引用自:jungleBlog