[250411] Meta 發布 Llama 4 系列 AI 模型 | Rust 1.86 引入重大語言特性

目錄

    • Llama 4 家族登場:開啟原生多模態 AI 創新新紀元
    • Rust 1.86.0 版本發布亮點
      • 主要新特性與改進
      • 其他重要信息

Llama 4 家族登場:開啟原生多模態 AI 創新新紀元

Meta AI 近日發布了其最新、最先進的 Llama 4 系列人工智能模型,標志著 AI 技術進入了一個原生支持多種信息類型(文本、圖像、視頻)的新時代。這些模型旨在推動更加個性化、智能化的 AI 體驗。

請添加圖片描述

核心亮點:

  • 原生多模態能力: Llama 4 模型從一開始就設計為能夠同時理解和處理文本、圖像及視頻信息,實現更自然的交互。
  • 開放可用: Llama 4 系列中的 Scout 和 Maverick 模型已開放權重,供全球開發者和研究人員下載使用,共同構建 AI 的未來。
  • 卓越性能與效率: 采用了創新的“混合專家”(MoE)架構,模型在保持強大能力的同時,訓練和運行更高效。

Llama 4 模型家族介紹:

  1. Llama 4 Scout:

    • 定位: 高效、強大的入門級模型。
    • 特點: 擁有 170 億活躍參數和 16 位專家,性能超越所有前代 Llama 模型及同級別的 Gemma 3、Gemini 2.0 Flash-Lite 等。
    • 突破: 提供業界領先的 1000 萬 token 超長上下文窗口,能處理極長的文檔或對話歷史。
    • 部署: 經過優化,可在單塊 NVIDIA H100 GPU 上運行。
  2. Llama 4 Maverick:

    • 定位: 性能領先的旗艦級模型。
    • 特點: 擁有 170 億活躍參數和 128 位專家,在多項基準測試中擊敗了 GPT-4o 和 Gemini 2.0 Flash,并在推理和編碼方面媲美 DeepSeek v3,但活躍參數更少。
    • 優勢: 實現了頂尖的性能與成本效益比,特別擅長精確的圖像理解和創意寫作。
    • 部署: 可在單個 H100 主機上運行。
  3. Llama 4 Behemoth (預覽):

    • 定位: 超大規模的“教師”模型,目前仍在訓練中。
    • 特點: 擁有 2880 億活躍參數和近 2 萬億總參數,是 Meta AI 迄今最強大的模型之一,在多個科學、技術、工程和數學 (STEM) 基準測試中超越了 GPT-4.5、Claude Sonnet 3.7 等頂尖模型。
    • 作用: 其強大的能力被用于“教導”Scout 和 Maverick 模型,顯著提升了它們的質量。

關鍵技術進步(非技術解讀):

  • 更懂世界: 通過“早期融合”技術,模型能更好地結合文本和視覺信息進行理解。
  • 更廣知識: 使用了超過 30 萬億 token(包括文本、圖像、視頻)的數據進行訓練,涵蓋 200 種語言,多語言能力大幅提升。
  • 更強能力: 經過專門的“中段訓練”和優化的“后訓練”流程,模型在推理、編碼、數學和對話能力上得到顯著增強。
  • 更長記憶: Scout 模型的超長上下文處理能力(1000 萬 token)得益于創新的 iRoPE 架構和注意力機制優化。

安全與責任:

  • Llama 4 的開發過程集成了多層安全措施,從數據過濾到模型訓練,再到提供給開發者的可調安全工具(如 Llama Guard、Prompt Guard),旨在防范有害內容和濫用。
  • 通過自動化和人工的對抗性測試(紅隊測試,包括新的 GOAT 方法)來發現并修復潛在風險。
  • 致力于減少模型偏見,特別是在有爭議的社會政治話題上,Llama 4 在保持中立、理解多方觀點方面相比 Llama 3 有顯著改進,拒絕回答敏感問題的比例降低,觀點平衡性更好。

如何體驗與獲取:

  • 立即試用: 用戶可以通過 Meta AI 助手(在 WhatsApp, Messenger, Instagram Direct 及 Meta.AI 網站)體驗由 Llama 4 驅動的最新功能。
  • 開發者獲取: Llama 4 Scout 和 Maverick 模型可在 Llama 官網 (llama.com) 和 Hugging Face 平臺下載。未來幾天也將通過各大云平臺和合作伙伴提供。

Llama 4 的發布為 AI 應用開辟了新的可能性,有望帶來更智能、更個性化、更安全的 AI 體驗。

來源:

https://ai.meta.com/blog/llama-4-multimodal-intelligence/

Rust 1.86.0 版本發布亮點

Rust 團隊榮幸地宣布 Rust 1.86.0 正式發布!Rust 是一種致力于讓每個人都能構建可靠、高效軟件的編程語言。此版本帶來了多項備受期待的功能和改進。

可以通過 rustup update stable 命令更新到最新版本。

主要新特性與改進

  • Trait 向上轉型 (Trait Upcasting) 穩定化

    • 這是一項期待已久的功能,現在可以將一個 Trait 對象(如 &dyn Trait)安全地向上轉換為其父 Trait 的對象(如 &dyn Supertrait)。
    • 這簡化了之前需要變通方法(如添加 as_supertrait 方法)的代碼,尤其在與 dyn Any 配合進行類型向下轉換時非常有用。
  • HashMap 與切片支持同時獲取多個可變元素

    • 新增了 get_disjoint_mut 方法,允許從 HashMap 或切片中安全地同時獲取多個不相交元素的可變引用,解決了之前借用檢查器對此類操作的限制。
    • 示例:v.get_disjoint_mut([0, 2]) 可以同時獲取索引 0 和 2 處元素的可變引用。
  • 允許為安全函數添加 #[target_feature] 屬性

    • 現在可以在 safe fn 上使用 #[target_feature] 屬性,用于編寫依賴特定 CPU 特性(如 AVX2)但本身邏輯安全的代碼。
    • 這些函數只能在同樣標記了該屬性的函數中安全調用,或在確認 CPU 支持該特性后的 unsafe 塊中調用。
  • 調試模式下增加指針非空斷言

    • 在啟用調試斷言(debug assertions)的構建中,編譯器會插入運行時檢查,確保在對指針進行解引用或再借用為引用時,指針值不為 null。
    • 這有助于在開發階段更早地發現潛在的空指針錯誤,但不應依賴此特性保證發布版本的健全性。
  • missing_abi Lint 默認級別提升為警告

    • extern 塊或 extern fn 中省略 ABI(如 extern {})現在會產生警告。
    • 推薦顯式指定 ABI,例如 extern "C" {}extern "C" fn

其他重要信息

  • 目標平臺棄用預告:計劃在 Rust 1.87.0 版本中移除對 i586-pc-windows-msvc 目標的支持。建議使用此目標的用戶遷移到 i686-pc-windows-msvc

  • API 穩定化:本次更新穩定了多項 API,包括:

    • 浮點數的 next_down / next_up 方法。
    • 切片和 HashMapget_disjoint_mut 系列方法。
    • Vec::pop_if
    • sync::Once::wait / wait_forcesync::OnceLock::wait
    • 多個 API(如 hint::black_box, str::split_at 等)現在可以在 const 上下文中使用。
  • 更多詳情:可以查閱 Rust、Cargo 和 Clippy 的詳細更新日志,了解所有變更。

Rust 1.86.0 的發布離不開眾多貢獻者的努力。感謝所有參與其中的人!

來源:

https://blog.rust-lang.org/2025/04/03/Rust-1.86.0.html

更多內容請查閱 : blog-250411

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/76883.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/76883.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/76883.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ArrayList 和 數組 的區別

定義與本質 數組:是 Java 語言內置的數據結構,是存儲相同類型元素的連續內存空間。它是一個基本的語言特性,在內存中是一塊連續的區域。ArrayList:是 Java 集合框架中的一個類,屬于動態數組。它是基于數組實現的&#…

??FireCrawl?爬蟲工具?, Craw4ai

?FireCrawl?是一款開源的AI爬蟲工具,專門用于Web數據提取,并將其轉換為Markdown格式或其他結構化數據。FireCrawl特別適合處理使用JavaScript動態生成的網站,能夠自動抓取網站及其所有可訪問的子頁面內容,并將其轉換為適合大語言…

通信原理-非線性調制

今天給大家帶來的是關于通信原理中非線性調制的內容,一起來看看吧!!! 1.角度調制 2.FM與PM的區別 3.單音調制FM 4.窄帶調頻 5.寬帶調頻 5.1FM信號的頻譜 5.2FM信號的帶寬 5.3FM信號的功率分配 6.FM信號的產生與解調 6.1FM信號的產生 6.2FM…

文心一言開發指南03——千帆大模型平臺產品優勢

版權聲明 本文原創作者:谷哥的小弟作者博客地址:http://blog.csdn.net/lfdfhl 千帆大模型平臺作為百度智能云推出的企業級大模型一站式平臺,具有顯著的產品優勢。千帆大模型平臺以其基礎強大、流程完善、運行穩定和安全可靠的產品優勢成為企…

mysql DQL

一.基本查詢 1.查詢多個字段 2.查看所有字段 3.設置別名 4.去除重復記錄 二.條件查詢 1.大于小于等于 2.查詢 身份證為空的 沒有所以沒有記錄 3.在15到20這個區間范圍內 4.or/in 或者 4.like 匹配 (_匹配單個字符 %匹配多個字符) 查詢員工信…

關于 軟件開發模型 的分類、核心特點及詳細對比分析,涵蓋傳統模型、迭代模型、敏捷模型等主流類型

以下是關于 軟件開發模型 的分類、核心特點及詳細對比分析,涵蓋傳統模型、迭代模型、敏捷模型等主流類型: 一、軟件開發模型分類及核心特點 1. 瀑布模型(Waterfall Model) 核心特點: 線性階段劃分:需求分…

2025年第十六屆藍橋杯省賽C++ A組真題

2025年第十六屆藍橋杯省賽C A組真題 1.說明2.題目A:尋找質數(5分)3.題目B:黑白棋(5分)4. 題目C:抽獎(10分)5. 題目D:紅黑樹(10分)6. 題…

JVM初探——走進類加載機制|三大特性 | 打破雙親委派SPI機制詳解

目錄 JVM是什么? 類加載機制 Class裝載到JVM的過程 裝載(load)——查找和導入class文件 鏈接(link)——驗證、準備、解析 驗證(verify)——保證加載類的正確性 準備(Prepare&…

分布式微服務系統架構第106集:jt808,補充類加載器

加群聯系作者vx:xiaoda0423 倉庫地址:https://webvueblog.github.io/JavaPlusDoc/ https://1024bat.cn/ 類加載器 類與類加載器 判斷類是否“相等” 任意一個類,都由加載它的類加載器和這個類本身一同確立其在 Java 虛擬機中的唯一性&#xf…

利用 pyecharts 實現地圖的數據可視化——第七次人口普查數據的2d、3d展示(關鍵詞:2d 、3d 、map、 geo、漣漪點)

參考文檔:鏈接: link_pyecharts 官方文檔 1、map() 傳入省份全稱,date_pair 是列表套列表 [ [ ],[ ] … ] 2、geo() 傳入省份簡稱,date_pair 是列表套元組 [ ( ),( ) … ] 1、準備數據 population_data:簡稱經緯度 population_da…

Enovia許可釋放

隨著企業規模的擴大和業務的不斷增長,Enovia許可證的管理變得至關重要。在許多情況下,企業可能面臨許可證資源浪費或不足的問題。為了解決這一問題,Enovia提供了許可釋放功能,幫助企業更加靈活地管理和使用許可證資源。本文將介紹…

每日一道leetcode(回來了!!!)

236. 二叉樹的最近公共祖先 - 力扣(LeetCode) 題目 給定一個二叉樹, 找到該樹中兩個指定節點的最近公共祖先。 百度百科中最近公共祖先的定義為:“對于有根樹 T 的兩個節點 p、q,最近公共祖先表示為一個節點 x,滿足…

【Redis】布隆過濾器應對緩存穿透的go調用實現

布隆過濾器 https://pkg.go.dev/github.com/bits-and-blooms/bloom/v3 作用: 判斷一個元素是不是在集合中 工作原理: 一個位數組(bit array),初始全為0。多個哈希函數,運算輸入,從而映射到位數…

【ROS2】行為樹 BehaviorTree(四):組合使用子樹

1、大樹調用子樹 如下圖,左邊為大樹主干: 1)如果門沒有關,直接通過; 2)如果門關閉了,執行開門動作,然后通過 右邊為子樹,主要任務是開門 1)嘗試直接開門; 2)嘗試開鎖開門,最多嘗試5次; 3)最后嘗試砸門! XML如何描述大樹主干調傭子樹:使用關鍵字 SubTree 來…

【口腔粘膜鱗狀細胞癌】文獻閱讀

寫在前面 看看文章,看看有沒有思路 文獻 The regulatory role of cancer stem cell marker gene CXCR4 in the growth and metastasis of gastric cancer IF:6.8 中科院分區:1區 醫學WOS分區: Q1 目的:通過 scRNA-seq 結合大量 RNA-seq 揭示癌癥干細胞…

【ComfyUI】藍耘元生代 | ComfyUI深度解析:高性能AI繪畫工作流實踐

【作者主頁】Francek Chen 【專欄介紹】 ? ? ?人工智能與大模型應用 ? ? ? 人工智能(AI)通過算法模擬人類智能,利用機器學習、深度學習等技術驅動醫療、金融等領域的智能化。大模型是千億參數的深度神經網絡(如ChatGPT&…

深入理解Java中的隊列:核心操作、實現與應用

隊列(Queue)是計算機科學中最基礎且重要的數據結構之一,遵循 先進先出(FIFO) 的規則。Java通過java.util.Queue接口及其豐富的實現類為開發者提供了強大的隊列工具。本文將詳細解析Java隊列的核心操作、常見實現類及其…

idea里面不能運行 node 命令 cmd 里面可以運行咋回事啊

idea里面不能運行 node 命令 cmd 里面可以運行咋回事啊 在 IntelliJ IDEA(或其他 JetBrains 系列 IDE)中無法運行某些命令,但在系統的命令提示符(CMD)中可以正常運行,這種情況通常是由于以下原因之一導致的…

Express學習筆記(六)——前后端的身份認證

目錄 1. Web 開發模式 1.1 服務端渲染的 Web 開發模式 1.2 服務端渲染的優缺點 1.3 前后端分離的 Web 開發模式 1.4 前后端分離的優缺點 1.5 如何選擇 Web 開發模式 2. 身份認證 2.1 什么是身份認證 2.2 為什么需要身份認證 2.3 不同開發模式下的身份認證 3. Sessio…