谷歌開源單個 GPU 可運行的Gemma 3 模型,27B 超越 671B 參數的 DeepSeek

自從 DeepSeek 把訓練成本打下來之后,各個模型廠家現在不再堆參數進行模型的能力對比。而是轉向了訓練成本優化方面,且還要保證模型能力不減反增的效果。包括使用較少的模型參數,降低 GPU 使用數量,降低模型內存占用等等技術手段。這里可以查看?DeepSeek 開源周發布的優化策略。

谷歌正式發布了全新一代 AI 模型 Gemma 3!這可不是簡單的升級,而是用了 Gemini 2.0 同款技術打造的 最先進、最便攜、最負責任的開放模型!啥意思?簡單說,就是性能更強、體積更小、更安全!更重要的是,它能在各種設備上 飛速運行,從你的手機、筆記本到專業工作站,都能輕松駕馭!Gemma 3 有多種尺寸(1B、4B、12B 和 27B),可以根據特定的硬件和性能需求選擇最佳模型。

Gemma 3 是多模態的!40 億、120 億和 270 億個參數模型可以處理圖像和文本,而 1B 版本只能處理文本。對于 1B 版本,輸入上下文窗口長度已從 Gemma 2 的 8k 增加到32k ,對于其他所有版本,則增加到 128k。與其他 VLM(視覺語言模型)一樣,Gemma 3 會根據用戶輸入生成文本,這些文本可能由文本組成,也可能由圖像組成。

與 Gemma2 相比,雖然模型參數沒有增加,但是上下文長度增加到了 128K,而且還是一個多模態的模型,不僅識別文本,還支持圖片與視頻內容的交互。更是支持了 140 種語言能力,簡直不要太強大。

Gemma 3 性能特點?

  1. 性能怪獸,單卡 GPU 就能起飛! Gemma 3 在 LMArena 排行榜上直接超越了 Llama3、DeepSeek 等一眾大佬!這意味著在單個 GPU 或 TPU 上,就能創建絲滑流暢的 AI 體驗!
  2. 140 種語言精通,走遍全球都不怕! 別再擔心語言障礙!Gemma 3 開箱即用支持超過 35 種語言,預訓練更是覆蓋 140 多種語言!
  3. 文能識圖寫詩,武能函數調用! 輕松搞定圖片、文本、短視頻分析,開啟交互式智能新紀元!函數調用也安排上了,自動執行任務、構建智能 Agent,不在話下!
  4. 海量信息輕松應對! 128k Token 上下文窗口,再復雜的任務,再多的信息,都能 hold 住!
  5. 官方量化版本,性能加速! 體積更小,計算更快,精度還不變!簡直是為移動端量身定制!

一張圖告訴你 Gemma 3 有多強:

看到了嗎?Gemma 3 (27B) 在眾多 AI 模型中脫穎而出!而且只需要一個 GPU,而其他模型可能需要多達 32 個!不僅如此,27B 參數的模型竟然超過了 671B 參數的 DeepSeek V3 模型,簡直不要太好用。這么小參數量的模型,完全可以跑在自己電腦上面了。普通電腦配置也能跑大模型了。

Gemma3 性能在最優點

安全第一,谷歌這次玩真的!

谷歌深知開放模型需要謹慎的風控!Gemma 3 經歷了嚴格的安全評估,包括數據管理、安全微調和基準評估。即使是增強的 STEM 性能也經過了特定評估,以確保濫用風險較低。

ShieldGemma 2:為圖像應用保駕護航!

除了 Gemma 3,谷歌還推出了 ShieldGemma 2!這是一個基于 Gemma 3 構建的強大圖像安全檢查器,能夠識別“危險內容、色情和暴力”!而且它是開源的,開發者可以根據需求進行定制!

Gemma 3 評估

在 LMSys Chatbot Arena 上,Gemma 3 27B IT 的 Elo 分數為1339,躋身前 10 個最佳模型之列,包括領先的封閉模型。Elo 與 o1-preview 相當,并且高于其他非思考開放模型。與表中的其他 LLM 一樣,Gemma 3 僅處理文本輸入即可獲得此分數。

Gemma 3 已通過 MMLU-Pro(27B:67.5)、LiveCodeBench(27B:29.7)和 Bird-SQL(27B:54.4)等基準測試進行評估,與封閉式 Gemini 模型相比,其性能更具競爭力。GPQA Diamond(27B:42.4)和 MATH(27B:69.0)等測試凸顯了其推理和數學技能,而 FACTS Grounding(27B:74.9)和 MMMU(27B:64.9)則展示了強大的事實準確性和多模態能力。然而,它在 SimpleQA(27B:10.0)的基本事實方面落后。與 Gemini 1.5 模型相比,Gemma 3 通常很接近,有時甚至更好,證明了其作為可訪問、高性能選項的價值。

無縫集成,即刻上手!

Gemma 3 和 ShieldGemma 2 可以輕松集成到你現有的工作流程中!支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch 等等!

#使用管道進行推理
import torch
from transformers import pipeline
pipe = pipeline("image-text-to-text",model="google/gemma-3-4b-it", # "google/gemma-3-12b-it", "google/gemma-3-27b-it" device="cuda",torch_dtype=torch.bfloat16)
messages = [{ "role": "user","content": [{"type": "image", "url": "candy.JPG"},{"type": "text", "text": "What animal is on the candy?"}]}]
output = pipe(text=messages, max_new_tokens=200)
print(output[0]["generated_text"][-1]["content"])

糖果上是什么動物?
讓我們分析一下圖片中的糖果吧!糖果上的動物是一只烏龜。
你可以清楚地看到龜殼和烏龜的頭和腿印在表面上。

使用 Transformer 進行推理

Transformer集成有兩個新的模型類:


Gemma3ForConditionalGeneration:適用于4B、12B和27B視覺語言模型。

Gemma3ForCausalLM:對于 1B 純文本模型

import torch
from transformers import AutoProcessor, Gemma3ForConditionalGeneration
ckpt = "google/gemma-3-4b-it"
model = Gemma3ForConditionalGeneration.from_pretrained(ckpt, device_map="auto", torch_dtype=torch.bfloat16,)
processor = AutoProcessor.from_pretrained(ckpt)
messages = [{"role": "user","content": [{"type": "image", "url": "password.jpg"},{"type": "text", "text": "What is the password?"}]}]
inputs = processor.apply_chat_template(messages, add_generation_prompt=True, tokenize=True,return_dict=True, return_tensors="pt"
).to(model.device)
input_len = inputs["input_ids"].shape[-1]
generation = model.generate(**inputs, max_new_tokens=100, do_sample=False)
generation = generation[0][input_len:]
decoded = processor.decode(generation, skip_special_tokens=True)
print(decoded)

密碼是什么?
根據圖片,密碼是aaeu

在線體驗

Gemma 3 不僅可以使用代碼進行執行,或者使用 ollama進行本地部署,若不想占用本地資源,也可以在線使用。可以直接在 hugging face 上面使用,當然也可以使用 Google studio 上面使用。

Gemmaverse 生態,無限可能!

谷歌還鼓勵社區基于 Gemma 構建各種應用和工具,形成一個龐大的 Gemmaverse 生態! AI Singapore 的 SEA-LION v3 打破語言障礙,促進了東南亞地區的交流;INSAIT 的 BgGPT 是首個保加利亞語大型語言模型;Nexa AI 的 OmniAudio 展示了設備內置 AI 的潛力!

Gemma 3 的發布,標志著 AI 技術民主化的又一里程碑!它將強大的 AI 能力帶到了每個人的指尖,讓開發者能夠創造出更多創新應用,改變我們的生活!不僅參數少,模型小,還可以在單個 GPU 上面運行,普通電腦也可以直接跑大模型了,而 DeepSeek 系列的模型需要 32 個 GPU,不是普通玩家玩的模型。

huggingface.co/blog/gemma3
blog.google/technology/developers/gemma-3/頭條號:人工智能研究所
v號:啟示AI科技

?動畫詳解transformer? 在線教程?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/75672.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/75672.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/75672.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

回歸預測 | Matlab實現NRBO-Transformer-LSTM多輸入單輸出回歸預測

回歸預測 | Matlab實現NRBO-Transformer-LSTM多輸入單輸出回歸預測 目錄 回歸預測 | Matlab實現NRBO-Transformer-LSTM多輸入單輸出回歸預測預測效果基本介紹程序設計參考資料 預測效果 基本介紹 1.【JCR一區級】Matlab實現NRBO-Transformer-LSTM多輸入單輸出回歸預測&#xf…

Photoshop 2025 Mac中文Ps圖像編輯

Photoshop 2025 Mac中文Ps圖像編輯 文章目錄 Photoshop 2025 Mac中文Ps圖像編輯一、介紹二、效果三、下載 一、介紹 Adobe Photoshop 2025 Mac版集成了多種強大的圖像編輯、處理和創作功能。①強化了Adobe Sensei AI的應用,通過智能摳圖、自動修復、圖像生成等功能…

7. 記憶(Memory)機制:讓AI擁有“短期記憶”與“長期記憶”

引言:當AI學會"記住你" 2025年某銀行智能客服因無法記住用戶身份,每次對話都要求重復驗證,引發大量投訴。引入LangChain 記憶系統后,客戶滿意度提升62%。本文將基于MemorySaver與FAISS本地存儲,教你構建符合…

【Python使用】嘿馬云課堂web完整實戰項目第3篇:增加數據,修改數據【附代碼文檔】

教程總體簡介:項目概述 項目背景 項目的功能構架 項目的技術架構 CMS 什么是CMS CMS需求分析與工程搭建 靜態門戶工程搭建 SSI服務端包含技術 頁面預覽開發 4 添加“頁面預覽”鏈接 頁面發布 需求分析 技術方案 測試 環境搭建 數據字典 服務端 前端 數據模型 頁面原…

論文筆記(七十五)Auto-Encoding Variational Bayes

Auto-Encoding Variational Bayes 文章概括摘要1 引言2 方法2.1 問題場景2.2 變分下界2.3 SGVB估計器與AEVB算法2.4 重參數化技巧 3 示例:變分自編碼器(Variational Auto-Encoder)4 相關工作5 實驗6 結論7 未來工作 文章概括 引用&#xff1…

Python3 學習筆記

Python3 簡介 | 菜鳥教程 一 Python3 簡介 Python 是一個高層次的結合了解釋性、編譯性、互動性和面向對象的腳本語言。 Python 的設計具有很強的可讀性,相比其他語言經常使用英文關鍵字,其他語言的一些標點符號,它具有比其他語言更有特色…

Java實現N皇后問題的雙路徑探索:遞歸回溯與迭代回溯算法詳解

N皇后問題要求在NN的棋盤上放置N個皇后,使得她們無法互相攻擊。本文提供遞歸和循環迭代兩種解法,并通過圖示解釋核心邏輯。 一、算法核心思想 使用回溯法逐行放置皇后,通過沖突檢測保證每行、每列、對角線上只有一個皇后。發現無效路徑時回退…

前端判斷值相等的方法和區別

1. (寬松相等) 在比較之前會進行類型轉換 可能導致一些意外的結果 0 // true 0 0 // true false 0 // true null undefined // true [1,2,3]1,2,3 // true2. (嚴格相等) 不進行類型轉換 類型和值都必須相同 0 // false 0 0 // false false 0 /…

Socket編程UDP

Socket編程UDP 1、V1版本——EchoServer2、網絡命令2.1、ping2.2、netstat2.3、pidof 3、驗證UDP——Windows作為client訪問Linux4、V2版本——DictServer5、V3版本——簡單聊天室 1、V1版本——EchoServer 首先給出EchoServer目錄結構:服務器的類我們實現在UdpServ…

輔助查詢是根據查詢到的文檔片段再去生成新的查詢問題

💡 輔助查詢是怎么來的? 它是基于你當前查詢(query)檢索到的某個文檔片段(chunk_result),再去“反推”出新的相關問題(utility queries),這些問題的作用是&a…

2025 年 4 月補丁星期二預測:微軟將推出更多 AI 安全功能

微軟正在繼續構建其 AI 網絡安全戰略,并于本月宣布在 Microsoft Security Copilot 中引入新代理。 他們引入了用于網絡釣魚分類的代理、用于數據丟失預防和內部風險管理的警報分類、條件訪問優化、漏洞修復和威脅情報簡報。 這些代理的目標是不斷從這些不同學科中…

【LLM系列】1.大模型簡介

1. 基礎 1.1 如何權衡模型的復雜度和性能? ├── a. 模型架構選擇 │ ├── 簡化架構 │ │ └── 選擇較小的網絡層數和寬度,降低復雜度; │ │ 可使用高性能基礎模型如 Transformers 作為起點,根據需求縮放模型。 │ └──…

【leetcode】記錄與查找:哈希表的題型分析

前言 🌟🌟本期講解關于力扣的幾篇題解的詳細介紹~~~ 🌈感興趣的小伙伴看一看小編主頁:GGBondlctrl-CSDN博客 🔥 你的點贊就是小編不斷更新的最大動力 🎆那么廢話不…

優選算法的妙思之流:分治——快排專題

專欄:算法的魔法世界 個人主頁:手握風云 目錄 一、快速排序 二、例題講解 2.1. 顏色分類 2.2. 排序數組 2.3. 數組中的第K個最大元素 2.4. 庫存管理 III 一、快速排序 分治,簡單理解為“分而治之”,將一個大問題劃分為若干個…

二叉樹的ACM板子(自用)

package 二叉樹的中序遍歷;import java.util.*;// 定義二叉樹節點 class TreeNode {int val; // 節點值TreeNode left; // 左子節點TreeNode right; // 右子節點// 構造函數TreeNode(int x) {val x;} }public class DMain {// 構建二叉樹(層序遍歷方式&…

Linux常用命令詳解:從基礎到進階

目錄 一、引言 二、文件處理相關命令 (一)grep指令 (二)zip/unzip指令 ?編輯 (三)tar指令 (四)find指令 三、系統管理相關命令 (一)shutdown指…

Qt多線程從基礎到性能優化

一、為什么需要多線程開發 現代應用程序的性能需求 CPU多核架構的有效利用 復雜任務的解耦與響應式界面保持 二、Qt線程創建四大方式 1. 繼承QThread重寫run() class WorkerThread : public QThread {void run() override {// 耗時操作qDebug() << "Thread ID…

【java】在 Java 中,獲取一個類的`Class`對象有多種方式

在 Java 中&#xff0c;獲取一個類的Class對象有多種方式。Class對象代表了 Java 中的一個類或接口的運行時類信息&#xff0c;可以用于反射操作。以下是獲取Class對象的幾種常見方法&#xff1a; 1.使用.class屬性 每個類都有一個.class屬性&#xff0c;可以直接獲取該類的Cl…

什么是RPC通信

RPC&#xff08;Remote Procedure Call&#xff0c;遠程過程調用&#xff09;通信是一種允許程序像調用本地函數一樣調用遠程服務器上函數的通信技術。它簡化了分布式系統中的網絡交互&#xff0c;隱藏了底層網絡通信的復雜性&#xff0c;使開發者能夠專注于業務邏輯。 一、RPC…

還是主題混合程序設計

以下是針對您現有代碼的完整主題化改造方案&#xff0c;實現跨QML/Qt Widgets的陰影主題系統&#xff1a; 一、主題管理系統核心 // thememanager.h #pragma once #include <QObject> #include <QColor> #include <QMap> #include <QQmlEngine>class…