谷歌發布文本嵌入模型EmbeddingGemma（附部署方式）

谷歌發布文本嵌入模型EmbeddingGemma（附部署方式）

news/2025/9/9 6:33:59/文章來源:https://blog.csdn.net/qq363685855/article/details/151327431

EmbeddingGemma是谷歌于2025年9月開源的開放式文本嵌入模型，專為端側設備設計，具備以下核心優勢：

性能優勢

在MTEB基準測試中，EmbeddingGemma在500M以下參數規模的多語言文本嵌入模型中表現最佳，性能接近參數翻倍的頂尖模型（如Qwen-Embedding-0.6B）。該模型已針對100多種語言進行訓練，并經過量化處理，可在低于200MB內存的設備上運行。 ?

端側適配能力

支持手機、筆記本等設備的離線運行，提供可自定義的輸出尺寸和2K令牌上下文窗口。其設計初衷是與Gemma 3n配合使用，共同推動移動端RAG（檢索增強生成）和語義搜索的應用。 ?

工具集成性

可與sentence-transformers、llama.cpp、MLX等工具無縫對接，簡化開發者上手難度。 ?

參數與特性

模型擁有3.08億參數，斷網環境下可生成高質量嵌入向量，用于提升文本語義表征精度。其設計注重隱私保護，生成的嵌入向量能有效保留語言細微差異。

部署方式

Ollama部署：

執行下面代碼：

ollama run dengcao/EmbeddingGemma

ollama模型庫：https://ollama.com/dengcao/EmbeddingGemma

?魔搭：https://modelscope.cn/models/google/embeddinggemma-300m

Hugging Face地址：https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/921619.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/921619.shtml
英文地址，請注明出處：http://en.pswp.cn/news/921619.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

CPU調度——調度的目標

CPU調度——調度的目標

2.2.2　調度的目標當系統中“想運行”的實體多于 CPU 的數量時，調度就不可避免地要在“效率”與“公平”之間做取舍。直觀地說，一類目標希望把硬件壓榨到更高的利用率，讓單位時間內做更多的工作；另一類目標則關心個體體驗&#x…

閱讀更多...

C++ 8

C++ 8

封裝一個學生的類，定義一個學生這樣類的vector容器, 里面存放學生對象（至少3個）再把該容器中的對象，保存到文件中。再把這些學生從文件中讀取出來，放入另一個容器中并且遍歷輸出該容器里的學生。#include <iostream…

閱讀更多...

短視頻矩陣系統源碼開發搭建技術指南--支持OEM

短視頻矩陣系統源碼開發搭建技術指南--支持OEM

短視頻矩陣系統架構設計短視頻矩陣系統通常采用分布式架構，包含內容管理、用戶管理、推薦算法、存儲分發等模塊。主流技術棧包括微服務框架（Spring Cloud/Dubbo）、消息隊列（Kafka/RabbitMQ）、數據庫（MySQL/…

閱讀更多...

不連續頁分配器補充

不連續頁分配器補充

vmalloc流程 1. 背景：vmalloc() 要解決的問題 kmalloc() 要求虛擬地址連續，物理頁也連續。大塊內存分配可能失敗。vmalloc() 只保證虛擬地址連續，物理內存可以由很多不連續的頁拼接。實現的關鍵就是： 在 vmalloc 區域找一塊空…

閱讀更多...

bug | 事務粒度不能太大，含demo

bug | 事務粒度不能太大，含demo

刷到一個說法，建議不要使用transaction注解。這個說法不太準確，注解可以用，但標注的事務粒度不能太大，這樣可能會引起數據庫阻塞問題。以下介紹注解事務和編程式事務的兩種用法。關鍵字：聲明式事務，編程式…

閱讀更多...

別再看人形機器人了！真正干活的機器人還有這些！

別再看人形機器人了！真正干活的機器人還有這些！

每次提起“機器人”，你腦海中是不是立刻浮現出雙足行走、擬人微笑、還能陪你聊天的那種“人形機器人”？但真相是：人形機器人并非更實用，只是滿足了我們對“人類替代品”的幻想。事實上，機器人的世界遠比我們想象的更豐…

閱讀更多...

垃圾回收，幾種GC算法及GC機制

垃圾回收，幾種GC算法及GC機制

1.什么是垃圾回收？如何觸發垃圾回收？ 垃圾回收(GC)是自動管理內存的一種機制，它負責自動釋放不再被程序引用的對象所占用的內存，這種機制減少內存泄漏和內存管理錯誤的可能性。可以通過多種方式觸發：內存不足時&#x…

閱讀更多...

更智能的零售終端設備管理：合規、安全與高效

更智能的零售終端設備管理：合規、安全與高效

目錄引言：為什么零售連鎖和自助終端需要更智能的設備管理？ 典型應用場景 1. 便利店連鎖 2. 大型超市 3. 加油站 4. 自助終端核心功能，驅動高效與安全 1. 批量配置 2. 定時策略同步 3. 設備狀態監控 4. Kiosk 模式，保…

閱讀更多...

Elasticsearch：向量搜索過濾 - 保持相關性

Elasticsearch：向量搜索過濾 - 保持相關性

作者：來自 Elastic Carlos Delgado 僅執行向量搜索以找到與查詢最相似的結果是不夠的。通常需要過濾來縮小搜索結果。本文解釋了在 Elasticsearch 和 Apache Lucene 中向量搜索的過濾是如何工作的。 Elasticsearch 擁有豐富的新功能，幫助你為自己的用例構…

閱讀更多...

Linux 性能調優之 OOM Killer 的認知與觀測

Linux 性能調優之 OOM Killer 的認知與觀測

寫在前面博文內容涉及到OOM Killer機制，以及利用 Cgroup/dmesg/BPF 觀測 OOM Killer 事件，包括云原生環境下的 OOM Killer 機制的簡單介紹這是內存調優的最后一篇，之后會分享一些網絡調優相關內容理解不足小伙伴幫忙指正 ??,生活加油我不再將這個世界與我所期待的，塑…

閱讀更多...

webrtc之高通濾波——HighPassFilter源碼及原理分析

webrtc之高通濾波——HighPassFilter源碼及原理分析

文章目錄前言一、導讀二、高通濾波過程1.HighPassFilter的創建1）HighPassFilter的作用2）開啟條件3）開啟配置2.高通濾波整體過程1）觸發時機2）濾波器創建3）高通濾波過程三、算法實現1.原理1）濾波器…

閱讀更多...

《sklearn機器學習——聚類性能指數》同質性，完整性和 V-measure

《sklearn機器學習——聚類性能指數》同質性，完整性和 V-measure

函數：homogeneity_score 參數： labels_true: array-like, shape [n_samples] 樣本的真實標簽。 labels_pred: array-like, shape [n_samples] 樣本的預測標簽。返回值： h: float 同質性得分，在0到1之間，值越大表示聚…

閱讀更多...

HarmonyOS 應用開發新范式：深入剖析 Stage 模型與 ArkTS 狀態管理

HarmonyOS 應用開發新范式：深入剖析 Stage 模型與 ArkTS 狀態管理

好的，請看這篇關于 HarmonyOS 應用開發中 Stage 模型與 ArkTS 狀態管理的技術文章。 HarmonyOS 應用開發新范式：深入剖析 Stage 模型與 ArkTS 狀態管理引言隨著 HarmonyOS 4、5 的發布以及 API 12 的迭代，HarmonyOS 的應用開發范式已經全面…

閱讀更多...

一個Java的main方法在JVM中的執行流程

一個Java的main方法在JVM中的執行流程

一個Java的main方法在JVM中的執行流程可以分為??四大階段??：??加載 -> 鏈接 -> 初始化 -> 執行??。// HelloWorld.java public class HelloWorld {public static void main(String[] args) {String message "Hello, JVM!";System.out.p…

閱讀更多...

聚焦診斷管理（DM）的傳輸層設計、診斷服務器實現、事件與通信管理、生命周期與報告五大核心模塊

聚焦診斷管理（DM）的傳輸層設計、診斷服務器實現、事件與通信管理、生命周期與報告五大核心模塊

聚焦診斷管理（DM）的傳輸層設計、診斷服務器實現、事件與通信管理、生命周期與報告五大核心模塊，明確 UDS（ISO 14229-1）與 SOVD（ASAM 服務化診斷）的功能邏輯、交互流程及規范性要求（SWS_DM 系列）。 1 UDS 傳輸層（UDS Transport Layer）作為 DM 與診斷客戶端的 UDS …

閱讀更多...

關于npm的鉤子函數

關于npm的鉤子函數

一、npm scripts 的生命周期鉤子（Lifecycle Scripts） npm 提供了一些 ??特殊的 script 名稱??，它們是 ??生命周期鉤子??，會在特定時機 ??自動執行??。這些鉤子包括： 1.prepublishOnly(在 npm publish之前執…

閱讀更多...

167.在Vue3中使用OpenLayers模仿共享單車，判斷點是否放在規劃的電子圍欄內

167.在Vue3中使用OpenLayers模仿共享單車，判斷點是否放在規劃的電子圍欄內

一、前言大家好，這里分享一個 Vue3 OpenLayers 的小案例： 模仿共享單車的電子圍欄功能，用戶在地圖上繪制停泊點時，系統會自動判斷該點是否在規劃好的電子圍欄內（多邊形或圓形）。這個功能在實際項目中有很大…

閱讀更多...

鍵盤上面有F3，四，R，F，V，按下沒有反應，維修記錄

鍵盤上面有F3，四，R，F，V，按下沒有反應，維修記錄

打開游戲，按了好幾遍F，結果都沒反應，但是左右上下行走是沒問題的。一臉懵逼？？？打開鍵盤測試網頁，發現有一列沒反應，F1不是，F1我定義了一個快捷鍵，跟測試沖突了…

閱讀更多...

8051單片機-成為點燈大師

8051單片機-成為點燈大師

第三章成為點燈大師 1. 硬件設計上一章說到，怎么點亮LED燈，很簡單啊，就是把P2口設置成低電平就行了。接下來讓我們更進一步，完成LED閃爍、流水燈實驗2. 軟件設計 2.1 LED閃爍實驗為了使LED閃爍，我們自然而然的想到要…

閱讀更多...

Rust 日志庫完全指南：從入門到精通

Rust 日志庫完全指南：從入門到精通

GitHub 倉庫: https://github.com/zhouByte-hub/rust-study ? 如果這個項目對您有幫助，請給我一個 star！ 在 Rust 生態系統中，日志處理是一個至關重要的環節。無論是開發小型應用還是大型系統，良好的日志記錄都能幫助我們追蹤問題…

閱讀更多...

最新文章