EmbeddingGemma是谷歌于2025年9月開源的開放式文本嵌入模型,專為端側設備設計,具備以下核心優勢:
性能優勢
在MTEB基準測試中,EmbeddingGemma在500M以下參數規模的多語言文本嵌入模型中表現最佳,性能接近參數翻倍的頂尖模型(如Qwen-Embedding-0.6B)。該模型已針對100多種語言進行訓練,并經過量化處理,可在低于200MB內存的設備上運行。 ?
端側適配能力
支持手機、筆記本等設備的離線運行,提供可自定義的輸出尺寸和2K令牌上下文窗口。其設計初衷是與Gemma 3n配合使用,共同推動移動端RAG(檢索增強生成)和語義搜索的應用。 ?
工具集成性
可與sentence-transformers、llama.cpp、MLX等工具無縫對接,簡化開發者上手難度。 ?
參數與特性
模型擁有3.08億參數,斷網環境下可生成高質量嵌入向量,用于提升文本語義表征精度。其設計注重隱私保護,生成的嵌入向量能有效保留語言細微差異。
部署方式
Ollama部署:
執行下面代碼:
ollama run dengcao/EmbeddingGemma
ollama模型庫:https://ollama.com/dengcao/EmbeddingGemma
?魔搭:https://modelscope.cn/models/google/embeddinggemma-300m
Hugging Face地址:https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4