智东西作者 李水青编辑 云鹏
智东西9月5日消息,今天,谷歌开源一款全新的开放式嵌入模型EmbeddingGemma。该模型以小博大,拥有3.08亿个参数,专为端侧AI设计,支持在笔记本、手机等设备上部署检索增强生成(RAG)、语义搜索等应用程序。
EmbeddingGemma的一大特征是能生成隐私性良好的高质量嵌入向量,即使在断网情况下也能正常运行,且性能直追尺寸翻倍的Qwen-Embedding-0.6B。
▲Hugging Face开源页面截图
Hugging Face地址:https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
据谷歌介绍,EmbeddingGemma具有以下几大亮点:
1、同类最佳:在海量文本嵌入基准(MTEB)上,在500M以下的开放式多语言文本嵌入模型中,EmbeddingGemma排名最高。EmbeddingGemma基于Gemma 3架构打造,已针对100多种语言进行训练,并且体积小巧,经过量化后可在不到200MB的内存上运行。
▲MTEB评分:EmbeddingGemma性能比肩比起尺寸大一倍的顶尖模型
2、专为灵活离线工作而设计:小巧、快速、高效,提供可自定义的输出尺寸,以及2K令牌上下文窗口,可在手机、笔记本电脑、台式机等日常设备上运行。它旨在与Gemma 3n配合使用,共同为移动RAG管道、语义搜索等解锁新的用例。
3、与流行工具集成:为了让用户轻松开始使用EmbeddingGemma,它已经可以与用户喜欢的工具一起使用,例如sentence-transformers、llama.cpp、MLX、Ollama、LiteRT、transformers.js、LMStudio、Weaviate、Cloudflare、LlamaIndex、LangChain等。
一、可生成优质嵌入向量,端侧RAG生成答案更准确
EmbeddingGemma会生成嵌入向量,在本文语境中,它能将文本转换为数值向量,在高维空间表征文本语义;嵌入向量质量越高,对语言细微差别与复杂特性的表征效果越好。
▲EmbeddingGemma会生成嵌入向量
构建RAG流程存在两个关键阶段:一是根据用户输入检索相关上下文,二是基于该上下文生成有依据的答案。
为实现检索功能,用户可以先生成提示词的嵌入向量,再计算该向量与系统中所有文档嵌入向量的相似度——通过这种方式,能够获取与用户查询最相关的文本片段。
随后,用户可将这些文本片段与原始查询一同输入生成式模型(如Gemma 3),从而生成符合上下文的相关答案。例如,模型能理解你需要联系木工的电话,以解决地板损坏的问题。
要让这个RAG流程切实有效,初始检索步骤的质量至关重要。质量不佳的嵌入向量会导致检索到不相关的文档,进而生成不准确或毫无意义的答案。
而EmbeddingGemma的性能优势正体现于此——它能提供高质量的(文本)表征,为精准、可靠的端侧应用提供核心支持。
二、以小博大,性能接近尺寸翻倍的Qwen-Embedding-0.6B
EmbeddingGemma提供了与其规模相适应的最先进的文本理解能力,在多语言嵌入生成方面具有特别强大的性能。
与其他流行嵌入模型的比较,EmbeddingGemma在检索、分类和聚类等任务上表现出色。
EmbeddingGemma在Mean(Task)、Retrieval、Classification、Clustering等测试中全面赶超了同等尺寸的gte-multilingual-base模型。其测试成绩也已接近尺寸达到其两倍的Qwen-Embedding-0.6B。
▲EmbeddingGemma的测评情况
EmbeddingGemma模型拥有308M参数,主要由大约100M模型参数和200M嵌入参数组成。
为了实现更高的灵活性,EmbeddingGemma利用Matryoshka表征学习(MRL),在一个模型中提供多种嵌入大小。开发者可以使用完整的768维向量以获得最佳质量,也可以将其截断为较小的维度(128、256或512),以提高速度并降低存储成本。
谷歌在EdgeTPU上将嵌入推理时间(256个输入token)缩短至<15ms,突破了速度界限,这意味着用户的AI功能可以提供实时响应,实现流畅、即时的交互。
利用量化感知训练(QAT),谷歌在保持模型质量的同时,显著将RAM使用量降低至200MB以下。
三、断网可用,可在不到200MB内存上运行
EmbeddingGemma支持开发者构建灵活且注重隐私的设备端应用。它直接在设备硬件上生成文档嵌入,帮助确保敏感用户数据的安全。
它使用与Gemma 3n相同的分词器进行文本处理,从而减少RAG应用的内存占用。用户可使用EmbeddingGemma解锁新功能,例如:
无需联网即可同时搜索个人文件、文本、电子邮件和通知。
通过RAG与Gemma 3n实现个性化、行业特定和离线支持的聊天机器人。
将用户查询分类到相关的函数调用,以帮助移动智能体理解(用户需求)。
下图为EmbeddingGemma的交互式演示,它将文本嵌入在三维空间中可视化,该模型完全在设备上运行。
▲EmbeddingGemma的交互式演示(图源:Hugging Face团队的Joshua)
Demo体验地址:https://huggingface.co/spaces/webml-community/semantic-galaxy)
结语:小尺寸大能力,加速端侧智能发展
EmbeddingGemma的推出标志着谷歌在小型化、多语言和端侧AI上的新突破。它不仅在性能上接近更大规模的模型,还兼顾了速度、内存和隐私的平衡。
未来,随着RAG、语义搜索等应用不断下沉至个人设备,EmbeddingGemma或将成为推动端侧智能普及的重要基石。
《白丝女学生喷浆❌❌❌》,《爱生活》詹娜大尺度r级未删减电影
“美女漫画网站㊙️免费”
13箩洗澡无码自慰AV网站
……
09月11日
“美女❌❌❌免费网视频”韩国无人机入侵朝鲜平壤
↓↓↓
09月11日,(两会观察)7天人代会:“小片段”折射民主“大全景”,魅魔被❌爽羞羞吸乳漫画,亚洲经典一区二区三区爱妃记歌词,fiee性Zoz0交体内谢2023,女仆被少爷❌到爽动漫
09月11日,“从中国式现代化发展成果中汲取宝贵经验”(外国政党政要和友好人士看中国式现代化),绝区零❌狂揉❌难受,美女扒开㊙️看片,仓井空,免费无遮挡🔞视频网站不用下载
09月11日,山东济南长清区发掘301座战国至清代时期古墓 出土文物850余件,永久免费裸体网站,NNXN🇨🇳👙👙18,扒开雏田❌狂揉❌难受,萌萝社app♥老版入口
09月11日|低价买法拍房转手赚差价? 男子被“熟人”骗了70万元|高清少妇做受高潮|裸体美女狂揉自己的胸|视频丨9l❤️丨口爆|雏田爆乳被❌🔞㊙网站
09月11日|【小新的Vlog】和小新一同感受东川泥石流汽车越野赛“猛兽呼啸”|mm131王语纯被❌喷水|欧美,美女性爱视频,草留视频,|免费观看刘嘉玲当年仓库的视频|白丝不知火舞玉足榨精
09月11日|中国航空货运量规模达历史最好水平|老板让我夹震蛋器陪客人吃饭|300元过夜电话|男人一边自慰一边呻吟|美女被狂揉下部❌羞羞电视……
09月11日,两会大家谈|激活新质生产力 新加坡学者看好中国经济高质量发展,绫波丽n开襟乳液狂飙,爽⋯好大⋯快⋯深点戴洛希老董,一女多男共妻被4P高H,扒开玖辛奈❌狂揉❌难受3d动漫
09月11日,中办、国办:推进新型城市基础设施建设打造韧性城市,男男做爰GaY✅在,男人的🍌伸到🍑里频频,裸交❌❌❌❌❌国产写真,日本少妇╳╳❌❌HaD曰
09月11日|68.0%受访者感到线下社交能力有所退化|黄品汇成人免费永久小红书|男GayGays✅小鲜肉下载|女生脱👙r让男生揉🐻小说|女人又爽❌又黄❌免费俄罗斯
09月11日,封禁百万个高频访问IP 国博配合公安打击黄牛,花语An3级片的网站 能看的网站 网站 网站,6080yy理论三级在线看短视频,散兵被扒开腿做❌同人漫画,星野和光头鱼视频
09月11日,云南省政协十三届二次会议在昆明开幕,交换乐园1-45集最新章节列表,被公牛日到高潮霍水,无遮挡18禁啪啪汗汗漫画,扒开疯狂揉脱脱内内作文
09月11日,近40名亚洲旅行商长沙采风 助力文旅产业可持续性增长,羞羞羞下面好紧爽⋯视频,SSS羞羞漫画,玉足球导管,阿部夏树主演的电影大全在线观看
09月11日|中新健康丨走进申城的综合性医院:微创方法百花齐放、达芬奇机器人助力|云缨同人18❌羞羞漫画免|动画埃及猫拔萝卜原创版视频|被女同桌强行足脚交了|艳女十八式婬乱史
09月11日|中国与瑙鲁何时互设使领馆?外交部回应|十八禁🔞爱情岛网站|91偷拍初高中女厕撒尿|㊙️两个男生互摸jiji㊙️|❤️国产嫩草影院久久久
09月11日|洋主播过“五一”:坐车5小时,探访“00后”台胞的海边露营地!|吴梦梦大战黑人45分钟|杨思敏被揉到高潮下不了床|国产婬妇痴汉精品无码|美女裸体㊙️无遮挡奶胸
江苏13市已全部进入中度老年化社会,伞学院 第四季|天天学习丨中南海月刊(2024.07)|❤️乱大交XX|老师裸露胸被强挤奶|Doinb成为LPL首位三次MVP|猛烈h继攵稚嫩亲女慕软瑶
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺