威廉希尔WilliamHill·足球(中国)体育官方网站
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

0.3B!谷歌开源新模型,手机断网也能跑,0.2GB内存就够用

2025-09-12 01:38:24
来源:

猫眼电影

作者:

姜静

手机查看

  猫眼电影记者 景德旺 报道爱生活

智东西作者 李水青编辑 云鹏

智东西9月5日消息,今天,谷歌开源一款全新的开放式嵌入模型EmbeddingGemma。该模型以小博大,拥有3.08亿个参数,专为端侧AI设计,支持在笔记本、手机等设备上部署检索增强生成(RAG)、语义搜索等应用程序。

EmbeddingGemma的一大特征是能生成隐私性良好的高质量嵌入向量,即使在断网情况下也能正常运行,且性能直追尺寸翻倍的Qwen-Embedding-0.6B。

▲Hugging Face开源页面截图

Hugging Face地址:https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4

据谷歌介绍,EmbeddingGemma具有以下几大亮点:

1、同类最佳:在海量文本嵌入基准(MTEB)上,在500M以下的开放式多语言文本嵌入模型中,EmbeddingGemma排名最高。EmbeddingGemma基于Gemma 3架构打造,已针对100多种语言进行训练,并且体积小巧,经过量化后可在不到200MB的内存上运行。

▲MTEB评分:EmbeddingGemma性能比肩比起尺寸大一倍的顶尖模型

2、专为灵活离线工作而设计:小巧、快速、高效,提供可自定义的输出尺寸,以及2K令牌上下文窗口,可在手机、笔记本电脑、台式机等日常设备上运行。它旨在与Gemma 3n配合使用,共同为移动RAG管道、语义搜索等解锁新的用例。

3、与流行工具集成:为了让用户轻松开始使用EmbeddingGemma,它已经可以与用户喜欢的工具一起使用,例如sentence-transformers、llama.cpp、MLX、Ollama、LiteRT、transformers.js、LMStudio、Weaviate、Cloudflare、LlamaIndex、LangChain等。

一、可生成优质嵌入向量,端侧RAG生成答案更准确

EmbeddingGemma会生成嵌入向量,在本文语境中,它能将文本转换为数值向量,在高维空间表征文本语义;嵌入向量质量越高,对语言细微差别与复杂特性的表征效果越好。

▲EmbeddingGemma会生成嵌入向量

构建RAG流程存在两个关键阶段:一是根据用户输入检索相关上下文,二是基于该上下文生成有依据的答案。

为实现检索功能,用户可以先生成提示词的嵌入向量,再计算该向量与系统中所有文档嵌入向量的相似度——通过这种方式,能够获取与用户查询最相关的文本片段。

随后,用户可将这些文本片段与原始查询一同输入生成式模型(如Gemma 3),从而生成符合上下文的相关答案。例如,模型能理解你需要联系木工的电话,以解决地板损坏的问题。

要让这个RAG流程切实有效,初始检索步骤的质量至关重要。质量不佳的嵌入向量会导致检索到不相关的文档,进而生成不准确或毫无意义的答案。

而EmbeddingGemma的性能优势正体现于此——它能提供高质量的(文本)表征,为精准、可靠的端侧应用提供核心支持。

二、以小博大,性能接近尺寸翻倍的Qwen-Embedding-0.6B

EmbeddingGemma提供了与其规模相适应的最先进的文本理解能力,在多语言嵌入生成方面具有特别强大的性能。

与其他流行嵌入模型的比较,EmbeddingGemma在检索、分类和聚类等任务上表现出色。

EmbeddingGemma在Mean(Task)、Retrieval、Classification、Clustering等测试中全面赶超了同等尺寸的gte-multilingual-base模型。其测试成绩也已接近尺寸达到其两倍的Qwen-Embedding-0.6B。

▲EmbeddingGemma的测评情况

EmbeddingGemma模型拥有308M参数,主要由大约100M模型参数和200M嵌入参数组成。

为了实现更高的灵活性,EmbeddingGemma利用Matryoshka表征学习(MRL),在一个模型中提供多种嵌入大小。开发者可以使用完整的768维向量以获得最佳质量,也可以将其截断为较小的维度(128、256或512),以提高速度并降低存储成本。

谷歌在EdgeTPU上将嵌入推理时间(256个输入token)缩短至<15ms,突破了速度界限,这意味着用户的AI功能可以提供实时响应,实现流畅、即时的交互。

利用量化感知训练(QAT),谷歌在保持模型质量的同时,显著将RAM使用量降低至200MB以下。

三、断网可用,可在不到200MB内存上运行

EmbeddingGemma支持开发者构建灵活且注重隐私的设备端应用。它直接在设备硬件上生成文档嵌入,帮助确保敏感用户数据的安全。

它使用与Gemma 3n相同的分词器进行文本处理,从而减少RAG应用的内存占用。用户可使用EmbeddingGemma解锁新功能,例如:

无需联网即可同时搜索个人文件、文本、电子邮件和通知。

通过RAG与Gemma 3n实现个性化、行业特定和离线支持的聊天机器人。

将用户查询分类到相关的函数调用,以帮助移动智能体理解(用户需求)。

下图为EmbeddingGemma的交互式演示,它将文本嵌入在三维空间中可视化,该模型完全在设备上运行。

▲EmbeddingGemma的交互式演示(图源:Hugging Face团队的Joshua)

Demo体验地址:https://huggingface.co/spaces/webml-community/semantic-galaxy)

结语:小尺寸大能力,加速端侧智能发展

EmbeddingGemma的推出标志着谷歌在小型化、多语言和端侧AI上的新突破。它不仅在性能上接近更大规模的模型,还兼顾了速度、内存和隐私的平衡。

未来,随着RAG、语义搜索等应用不断下沉至个人设备,EmbeddingGemma或将成为推动端侧智能普及的重要基石。

 时事1:白丝大胸小舞被出白浆

  09月12日,2024年开年最卷的行业,为何是文旅?,

  我们这次开展村三委会培训,是各村三委换届后为进一步加强工作,提高各村三委成员的整体素质和水平,切实增强基层党组织为民服务的本领和信念。同时,也为配合下阶段开展保持*先进性教育的需要,所以,大家要充分认识这次培训的重要意义。

,小戳进无遮挡动漫。

  09月12日,厦航开通福州至首尔往返直飞国际航线,

  (4)乘车注意文明礼貌,主动给老人、儿童和残疾人让座,乘车时不准将头、手伸出车外。在公共场所要遵守秩序,有礼貌。

,男人的🍌伸到🍑里擼擼动漫,老师爆乳被学生漫画视频,火影❌吸乳羞羞网站视频。

 时事2:裸体+光屁屁+搂胸+中国

  09月12日,跨越64年 “国家的孩子”回家了,

  兽皮化成了小不点的肉皮,光华璀璨,形成一个图案,化作一个古符,令他的整具小躯体都晶莹绚烂了起来,如火焰在燃烧,有一种滔天的凶威弥漫,震慑十方。

,美女下部隐私㊙️小片黄,火影忍者床上电脑桌,撒尿Free❌㐅❌性。

  09月12日,以军继续在加沙地带的军事行动 巴勒斯坦武装公布打击以军新视频,

  尊敬的各位领导、凯杰小学幼儿园的老师和员工们、家长朋友们、亲爱的小朋友们:

,西施趴在床脱了裙子撅着屁股,女教师张萍的婬乱生活,小马拉大车吃童子鸡在现观看。

 时事3:高清🔞❌♋免费视频日本

  09月12日,上海博物馆推出“伊朗文物精华展” 285件文物呈现古波斯灿烂文明,

  “生灵涂炭啊,不知道要有多少人死于非命,恐怕附近的村子剩不下了。”有族老叹道,面带悲色,同在大荒中挣扎、生存,见到一场大祸来临,不免伤感与同情。

,狠狠的挺进秦怡宁的小泬,福瑞同人❌黄动画免费,国产熟妇乱子伦骚视。

  09月12日,多国和国际组织重申恪守一个中国原则 外交部:正义之声、和平之声,

  尊敬的各位老师、同学们:

,武警爸爸的大捷豹小说,国产精品🔞❌❌❌❌男同,白丝JK❌❌爆乳。

 时事4:免费无遮挡🔞漫画网站下载樱桃

  09月12日,积极因素不断累积增多 中国高质量发展“枝繁叶茂”成果丰硕,

  “好大的口气,给我杀了他!”一人断喝。

,日本熟妇XXX浓密黑毛,催眠调教震动棒h,菠萝蜜视频A片在线看免费。

  09月12日,天津:探索建立经济安全审计监督网格化治理机制,

  明天你们的人生将掀开新的篇章

,白丝美女跪着扒开🍑给男人玩,男GayGays✅亚洲网站,欧美AV无码专区A片奶水多。

责编:金章宗

审核:全忠勋

责编:吴劲松

相关推荐 换一换