威廉希尔WilliamHill·足球(中国)体育官方网站
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车

2025-05-12 18:52:19
来源:

猫眼电影

作者:

关学曾

手机查看

  猫眼电影记者 何燕系 报道w3u7903ejky2ywls

新智元报道

编辑:编辑部 HNZ

【新智元导读】法国初创Mistral,刚刚推出定价碾压DeepSeek V3的模型,而模型性能,却超过Claude Sonnet 3.7的90%。不过在网友们的实测中,它却翻车了?有人建议:不必下载浪费流量和硬盘空间。

就在刚刚, Mistral AI发布了他们最新多模态模型Mistral Medium 3。

Mistral兴奋地宣称Mistral Medium 3的性能接近甚至达到了Claude Sonnet 3.7的水平,但成本却比DeepSeek V3还低。

性价比拉满!

在Mistral官方的博客中,列出了Mistral Medium 3的核心亮点:

1. Mistral Medium 3平衡了:

顶尖性能

成本降低至原来的八分之一

更易于部署,从而加速企业应用

2. 模型在代码编写和多模态理解等专业应用场景中表现出色。

3. 模型提供一系列企业功能,包括:

支持混合云部署、本地部署以及在VPC内部署

定制化后训练

集成到企业工具和系统中

Mistral Medium 3 API,现已在Mistral La Plateforme和Amazon Sagemaker上线,并将很快登陆IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex。

完美平衡

Mistral Medium 3在提供前沿性能的同时,成本却降低了一个数量级。

例如,在各项基准测试中,Mistral Medium 3的性能达到甚至超过了Claude Sonnet 3.7的90%,但成本却显著降低(每百万Token的输入成本为0.4美元,输出成本为2美元)。

Mistral Medium 3的性能也超越了领先的开源模型,如Llama 4 Maverick和Cohere Command A等企业模型。

无论是API还是自主部署,Mistral Medium 3的成本都要比DeepSeek V3还低。

此外,Mistral Medium 3还可以部署在任何云上,包括四个GPU及以上的自托管环境。

顶级性能

Mistral表示,Mistral Medium 3的目标是成为一款性能顶尖的模型,尤其是在编码和STEM任务中表现突出,性能直逼那些规模更大、速度更慢的竞争对手。

从Mistral给出的表中可以看出Mistral Medium 3性能已经基本上超越Llama 4 Maverick和GPT-4o,接近Claude Sonnet 3.7以及DeepSeek 3.1的水平。

人工评估结果

除了学术基准之外,Mistral还公布了第三方人工评估,后者更能代表真实世界的用例。

可以看到,Mistral Medium 3在编码领域表现出色,并且在各个方面都比其他竞争对手提供了更好的性能。

专为企业级应用打造

Mistral Medium 3在适应企业环境的能力方面优于其他SOTA模型。

在企业面临通过API进行微调,或从零开始自部署并定制模型行为的艰难选择时,Mistral Medium 3提供了一条将智能全面集成到企业系统中的途径。

Mistral还推出了由Mistral Medium 3模型驱动的Le Chat Enterprise,一款面向企业的聊天机器人服务。

它提供了一个AI智能体构建工具,并将Mistral的模型与Gmail、Google Drive和SharePoint等第三方服务整合。

这就可以解决企业面临的AI挑战,如工具碎片化、不安全的知识集成、僵化的模型以及缓慢的投资回报率等,为所有组织工作提供统一的AI平台。

Le Chat Enterprise很快将支持MCP协议,这是Anthropic提出的连接AI与数据系统和软件的标准。

One more thing…

Mistral还在博客中透露,虽然Mistral Small和Mistral Medium都已经发布,但在未来几周内,他们有一个「大」计划,也就是Mistral Large。

他们表示刚发布的Mistral Medium性能已经远胜Llama 4 Maverick等顶尖开源模型,Mistral Large的性能更加值得期待。

网友实测:就这?

号称超越Claude Sonnet 3.7的90%,Medium 3果然有这么强吗?

媒体和网友们立刻展开了实测。

在基于《纽约时报》Connections栏目词汇分类题的评测中,Medium 3处于倒数的位置,几乎找不到它。

在全新的100题测评中,它在前排模型中也排不上号。

有人测试Medium 3后表示,它的写作能力还是老样子,没啥进步。不过在LLM评测中,它倒是处在帕累托前沿。

而Zhu Liang测试后发现,模型在代码编写和文本生成方面表现都很扎实,在这两项评测中都跻身前五。

在简单编码任务(Next.js TODO应用)中:

它生成了简洁明了的回复

评分和Gemini 2.5 Pro、Claude 3.5 Sonnet差不多

逊于DeepSeek V3 (新) 和GPT-4.1

在复杂编码任务(基准测试可视化)中:

产生的平均结果与Gemini 2.5 Pro和DeepSeek V3(新)相似

不如GPT-4.1、o3和Claude 3.7 Sonnet

在写作上:

它的内容覆盖了大部分要点,但格式不正确

评分与DeepSeek V3 (新) 和Claude 3.7 Sonnet相近

不如GPT-4.1和Gemini 2.5 Pro

知名大佬「karminski-牙医」实测后发现,它的性能并不像官方吹得那么强。

建议我们不必下载,浪费流量和硬盘空间了。

参考资料:

https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

https://venturebeat.com/ai/mistral-comes-out-swinging-for-enterprise-ai-customers-with-new-le-chat-enterprise-medium-3-model/

https://mistral.ai/news/mistral-medium-3

 时事1:玛拉妮被调教到奶水直流视频

  05月12日,甘肃临夏乡村:老人3元钱吃“暖心饭” 天然气入户告别呛人煤烟味,

  “吱吱……”金色的毛球惨叫,一百二十个不乐意。

,mofos免费48👙。

  05月12日,王毅同埃及外长舒凯里举行会谈 双方就巴以冲突深入沟通,

  “这是我与他们的约定,昊儿将在这里养伤。”石子陵道。

,宋雨琦❌❌喷水自慰免费网站,美女裸露拉屎㊙️网站,16女生裸体免费。

 时事2:樱桃控久久AV㊙️一区二区

  05月12日,十四届全国人大二次会议第三场“部长通道”集中采访活动举行,

咨询问题

违法约定试用期如何赔偿?

违法约定试用期如何赔偿?

律师解答

看违法约定的试用期是否已经实际履行。

如果没有实际履行,用人单位无需赔偿,由劳动行政部门责令用人单位改正。

如果已经实际履行,由用人单位以劳动者试用期满月工资为标准,按已经履行的超过法定试用期的期间向劳动者支付赔偿金。

附:《劳动合同法》第八十三条 用人单位违反本法规定与劳动者约定试用期的,由劳动行政部门责令改正;违法约定的试用期已经履行的,由用人单位以劳动者试用期满月工资为标准,按已经履行的超过法定试用期的期间向劳动者支付赔偿金。

例如:用人单位与劳动者签订2年的劳动合同,月工资标准为20000元,试用期月工资16000元。按照法律规定,试用期不得超过2个月,但劳动合同约定了6个月试用期,实际履行了5个月试用期。得知:劳动者试用期满月工资为20000元,超过法定试用期的期间为3个月。

则,用人单位应当以月工资20000元为标准,向劳动者支付3个月的赔偿金,即用人单位应向劳动者支付60000元赔偿金。

我国银行开业致辞900字(通用5篇),Feer♥XXX♥Movies动漫,车后座挺进朋友人妻女友,♥同人♥本子♥app。

  05月12日,北京力争到2027年新型储能产业营收超千亿元,

  仙桃树不高,银光闪烁,枝干蜿蜒,若虬龙蛰伏,上面结有两枚桃子,银白中带着淡金色,清香扑鼻。

,成人漫画精精一区二区无码,♥️爱情岛论坛aqdavcc,扒开老师狂揉免费看。

 时事3:🔞黄㊙️动漫❌触手

  05月12日,新生虎宝宝!华南虎种群再添新“丁”,

  “小不点,你虽然洗礼成功,力量暴涨,但是切不可骄傲,须知这个天地间强者诸多,且都极其恐怖。”老族长严肃地告诫。

,动漫自慰✅免费网站,冢本一冢本夫人家庭背景和成就,Free❌㐅❌性HD另类。

  05月12日,新疆兵团养老服务如何从“基本养老”迈向“品质养老”?,

  直到天亮,一群孩子还有部分年轻人才瞪着熊猫眼从湖中爬上来,灰溜溜地逃回了自己的家门。

,憋尿灌水视频㊙️,成人免费A片10086,孕妇分娩㊙️免费网站。

 时事4:刘涛裸体后进式

  05月12日,厂通路潮白河大桥主桥完成首段钢箱梁吊装,

  仅这只爪子而已,就比很多座大山加起来都要巨大,正是因为它探出地面,才导致诸多巨山崩塌,大地龟裂。

,娜美被❌18禁Naruto堂,纳西妲被❌到爽羞羞漫画,在线无码精品㊙️入口免费77。

  05月12日,首期“双周政策分析会” 聚焦新质生产力,

  在这里首先我与大家分享一个关键词:目标

,国產黃色亂伦一級毛片芒果视频,美女又爽又黄免费蘑菇,免费无遮挡🔞视频男男。

责编:李国

审核:夏中华

责编:郑贤

相关推荐 换一换