当前位置:首页 > 资讯

技术突破驱动成本下降 多款国产大模型宣布降价

2026-06-16 来源:人民网

  近期,DeepSeek、小米、腾讯云等头部国产大模型运营主体接连宣布下调API(应用程序编程接口)调用费用,多款主流模型降价幅度突破90%。

  有行业分析师对《证券日报》记者表示,大模型API价格的接连下探,本质上是技术红利释放与市场竞争博弈共振的结果。一方面,底层模型架构的不断迭代与推理系统效能的深度挖掘,正推动单位词元(Token)的计算成本实现阶梯式下降,为价格体系的重塑提供了底层支撑;另一方面,白热化的市场角逐进一步加速了这一进程,使得降价成为厂商在激烈竞争中抢占身位的现实选择。

  降价动作频频

  本轮国产大模型降价周期集中在5月下旬至6月中旬,降价力度逐层加码,接连打破全球商用大模型API底价纪录。

  5月22日,DeepSeek率先启动调价,其旗下旗舰级通用大模型V4-Pro开启永久性降价,整体降幅达到75%;依托缓存加速技术,该模型输入侧缓存命中单价跌至0.025元/百万词元,成为当前全球公开报价最低的顶级能力大模型。

  仅仅5天后,小米紧随其后完成调价动作,其旗下MiMo-V2.5全系列API接口永久下调资费,部分细分调用场景降价比例逼近99%,成为本轮降价潮中单次降幅最高的厂商。

  头部公有云厂商也快速跟进。6月2日腾讯云发布服务调价公告,明确自6月3日起,平台内上线的DeepSeek-V4全系列模型同步下调调用价格,最高降幅达到97.5%。腾讯云同时强调,本次调整仅修改计费标准,模型推理速度、上下文窗口、输出准确率等核心服务参数不做任何改动,用户使用体验不受影响。

  腾讯云后续还在6月12日推出第二轮差异化调价,覆盖自研与第三方两类商用模型。首先落地调价的是自研多语言翻译模型Hy-MT2-Pro,输入词元计费下调66.67%、输出词元计费下调55.56%;针对第三方入驻模型MiniMax-M3,则设定延后调价节点,定于6月15日统一下调推理输入、推理输出、缓存命中三项费用,各项降幅均为50%。

  值得关注的是,本轮降价完全背离上游算力市场走势。2026年上半年,AI硬件供应链供需矛盾持续激化,核心存储部件HBM(高带宽内存)半年内市价涨幅超500%,英伟达高端GPU(图形处理器)现货长期供不应求,海外亚马逊云、微软Azure以及国内少量中小型云厂商早已启动涨价,部分海外厂商API最高涨幅甚至达到463%。

  一涨一跌的反向走势,让国产大模型的竞争策略差异彻底凸显。

  广州艾媒数聚信息咨询股份有限公司CEO张毅对《证券日报》记者表示,国内大模型行业已经走完前期烧钱试错的技术验证阶段,全面迈入商业化落地攻坚期。对于中小开发者、垂直小微企业而言,本次大范围降价直接降低AI创业试错成本。在预算不变的前提下,团队可调用的模型词元总量能够提升数倍至近百倍,原本受资金限制无法落地的轻量化AI工具、行业定制插件,如今具备了商业化测试条件,小众创新团队的生存空间得到明显拓宽。

  多重因素形成支撑

  抛开市场竞争因素,业内人士普遍认为,多级存储缓存优化、稀疏算力架构迭代、国产算力适配三大技术突破,是厂商能够逆势降价的核心支撑,上游硬件涨价的压力已经被推理层技术优化所对冲。

  小米官方披露了MiMo模型的降本技术路径:研发团队基于SGLang(结构化生成语言)框架配套HiCache(配套高速)缓存方案,完整兼容滑动窗口注意力(SWA)算法。通过重构词元缓存调度逻辑,将KV(键值)缓存在GPU显存、CPU(中央处理器)内存、固态硬盘三级存储之间的数据迁移量压缩至原先的1/7,同时把系统可长效缓存的词元容量提升5倍。除此之外,团队还优化了混合专家模型的并行调度逻辑,新增输入文本长度分桶匹配策略,解决了超长文本并发调用时集群算力浪费问题,集群整体吞吐效率提升后,单词元的平均推理成本自然下降。

  DeepSeek则从模型原生架构和算力国产化两条路径实现降本。架构层面,自研轻量化稀疏注意力机制搭配动态混合专家结构,让V4系列模型处理十万级至百万级超长上下文时,算力资源消耗仅为上一代版本的27%,KV缓存显存占用直接压缩90%;算力适配层面,该模型完成了昇腾系列国产算力芯片的深度底层适配,摆脱了对海外高端GPU的单一依赖。一方面降低了硬件采购与长期租赁成本,另一方面也补齐了国产算力生态的商用落地案例,实现技术与成本双向收益。

  张毅表示,未来大模型价格将呈现两极分化走势:基础推理服务价格因技术迭代和规模效应持续下探,逐步接近公用事业定价;而高端定制化服务将维持溢价。行业竞争焦点正从算力堆砌转向效率优化与生态构建,具备自主架构创新能力和国产算力适配能力的企业有望胜出,缺乏技术护城河的厂商将面临出清压力。

责任编辑:zzy2026

声明:

1、内容征集与合作:诚邀各界提供新闻稿件、文学创作;承接单位工作资讯代发服务;同步转发各类正能量文章;专业策划并刊登多种软性广告。

2、免责声明: 本平台转载并标注来源的作品,旨在拓宽信息传播渠道,不代表本平台对其观点的认同或内容真实性的背书,亦不承担该类作品因侵权引发的直接及连带责任。 同时,我们秉持分享理念,尊重原创权益。若涉及作品侵权,请及时与我们联系,我们将在24小时内予以删除,感谢理解与支持!

3、如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行。电话:13716035981

相关阅读

  人民网北京6月15日电 (记者孙博洋)作为民生消费重要领域的网络餐饮市场,规模达到万亿级别,如何有效提升海量网络餐饮商家的食品安全监管?  近日,经市场监管总局局务会议

2026-06-16

  近期,DeepSeek、小米、腾讯云等头部国产大模型运营主体接连宣布下调API(应用程序编程接口)调用费用,多款主流模型降价幅度突破90%。  有行业分析师对《证券日报》记者表

2026-06-16

  从新能源卡车到无人机、智能储能设备,中国企业展品在巴西第20届巴伊亚农业展上随处可见。巴西各地的农户和采购商表示,中国“智造”正在助力当地农业发展。  

2026-06-16

  未来的空间望远镜在监测太阳磁场活动时,只需一个指甲盖大小的关键元件。美国加州大学圣迭戈分校与英国宇航系统公司合作开发出一种直径仅6毫米的新型超表面元件,可一次完

2026-06-16

  全球足球赛事正式开幕,随着世界各地球迷的目光聚焦赛场,一场属于足球的狂欢正式开启。而在赛场之外,各大品牌间的较量也已悄然打响。  当足球广告越来越卷,伊利杀出一条血

2026-06-16

  6月12日,胖东来发布关于“网传员工工资问题”相关情况说明。  说明指出,6月11日,网络上出现大量关于“胖东来大幅降薪,将调整员工薪酬”、“员

2026-06-16

  6月15日,市说新语公众号发文称,为切实保障端午节期间食品安全,营造安全放心的节日消费环境,市场监管总局在全国范围组织开展粽子专项抽检。抽检结果显示,粽子总体质量安全状

2026-06-16

  近日,达普生物发布公告称,公司宣布完成B+轮超1.2亿元融资。本轮融资在半年内连续完成三笔交割,获得上海科创集团知识产权基金、深圳南山战新投、上海浦东创投、广州海汇投

2026-06-16

热门推荐

阅读排行

首页 | 资讯 | 城市 | 娱乐 | 农村 | 公益 | 生态 | 文化 | 教育 | 健康 | 旅游 | 职场 | 关于我们 | 联系我们 | 人员查询

运营单位:北京竣发文化传媒有限公司

地址:北京市丰台区泥洼北路6号院9号楼二层203-1520室

中华人民共和国国家工业和信息化部备案号: 京ICP备2025122738号-1

京公网安备11010602201975号

Copyright © 2025-2030 城乡观察网 版权所有

本网站内容来源于互联网,如因版权和其它问题需要同本网联系。 邮箱:axlt6@qq.com    电话:13716035981