首页 > 实时讯息 >

全球首次达成!“本源悟空”真机运行十亿级AI微调大模型|科技观察

  • 0次浏览     发布时间:2025-04-08 18:54:00    

封面新闻记者 边雪

近日,封面新闻记者从安徽省量子计算工程研究中心获悉,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在中国第三代自主超导量子计算机“本源悟空”真机上,全球首次运行十亿参数AI大模型微调任务。实验结果显示,在参数量减少76%的前提下,训练效果反而提升8.4%。这一成果不仅验证了量子计算助力实现大模型轻量化的可行性,更为破解大模型“算力焦虑”开辟了新路径。

微调是指在通用大模型(如 DeepSeek、Qwen)的基础上,通过进一步训练特定领域数据,使其适应医疗诊断、金融风控等专业场景。传统低秩微调面临性能瓶颈、泛化能力有限等问题,量子计算凭借其叠加态和纠缠态特性可同时探索海量参数组合,可提升大模型微调的效率。

“就好比给经典模型装上了‘量子引擎’,让两者协同发力。”本源量子副总裁窦猛汉告诉封面新闻记者,团队创新设计了“量子加权张量混合参数微调”,通过量子计算特性实现智能“微调”——将模型权重转化为量子神经网络与张量网络混合架构,前者通过量子门操作提取高维非线性特征,张量网络则压缩参数规模。

在“本源悟空”的量子芯片上,单批次数据可生成数百个量子任务并行处理。实验数据显示,优化后的模型在心理咨询对话数据集(CPsyCountD)上训练损失降低15%,数学推理任务(R1-Distill-SFT)的严格准确率从68%提升至82%。合肥综合性国家科学中心人工智能研究院副研究员陈昭昀补充:“这是量子计算首次‘真机实战’大模型任务,证明现有硬件已能初步支撑大模型微调。”

据封面新闻记者了解,“本源悟空”是目前我国先进的可编程、已交付超导量子计算机,已为全球139个国家超2300万人次提供量子算力云服务,完成35万个量子运算任务,涵盖流体动力学、金融、生物医药等多个行业领域,成功完成全球最大规模的量子计算流体动力学仿真,并接入金融量子云实验平台用于探索金融领域更高效的问题解决方案。

相关文章

  • 仅6股!“耐心资本”连续13个季度持仓且机构首次关注

    随着2024年年报以及2025年一季报披露进入尾声,本周(4月21日至4月25日)以来机构活跃度持续上升。无论是参与调研机构家数,还是参与评级机构家数均大幅提升,优质个股机构的关注度大幅提升。22股本周获得10家及以上机构重点关注据证券时报·数据宝统计,截至周五收盘,本周(4月21日至4月25日),

    2025-04-27 11:25:00
  • 魔都眼·上海车展⑥|周六客流超13.5万人次,创开展新高

    4月26日,专业观众日遇上周末,2025年上海车展迎来观展客流高峰。澎湃新闻记者从上海警方获悉,截至16时,车展参展客流已超13.5万人次,较昨日客流高1万多人次,创本届车展新高。2025年4月26日,国家会展中心(上海),上海车展迎来大客流。澎湃新闻记者 朱伟辉 图“请观众提前准备好身份证,有序安

    2025-04-26 21:12:00
  • 百度后手出牌,如何应对被重构的大模型格局

    新一轮AI卡位战中,人们对百度的质疑多集中于百度是不是懈怠跑不动了,从目前的事实进展来看,百度的每一个动作里,仍然藏着野心和激情文|吴俊宇编辑|谢丽容2025年初,DeepSeek-R1搅乱了中国的大模型竞争格局。过去三年行业里有一个基本共识——AI大模型只是科技大厂的游戏,创业公司很难出头。一位中

    2025-04-25 18:59:00
  • 华为云将发布盘古行业推理大模型;商业航天创新联合体成立|数智早参

    每经记者:杨煜 每经编辑:马子卿丨2025年4月25日 星期五丨NO.1 华为云将发布盘古行业推理大模型4月24日,华为宣布华为开发者大会(HDC 2025)将于6月20日至22日在东莞松山湖举办。此次大会,华为云将发布包括盘古基础大模型、盘古行业推理大模型、昇腾AI云服务基础设施在内的最新进展。点

    2025-04-25 08:03:00
  • “小天才特惠”竟是商标,被指擦边“小天才”,涉事公司:已整改下架

    极目新闻记者 张皓有媒体日前报道,在电商平台上搜索“儿童电话手表”,除有广东小天才科技有限公司旗下知名品牌“小天才”外,还涌现出“小天才特×”等名称高度相似的店铺和商品。如一款“小天才特×”手表售价仅218元,已售2000件。有消费者反映,他们收到的产品存在定位不准、电池续航差等问题,“给孩子买的,

    2025-04-24 17:44:00