在今日下午召开的华为开发者大会 HDC2025 主旨演讲上,华为常务董事兼华为云 CEO 张平安正式发布了全新升级的盘古大模型 5.5。这一版本的发布,标志着华为在自然语言处理(NLP)、计算机视觉(CV)、多模态学习、智能预测和科学计算五大核心模型领域实现了全面进阶。
在自然语言处理方向,全新的 718B 大模型基于 256 个专家的 MoE 架构设计,展现出更强的知识理解、工具调用和数学推理能力,综合性能位居行业前列。该模型依托昇腾云提供的软硬件一体化平台进行训练,充分展示了昇腾架构在打造高质量大模型方面的强大能力。此外,盘古 5.5 在处理长文本、降低幻觉率、结合快慢思考机制以及支持智能 Agent 等方面也得到了显著优化,采用的“自适应快慢思考融合”技术使模型能根据任务复杂度动态调整推理节奏,整体效率提升达到 8 倍。盘古的 DeepDiver 深度引擎通过“长链任务构建”和“分阶段奖励机制”等手段,大幅增强了模型在网页检索、常识问答等场景中的执行效率,能在短时间内处理高跳数复杂问题,甚至生成超过万字的专业报告,大幅提升了工作效能。
在智能预测方面,盘古预测大模型首次引入“triplet transformer”统一预训练架构,实现了对不同行业数据的标准化处理与编码,不仅提升了模型的预测准确性,也增强了其在跨行业和多场景下的通用能力。
科学计算方向,盘古模型与实际应用深度融合。例如深圳市气象局基于盘古升级了“智霁”大模型,实现集合预报能力,有效降低天气预报误差;重庆气象局则结合本地降雨特征构建了“天资・12h”模型,显著提升灾害天气的短时预警能力;深圳能源也借助盘古模型进行风、光、水等多源能源的中短期发电预测,从而优化能源管理、减少弃电现象。
在计算机视觉领域,华为云推出了一款参数规模高达 300 亿的视觉大模型,采用新的 MoE 架构,是目前视觉模型领域中参数量最大的模型之一。这一模型支持多维泛视觉感知、分析与决策,并通过跨维生成方式构建了覆盖工业场景的稀缺故障样本库,显著提升了模型在实际业务场景下的识别种类与准确性。
在多模态技术方面,盘古大模型推出了“世界模型”,用于模拟现实物理环境,为智能驾驶与具身智能体提供训练支持。这一模型能够大规模合成训练数据,显著降低数据采集成本,助力自动驾驶领域更快发展。
此外,盘古 5.5 也进一步拓展其在行业中的实际应用场景,发布了五个专为不同行业打造的深度思考自然语言模型,包括医学、金融、政务、工业和汽车领域。这些“Thinking”系列模型旨在为各行业提供更具专业性和智能化的自然语言理解与生成能力,预计很快将全面上线,推动行业智能化转型加速落地。