×

云端赋能加速AI落地 | 2025年智算云(AI云)平台服务标准体系国际国内评估正式启动

hqy hqy 发表于2025-02-27 03:08:07 浏览6 评论0百度未收录

抢沙发发表评论

随着人工智能技术的快速发展,大模型、生成式AI等技术的突破性进展,AI应用场景日益丰富,对算力的需求也呈现爆发式增长。智算云(AI云)平台服务作为推动AI大规模应用的核心,正在成为智能算力资源调度和高效利用的关键支撑。平台通过大规模异构智能算力的融合调度,为AI模型开发、训练、部署和推理提供了高效、便捷的云化服务,成为加速AI落地的核心引擎。

在此背景下,中国信通院云计算部智算团队自2019年起针对智算云(AI云)平台服务开展技术研究,先后立项《云计算服务客户信任体系能力要求 第14部分:机器学习服务》、《高性能计算(HPC)云平台能力要求》、《智算工程平台能力要求》等国内标准。在国际方面,于2020年在ITU SG16成功牵头立项人工智能云平台技术规范(AICP,Technical specification for artificial intelligence cloud platform)标准体系,并陆续完成ITU-T AICP 系列标准总体架构F.AICP-GA(F.748.38)、模型开发F.AICP-MD(F.748.17)、性能F.AICP-Performance(F.748.26)、模型部署F.AICP-MDep标准结项发布工作。通过构建全面、科学的国内国际评估体系,帮助企业明确技术方向、优化资源配置,同时为行业用户提供选型参考,加速AI技术在垂直领域的应用落地。基于前期工作,2025年智算云(AI云)平台服务标准体系国际国内评估正式启动,欢迎各界广泛参与!

评估体系介绍

国内标准

平台类

1、《智算工程平台能力要求》

标准内容:涵盖智算管理运维服务、数据工程服务、模型开发训练服务、模型推理部署服务、智算安全服务、AI能力中心、中间件服务以及应用服务八个部分,共220余项能力项。

面向对象:提供智算云平台基础设施和服务的厂商

标准意义:旨在客观衡量智算工程平台产品能力,从而为制造商建设和优化智算工程平台提供方向,帮助用户以尽可能低的成本选择符合需求的工程平台产品,促进行业的规范化和快速发展。

智算工程平台总体框架

2、《大模型服务平台能力要求》

标准内容:涵盖大模型接入、推理优化、模型转换、模型交付、模型评估、服务治理等核心平台服务能力

面向对象:大模型企业级服务平台提供商

标准意义:通过明确大模型服务的关键技术指标和服务能力边界,为行业提供了统一的评价基准,加速大模型在智能制造、金融服务等垂直领域的规模化落地,同时引导厂商从单纯算力竞争转向服务质量与生态兼容性提升

大模型服务平台能力框图

3、《机器学习平台》

标准内容:该标准内容包括五个方面:一是基础资源能力要求;二是平台架构能力要求;三是平台高可用性;四是平台性能;五是机器学习平台安全要求。

面向对象:提供机器学习平台服务商以及企业自建机器学习平台产品

标准意义:适用于指导云厂商建设机器学习服务规范以及为企业用户选择机器学习平台产品提供参考,同时规范了机器学习服务的评估方法。

4、《高性能计算(HPC)云平台能力要求》

标准内容:该标准内容高性能计算云平台包括基础资源层、平台能力层、应用层,同时包含平台运维管理能力及平台性能

面向对象:提供智算/超算平台服务商以及企业智算/超算平台产品

标准意义:明确HPC云平台的算力调度、平台能力、应用能力等核心能力要求,为异构资源云平台建设提供统一参考。

5、《企业训推一体化平台能力要求》(编制中...)

标准对象:面向支持超大规模参数模型的训练、推理一体化平台。

标准意义:明确了企业训推一体化平台应具备的核心能力和技术要求,为企业构建高效、灵活、可扩展的训推一体化平台提供科学指导和规范,针对不同行业一体化平台提出可实施建设路径。

专项技术类

1、《智算云平台技术服务能力要求 第1部分:智算云资源调度与管理》

标准内容:包含算力纳管、算力感知、算力监控 、算力调度、算力运营、算力运维、性能评估七个部分功能100余项能力项,旨在为设计、运行、优化及评估智算云资源管理和调度能力提供参考。

面向对象:智算调度服务产品

标准意义:该标准规范了智算云平台资源管理和调度技术路径技术和服务能力要求,有助于规范企业智算资源调度技术服务的建设和运营水平,通过评估资源利用效率,运营成本,提高算力资源经济效益。

2、《智算云平台技术服务能力要求 第2部分:训推加速》

标准内容:包含并行策略、计算加速、模型压缩、显存优化、参数优化、系统优化等部分内容。

面向对象:支持AI大模型训推加速及相关产品和解决方案。

标准意义:评估企业存储、网络、计算的协同优化技术,从而支持更大的模型、更长的上下文、更高的性能及更低的能耗,促进算力芯片在大模型训练推理方面的更好应用。

应用服务类

1、《智算云平台应用服务能力要求 第1部分:智能体交付》

标准内容:规范了智能体交付管理能力要求,包括规划与准备、开发与测试、部署与上线、运行与改进四个阶段。

面向对象:面向企业级智能体平台和解决方案。

标准意义:规范智能体的研发与设计,确保其在诞生之初便具备合格的观测能力,还能为不同应用场景下衡量智能体的性能提供清晰的参照,帮助使用者筛选出最契合需求的智能体,同时也为智能体技术持续健康发展、不断拓展应用边界奠定坚实的基础,让智能体推动各行业高质量发展。

2、《智算云平台应用服务能力要求 第2部分:一体机》

标准内容:评估覆盖跨模态数据融合能力和异构资源动态调度能力评估,包括文本、图像、音频等模态的联合训练与推理能力。

面向对象:面向芯片厂商、服务器厂商、软件平台厂商、系统集成商、云服务商。

标准意义:评估各类具备大模型训练推理功能的 “全栈式” 人工智能设备的行业基准,推动行业的规范化与高质量发展。面向大模型的智算一体化解决方案针对大模型一体机供应方,为大模型一体机技术水平提供行业基准;针对需求方,提供安全可信、开箱即用的大模型一体机选型参考。

国际标准

ITU国际标准评估背景:2022年10月,中国信息通信研究院中国泰尔实验室经评定获得国际电联(ITU)“一致性和互操作性(C&I)计划”认可,正式进入ITU认可的检测实验室数据库,这标志着中国泰尔实验室的ITU-T国际标准测试能力被国际权威标准化组织承认及肯定。

ITU国际标准评估意义:为了加快推进信息化标准国际化,促进国内人工智能云平台产品在关键领域、前沿技术上保持与国际标准相同步,助力国内人工智能云平台产品通过国际标准的验证与认可,中国信通院正式启动ITU-T AICP 系列标准评估工作。

人工智能云平台总体架构图

目前,中国信通院已开放总体架构F.AICP-GA(F.748.38)、模型开发F.AICP-MD(F.748.17)、性能F.AICP-Performance(F.748.26)、模型部署F.AICP-MDep四项ITU国际标准评估工作。

总体架构F.AICP-GA:旨在衡量企业人工智能云平台的技术规格和能力范围。指导云供应商构建人工智能云平台服务规范,为企业用户选择人工智能云平台产品提供参考。

模型开发F.AICP-MD:为人工智能云平台模型开发提供了参考架构和分级功能要求。规定了模型开发应包含的能力描述,以及AI模型开发的最低和高阶功能要求。

模型部署F.AICP-MDep:旨在规定人工智能模型部署的框架,以及支持人工智能模型部署的人工智能云平台的功能要求,包括模型处理和部署管理两个核心模块的功能要求。

性能F.AICP-Performance:为人工智能云平台提供了一个全面的性能评估框架。包括评估框架概述、云平台性能评估的规范、工作负载和指标和评估结果的要求。

评估流程

1

评估

报名即日起至2025年3月。

2

合同签订

报名完成后与中国信通院签订商务合同。

3

技术测评

合同确认后,将安排测试人员对接,并根据准备情况排期开展评估。

4

专家评审

评测结束后,由我院组织行业技术专家对本批次参评产品统一进行答辩评审。

5

结果发布

2025年上半年成果大会正式颁发国际/国内标准证书。

评估相关事宜,请联系:

中国信息通信研究院云计算与大数据研究所

刘天赐

电话:13716468283(同微信)

邮箱:liutianci@caict.ac.cn

韩思齐

电话:18810575307(同微信)

邮箱:hansiqi@caict.ac.cn

庄祎

电话:15330061027

邮箱:zhuangyi@caict.ac.cn继续滑动看下一个轻触阅读原文

云计算与大数据研究所向上滑动看下一个

原标题:《云端赋能加速AI落地 | 2025年智算云(AI云)平台服务标准体系国际国内评估正式启动》