×

DXOMARK 发布第六版智能手机影像测试基准:着眼用户真实体验,升级评测体系

AI

DXOMARK 发布第六版智能手机影像测试基准:着眼用户真实体验,升级评测体系

hqy hqy 发表于2025-07-08 浏览2 评论0

2025年6月26日,中国北京,全球领先的智能手机影像、屏幕、电池及其他大众和专业电子产品质量评估领域机构DXOMARK于今日正式发布第六版智能手机影像测试基准,这是其自2022年第五版更新以来,基于两年间全球用户调研与技术创新的又一次重大体系升级。新基准立足于全球用户洞察结果,在人像摄影、HDR 、变焦能力及视频拍摄四大维度对测试的方法论进行了系统性革新,并同时推出全新的评分架构与权重体系,为智能手机影像技术发展打造更贴近现实使用场景的评测基准。

“巢燧”大模型基准测试发布国内深度推理大模型评测报告

AI

“巢燧”大模型基准测试发布国内深度推理大模型评测报告

hqy hqy 发表于2025-07-08 浏览2 评论0

  继DeepSeek-R1开源发布之后,国内多家企业陆续研发和上线了深度推理大模型。“巢燧”大模型基准测试密切追踪国内深度推理大模型最新进展,近期,红星新闻联合天津大学自然语言处理实验室,依托“燧观”大模型智能测试平台,开展“巢燧”大模型基准综合评测第三次评测,对国内几款主流深度推理大模型进行了系统评测,覆盖数学、多步推理、代码三大维度。希望通过系统而全面的推理大模型评测,为中国AI发展提供关键数据,实现AI智善和谐发展。

AI

中国信通院牵头的大模型基准测试ITU国际标准正式发布

hqy hqy 发表于2025-07-08 浏览2 评论0

国际电信联盟电信标准分局(ITU-T)于2025年3月正式发布ITU-T F.748.44 基础模型的评估标准:基准测试/ Assessment criteria for foundation models: Benchmark。该项国际标准由中国信息通信研究院(简称“中国信通院”)牵头制定,规范了大模型基准测试的指标要求和测试方法。该标准旨在推动大模型基准测试体系架构形成国际共识,为大模型技术提供方和应用方提供高质量的能力评估依据,引导大模型技术及产业健康有序发展。