AI
AI 基准测试曝出丑闻:大厂模型都在做手脚 ?
hqy 发表于2025-02-27 浏览5 评论0
AI
惊爆!OpenAI员工炮轰xAI,Grok 3基准测试结果遭疑
hqy 发表于2025-02-27 浏览4 评论0
在人工智能领域飞速发展的当下,各大科技公司之间的竞争也愈发激烈。2025年2月23日,一则关于OpenAI与xAI之间的争议新闻,再次将AI基准测试的准确性和有效性推到了公众视野的焦点位置。
AI
新 AI 基准测试 EnigmaEval 问世,所有模型得分挂零
hqy 发表于2025-02-27 浏览4 评论0
AI
xAI 在 Grok 3 的基准测试上疑似伪造
hqy 发表于2025-02-27 浏览8 评论0
在当今人工智能飞速发展的时代,AI 基准测试作为衡量模型能力的关键手段,其重要性不言而喻。通过设计合理的任务、数据集和指标对大模型进行基准测试,不仅能评估当前技术水平,指引学术研究和产品研发方向,还能增进公众对人工智能的正确认知。然而,近期关于 AI 基准测试以及 AI 实验室如何报告这些基准测试的争论,却逐渐进入公众视野,引发了广泛关注。
AI
不会打游戏的大模型不是好AI?甲骨文最强模型用《宝可梦》当“期末考”
hqy 发表于2025-02-27 浏览6 评论0
财联社2月25日讯(编辑 马兰)甲骨文周一发布了其最强模型Claude 3.7 Sonnet,据甲骨文称,该模型同时具备推理能力和传统实时生成文本的能力,是市面上唯一的混合模型。
AI
xAI 是否对 Grok 3 的基准测试撒了谎?
hqy 发表于2025-02-27 浏览12 评论0
关于人工智能基准的争论——以及人工智能实验室如何报告这些基准——正在进入公众视野。
AI
微软CEO对AI持续炒作感到厌倦 称很多是无意义的基准测试
hqy 发表于2025-02-27 浏览7 评论0

AI
信息量巨大!13部门联合发文,支持这类企业上市!
hqy 发表于2025-02-27 浏览4 评论0

AI
国务院关于印发计量发展规划(2021—2035年)的通知
hqy 发表于2025-02-27 浏览11 评论0
国务院关于印发计量发展规划(2021—2035年)的通知

AI
工业领域大规模设备更新来了!
hqy 发表于2025-02-27 浏览7 评论0
来源:工信微报微信
导 读