2025年2月27日第86页 - 一个和谐有爱的空间

HQY

欢迎光临，有什么想法就留言告诉我吧！

你的精彩评论可能会出现在这里哦！留言抢沙发

AI

AI 基准测试曝出丑闻：大厂模型都在做手脚？

hqy 发表于2025-02-27 浏览15 评论0

AI

惊爆！OpenAI员工炮轰xAI，Grok 3基准测试结果遭疑

hqy 发表于2025-02-27 浏览13 评论0

在人工智能领域飞速发展的当下，各大科技公司之间的竞争也愈发激烈。2025年2月23日，一则关于OpenAI与xAI之间的争议新闻，再次将AI基准测试的准确性和有效性推到了公众视野的焦点位置。

AI

新 AI 基准测试 EnigmaEval 问世，所有模型得分挂零

hqy 发表于2025-02-27 浏览17 评论0

AI

xAI 在 Grok 3 的基准测试上疑似伪造

hqy 发表于2025-02-27 浏览27 评论0

在当今人工智能飞速发展的时代，AI 基准测试作为衡量模型能力的关键手段，其重要性不言而喻。通过设计合理的任务、数据集和指标对大模型进行基准测试，不仅能评估当前技术水平，指引学术研究和产品研发方向，还能增进公众对人工智能的正确认知。然而，近期关于 AI 基准测试以及 AI 实验室如何报告这些基准测试的争论，却逐渐进入公众视野，引发了广泛关注。

AI

不会打游戏的大模型不是好AI？甲骨文最强模型用《宝可梦》当“期末考”

hqy 发表于2025-02-27 浏览19 评论0

财联社2月25日讯（编辑马兰）甲骨文周一发布了其最强模型Claude 3.7 Sonnet，据甲骨文称，该模型同时具备推理能力和传统实时生成文本的能力，是市面上唯一的混合模型。

AI

xAI 是否对 Grok 3 的基准测试撒了谎？

hqy 发表于2025-02-27 浏览26 评论0

关于人工智能基准的争论——以及人工智能实验室如何报告这些基准——正在进入公众视野。

AI

微软CEO对AI持续炒作感到厌倦称很多是无意义的基准测试

hqy 发表于2025-02-27 浏览22 评论0

信息量巨大！13部门联合发文，支持这类企业上市！

AI

信息量巨大！13部门联合发文，支持这类企业上市！

hqy 发表于2025-02-27 浏览16 评论0

国务院关于印发计量发展规划（2021—2035年）的通知

AI

国务院关于印发计量发展规划（2021—2035年）的通知

hqy 发表于2025-02-27 浏览22 评论0

国务院关于印发计量发展规划（2021—2035年）的通知

工业领域大规模设备更新来了！

AI

工业领域大规模设备更新来了！

hqy 发表于2025-02-27 浏览17 评论0

来源：工信微报微信

导读

« 2025年2月 »
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28

一句话侧栏

我在人生的道路上迷失了。

控制面板

您好，欢迎到访网站！
查看权限

网站分类

最近发表

最新留言

文章归档

标签列表

友情链接

蓝队云提供免费虚拟主机