×

AI

红杉中国推出全新AI基准测试xbench,要在AI下半场定义“好问题”

hqy hqy 发表于2025-06-06 浏览3 评论0

随着基础模型的快速发展和AI Agent进入规模化应用,被广泛用于评估AI能力的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实反映AI系统的客观能力正变得越来越困难,这其中最直接的表现——基础模型“刷爆”了市面上的基准测试题库,纷纷在各大测试榜单上斩获高分甚至满分。

原创
            普京政府彻底醒悟,俄罗斯落难之时,唯有中国不会去“落井下石”

AI

原创 普京政府彻底醒悟,俄罗斯落难之时,唯有中国不会去“落井下石”

hqy hqy 发表于2025-06-06 浏览3 评论0

在西方制裁和乌俄冲突的交叉火焰中,俄罗斯的能源战略正经历着前所未有的动荡与挑战。普京政府愈发清醒地认识到,在其经济困境面前,唯一不会趁火打劫的国家便是中国。近日,俄罗斯天然气巨头俄气终于宣布放弃了其雄心勃勃的土耳其天然气枢纽计划,这一决定源于现实的无奈与对未来的重新思考。