×

AI

科大讯飞:认知智能领域陆续开源6个大类超40个中文预训练语言模型幽州在什么地方,为何在古代,这块地区总能成为叛军的根据地呢?

hqy hqy 发表于2025-05-20 浏览14 评论0

金融界5月7日消息,有投资者在互动平台向科大讯飞提问:你好,请问公司最新发布的星火X1什么时候能开源?

公司回答表示:您好,科大讯飞在认知智能领域陆续开源了6个大类、超过40个通用领域的系列中文预训练语言模型,并于2024年1月发布深度适配国产算力的星火开源-13B模型,感谢您的关注。

阿里巴巴公布大语言模型新专利 可解决答复准确性较低的问题杭州湾北岸抗战人物黄八妹◇看上海金山区文史社团如何记述她?

AI

阿里巴巴公布大语言模型新专利 可解决答复准确性较低的问题杭州湾北岸抗战人物黄八妹◇看上海金山区文史社团如何记述她?

hqy hqy 发表于2025-05-20 浏览15 评论0

天眼查App显示,5月13日,阿里巴巴(中国)网络技术有限公司申请的“大语言模型的训练方法和信息处理方法”专利公布。

摘要显示,本申请涉及人工智能技术领域。其中,该方法包括:获取第一知识信息;将第一知识信息输入到大语言模型中,以使大语言模型学习第二知识信息,得到学习后的大语言模型;依据第二知识信息,构建训练样本集,其中,训练样本集至少包括多个知识样本,以及知识样本对应的第一答复信息和第二答复信息;通过训练样本集对学习后的大语言模型进行监督训练,得到目标大语言模型。本申请解决了相关技术中通过将相关知识输入到大语言模型中实现对大语言模型的训练,导致大语言模型答复准确性比较低的技术问题。

AI

小米MiMo模型:如何从预训练到后训练全面激发大语言模型推理潜力老照片:60年代慰问美军的韩国女团,入侵捷克斯洛伐克的华约军队

hqy hqy 发表于2025-05-20 浏览14 评论0

2025年5月,小米LLM核心团队发布了一项突破性研究,展示了他们全新的大语言模型MiMo-7B如何在数学和编程推理任务上取得卓越成绩。这项研究发表于arXiv(arXiv:2505.07608v1),论文链接为

https://github.com/xiaomimimo/MiMo。

AI

新型AI芯片将大语言模型能耗减半他曾被扔进粪坑,熬死4代皇帝装傻36年,登基后雪耻成为千古贤君

hqy hqy 发表于2025-05-20 浏览16 评论0

南方财经5月15日电,美国俄勒冈州立大学科研团队研发出一种新型AI芯片,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的“绿色钥匙”。当前,以谷歌“双子座”和OpenAI的GPT-4为代表的大语言模型,因海量参数使得算力需求激增,进而导致能源需求急速飙升。研究团队指出,问题的关键在于数据中心铜基通信链路的数据传输。高速数据交换不仅会产生误差,更会带来巨大的能源浪费。传统均衡器虽能纠错,但其自身就是“电老虎”。一种解决方案是开发更高效的有线通信芯片。他们开发的新芯片能够借助AI技术,通过训练其上的分类器识别并纠正错误,以更智能高效的方式恢复数据,从而降低能耗。与传统设计相比,新芯片能使大语言模型消耗的能源减半。(科技日报)