AI
小米MiMo模型:如何从预训练到后训练全面激发大语言模型推理潜力梦境谜团:源于潜意识,还是平行宇宙的投影?
hqy 发表于2025-05-16 浏览10 评论0
2025年5月,小米LLM核心团队发布了一项突破性研究,展示了他们全新的大语言模型MiMo-7B如何在数学和编程推理任务上取得卓越成绩。这项研究发表于arXiv(arXiv:2505.07608v1),论文链接为
https://github.com/xiaomimimo/MiMo。AI
新型AI芯片将大语言模型能耗减半老照片:被飞机撞击的美国帝国大厦,末代沙皇被处决后的现场
hqy 发表于2025-05-16 浏览13 评论0
南方财经5月15日电,美国俄勒冈州立大学科研团队研发出一种新型AI芯片,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的“绿色钥匙”。当前,以谷歌“双子座”和OpenAI的GPT-4为代表的大语言模型,因海量参数使得算力需求激增,进而导致能源需求急速飙升。研究团队指出,问题的关键在于数据中心铜基通信链路的数据传输。高速数据交换不仅会产生误差,更会带来巨大的能源浪费。传统均衡器虽能纠错,但其自身就是“电老虎”。一种解决方案是开发更高效的有线通信芯片。他们开发的新芯片能够借助AI技术,通过训练其上的分类器识别并纠正错误,以更智能高效的方式恢复数据,从而降低能耗。与传统设计相比,新芯片能使大语言模型消耗的能源减半。(科技日报)
AI
北京连屏申请基于自然语言理解的多模态大语言模型对话生成专利,提高对用户意图的理解能力
hqy 发表于2025-05-16 浏览11 评论0
本文源自:金融界
金融界2025年5月16日消息,国家知识产权局信息显示,北京连屏科技股份有限公司申请一项名为“一种基于自然语言理解的多模态大语言模型对话生成方法”的专利,公开号CN119989268A,申请日期为2025年1月。
AI
达观数据取得基于大语言模型协同知识图谱的 AI Agent 智能体及其实现方法专利
hqy 发表于2025-05-16 浏览11 评论0
本文源自:金融界
金融界 2025 年 5 月 16 日消息,国家知识产权局信息显示,达观数据有限公司取得一项名为“一种基于大语言模型协同知识图谱的 AI Agent 智能体及其实现方法”的专利,授权公告号 CN119377360B ,申请日期为 2024 年 12 月。
AI
歆广数据取得基于大语言模型的案由模版结构创建系统及方法专利
hqy 发表于2025-05-16 浏览8 评论0
本文源自:金融界
金融界2025年5月16日消息,国家知识产权局信息显示,上海歆广数据科技有限公司取得一项名为“一种基于大语言模型的案由模版结构创建系统及方法”的专利,授权公告号CN118966182B,申请日期为2024年7月。
AI
思必驰申请基于大语言模型后处理的长语音识别专利,提高长语音识别的准确率
hqy 发表于2025-05-16 浏览8 评论0
本文源自:金融界
金融界2025年5月16日消息,国家知识产权局信息显示,思必驰科技股份有限公司申请一项名为“基于大语言模型后处理的长语音识别方法及电子设备”的专利,公开号CN119993136A,申请日期为2025年2月。
AI
山东浪潮申请联邦大语言模型训练专利,能实现预置大语言模型的训练更新
hqy 发表于2025-05-16 浏览10 评论0
本文源自:金融界
金融界 2025 年 5 月 16 日消息,国家知识产权局信息显示,山东浪潮科学研究院有限公司申请一项名为“一种联邦大语言模型的训练方法、装置、设备及介质”的专利,公开号 CN119990367A,申请日期为 2025 年 1 月。
AI
孚临科技取得基于大语言模型的财务数据深度分析方法专利
hqy 发表于2025-05-16 浏览9 评论0
本文源自:金融界
金融界2025年5月16日消息,国家知识产权局信息显示,浙江孚临科技有限公司取得一项名为“一种基于大语言模型的财务数据深度分析方法”的专利,授权公告号CN119809844B,申请日期为2025年3月。
AI
国网信息通信产业及福建亿榕取得基于知识增强及自适应微调的电力大语言模型构建方法专利
hqy 发表于2025-05-16 浏览10 评论0
本文源自:金融界
金融界2025年5月16日消息,国家知识产权局信息显示,国网信息通信产业集团有限公司、福建亿榕信息技术有限公司取得一项名为“基于知识增强及自适应微调的电力大语言模型构建方法”的专利,授权公告号CN119416874B,申请日期为2025年1月。
AI
沃东天骏取得应用大语言模型的方法和装置专利
hqy 发表于2025-05-16 浏览8 评论0
本文源自:金融界
金融界2025年5月16日消息,国家知识产权局信息显示,北京沃东天骏信息技术有限公司、北京京东世纪贸易有限公司取得一项名为“应用大语言模型的方法和装置”的专利,授权公告号CN118709195B,申请日期为2024年6月。