AI
GPT-2训练要耗费多少内存,提供一个相对可靠的公式(上)
hqy 发表于2025-02-28 浏览6 评论0
《Transformer分析之模型训练内存计算的一个简单公式》介绍了Transformer算法内存占用的一个公式,但不是特别严谨,遗漏了很多细节,同时也没有与实际训练进行比较。

AI
GPT-2&GPT-3&BART论文阅读笔记
hqy 发表于2025-02-28 浏览12 评论0
《language models are unsupervised multitask learners》 2019,GPT-2GPT、BERT需要采用监督微调的方法来适应特定的下游任务,GPT-2希望可以通过更大的模型,通过无监督训练之后,可以zero-shot完成多种下游任务。《Language Models are Few-Shot Learners》 2020,GPT-3

AI
干货 | DeepSeek为何会火?又怎么赋能汽车?肥皂捏假人头、挖洞一年,史上“高智商”越狱,逃亡61年仍没下落
hqy 发表于2025-02-28 浏览14 评论0
本文没有废话,只谈三件事儿。第一是简介DeepSeek的基础知识,二来汇总一下当下融合DeepSeek的车企,最后聊聊DeepSeek对汽车的影响。全文约5000字,建议开启「听全文」。
AI
最高降价75%!DeepSeek官宣!
hqy 发表于2025-02-28 浏览5 评论0

AI
最高优惠75%!DeepSeek推错峰优惠,下调API夜间空闲时段价格
hqy 发表于2025-02-28 浏览4 评论0
AI
招商信诺携手华为云接入DeepSeek大模型
hqy 发表于2025-02-28 浏览5 评论0
近日,招商信诺人寿保险有限公司(以下简称“招商信诺”)宣布与华为云昇腾AI云服务达成合作,基于DeepSeek大模型展开业务创新,推动保险服务的智能化升级。

AI
当高校“定制版”DeepSeek开启“深度求索”
hqy 发表于2025-02-28 浏览4 评论0
登录学校“DeepSeek版”网页,打开对话框,输入指令,数秒之内,便可获得文章架构……这样的应用场景近期出现在多所高校中。新学期伊始,清华大学、浙江大学、上海交通大学、东南大学、中国人民大学、武汉大学、北京师范大学等高校陆续宣布开展DeepSeek的实践应用,不少学校本地化部署了“满血版”DeepSeek。当高校与DeepSeek相遇,会碰撞出怎样的火花?如何用好DeepSeek这把人工智能(AI)双刃剑?如何发挥“DeepSeek+”优势,为教育赋能?带着上述问题,本报记者采访多位教育专家,展开了一场关于教育的“深度求索”……

AI
山东已有多所高校接入DeepSeek
hqy 发表于2025-02-28 浏览13 评论0
AI
沈阳文旅系统举办DeepSeek赋能数字文旅产业培训会
hqy 发表于2025-02-28 浏览13 评论0
转自:沈阳日报
本报讯(沈阳日报、沈报全媒体记者谢飞燕)近日,沈阳文旅系统DeepSeek赋能数字文旅产业培训会在沈阳博物馆报告厅举行。会议由沈阳市文化旅游和广播电视局主办,全市文旅系统及行业头部企业代表共聚一堂,探索AI技术赋能文旅产业高质量发展的创新路径。

AI
DeepSeek带火这个岗!急缺,高薪!
hqy 发表于2025-02-28 浏览11 评论0
2025年春节,中国人工智能大模型DeepSeek在全球引发轰动。DeepSeek的崛起也让相关领域的人才在这个春招季炙手可热。