×

2025人工智能系列深度报告:DeepSeek研究框架

hqy hqy 发表于2025-04-06 01:11:38 浏览11 评论0百度已收录

抢沙发发表评论

今天分享的是:2025人工智能系列深度报告:DeepSeek研究框架

报告共计:51页

《DeepSeek研究框架——计算机人工智能系列深度报告》由国海证券发布,深度剖析了DeepSeek在AI领域的创新、影响及发展趋势。

1. 公司与模型概览:DeepSeek于2023年7月由幻方量化创立,专注大模型技术。其团队年轻且技术底蕴深厚,薪酬对标字节跳动研发岗。自2024年起,陆续发布多款模型,如DeepSeek LLM、DeepSeek-V3、DeepSeek-R1等。这些模型基于Transformer架构,运用MLA、DeepSeek MoE等核心技术,在性能上表现卓越,DeepSeek-V3性能与GPT-4o、Claude-3.5-Sonnet相当,DeepSeek-R1在数学、代码等任务上比肩OpenAI o1正式版,且二者均具高性价比优势。

2. 行业影响深远:DeepSeek对全球AI行业影响重大。它激发了行业创新,促使全球AI模型迭代和发布加速,如OpenAI在DeepSeek-R1发布后连续推出新模型。同时,提振了国产AI产业信心,探索出“算法创新 + 有限算力”的发展路径,有望驱动国产AI软硬件估值重塑。此外,作为开源AI的重要推动者,其开源策略吸引了更多开发者参与,加速了全球AI创新进程。

3. 应用与算力变革:在AI应用方面,DeepSeek降低了推理模型成本,加速了AI应用在各领域的布局。其强化学习框架下,代码、教育、医疗等垂直领域有望大规模应用低成本模型。通过模型蒸馏,赋予小模型高性能,推动端侧AI发展,全球端侧AI市场规模预计大幅增长。在算力层面,DeepSeek V3训练成本相对较低,但整体训练总成本较高。其发展符合Jevons悖论,虽提升了计算效率,但推理需求增长导致算力需求上升。推理算力需求占比持续提升,GenAI云厂商将从中受益。并且,受推理化趋势和中美博弈影响,国产AI芯片需求有望提升,其硬件性能、软件调用能力不断增强,生态逐渐蓬勃发展。

以下为报告节选内容

报告共计: 51页

中小未来圈,你需要的资料,我这里都有!返回搜狐,查看更多