2025人工智能系列深度报告：DeepSeek研究框架

今天分享的是：2025人工智能系列深度报告：DeepSeek研究框架

报告共计：51页

《DeepSeek研究框架——计算机人工智能系列深度报告》由国海证券发布，深度剖析了DeepSeek在AI领域的创新、影响及发展趋势。

1. 公司与模型概览：DeepSeek于2023年7月由幻方量化创立，专注大模型技术。其团队年轻且技术底蕴深厚，薪酬对标字节跳动研发岗。自2024年起，陆续发布多款模型，如DeepSeek LLM、DeepSeek-V3、DeepSeek-R1等。这些模型基于Transformer架构，运用MLA、DeepSeek MoE等核心技术，在性能上表现卓越，DeepSeek-V3性能与GPT-4o、Claude-3.5-Sonnet相当，DeepSeek-R1在数学、代码等任务上比肩OpenAI o1正式版，且二者均具高性价比优势。

2. 行业影响深远：DeepSeek对全球AI行业影响重大。它激发了行业创新，促使全球AI模型迭代和发布加速，如OpenAI在DeepSeek-R1发布后连续推出新模型。同时，提振了国产AI产业信心，探索出“算法创新 + 有限算力”的发展路径，有望驱动国产AI软硬件估值重塑。此外，作为开源AI的重要推动者，其开源策略吸引了更多开发者参与，加速了全球AI创新进程。

3. 应用与算力变革：在AI应用方面，DeepSeek降低了推理模型成本，加速了AI应用在各领域的布局。其强化学习框架下，代码、教育、医疗等垂直领域有望大规模应用低成本模型。通过模型蒸馏，赋予小模型高性能，推动端侧AI发展，全球端侧AI市场规模预计大幅增长。在算力层面，DeepSeek V3训练成本相对较低，但整体训练总成本较高。其发展符合Jevons悖论，虽提升了计算效率，但推理需求增长导致算力需求上升。推理算力需求占比持续提升，GenAI云厂商将从中受益。并且，受推理化趋势和中美博弈影响，国产AI芯片需求有望提升，其硬件性能、软件调用能力不断增强，生态逐渐蓬勃发展。

以下为报告节选内容