中国 AI 应用与大模型 — DeepSeek / 智谱 / 豆包 / 通义 / 国产化主线
本质:2025-01 DeepSeek R1 以 1/10 成本对标 GPT-4o 震撼全球,中国 AI 进入"开源 + 低成本 + 追赶"新阶段。国产大模型 6 大派系:字节豆包(C 端 DAU 第一)/ DeepSeek(开源 + 推理王)/ 智谱 GLM(B 端 + 学术)/ 月之暗面 Kimi(长文本)/ 通义 Qwen(阿里 + 开源)/ 腾讯混元 + 百度文心 + 华为盘古。投资映射:直接受益(字节 + 阿里 + 腾讯 + 百度 + 科大讯飞)+ 算力基础(中芯 + 寒武纪 + 海光 + 华为昇腾)+ 数据中心(光迅 + 中际旭创)+ 电力(长江电力 + 核电)+ 终端应用(WPS / 有道 / 福昕)。
学习目标
读完本页后,你应该能够:
- 默写6 大国产大模型玩家 + 代表模型
- 理解 DeepSeek R1 低成本突破的技术 + 商业含义
- 区分 C 端 vs B 端 vs 开源 模型竞争格局
- 识别 算力限制(美国芯片禁运)+ 国产替代
- 评估 AI 应用 3 层:(i) 基础模型;(ii) 中间层 API;(iii) 应用层
- 给组合选择上游 / 中游 / 下游 AI 标的
- 跟踪关键 KPI:模型能力 / DAU / API 调用 / 算力采购
Summary
6 大国产大模型派系(2026-04):(1) 字节豆包(字节跳动,2024-05 发布,DAU 8000 万+ 国内 C 端第一,基于 Seed 自研);(2) DeepSeek(幻方量化子,2024-05 V2 / 2025-01 R1 / 2025-04 V3 —— 开源 + 推理王);(3) 智谱 GLM(清华系,B 端 + 政企强,估值 30B);(4) **月之暗面 Kimi**(杨植麟,长文本 200K+ context);(5) **阿里 Qwen**(通义千问,**全球开源榜首**,全栈能力);(6) **腾讯混元 + 百度文心 + 华为盘古 + 科大讯飞 星火**。**DeepSeek R1 震撼**:MoE 架构 + 强化学习 + **训练成本 5.6M**(OpenAI GPT-4 估计 100M+)+ **API 定价 0.55/百万 token**(vs GPT-4 30)\to 2025-01 全球 AI 估值重估。**算力限制**:美国 2022 + 2023 + 2025 三次升级芯片禁运,H100 / H200 / B200 禁止出口;中国用 A100 / H800 / 华为昇腾 910B / 寒武纪思元 / 海光 DCU 替代。**"算力天花板"** vs **"算法突破"** 的赛跑。**AI 应用投资 3 层**:基础模型(BAT + 字节 + 智谱)/ 算力基础(中芯 + 寒武纪 + 华为系 + 光通信)/ 终端应用(WPS + 有道 + 金山 + 福昕 + 百度 + 字节)。**估值**:(a)字节(未上市,估值\400B)/ 阿里 280B / 腾讯 540B / 百度 $40B;(b)DeepSeek / 智谱 / 月之暗面 均未上市;(c)应用层 WPS / 有道 / 福昕 / 科大讯飞 总市值 ¥800B+。风险:(i) 美国进一步升级芯片禁运;(ii) 中国 AI 监管加强;(iii) 应用落地慢;(iv) 烧钱补贴无回报。投资结论:长期 AI 国产化 = 结构性机会;选标推荐算力上游 + 平台巨头 组合(占组合 5–10%);避免纯应用层同质化竞争。
1. 中国 AI 格局(2026-04)
1.1 6 大派系
| 派系 | 代表模型 | 估值 / 上市 | 特点 |
|---|---|---|---|
| 字节跳动 | 豆包(C 端)+ Seed | 未上市,$400B | C 端 DAU 第一 |
| DeepSeek(幻方) | DeepSeek V3 / R1 | 未上市 | 开源 + 推理王 |
| 智谱(清华) | GLM-4 / GLM-Z1 | 未上市,$30B+ | B 端 + 政企 |
| 月之暗面 | Kimi K1.5 | 未上市,$33B | 长文本 + C 端 |
| 阿里 | Qwen 系列 | 9988.HK | 开源榜首 + 全栈 |
| 腾讯 / 百度 / 华为 / 讯飞 | 混元 / 文心 / 盘古 / 星火 | 不同 | 大厂生态 |
1.2 市场份额(C 端 DAU,2026-04)
- 豆包(字节):8000 万
- Kimi(月之暗面):5000 万
- 文心一言(百度):3000 万
- 腾讯元宝 + 讯飞星火:各 3000 万
- 通义(阿里):2000 万
- DeepSeek 官方 App:4000 万
- 总国产 AI C 端 DAU 约 3 亿(部分重复)
1.3 开源模型影响力
| 模型 | 下载量 | 全球排名 |
|---|---|---|
| Qwen(阿里) | > 100M | 全球开源第一 |
| DeepSeek V3/R1 | > 50M | 第 2 |
| GLM-4(智谱) | 20M+ | 第 5 |
| Llama 3(Meta,参考) | 第 3 |
开源是国产核心战略 + 影响全球 AI 格局。
2. DeepSeek 现象
2.1 时间线
- 2024-05 DeepSeek V2(MoE 架构)
- 2024-12 V3(6710 亿参数)
- 2025-01-20 R1 发布(推理模型)
- 全球 AI 估值重估(英伟达 2 天跌 17%)
- 2025-04 V4(更快更便宜)
2.2 技术突破
R1 关键创新:
- MoE 稀疏激活(训练成本低 10×)
- 强化学习 + 冷启动(无需大量标注)
- 推理链路模拟 OpenAI o1
- 开源 + 免费商用
训练成本:
- DeepSeek V3: $5.58M
- GPT-4 估计:$78M
- 差距 14×
API 定价:
- DeepSeek V3:
0.27/M input /1.10/M output - GPT-4o:
2.50/M /10/M - 便宜 10×
2.3 商业模式
- 完全开源(代码 + 权重)
- 不主要靠 API 收入(给行业定义)
- 母公司幻方量化盈利支撑
- CEO 梁文锋:前量化基金经理 + 技术理想主义
2.4 全球影响
- 2025-01-27 美股 AI 集体下跌
- NVIDIA -17% / -$593B 市值(单日最大跌幅纪录)
- 重新评估"算力壁垒"
- 开源 AI 加速采用
2.5 投资者视角
- DeepSeek 不上市(公益性质声明)
- 但全行业受益:
- 算力需求仍增(应用爆发)
- 国产 API 更便宜 → 应用落地
- 中国 AI 估值重估
3. 字节豆包
3.1 规模
- DAU 8000 万+(国内 C 端第一)
- 覆盖:PC + 手机 + 车机 + 智能音箱
- 免费 + 无广告战略
3.2 技术
- Seed 自研模型
- Doubao-1.5-pro 性能接近 GPT-4
- 多模态(文字 + 图像 + 视频 + 语音)
3.3 字节 AI 布局
- C 端:豆包 + 抖音 AI
- 创作工具:剪映 + CapCut AI
- 企业:Coze 平台 + API
- 搜索:AI 增强抖音搜索
3.4 未上市
- 2024 估值 $400B
- TikTok 分拆传闻持续
- 主要对华上市障碍:政治 + 美股风险
3.5 投资思路
- 字节不直接可投
- 间接:
- 抖音电商受益方(吉利 / 海尔)
- TikTok 分拆潜在 IPO
4. 智谱 AI
4.1 背景
- 清华系(2019 孵化)
- 创始人:唐杰(清华 KEG 实验室)
- 学术 + 工程兼顾
4.2 模型
- GLM-4(2024-01)对标 GPT-4
- GLM-Z1(2025)推理模型
- ChatGLM 开源系列
4.3 商业化
- B 端 + 政企强
- 金融 / 政府 / 央企 / 医疗
- API + 私有化部署
- "AI 国家队" 地位
4.4 融资
- 2024 H2 新一轮 $30B 估值
- 股东:中关村 + 北京市国资 + 沙特 PIF + 腾讯
- 未上市
4.5 2026 可能港股上市
- 市场预期 2027 IPO
- 中概股港股上市热
5. 月之暗面(Kimi)
5.1 背景
- 创始人:杨植麟(清华毕业,Meta AI 前研究员)
- 2023 成立
- 主打长文本(支持 200K+ tokens)
5.2 产品
- Kimi Chat(C 端):DAU 5000 万
- Kimi K1.5(推理)
- Kimi Browser(2025 推出 AI 浏览器)
5.3 2024-2025 营销
- B 端广告投入大
- "大厂挖角阿里 系团队**"
- 腾讯 + 阿里 + 红杉 + 高瓴投资
5.4 融资
- 2024 估值 $33B
- 2025 继续融资
- 未上市
5.5 挑战
- C 端用户获取成本高
- 字节豆包压力大
- 需验证商业化
6. 阿里巴巴 Qwen
6.1 Qwen 家族
- Qwen-7B / 14B / 72B(2023-2024 开源)
- Qwen 2.5(2024-09)
- Qwen-VL(视觉)
- Qwen-Audio(音频)
- QwQ-32B(推理)
- Qwen-Max(闭源旗舰)
6.2 开源成就
- HuggingFace 全球开源模型第一
- 下载量 > 100M
- 社区贡献 活跃
6.3 阿里 AI 战略
- 阿里云 AI 底座(Bailian 百炼)
- 通义千问 API(2 价)
- 通义 C 端 App(DAU 2000 万)
- 钉钉 AI 办公
- 夸克搜索 AI
6.4 投资意义
- 阿里 9988.HK 最大 AI 敞口
- 未来云业务 + AI分拆可能
- 估值反映 AI 部分~10%
7. 腾讯 / 百度 / 华为 / 讯飞
7.1 腾讯 混元
7.2 百度 文心
- 文心一言(2023-03 第一家发布的中国大厂 LLM)
- 文心 4.0 Turbo(2024)
- 集成百度搜索 + 地图
- 但 C 端 DAU 不如豆包 + Kimi
7.3 华为 盘古
- 盘古大模型(2024)
- 行业专用(气象 / 医药 / 汽车)
- 不做 C 端
- 核心:昇腾 910B 算力
7.4 科大讯飞 星火
- 600519 科大讯飞(A 股)
- 语音 AI 龙头
- 星火大模型
- 教育 + 医疗 + 办公 场景
- 被阿尔特曼提及"让 OpenAI 紧张"(非实际)
8. 算力:中国 AI 的咽喉
8.1 美国芯片禁运
- 2022-10 第一次
- 2023-10 升级
- 2025-01 进一步细化
- 禁止:H100 / H200 / B200 / GB200
- 受限:A100 / H800(带宽降版)
8.2 华为昇腾
- 昇腾 910B(2022)
- 昇腾 910C(2025)
- 性能:H100 的 60–70%
- 但配套软件 + 生态弱
- 产能有限(中芯 7nm)
8.3 寒武纪
- 688256 A 股
- 思元 370 / 590
- MLU270 云端
- 2025 订单激增(字节 + 科大讯飞)
8.4 海光信息
- 688041 A 股
- DCU(AMD 架构授权)
- 国产替代 NVIDIA
8.5 中芯国际
- 688981 / 0981.HK
- 7nm 代工(2023 起)
- 服务昇腾 + 寒武纪 + 海光
- 产能瓶颈关键
8.6 DeepSeek 效应
- 低算力训练可能
- 减轻"算力荒"
- NVIDIA 股价冲击
- 但推理需求仍增
9. AI 应用 3 层投资
9.1 第 1 层:基础模型
直接受益:
- 阿里(9988.HK)—— Qwen + 云
- 腾讯(0700.HK)—— 混元 + 元宝
- 百度(9888.HK / BIDU)—— 文心 + 云
- 科大讯飞(002230)—— 星火
- 字节(未上市)
未上市(未来 IPO 概率):
- DeepSeek
- 智谱(预期 2027)
- 月之暗面
- 字节(受阻)
9.2 第 2 层:算力 + 基础设施
AI 芯片:
- 寒武纪(688256)
- 海光(688041)
- 华为(未上市但 A 股 + 港股供应链受益)
- 中芯国际(0981.HK / 688981)
- 华虹半导体(1347.HK / 688347)
光模块 / 网络:
- 中际旭创(300308)
- 光迅科技(002281)
- 新易盛(300502)
服务器:
- 浪潮信息(000977)
- 中科曙光(603019)
数据中心:
- 世纪华通 + 光环新网 + 数据港
电力 + 能源:
9.3 第 3 层:终端应用
办公:
- 金山办公 WPS(688111)—— AI Copilot
- 福昕软件(688095)—— PDF AI
- 用友网络(600588)—— 企业 SaaS AI
教育:
- 有道(DAO)
- 学而思 / 新东方(AI 个性化教学)
医疗:
- 鹰瞳科技(2251.HK)—— 医学影像 AI
- 平安好医生(1833.HK)
创意 / 设计:
- 万兴科技(300624)
自动驾驶:
10. 投资组合建议
10.1 核心暴露(2026-04)
推荐配置(占组合 5–10%):
平台巨头(3–5%):
- 腾讯(0700.HK):AI 应用 + 算力 + 投资组合
- 阿里(9988.HK):AI 云 + 开源 Qwen
- 百度(9888.HK):AI + 搜索(但执行力弱)
算力上游(2–3%):
- 中芯国际(0981.HK):半导体代工
- 寒武纪(688256):AI 芯片(高风险)
- 中际旭创(300308):光模块
终端应用(1–2%):
- 金山办公(688111)
- 科大讯飞(002230)
10.2 风险分散
- 不要单一押注(DeepSeek / 智谱未上市)
- 上中下游都配置
- 限制总 AI 敞口 10–15%
10.3 观察名单
- 字节 IPO(如果发生)
- 智谱 港股 IPO
- DeepSeek 融资动态
- 华为 可能独立上市(概率低)
11. 关键风险
11.1 美国进一步制裁
- 2025 已升级
- 2026–2027 可能再升级
- 实体清单扩大
- 对策:国产化加速
11.2 监管
- 生成式 AI 管理办法
- 内容审查
- 数据安全
- 对策:合规优先
11.3 应用落地慢
- B 端 ROI 难证明
- C 端免费战争
- 商业化挑战
- 对策:时间
11.4 算力瓶颈
- 国产芯片产能
- 中芯 7nm 良率
- 依赖华为+ 国企产能
11.5 人才流失
- 美国 AI 薪水 3–5× 国内
- 高端人才回国但顶尖流失
12. AI vs 科技估值
12.1 2025 AI 股涨幅
- 美股 Mag 7:+50%
- 英伟达:+170%(2024 Q4-2025 Q2)
- 中概 AI:分化
- 阿里:+100%
- 百度:+30%
- 腾讯:+40%
12.2 AI 泡沫担忧
12.3 中国 AI 估值
- 比美股便宜 50%+
- 但收入落后更多
- 相对机会
13. 跟踪清单
13.1 每周
- NVIDIA 股价(风向标)
- 新模型发布(DeepSeek / 字节)
- DAU 数据
13.2 每月
- API 调用量增长
- 芯片 + 算力 新闻
- 美国制裁动态
13.3 每季
- AI 厂商财报
- 估值变化
- 融资动态
13.4 年度
- State of AI Report(Nathan Benaich)
- 中国 AI 指数报告
- 技术突破(年度评选)
14. 对应读物
- 《State of AI Report》Nathan Benaich(年度)
- DeepSeek 技术报告(论文)
- 阿里 Qwen 论文系列
- 字节 Seed 论文
- Stratechery(Ben Thompson)AI 分析
- 机器之心 + 量子位(中文)
- 硅谷洞察 + AI Geek
15. 对应 wiki 页面
- 中国科技龙头 — 中国互联网
- 腾讯 — 混元 + 元宝
- NVIDIA — AI 算力
- TSMC — 全球芯片制造
- Chip War — 半导体地缘
- 量子计算 — 相关技术
- 中国宏观 — 新质生产力
- 美国宏观 — AI 生产率红利
- 地缘政治与投资 — 制裁风险
- 国产半导体 — 算力国产化
最后更新 2026-04-19。中国 AI 是最动态的技术主题。DeepSeek / 豆包 / 智谱 每季度可能变格局,NVIDIA 股价是全球 AI 情绪指标。
核心要点
- TODO: 通读全文后填入 5–10 条核心要点(每条 ≤80 字,含数字 / 名称 / 时间锚点)