中国 AI 应用与大模型 — DeepSeek / 智谱 / 豆包 / 通义 / 国产化主线

L4别名 AI 国产化 · DeepSeek · 智谱 · 月之暗面 · Kimi · 豆包 · 通义千问 · 文心一言 · 混元 · 国产大模型

本质:2025-01 DeepSeek R11/10 成本对标 GPT-4o 震撼全球,中国 AI 进入"开源 + 低成本 + 追赶"新阶段。国产大模型 6 大派系:字节豆包(C 端 DAU 第一)/ DeepSeek(开源 + 推理王)/ 智谱 GLM(B 端 + 学术)/ 月之暗面 Kimi(长文本)/ 通义 Qwen(阿里 + 开源)/ 腾讯混元 + 百度文心 + 华为盘古投资映射:直接受益(字节 + 阿里 + 腾讯 + 百度 + 科大讯飞)+ 算力基础(中芯 + 寒武纪 + 海光 + 华为昇腾)+ 数据中心(光迅 + 中际旭创)+ 电力(长江电力 + 核电)+ 终端应用(WPS / 有道 / 福昕)。

学习目标

读完本页后,你应该能够:

  • 默写6 大国产大模型玩家 + 代表模型
  • 理解 DeepSeek R1 低成本突破的技术 + 商业含义
  • 区分 C 端 vs B 端 vs 开源 模型竞争格局
  • 识别 算力限制(美国芯片禁运)+ 国产替代
  • 评估 AI 应用 3 层:(i) 基础模型;(ii) 中间层 API;(iii) 应用层
  • 给组合选择上游 / 中游 / 下游 AI 标的
  • 跟踪关键 KPI:模型能力 / DAU / API 调用 / 算力采购

Summary

6 大国产大模型派系(2026-04):(1) 字节豆包(字节跳动,2024-05 发布,DAU 8000 万+ 国内 C 端第一,基于 Seed 自研);(2) DeepSeek(幻方量化子,2024-05 V2 / 2025-01 R1 / 2025-04 V3 —— 开源 + 推理王);(3) 智谱 GLM(清华系,B 端 + 政企强,估值 30B);(4) **月之暗面 Kimi**(杨植麟,长文本 200K+ context);(5) **阿里 Qwen**(通义千问,**全球开源榜首**,全栈能力);(6) **腾讯混元 + 百度文心 + 华为盘古 + 科大讯飞 星火**。**DeepSeek R1 震撼**:MoE 架构 + 强化学习 + **训练成本 5.6M**(OpenAI GPT-4 估计 100M+)+ **API 定价 0.55/百万 token**(vs GPT-4 30)\to 2025-01 全球 AI 估值重估。**算力限制**:美国 2022 + 2023 + 2025 三次升级芯片禁运,H100 / H200 / B200 禁止出口;中国用 A100 / H800 / 华为昇腾 910B / 寒武纪思元 / 海光 DCU 替代。**"算力天花板"** vs **"算法突破"** 的赛跑。**AI 应用投资 3 层**:基础模型(BAT + 字节 + 智谱)/ 算力基础(中芯 + 寒武纪 + 华为系 + 光通信)/ 终端应用(WPS + 有道 + 金山 + 福昕 + 百度 + 字节)。**估值**:(a)字节(未上市,估值\400B)/ 阿里 280B / 腾讯 540B / 百度 $40B;(b)DeepSeek / 智谱 / 月之暗面 均未上市;(c)应用层 WPS / 有道 / 福昕 / 科大讯飞 总市值 ¥800B+。风险:(i) 美国进一步升级芯片禁运;(ii) 中国 AI 监管加强;(iii) 应用落地慢;(iv) 烧钱补贴无回报。投资结论:长期 AI 国产化 = 结构性机会;选标推荐算力上游 + 平台巨头 组合(占组合 5–10%);避免纯应用层同质化竞争

1. 中国 AI 格局(2026-04)

1.1 6 大派系

派系代表模型估值 / 上市特点
字节跳动豆包(C 端)+ Seed未上市,$400BC 端 DAU 第一
DeepSeek(幻方)DeepSeek V3 / R1未上市开源 + 推理王
智谱(清华)GLM-4 / GLM-Z1未上市,$30B+B 端 + 政企
月之暗面Kimi K1.5未上市,$33B长文本 + C 端
阿里Qwen 系列9988.HK开源榜首 + 全栈
腾讯 / 百度 / 华为 / 讯飞混元 / 文心 / 盘古 / 星火不同大厂生态

1.2 市场份额(C 端 DAU,2026-04)

  • 豆包(字节):8000 万
  • Kimi(月之暗面):5000 万
  • 文心一言(百度):3000 万
  • 腾讯元宝 + 讯飞星火:各 3000 万
  • 通义(阿里):2000 万
  • DeepSeek 官方 App:4000 万
  • 总国产 AI C 端 DAU 约 3 亿(部分重复)

1.3 开源模型影响力

模型下载量全球排名
Qwen(阿里)> 100M全球开源第一
DeepSeek V3/R1> 50M第 2
GLM-4(智谱)20M+第 5
Llama 3Meta,参考)第 3

开源是国产核心战略 + 影响全球 AI 格局。

2. DeepSeek 现象

2.1 时间线

  • 2024-05 DeepSeek V2(MoE 架构)
  • 2024-12 V3(6710 亿参数)
  • 2025-01-20 R1 发布(推理模型)
  • 全球 AI 估值重估(英伟达 2 天跌 17%)
  • 2025-04 V4(更快更便宜)

2.2 技术突破

R1 关键创新

  • MoE 稀疏激活(训练成本低 10×)
  • 强化学习 + 冷启动(无需大量标注)
  • 推理链路模拟 OpenAI o1
  • 开源 + 免费商用

训练成本

  • DeepSeek V3: $5.58M
  • GPT-4 估计:$78M
  • 差距 14×

API 定价

  • DeepSeek V3: 0.27/M input / 1.10/M output
  • GPT-4o: 2.50/M / 10/M
  • 便宜 10×

2.3 商业模式

  • 完全开源(代码 + 权重)
  • 不主要靠 API 收入(给行业定义)
  • 母公司幻方量化盈利支撑
  • CEO 梁文锋:前量化基金经理 + 技术理想主义

2.4 全球影响

  • 2025-01-27 美股 AI 集体下跌
  • NVIDIA -17% / -$593B 市值(单日最大跌幅纪录
  • 重新评估"算力壁垒"
  • 开源 AI 加速采用

2.5 投资者视角

  • DeepSeek 不上市(公益性质声明)
  • 全行业受益
    • 算力需求仍增(应用爆发)
    • 国产 API 更便宜 → 应用落地
    • 中国 AI 估值重估

3. 字节豆包

3.1 规模

  • DAU 8000 万+(国内 C 端第一)
  • 覆盖:PC + 手机 + 车机 + 智能音箱
  • 免费 + 无广告战略

3.2 技术

  • Seed 自研模型
  • Doubao-1.5-pro 性能接近 GPT-4
  • 多模态(文字 + 图像 + 视频 + 语音)

3.3 字节 AI 布局

  • C 端:豆包 + 抖音 AI
  • 创作工具:剪映 + CapCut AI
  • 企业:Coze 平台 + API
  • 搜索:AI 增强抖音搜索

3.4 未上市

  • 2024 估值 $400B
  • TikTok 分拆传闻持续
  • 主要对华上市障碍:政治 + 美股风险

3.5 投资思路

  • 字节不直接可投
  • 间接:
    • 抖音电商受益方(吉利 / 海尔)
    • TikTok 分拆潜在 IPO

4. 智谱 AI

4.1 背景

  • 清华系(2019 孵化)
  • 创始人:唐杰(清华 KEG 实验室)
  • 学术 + 工程兼顾

4.2 模型

  • GLM-4(2024-01)对标 GPT-4
  • GLM-Z1(2025)推理模型
  • ChatGLM 开源系列

4.3 商业化

  • B 端 + 政企强
  • 金融 / 政府 / 央企 / 医疗
  • API + 私有化部署
  • "AI 国家队" 地位

4.4 融资

  • 2024 H2 新一轮 $30B 估值
  • 股东:中关村 + 北京市国资 + 沙特 PIF + 腾讯
  • 未上市

4.5 2026 可能港股上市

  • 市场预期 2027 IPO
  • 中概股港股上市热

5. 月之暗面(Kimi)

5.1 背景

  • 创始人:杨植麟(清华毕业,Meta AI 前研究员)
  • 2023 成立
  • 主打长文本(支持 200K+ tokens)

5.2 产品

  • Kimi Chat(C 端):DAU 5000 万
  • Kimi K1.5(推理)
  • Kimi Browser(2025 推出 AI 浏览器)

5.3 2024-2025 营销

  • B 端广告投入大
  • "大厂挖角阿里 系团队**"
  • 腾讯 + 阿里 + 红杉 + 高瓴投资

5.4 融资

  • 2024 估值 $33B
  • 2025 继续融资
  • 未上市

5.5 挑战

  • C 端用户获取成本高
  • 字节豆包压力大
  • 需验证商业化

6. 阿里巴巴 Qwen

6.1 Qwen 家族

  • Qwen-7B / 14B / 72B(2023-2024 开源)
  • Qwen 2.5(2024-09)
  • Qwen-VL(视觉)
  • Qwen-Audio(音频)
  • QwQ-32B(推理)
  • Qwen-Max(闭源旗舰)

6.2 开源成就

  • HuggingFace 全球开源模型第一
  • 下载量 > 100M
  • 社区贡献 活跃

6.3 阿里 AI 战略

  • 阿里云 AI 底座(Bailian 百炼)
  • 通义千问 API(2 价)
  • 通义 C 端 App(DAU 2000 万)
  • 钉钉 AI 办公
  • 夸克搜索 AI

6.4 投资意义

  • 阿里 9988.HK 最大 AI 敞口
  • 未来云业务 + AI分拆可能
  • 估值反映 AI 部分~10%

7. 腾讯 / 百度 / 华为 / 讯飞

7.1 腾讯 混元

  • 混元大模型(2024)
  • 腾讯元宝 C 端
  • 微信 AI 集成
  • 腾讯

7.2 百度 文心

  • 文心一言(2023-03 第一家发布的中国大厂 LLM)
  • 文心 4.0 Turbo(2024)
  • 集成百度搜索 + 地图
  • 但 C 端 DAU 不如豆包 + Kimi

7.3 华为 盘古

  • 盘古大模型(2024)
  • 行业专用(气象 / 医药 / 汽车)
  • 不做 C 端
  • 核心:昇腾 910B 算力

7.4 科大讯飞 星火

  • 600519 科大讯飞(A 股)
  • 语音 AI 龙头
  • 星火大模型
  • 教育 + 医疗 + 办公 场景
  • 被阿尔特曼提及"让 OpenAI 紧张"(非实际)

8. 算力:中国 AI 的咽喉

8.1 美国芯片禁运

  • 2022-10 第一次
  • 2023-10 升级
  • 2025-01 进一步细化
  • 禁止:H100 / H200 / B200 / GB200
  • 受限:A100 / H800(带宽降版)

8.2 华为昇腾

  • 昇腾 910B(2022)
  • 昇腾 910C(2025)
  • 性能:H100 的 60–70%
  • 配套软件 + 生态
  • 产能有限(中芯 7nm)

8.3 寒武纪

  • 688256 A 股
  • 思元 370 / 590
  • MLU270 云端
  • 2025 订单激增(字节 + 科大讯飞)

8.4 海光信息

  • 688041 A 股
  • DCU(AMD 架构授权)
  • 国产替代 NVIDIA

8.5 中芯国际

  • 688981 / 0981.HK
  • 7nm 代工(2023 起)
  • 服务昇腾 + 寒武纪 + 海光
  • 产能瓶颈关键

8.6 DeepSeek 效应

  • 低算力训练可能
  • 减轻"算力荒"
  • NVIDIA 股价冲击
  • 推理需求仍增

9. AI 应用 3 层投资

9.1 第 1 层:基础模型

直接受益

  • 阿里(9988.HK)—— Qwen + 云
  • 腾讯0700.HK)—— 混元 + 元宝
  • 百度(9888.HK / BIDU)—— 文心 + 云
  • 科大讯飞(002230)—— 星火
  • 字节(未上市)

未上市(未来 IPO 概率)

  • DeepSeek
  • 智谱(预期 2027)
  • 月之暗面
  • 字节(受阻)

9.2 第 2 层:算力 + 基础设施

AI 芯片

  • 寒武纪(688256)
  • 海光(688041)
  • 华为(未上市但 A 股 + 港股供应链受益)
  • 中芯国际(0981.HK / 688981)
  • 华虹半导体(1347.HK / 688347)

光模块 / 网络

  • 中际旭创(300308)
  • 光迅科技(002281)
  • 新易盛(300502)

服务器

  • 浪潮信息(000977)
  • 中科曙光(603019)

数据中心

  • 世纪华通 + 光环新网 + 数据港

电力 + 能源

9.3 第 3 层:终端应用

办公

  • 金山办公 WPS(688111)—— AI Copilot
  • 福昕软件(688095)—— PDF AI
  • 用友网络(600588)—— 企业 SaaS AI

教育

  • 有道(DAO)
  • 学而思 / 新东方(AI 个性化教学)

医疗

  • 鹰瞳科技(2251.HK)—— 医学影像 AI
  • 平安好医生(1833.HK)

创意 / 设计

  • 万兴科技(300624)

自动驾驶

10. 投资组合建议

10.1 核心暴露(2026-04)

推荐配置(占组合 5–10%):

平台巨头(3–5%):

  • 腾讯(0700.HK):AI 应用 + 算力 + 投资组合
  • 阿里(9988.HK):AI 云 + 开源 Qwen
  • 百度(9888.HK):AI + 搜索(但执行力弱)

算力上游(2–3%):

  • 中芯国际(0981.HK):半导体代工
  • 寒武纪(688256):AI 芯片(高风险)
  • 中际旭创(300308):光模块

终端应用(1–2%):

  • 金山办公(688111)
  • 科大讯飞(002230)

10.2 风险分散

  • 不要单一押注(DeepSeek / 智谱未上市)
  • 上中下游都配置
  • 限制总 AI 敞口 10–15%

10.3 观察名单

  • 字节 IPO(如果发生)
  • 智谱 港股 IPO
  • DeepSeek 融资动态
  • 华为 可能独立上市(概率低)

11. 关键风险

11.1 美国进一步制裁

  • 2025 已升级
  • 2026–2027 可能再升级
  • 实体清单扩大
  • 对策:国产化加速

11.2 监管

  • 生成式 AI 管理办法
  • 内容审查
  • 数据安全
  • 对策:合规优先

11.3 应用落地慢

  • B 端 ROI 难证明
  • C 端免费战争
  • 商业化挑战
  • 对策:时间

11.4 算力瓶颈

  • 国产芯片产能
  • 中芯 7nm 良率
  • 依赖华为+ 国企产能

11.5 人才流失

  • 美国 AI 薪水 3–5× 国内
  • 高端人才回国但顶尖流失

12. AI vs 科技估值

12.1 2025 AI 股涨幅

  • 美股 Mag 7:+50%
  • 英伟达:+170%(2024 Q4-2025 Q2)
  • 中概 AI:分化
    • 阿里:+100%
    • 百度:+30%
    • 腾讯:+40%

12.2 AI 泡沫担忧

  • Mag 7 P/E 已 30+
  • 数据中心 CAPEX $500B+ / 年
  • ROI 未证明
  • DeepSeek 提醒"算力不一定是护城河"

12.3 中国 AI 估值

  • 比美股便宜 50%+
  • 收入落后更多
  • 相对机会

13. 跟踪清单

13.1 每周

  • NVIDIA 股价(风向标)
  • 新模型发布(DeepSeek / 字节)
  • DAU 数据

13.2 每月

  • API 调用量增长
  • 芯片 + 算力 新闻
  • 美国制裁动态

13.3 每季

  • AI 厂商财报
  • 估值变化
  • 融资动态

13.4 年度

  • State of AI Report(Nathan Benaich)
  • 中国 AI 指数报告
  • 技术突破(年度评选)

14. 对应读物

  • State of AI Report》Nathan Benaich(年度)
  • DeepSeek 技术报告(论文)
  • 阿里 Qwen 论文系列
  • 字节 Seed 论文
  • Stratechery(Ben Thompson)AI 分析
  • 机器之心 + 量子位(中文)
  • 硅谷洞察 + AI Geek

15. 对应 wiki 页面


最后更新 2026-04-19。中国 AI 是最动态的技术主题。DeepSeek / 豆包 / 智谱 每季度可能变格局,NVIDIA 股价是全球 AI 情绪指标。


核心要点

  • TODO: 通读全文后填入 5–10 条核心要点(每条 ≤80 字,含数字 / 名称 / 时间锚点)

Cross-references