量化系统化投资 — Renaissance / AQR / Two Sigma / 因子 / 机器学习
本质:量化投资是用数学 + 统计 + 计算机 代替人脑做投资决策 —— Renaissance Medallion 40 年 66% 年化(毛) 是人类投资史上最强记录。AQR / Two Sigma / DE Shaw / Citadel / Millennium 是后 Medallion 顶级量化玩家。普通散户不能复制 Medallion(需要百亿美元 + 数十位博士 + 专属数据),但因子投资 + ETF 组合 + 简单机器学习是可行 路径。本页把量化 方法论 + 顶级基金 + 散户可用工具 压成一页。
学习目标
读完本页后,你应该能够:
- 区分统计套利 / CTA / 因子 / 高频 4 大量化流派
- 识别Renaissance Medallion 秘密(即使无法复制)
- 默写 Fama-French 多因子 + Carhart 4 因子
- 理解 AQR Asness 价值 + 动量 + 质量 + 低波动 多因子融合
- 评估散户 可用 工具(因子 ETF / Quant ML Python)
- 规划量化 5-10% 组合 敞口
- 避免过拟合 + 因子 衰减 陷阱
Summary
量化投资 4 大流派:(1) 统计套利(Renaissance / Two Sigma)—— 短周期 + 高频 + 均值回归;(2) CTA / 趋势跟随(Man AHL / Winton / DE Shaw Oculus)—— 见 趋势跟随;(3) 因子投资(AQR / DFA)—— Fama-French + 多因子 / 长周期 / 大规模;(4) 高频交易 HFT(Citadel / Virtu / Jump)—— 微秒 + 做市 + 机构 专属。Renaissance Medallion:1988-2024 年化 66%(扣费前) / ~40% 净值 / 10B AUM 封顶**(外部 100B 其他基金,但 Medallion 只 员工)/ Jim Simons + Robert Mercer + Henri Berestycki 团队 / 300+ 员工 200+ 博士(数学 + 物理 + 统计)/ 关键:短周期信号 + 大数据 + 严格 风控。AQR(Asness)100B+ AUM**:**6 大因子**(价值 + 动量 + 规模 + 质量 + 低波动 + carry)/ **理论 + 实证 + 实战** 结合 / **开源** 许多研究 / **2020 低潮后 反弹**。**Two Sigma 60B AUM:机器学习 + 另类数据(卫星 / 信用卡 / 网络 爬取)/ David Siegel + John Overdeck。DE Shaw $50B:Oculus 趋势 + 系统 多策略。Millennium + Citadel 多 Pod:平台模式(雇用 数百 基金经理 + 风控统一) / 20%+ 年化。Fama-French 五因子:Market + Size(SMB)+ Value(HML)+ Profitability(RMW)+ Investment(CMA);Carhart + Momentum(WML)。散户 工具:(a) 因子 ETF(MTUM / QUAL / USMV / VLUE / VIG / SPLV);(b) Python + yfinance + pandas自己 回测;(c) Alpha Vantage / Alpaca API自动化;(d) 小额 量化(Kelly + 因子 + 分散)。核心教训:(i) Medallion 不可复制(专属数据 + 人才 + 资金);(ii) 因子有效 但会衰减**(小盘 2016-2023);(iii) 过拟合 是最大敌人;(iv) 简单 + 分散 + 长期 胜过 复杂 + 短期。
1. 量化投资 4 大流派
1.1 统计套利(Stat Arb)
核心:
- 短周期 信号(小时到天)
- 均值 回归
- 高频率 交易
玩家:
- Renaissance Medallion(史上最强)
- Two Sigma
- Jane Street
回报:
- Medallion 40% 净
- Two Sigma 15-20%
1.2 CTA / 趋势跟随
核心:
- 多资产 多市场
- 趋势追随(6-12 月)
- 相对简单 模型
玩家:
- Man AHL(英国)
- Winton Capital
- Graham Global
- Millburn
详见 趋势跟随 CTA
1.3 因子投资
核心:
- 长周期(季度 + 年)
- 规模大 + 成本低
- Fama-French 基础
玩家:
- AQR(Cliff Asness)
- DFA(Dimensional Fund Advisors)
- Research Affiliates
- BlackRock iShares 因子 ETF
回报:
- 长期超额 α 2-5%
1.4 高频交易(HFT)
核心:
- 微秒 级
- 做市 + 套利
- 延迟 + 硬件 + 人才
玩家:
- Citadel Securities
- Virtu Financial
- Jump Trading
- Jane Street
回报:
- 做市 20%+
- 散户 无缘
2. Renaissance Medallion 深入
2.1 基金历史
1988 成立:
- Jim Simons 创立
- 前 NSA 密码学家 + 博士
- 数学教授(SUNY Stony Brook)
- 几何 Chern-Simons theory(与 Chern 合作)
Medallion Fund:
- 1988-2024
- 扣费前 年化 66%
- 扣费后 年化 40%
- 2000-2020 波动 10-15%(低!)
- $10B AUM 封顶
2.2 为什么独特
人才:
- 300+ 员工
- 200+ PhDs
- 数学 + 物理 + 统计 + 计算机
- 不招 Wall Street 传统金融人
数据:
- 几十 TB 历史数据
- 专属数据集(买 + 自采)
- 30 年 积累
信号:
- 数千 短周期 信号
- 每个 信号 Sharpe < 0.1
- 组合 Sharpe 2-4
- 分散 的极致
风控:
2.3 关键 人物
Jim Simons(1938-2024):
- 密码学 + 数学家
- "The Man Who Solved the Market"
- 2010 退休
Robert Mercer:
- IBM 前
- 自然语言处理
- Simons 接班
Peter Brown:
- Co-CEO 2010+
- Mercer 接班
Henri Berestycki:
- 法国 数学家
2.4 外部基金
Medallion 封闭:
- 只员工
- 2005 起不接受外部
- 员工 退休 才能退出
RIEF(Renaissance Institutional Equities Fund):
- 外部 开放
- $10B AUM
- 但 回报 差(2020-2023 年化 -5%!)
- 不是 Medallion
RIDA(Renaissance Institutional Diversified Alpha):
- 类似
启示:
- 即使 Renaissance 自己
- 外部 基金 表现远不如 Medallion
- **"Alpha 规模 限制"**铁律
2.5 散户 能学什么
教训:
- 数据 + 人才 + 资金 缺一不可
- 不要 试图 复制 Medallion
- 但 理解 量化 思维:多信号 + 严格风控 + 系统化
3. AQR(Cliff Asness)
3.1 公司
2001 成立:
- Cliff Asness(前 Goldman QI)
- David Kabiller
- John Liew
特点:
- 开放 + 开源 研究
- 因子投资 + 多策略
- $100B+ AUM 高峰(2018)
- 2019-2020 低潮(-30% 回撤)
- 2022-2024 反弹
3.2 6 大 因子
1. Value(价值):
- 低 P/B / P/E / EV/EBITDA
- Fama-French HML
- 长期 +3-5%(Carhart 数据)
2. Momentum(动量):
- 过去 12 月 赢家
- Carhart UMD
- +4-6%
3. Size(规模):
- 小盘 溢价
- Fama-French SMB
- +2-3%(2016-2023 失效)
4. Quality(质量):
- 高 ROE + 低 杠杆 + 稳定 盈利
- AQR 首创
- +3-4%
5. Low Volatility(低波动):
- 低 σ 股票
- 反 CAPM 异象
- +2-3% Sharpe 高
6. Carry:
- 高 yield 资产(货币 / 大宗 / 债 / 股)
- +3-5%
3.3 因子 ETF
因子 分别:
- MTUM(iShares MSCI USA Momentum)—— 动量
- QUAL(iShares MSCI USA Quality)—— 质量
- USMV(iShares MSCI USA Min Vol)—— 低波
- VLUE(iShares MSCI USA Value)—— 价值
- VIG(Vanguard Dividend Growth)—— 质量 代理
- SPLV(Invesco S&P 500 Low Vol)—— 低波
多因子:
- LRGF(iShares MSCI USA Multifactor)
- QUSA(Columbia US EQ Income)
- Goldman ActiveBeta GSLC
3.4 AQR 持仓 哲学
核心:
- 价值 + 动量 合二为一 最强
- "Value and Momentum Everywhere"(2013 paper)
- 多资产 + 多因子
3.5 2019-2020 低潮
Value 因子 10 年 跑输:
- 2010-2020 Growth > Value
- AQR 坚持 Value → 累计 -30%
- 差点 关门
- 2021-2024 反弹
教训:
- 因子 周期 10+ 年
- 纪律 or 弃
4. Two Sigma(David Siegel + John Overdeck)
4.1 公司
2001 成立:
- DE Shaw 系
- 计算机 + 机器学习
- $60B AUM
独特:
- 机器学习
- 另类数据(卫星 / 信用卡 / 爬取 / 社交)
- 1200+ 员工
- 多数 博士
4.2 策略
多策略:
4.3 另类数据
例子:
- Orbital Insight(卫星图,停车场 → 零售客流)
- 信用卡 汇总(消费趋势)
- Web Scraping(价格 + 评论)
- Twitter / Reddit 情绪
4.4 回报
- 2003-2020 年化 15-20%
- 2021-2024 略降
- 机构基金不对散户开放
5. DE Shaw(David Shaw)
5.1 公司
1988 成立:
- David Shaw(哥大计算机系)
- $50B+ AUM
- 低调
- Amazon Jeff Bezos 前雇主
5.2 策略
多策略:
- Oculus(趋势跟随)
- Composite Fund(市场中性)
- Valence Fund(macro)
5.3 回报
- 长期 年化 15%+
- 低 波动
- 稳定
6. Millennium / Citadel 多 Pod 模式
6.1 Pod 模式
基金:
- Millennium Management(Izzy Englander)—— $70B AUM
- Citadel(Ken Griffin)—— $65B AUM
机制:
- 雇用 300-400 PM(Portfolio Manager)
- 每 PM 管 $100M-1B
- 独立 策略
- 严格 风险限额
- 绩效 分成
6.2 优势
- 分散 Alpha 来源
- 任一 PM 亏 → 自动 关仓
- 平台 稳定 20%+ 年化
6.3 问题
- PM 流失 高
- 挖人成本 飙升
- 工资 $10M+ 明星 PM
- 2024 美国 法律 挑战
7. Fama-French 因子模型(散户基础)
7.1 Fama-French 三因子(1993)
- = α + β_Market + β_SMB + β_HML
- Market:超额市场回报
- SMB(Small Minus Big):小盘 超额
- HML(High Minus Low B/M):价值 超额
7.2 五因子(2015)
加入:
- RMW(Robust Minus Weak Profitability):高盈利
- CMA(Conservative Minus Aggressive Investment):低投资
7.3 Carhart(1997)
加入 Momentum:
- WML(Winners Minus Losers)
7.4 因子 数据
免费:
- Kenneth French Data Library(ksrd)
- tuchong.ac(中国版)
付费:
- Bloomberg
- WRDS
7.5 散户 用法
简单:
- 持有多因子 ETF
- MTUM + QUAL + USMV 30/30/40 组合
- 长期 跑赢 SPX 1-2%
中等:
- 自己计算 因子 分数
- Python + yfinance
- 重平衡 每月
高级:
- 多因子 时间 权重
- 机器学习 综合
8. 散户 量化 工具
8.1 因子 ETF 组合
经典(2026-04):
- MTUM 动量 25% $5B AUM
- QUAL 质量 25% $50B
- USMV 低波 20% $35B
- VLUE 价值 15% $10B
- SPY 市场 15% $520B
回报:
- 长期 SPX + 1-2%
- Sharpe 略高
8.2 Python + yfinance(DIY)
工具:
- Python + pandas + yfinance + scipy
- 免费数据
简单 策略:
import yfinance as yf
import pandas as pd
# 下载 SPX 500 数据
tickers = ['AAPL', 'MSFT', 'GOOGL'] # 扩展到 500
data = yf.download(tickers, start='2020-01-01')
# 计算 动量(过去 12 月)
momentum = data['Adj Close'].pct_change(252)
# 排序 + 选前 20%
# ... 回测
回测 工具:
- Backtrader(免费 Python)
- Zipline(免费)
- QuantConnect(云端 + 免费版)
8.3 ML 机器学习
工具:
- scikit-learn(入门)
- xgboost / lightgbm(树模型)
- TensorFlow / PyTorch(深度学习)
典型 应用:
- 多因子 优化
- 预测 短期 收益
- 分类 强 / 弱 股票
挑战:
- 过拟合 严重
- 数据量 相对小(vs CV / NLP)
- 信号-噪声 比低
8.4 Alpha Vantage / Alpaca API
自动化 交易:
- Alpaca(美股 API)
- Interactive Brokers IBKR API
- iFind / Wind(A 股)
用法:
- 自动 执行 信号
- Python 实盘
9. 量化 陷阱
9.1 过拟合(Overfitting)
问题:
- 参数太多
- 历史完美
- 未来 失败
对策:
- Out-of-Sample Testing
- Walk-Forward Analysis
- Cross-Validation
- Occam's Razor 简单最好
9.2 因子 衰减
历史:
- 小盘 因子 1980s 强 / 2016-2023 失效
- 动量 2020-2022 失效
- 价值 2010-2020 失效
原因:
- 大家 都知道
- 套利 消失
- 或 结构变化
9.3 数据 挖矿
问题:
- 测试 1000 个策略
- 5% 假阳性 → 50 个"显著"
- 随机 并非 真
对策:
- Bonferroni 校正
- 理论 支持(不是数据挖出)
- OOS 验证
9.4 执行 成本
忽略:
- 冲击 + 价差 + 滑点
- HFT 对手
- 散户 成本 比机构高 10×
9.5 规模 限制
大规模:
- Medallion 封顶 $10B
- RIEF $10B 但弱于 Medallion
- Alpha 不 scalable
10. 简单 量化 策略(散户可)
10.1 Magic Formula(Greenblatt)
2 因子:
- 高 Earnings Yield(EBIT / EV)
- 高 ROC(EBIT / 投入资本)
排序:
- 每因子排名
- 合计排名
- 买入 Top 30
- 年度 再平衡
回报:
- 1988-2004 年化 30%(书中)
- 后期 减少到 10-15%
10.2 3 因子组合
AQR 启发:
- 价值 + 质量 + 动量
- 各 33%
- 每月 重平衡
10.3 动量 + 低波
简单:
- 过去 12 月动量 Top 20%
-
- 低波 Top 50%
- 月度 调整
回报:
- SPX + 2-3% 长期
10.4 Trend + 价值
跨资产:
- 股票 + 债 + 商品 + 房产
- 趋势 + 价值 信号
- All Weather 升级版
11. 组合 建议(2026-04)
11.1 保守(5% 组合)
- 多因子 ETF 分散
- MTUM + QUAL + USMV 33/33/33
- 无需 自管
11.2 均衡(10% 组合)
- 多因子 ETF 5%
- Merger Arb ETF MERFX 3%
- 自研 Magic Formula 2%
11.3 进取(15% 组合)
- 多因子 ETF 5%
- 自研 多因子(Python)5%
- CTA 基金 / AHL ETF 3%
- Merger Arb 2%
11.4 不 推荐
- 追求 Medallion-like
- 复杂 ML 单人
- 高频 策略
12. 中国 量化
12.1 A 股 量化 公司
头部:
- 幻方量化(2015,DeepSeek 母公司)—— AI + 量化
- 九坤(Jiukun)
- 明汯投资(Minghong)
- 衍复投资
- 灵均投资
AUM:
- 前 10 家 合计 ¥2T+
12.2 产品
- 指数增强(沪深 300 / 中证 500 / 1000 增强)
- 市场中性
- CTA 趋势
- 量化多策略
12.3 业绩
- 指数增强 年化 超额 5-15%
- 2024 表现 分化
- 监管 2023-2024 收紧
12.4 散户 能买
量化 公募:
- 华宝 DeepSeek 量化
- 易方达 量化
- 招商 量化
私募:
- 100 万门槛
- 幻方 / 九坤 等 头部
13. 量化 vs 主动 选股
13.1 对比
| 维度 | 主动 选股 | 量化 |
|---|---|---|
| 决策 | 判断 | 规则 |
| 时间 | 1-10 年 | 分钟 - 月 |
| 标的 | 10-30 | 100-1000 |
| 成本 | 低 | 中-高 |
| 情绪 | 影响大 | 无 |
| 过拟合 | 低 | 高 |
| 规模 | 几十亿 | 有限 |
13.2 长期 回报
Buffett / Munger:
- BRK 60 年 20%
- 集中 质量价值
- 复杂 思考
Renaissance:
- Medallion 40%
- 纯数学
- 但 $10B 封顶
多数 主动基金:
- 负 α(扣费后)
- SPIVA 数据
多因子 ETF:
- SPX + 1-2%
- 稳定
13.3 建议
散户:
- 核心 被动 + 卫星 多因子 ETF
- 不 追求 复制 Medallion
- 留点 主动 个股(趣味 + 学习)
14. 2026-04 展望
14.1 量化 行业
主题:
- AI + ML 广泛应用
- 另类数据 扩张
- ESG 因子 兴起
- 加密 量化 增长
挑战:
- Alpha 衰减
- 监管 收紧
- 人才 成本
- 规模 限制
14.2 个人 机会
2026-2030:
- ChatGPT / Claude 辅助 量化
- 普通散户用 AI 构建简单策略
- Python + Copilot 代码生成
- 民主化 量化工具
15. 对应读物
- Gregory Zuckerman《The Man Who Solved the Market》(Simons 传)
- Scott Patterson《The Quants》
- Andrew Lo《Adaptive Markets》
- Grinold + Kahn《Active Portfolio Management》
- Ernest Chan《Quantitative Trading》
- AQR Research Papers(免费)
- QuantConnect 教程
- Kaggle 量化竞赛
16. 对应 wiki 页面
- 量化因子投资 — 因子基础
- 趋势跟随 CTA — CTA
- 现代金融理论 — CAPM + EMH
- 概率与统计 — 数学基础
- 特殊情境与套利 — Merger Arb
- 可转债 — 双低量化
- 做空策略 — Pair Trading
- Kelly 仓位 — 仓位
- Global Macro — 宏观量化
- 中国 AI 应用 — DeepSeek / 幻方
最后更新 2026-04-21。量化是高深但民主化领域——Renaissance Medallion 不可复制,但多因子 ETF + Python 自研 散户可入门。5-15% 组合敞口,长期 + 分散 + 简单 胜。
核心要点
- TODO: 通读全文后填入 5–10 条核心要点(每条 ≤80 字,含数字 / 名称 / 时间锚点)