为什么统计学和概率论是量化面试的核心
量化金融的本质是在不确定性中做出最优决策。无论是做市商(Optiver、IMC)的定价模型、对冲基金(Citadel、Two Sigma)的 Alpha 信号,还是量化研究员(G-Research、Jane Street QR)的统计模型,都建立在概率论和统计学的基础之上。
根据 AT&T Career 对 300+ 位量化求职学员面试经历的分析,概率论和统计学题目在量化面试中的出现频率如下:
| 考察领域 | 出现频率 | 代表机构 | |---------|---------|--------| | 期望值与方差计算 | 95% | 所有量化机构 | | 条件概率与贝叶斯定理 | 85% | Jane Street、G-Research、Citadel | | 常见概率分布 | 80% | 所有量化机构 | | 随机游走与马尔可夫链 | 70% | Jane Street、Two Sigma、G-Research | | 假设检验与置信区间 | 65% | G-Research、Two Sigma | | 中心极限定理应用 | 60% | 所有量化机构 | | 蒙特卡洛模拟 | 55% | Citadel、Two Sigma |
本文将按照从基础到进阶的顺序,系统讲解每个考察领域的核心概念和高频题目。
第一章:期望值与方差——量化面试的基石
期望值(Expected Value)是量化面试中最基础也最重要的概念。几乎所有量化机构的面试都会考察期望值计算,从简单的骰子问题到复杂的随机过程。
核心公式
离散随机变量:E[X] = Σ xi·P(X=xi) 连续随机变量:E[X] = ∫ x·f(x)dx 期望的线性性质:E[aX + bY] = aE[X] + bE[Y](无需独立性) 方差:Var(X) = E[X²] - (E[X])²
高频面试题目
题目 1(基础):你掷一个公平的六面骰子,如果点数为 6 则获得 £6,否则获得 £0。这个游戏的公平价格是多少?
解析:E[收益] = 6 × (1/6) + 0 × (5/6) = £1。公平价格为 £1。
题目 2(中等):你有一个装有 3 个红球和 2 个蓝球的袋子。每次随机取出一个球(不放回),直到取出红球为止。求取球次数的期望值。
解析:利用对称性,5 个球中 3 个红球,第一个红球出现的位置期望为 (5+1)/(3+1) = 6/4 = 3/2。
题目 3(进阶):你参与一个游戏:连续掷硬币,出现正面得 +1 分,出现反面得 -1 分,游戏在你的分数达到 +3 或 -1 时结束。求游戏持续轮数的期望值。
解析:这是一个经典的赌徒破产问题变体。设 Ek 为当前分数为 k 时的期望剩余轮数(边界 E_{-1} = E_3 = 0)。建立方程组并求解,得 E_0 = 3。
第二章:条件概率与贝叶斯定理
条件概率是量化面试中最容易出错的领域,也是面试官最喜欢用来区分候选人的考察点。
核心公式
条件概率:P(A|B) = P(A∩B) / P(B) 贝叶斯定理:P(A|B) = P(B|A)·P(A) / P(B) 全概率公式:P(B) = Σ P(B|Ai)·P(Ai)
高频面试题目
题目 4(经典):一个家庭有两个孩子,已知至少有一个是男孩。求两个都是男孩的概率。
解析:样本空间为 {男男, 男女, 女男, 女女},等概率。已知至少一个男孩,排除 {女女},剩余 {男男, 男女, 女男}。P(两个都是男孩 | 至少一个男孩) = 1/3。注意:这道题的答案是 1/3,不是 1/2。
题目 5(贝叶斯):某疾病在人群中的发病率为 1%。一个检测工具的准确率为 99%(患病者检测为阳性的概率为 99%,未患病者检测为阴性的概率为 99%)。如果一个人检测结果为阳性,求他真正患病的概率。
解析:P(D) = 0.01,P(T|D) = 0.99,P(T|¬D) = 0.01。P(T) = 0.99×0.01 + 0.01×0.99 = 0.0198。P(D|T) = 0.0099 / 0.0198 = 50%。这个结果令人惊讶:即使检测准确率高达 99%,阳性结果真正患病的概率也只有 50%,这是基础率效应(Base Rate Fallacy)的经典案例。
题目 6(蒙提霍尔问题):一个赌场有三扇门,其中一扇门后面有奖品。你选择了第一扇门,主持人(知道奖品在哪里)打开了第三扇门(空的)。你是否应该换选第二扇门?
解析:应该换。初始选择正确的概率为 1/3,错误的概率为 2/3。主持人打开空门后,如果你换选,获奖概率为 2/3;如果不换,获奖概率为 1/3。换选能使获奖概率翻倍。
第三章:常见概率分布及其应用
量化面试中,候选人需要熟悉常见概率分布的性质、参数和应用场景。
关键分布速查表
| 分布 | 参数 | 期望 | 方差 | 量化应用 | |------|------|------|------|--------| | 二项分布 B(n,p) | n次试验,成功概率p | np | np(1-p) | 期权定价(二叉树模型) | | 泊松分布 Pois(λ) | 单位时间事件数λ | λ | λ | 订单到达率建模 | | 正态分布 N(μ,σ²) | 均值μ,方差σ² | μ | σ² | 收益率分布、Black-Scholes | | 指数分布 Exp(λ) | 事件率λ | 1/λ | 1/λ² | 等待时间建模 | | 均匀分布 U(a,b) | 区间[a,b] | (a+b)/2 | (b-a)²/12 | 随机数生成 | | 对数正态分布 | μ,σ(对数的) | e^(μ+σ²/2) | — | 股价建模(GBM) |
高频面试题目
题目 7:一家做市商每分钟平均收到 5 个订单,订单到达服从泊松过程。求在某一分钟内收到 0 个订单的概率。
解析:X ~ Pois(5)。P(X=0) = e^(-5) ≈ 0.0067(约 0.67%)。
题目 8:两个独立的正态分布随机变量 X ~ N(0,1) 和 Y ~ N(0,1),求 X+Y 和 X-Y 的分布,并说明它们是否独立。
解析:X+Y ~ N(0,2),X-Y ~ N(0,2)。由于 Cov(X+Y, X-Y) = Cov(X,X) - Cov(Y,Y) = 1 - 1 = 0,且两者都是正态分布,协方差为零意味着独立。因此 X+Y 和 X-Y 是独立的正态分布随机变量。
第四章:随机游走与马尔可夫链
随机游走和马尔可夫链是量化面试中最能区分候选人数学深度的考察领域,也是量化金融中最重要的数学工具之一。
随机游走基础
简单随机游走:从 0 出发,每步以概率 p 向右 +1,以概率 (1-p) 向左 -1。对称随机游走(p=0.5)是鞅(Martingale),即 E[Sn|S1,...,Sn-1] = Sn-1。
高频面试题目
题目 9(赌徒破产):你有 £k,对手有 £(n-k)。每局以概率 p 赢 £1,以概率 (1-p) 输 £1。求你最终赢得全部 £n 的概率。
解析:当 p ≠ 0.5 时:Pk = [1-(q/p)^k] / [1-(q/p)^n],其中 q = 1-p。当 p = 0.5 时:Pk = k/n。
题目 10(马尔可夫链):一只青蛙在三块石头(A、B、C)之间跳跃。从任意一块石头跳到另外两块的概率各为 1/2。求这个马尔可夫链的稳态分布。
解析:由对称性,稳态分布为 π = (1/3, 1/3, 1/3)。
题目 11(进阶):一个随机游走从 0 出发,每步以概率 1/2 向右 +1,以概率 1/2 向左 -1。求首次到达 +a 或 -b(a,b > 0)的期望时间。
解析:对称随机游走的首达时间期望为 E_0 = a·b(可通过建立差分方程验证)。
第五章:中心极限定理与大数定律的实际应用
中心极限定理(CLT)和大数定律(LLN)是量化金融中最重要的统计学基础,也是量化面试中经常以"应用题"形式出现的考察点。
核心定理
大数定律:当 n → ∞ 时,样本均值收敛到总体均值。中心极限定理:当 n 足够大时,样本均值的标准化版本近似服从标准正态分布 N(0,1),无论原始分布是什么形状。
量化金融中的应用
应用 1:样本量估计
一个量化策略的日收益率均值为 0.05%,标准差为 1%。需要多少天的数据才能以 95% 的置信度确认策略的期望收益为正?
解析:需要 E[X̄] - 1.96·σ/√n > 0,即 0.0005 > 1.96 × 0.01/√n,解得 n > (39.2)² ≈ 1537 天(约 6 年的日数据)。这说明量化策略的有效性验证需要大量数据。
应用 2:夏普比率的统计显著性
一个策略的年化夏普比率为 1.0,基于 3 年的日数据(约 756 个交易日)。夏普比率的标准误差约为 sqrt(1.5/756) ≈ 0.045。t 统计量 = 1.0/0.045 ≈ 22,远大于 1.96,因此在统计上显著。但注意:3 年数据在量化研究中仍然偏少,存在过拟合风险。
AT&T Career 的数学备考资源
AT&T Career 的 Quant Track 提供系统化的数学备考课程,涵盖概率论(8 节课,从基础到随机过程)、统计学(6 节课,从描述统计到贝叶斯推断)以及量化金融数学(4 节课,随机微积分基础)。所有课程均由顶级量化机构的现任研究员讲授,配合真实面试题目练习。
常见问题 · FAQ
量化面试需要会随机微积分(Stochastic Calculus)吗?+
这取决于岗位类型。QR 岗位(尤其是衍生品定价方向)通常需要了解伊藤引理(Ito's Lemma)和布朗运动的基本概念。QT 岗位更注重概率直觉和快速计算,对随机微积分的要求相对较低。QD 岗位通常不考察随机微积分。建议根据目标岗位有针对性地准备。
贝叶斯定理在量化面试中有多重要?+
非常重要,尤其是在 Jane Street 和 G-Research 的面试中。贝叶斯定理不仅是概率题的核心工具,也体现了量化思维的本质——在获得新信息后更新概率判断。建议深入理解贝叶斯定理的直觉含义,而不仅仅是记住公式。
如何在面试中快速估算期望值?+
掌握以下技巧:利用线性性质分解复杂期望;对称性(如果问题有对称结构,利用对称性简化计算);条件期望(E[X] = E[E[X|Y]],先条件化再求期望);指示函数(对非负整数随机变量,E[X] = Σ P(X≥k))。在面试中,先说出你的解题思路,再进行计算,这样即使计算出错也能展示你的数学直觉。
马尔可夫链在量化面试中考察哪些方面?+
主要考察三个方面:稳态分布的计算(解方程 πP = π)、首达时间(First Passage Time)的期望值计算以及吸收态(Absorbing State)问题(如赌徒破产)。建议掌握这三类问题的标准解法,并能够快速建立转移矩阵。
统计学和概率论哪个更重要?+
两者都很重要,但侧重点因岗位而异。QT 面试更注重概率直觉(快速估算期望值和概率);QR 面试更注重统计学(假设检验、回归分析、时间序列);QD 面试对两者要求相对较低,但需要了解基本概念。建议优先掌握概率论基础(期望值、条件概率、常见分布),再根据目标岗位深化统计学知识。
Free Resource
免费领取【Quant Finance 求职全套资料包】
包含 CV 模板、面试题库、Networking 模板信及完整的求职 Timeline。已有 1,200+ 学员领取。