Math——马尔可夫链及其平稳分布


核心定义

  • 一句话定义:平稳分布在马尔可夫链长期演化后系统达到的稳态概率分布
  • 对于一个离散时间马尔可夫链(Markov Chain) ,若存在一个概率分布 \(\pi\) 满足以下方程:
    $$
    \pi = \pi P
    $$
    • \(P\) 是转移概率矩阵(\(P_{ij}\) 表示从状态 \(i\) 转移到状态 \(j\) 的概率)
    • \(\pi\) 是行向量,表示每个状态的概率
  • 则称 \(\pi\) 为该马尔可夫链的平稳分布(Stationary Distribution)。直观上,这意味着系统达到 \(\pi\) 后,状态分布不再随时间改变

关键性质

  • 存在性与唯一性

    • 若马尔可夫链是不可约马尔可夫链(Irreducible Markov Chain)(不可约马尔可夫链的所有状态互通),且满足正常返(Positive Recurrent)特性(即每个状态会被无限次访问),则平稳分布存在且唯一
    • 对于有限状态的不可约链,平稳分布一定存在
  • 长期行为

    • 无论初始分布如何,若链满足一定条件(如非周期性),长期后的状态分布会收敛到平稳分布:
      $$
      \lim_{n \to \infty} \mu P^n = \pi
      $$
      其中 \(\mu\) 是初始分布
  • 细致平衡条件(Detailed Balance):

    • 若分布 \(\pi\) 满足 \(\pi_i P_{ij} = \pi_j P_{ji}\)(对所有 \(i,j\)),则 \(\pi\) 是平稳分布。满足此条件的链称为可逆马尔可夫链

计算方法

  • 解线性方程组
    • 通过 \(\pi = \pi P\) 和 \(\sum_i \pi_i = 1\) 联立求解
    • 例如,对两状态链:
      $$
      \begin{cases}
      \pi_1 = \pi_1 P_{11} + \pi_2 P_{21} \\
      \pi_2 = \pi_1 P_{12} + \pi_2 P_{22} \\
      \pi_1 + \pi_2 = 1
      \end{cases}
      $$
  • 其他求解方法:特征向量法

例子

  • 假设天气模型(晴/雨)的转移矩阵,描述了晴雨天转换的概率:
    $$
    P = \begin{bmatrix}
    0.9 & 0.1 \\
    0.5 & 0.5
    \end{bmatrix}
    $$
  • 解 \(\pi P = \pi\) 得 \(\pi = [\frac{5}{6}, \frac{1}{6}]\),即长期下有5/6概率为晴天,1/6为雨天