马尔可夫链出现在许多领域,如物理、遗传学、金融,还有数据科学和机器学习。它是自然语言处理和强化学习中的一个典型的统计技术。在本文中,我们将简单地解释什么是马尔可夫链。
马尔可夫性质
对于任何马尔可夫的建模过程,它必须满足马尔可夫性质。这个性质表示下一个状态的概率仅取决于当前状态(与当前状态之前的一切都是无关的)。换句话说,整个系统是“完全无记忆”的。
从数学上讲,这可以写成:
其中n为时间步长参数,X为在给定状态空间s中取某一值的随机变量。状态空间是指一个事件的所有可能结果。例如,一枚硬币在其状态空间中有两个值:s = {正,反},从一种状态转换到另一种状态的概率是0.5。
马尔可夫链
使用马尔可夫性质的过程称为马尔可夫过程。如果状态空间是有限的,我们使用离散时间步,这个过程被称为马尔可夫链。换句话说,它是一个随机变量序列在给定的状态空间中呈现的各种状态。
在本文中,我们将讨论时间齐次离散时间马尔科夫链,因为它们是最容易使用和理解的。非齐次时间马尔可夫链状态间的转移概率不固定,且随时间变化。
下面是一个带有状态空间{A,B,C}的马尔可夫链的例子。箭头上的数字表示在这两种状态之间转换的概率。
例如,如果想从状态B到状态C,那么这个转变的概率是20%。从数学上讲,我们可以得出如下结论:
概率转换矩阵
我们可以通过构造给定马尔可夫链的概率转换矩阵来简化这些转换。转换矩阵有i行和j列,因此i,j的索引值给出了从i到j的转换概率为:
上述马尔可夫链的转换矩阵为:
在这篇文章中,我简单介绍了马尔可夫性质和概念,并利用这个概念来构造和理解一个基本的马尔可夫链。这个随机过程出现在数据科学和机器学习的许多方面,所以熟悉它是很有必要的。