马尔可夫链的一个直观且简单的解释

马尔可夫链出现在许多领域，如物理、遗传学、金融，还有数据科学和机器学习。它是自然语言处理和强化学习中的一个典型的统计技术。在本文中，我们将简单地解释什么是马尔可夫链。

马尔可夫性质

对于任何马尔可夫的建模过程，它必须满足马尔可夫性质。这个性质表示下一个状态的概率仅取决于当前状态（与当前状态之前的一切都是无关的）。换句话说，整个系统是“完全无记忆”的。

从数学上讲，这可以写成：

其中n为时间步长参数，X为在给定状态空间s中取某一值的随机变量。状态空间是指一个事件的所有可能结果。例如，一枚硬币在其状态空间中有两个值：s = {正，反}，从一种状态转换到另一种状态的概率是0.5。

马尔可夫链

使用马尔可夫性质的过程称为马尔可夫过程。如果状态空间是有限的，我们使用离散时间步，这个过程被称为马尔可夫链。换句话说，它是一个随机变量序列在给定的状态空间中呈现的各种状态。

在本文中，我们将讨论时间齐次离散时间马尔科夫链，因为它们是最容易使用和理解的。非齐次时间马尔可夫链状态间的转移概率不固定，且随时间变化。

下面是一个带有状态空间{A，B，C}的马尔可夫链的例子。箭头上的数字表示在这两种状态之间转换的概率。

例如，如果想从状态B到状态C，那么这个转变的概率是20%。从数学上讲，我们可以得出如下结论：

概率转换矩阵

我们可以通过构造给定马尔可夫链的概率转换矩阵来简化这些转换。转换矩阵有i行和j列，因此i，j的索引值给出了从i到j的转换概率为：

上述马尔可夫链的转换矩阵为：

在这篇文章中，我简单介绍了马尔可夫性质和概念，并利用这个概念来构造和理解一个基本的马尔可夫链。这个随机过程出现在数据科学和机器学习的许多方面，所以熟悉它是很有必要的。

举报/反馈

老胡说科学

30.8万获赞 9.2万粉丝

科学如此美妙，我想让你知道

优质科学领域创作者

关注