文章目录
- 引言
- I 预备知识
- 1.1 信息的正交关系
- 1.2 相关不是因果
- 1.3 条件熵
- II 互信息
- III 信息增益(Information Gain,简称IG)
-
引言
在大数据时代,我们需要寻找的是强相关性。两种信息相关性的强弱,可以通过互信息衡量的。利用互信息我们可以找到那些靠谱的信号,过滤掉那些不大灵的信息。
信息增益定量衡量每一条信息价值的尺度。
I 预备知识
1.1 信息的正交关系
寻找能够彼此互补信息的重要性
1.2 相关不是因果
- 等价信息: 它们之间有确定的因果关系
- 相互关联的信息:如果相关性比较强,在得到信息A之后,就可以消除关于B的不确定性。
互信息则给出了一种量化度量各种不同信息相关性的方法。
<