摘要:为快速发现海量遥测数据中的相关关系,提出一种基于改进最大信息系数(Maximal Information Coefficient,MIC)的遥测数据相关性知识发现方法。以Mini Batch K-Means聚类算法为前驱过程对数据进行网格划分;计算该网格划分下的互信息,并以信息熵代替原有最大熵对互信息进行归一化矫正得到信息系数;选择不同网格划分下MIC作为变量相关性的测度。采用量子卫星遥测数据进行试验,结果表明:与基于动态规划算法的MIC方法相比,所提方法可有效解决MIC测度偏向多值变量的问题,时间复杂度从O(n^2.4)下降为O(n^1.6),是一种适用于大规模遥测数据相关性分析的有效方法。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社