基于字节流信息熵的版面全局复杂度的评估方法

摘要:以图文要素构成的word2003版面存储文档为研究对象,提出了一种利用信息熵评估版面文档复杂度的方法.首先,从图像和文本存储特点出发,提出一种利用文件字节流信息熵度量版面全局复杂度的方案;其次,将文件视为信源,每个字节视为信源符号,以二进制方式读取文件,然后根据字节相关性,采用N次扩展信源计算信息熵;最后,通过实验验证表明,本文方法切实可行,给出的版面全局复杂度定量描述不仅能很好地符合人的视觉直观感受,而且能够为版面数据可压缩性提供依据.

关键词:
  • 版面复杂度  
  • 信息熵  
  • 字节相关性  
作者:
王琪; 崔荣一
单位:
延边大学工学院; 吉林延吉133002
刊名:
延边大学学报·自然科学版

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

延边大学学报·自然科学版紧跟学术前沿,紧贴读者,国内刊号为:22-1191/N。坚持指导性与实用性相结合的原则,创办于1962年,杂志在全国同类期刊中发行数量名列前茅。