1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于PDC编码的中文文本压缩算法.pdf

论文研究基于PDC编码的中文文本压缩算法.pdf

上传者: 2020-05-27 23:30:02上传 .PDF文件 487KB 热度 26次
针对中文文本结构的特点以及传统压缩算法对中文文本压缩的不足,提出并实现了一个基于PDC编码的中文文本压缩算法。该算法采用的是字典压缩方式。根据单个汉字在中文文本出现的概率,采用Huffman编码方式进行前缀变长编码;定义由某个汉字为前缀的词组和短语的深度;对具有相同前缀和相同深度的词组和短语进行局部的定长编码,构成一部压缩编码字典。通过对相同文本分别使用该算法和传统的LZW和LZSS编码算法压缩后得到的数据结果对比,压缩率有2.53%~40.48%的提高,表明该压缩算法有较好的压缩效果。
下载地址
用户评论