RAR编码文件格式分析

时间:2025-04-04

2010年第02期,第43卷 通 信 技 术 Vol.43,No.02,2010 总第218期 Communications Technology No.218,Totally

RAR编码文件格式分析

孙文歌, 刘立柱, 刘伟华

(信息工程大学 信息工程学院,河南 郑州 450002)

【摘 要】网络数据在传输过程中要先经过RAR编码进行压缩,节省传输时间。RAR格式的数据压缩编码在信息存储、信息管理、通信及保密方面得到广泛应用。其编码生成的压缩文件,存储格式复杂并且独特,包含有不同的数据块。根据RAR编码的显著特点,对RAR文件二进制码流块所包含的比特位做了定位分析,为研究其译码以及纠错译码算法奠定了基础。

【关键词】RAR;压缩编码;块;CRC

【中图分类号】TP911.21 【文献标识码】A 【文章编号】1002-0802(2010)02-0083-02

Analysis on RAR Compressed Format Files

SUN Wen-ge, LIU Li-zhu, LIU Wei-hua

(Institute of Information Engineering, PLA Information Engineering University, Zhengzhou Henan 450002, China)

【Abstract】Network data must be first compressed through RAR coding in the process of transmission, and thus the transmission time could be reduced. RAR compressed format files are widely used in processing, running, communication, information hiding and so on. The compressed format files are intricate and particular, and contains different data blocks. The article, based upon the distinct characters of RAR coding, makes location analysis on the bit contained in the binary code stream block, thus laying a foundation for the decoding and error-correct decoding algorithm in RAR compressed format files.

【Key words】RAR;compression code;HEAD;CRC

0 引言

计算机及相关学科的出现使得多媒体数据处理迅速发展并得到普遍应用。目前,多媒体数据处理已经成为工程学、计算机科学、信息科学、社会科学等领域中各学科研究的对象,多媒体数据处理的需求与日俱增[1-6]。要很好地利用数字多媒体数据,首先要把数据保存下来,目前常用的保存方法是按照一定的格式要求将数据保存成文件的形式。因此,无论是实际使用,还是理论仿真,只要想对数字多媒体数据进行利用或者处理,就要对多媒体数据的文件格式分析研究[7-10]。

应该指出:在网络数据传输过程中,一般都首先经RAR编码进行压缩,节省传输时间。但由于网络环境复杂多变,经RAR编码后的数据很难抗御传输误码带来的灾难性的后果,用常规的解压软件往往打不开,为研究更好的纠错译码

收稿日期:2008-11-30。 作者简介:孙文歌(1982-),男,助理工程师,硕士研究生,主要研究

方向为信号与信息处理;刘立柱(1949-),男,教授,博士生导师,主要研究方向为信号与信息处理;刘伟华(1986-),女,助理工程师,硕士研究生,主要研究方向为信号与信息处理。

算法,进行文件格式对比分析是有意义的。

该论文对当前应用最广泛的RAR格式文件进行了较深入研究,给出了其特点分析,讨论了压缩编码算法,重点研究了各数据块的具体参数及代表的意义。

1 RAR的特点

RAR 是一个强力压缩工具,允许你管理和控制压缩文件。压缩文件通常是一个带有 ".rar" 扩展名的文件。RAR 的特点包括:

① 高度成熟的原创压缩算法;

② 对于文本、声音、图像和32位和64位 Intel 可执行程序压缩的特殊优化算法;

③ 获得比类似工具更好的压缩率,使用'固实'压缩; ④ 自解压压缩文件和分卷压缩(SFX); ⑤ 对物理损伤的压缩文件的恢复能力。

固实(Solid)压缩方式是RAR压缩编码的一个显著特点。固实压缩文件是RAR的一种特殊压缩方式存储的压缩文件,它把压缩文件中的全部文件都当成一个连续数据流来

83

看待,从而找到更多的冗余信息。 个字节0X0000为RESERVED1即保留字节,紧跟着的0X00000000为RESERVED2即为第二部分保留备用字节,在大量压缩实验条件下两段均保留字节全为0。至此压缩文件头每比特位分析结束,所有的RAR编码文件该数据块大小均为13字节。

第三块为文件头,该数据块包含压缩前的原文件大小、文件名、文件格式等信息,详细分析如下:块校验HEAD_CRC(2 字节)从 HEAD_TYPE 到 FILEATTR 的 CRC 结构和HEAD_FLAGS文件名。HEAD_TYPE(1 字节)头类型: 0x74。(2 字节)位标记:0x01 – 文件在前一卷中继续,0x02 – 文件在后一卷中继续,0x04 – 文件使用密码加密,0x08 – 文件注释存在(RAR 3.x 使用分开的注释块,不设置这个标记)。0x10 – 前一文件信息被使用(固实标记),7 6 5 位(对于 RAR 2.0 和以后版本)如表1。

表1 压缩字典

0 0 0字典大小64 KB

0 0 1字典 大小 128KB

0 1 0字典 大小 256KB

0 1 1 1 0 0 字典 大小 512KB

字典 大小

1 0 1 1 1 0 字典 大小

字典 大小 4096KB

1 1 1文件作为字典

2 RAR码流分析

RAR格式文件由可变长度的块组成。这些块的顺序可以变化,但是第一块必须是一个在档案文件头后的标记块。这里通过实例详细分析每个数据块的参数:下面为压缩后的

.text码流。

RAR压缩编码后的文件通常有以下数据块组成:HEAD_TYPE=0x72标记块,HEAD_TYPE=0x73压缩文件头,HEAD_TYPE=0x74文件头,HEAD_TYPE=0x75旧风格的注释头 …… 此处隐藏:5185字,全部文档内容请下载后查看。喜欢就下载吧 ……

RAR编码文件格式分析.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219