Java解析魔兽争霸3录像W3G文件(一):Header(一)

2014-11-24 07:14:22 · 作者: · 浏览: 3

魔兽争霸3是一款非常著名的即时战略游戏。相信很多人都听过sky、moon、grubby这些名字,还有塔魔infi、中国的鬼王ted、刚猛的fly、飘逸的th000等选手。遗憾的是WCG2013是魔兽争霸3的最后一届,我自己也去现场观看了魔兽的总决赛。此外,还有DOTA、真三、澄海3C等著名的地图。

魔兽争霸的录像大家都知道,是用来回放的,文件后缀名是.w3g,保存在魔兽争霸下的REPLAY目录下。现在很多软件可以分析魔兽争霸录像,直接可以查看录像的玩家、地图,以及玩家的APM等信息。

最近在YY对战平台打魔兽,经常能遇到Java程序员,说明Java程序员中有很多魔兽争霸3的玩家,这里将Java解析魔兽争霸3录像的方法贡献给同是WAR3玩家的小伙伴们。

魔兽争霸3录像文件由一个头部(Header)多个压缩数据块(compressed data blocks)组成。本文主要内容是解析Header部分,压缩数据块部分的解析会在后续的博文中详细介绍。

Header结构:

Header部分包含了录像的最基本的信息,大小是固定的前68个字节,此后的全部是压缩数据块。对于1.06版本及之前的录像,Header部分大小是64字节,由于版本太古老这里就不考虑了。下面的代码中也不再支持老版本的录像。

Header中每个部分的意义:

1~28字节(28个字符):固定的字符串"Warcraft III recorded game\0x1A\0"。
29~32字节(4个字节):Header部分的总字节数,对于1.07版本及之后,是68(0x44),对于1.06版本及之前是64(0x40)。
33~36字节(4个字节):压缩数据块的压缩数据总字节数,即解压前。
37~40字节(4个字节):录像版本标识(0表示1.06版本及之前版本,1表示1.07版本及之后版本)。
41~44字节(4个字节):压缩数据块解压缩后的总字节数。
45~48字节(4个字节):压缩数据块的个数。
49~52字节(4个字节):一个字符串标识,"WAR3"表示非冰封王座,"W3XP"表示冰封王座。
53~56字节(4个字节):版本号(例如24即是1.24版本)。
57~58字节(2个字节):构建号(build number)。
59~60字节(2个字节):0x0000表示单人游戏,0x8000(十进制32768)表示多人游戏。
61~64字节(4个字节):录像时长(毫秒数)。
65~68字节(4个字节):Header部分CRC32校验码(包含这四个字节但是要都设为0)。

可以使用EditPlus的Hex Viewer方式打开w3g文件查看Header部分。

\

\

在这里可以发现一个问题,除了第一个字符串"Warcraft III recorded game\0x1A\0"以外,其他每个部分的字节顺序都是倒过来的。例如Header部分总字节数是0x44000000,"W3XP"字符串顺序是"PX3W"。这是因为这里使用的是小字节序(Little-Endian),也就是字节顺序和正常的顺序完全相反,所以在读取的时候应该将其倒过来读。

\


Java解析Header:

知道了Header部分的结构,下面就可以用Java语言来解析Header了。

首先定义一个Replay类,表示一场录像,构造函数传入录像文件File。为了方便,将文件转换成字节数组,再将字节数组传给Header类进行处理。

Replay.java

package com.xxg.w3gparser;

import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

public class Replay {
	
	private Header header;
	
	public Replay(File w3gFile) throws IOException, W3GException {
		
		byte[] fileBytes = fileToByteArray(w3gFile);
		header = new Header(fileBytes);

	}

	/**
	 * 将文件转换成字节数组
	 * @param w3gFile 文件
	 * @return 字节数组
	 * @throws IOException
	 */
	private byte[] fileToByteArray(File w3gFile) throws IOException {

		FileInputStream fileInputStream = new FileInputStream(w3gFile);
		ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();

		byte[] buffer = new byte[1024];
		int n;
		
		try {
			while((n = fileInputStream.read(buffer)) != -1) {
				byteArrayOutputStream.write(buffer, 0, n);
			}
		} finally {
			fileInputStream.close();
		}
		
		return byteArrayOutputStream.toByteArray();
	}

	public Header getHeader() {
		return header;
	}
	
}

在Header类中,按小字节序读取所有的Header信息。Header的最后四个字节是CRC32循环冗余检验码,Java中可以使用java.util.zip.CRC32类来计算,下面的代码中校验了计算结果和Header中是否一致。有关CRC32的介绍可以查看相关资料,这里不再介绍。

Header.java

package com.xxg.w3gparser;

import java.util.zip.CRC32;

public class Header {
	
	public static final String BEGIN_TITLE = "Warcraft III recorded game\u001A\0";
	
	private long headerSize;

	private long compressedDataSize;

	private long headerVersion;

	private long uncompressedDataSize;

	private long compressedDataBlockCount;

	private String versionIdentifier;

	private long versionNumber;

	private int buildNumber;

	private int flag;

	private long duration;

	public Header(byte[] fileBytes) throws W3GException {
		
		// 读取开头的字符串"Warcraft III recor