Java GZip 基于磁盘实现压缩和解压的方法

2025-05-29 0 77

  GZip是常用的无损压缩算法实现,在Linux中较为常见,像我们在Linux安装软件时,基本都是.tar.gz格式。.tar.gz格式文件需要先对目录内文件进行tar压缩,然后使用GZip进行压缩

  本文针对基于磁盘压缩解压进行演示,演示只针对一层目录结构进行,多层目录只需递归操作进行即可。

  Maven依赖

  org.apache.commons: commons-compress: 1.19: 此依赖封装了很多压缩算法相关的工具类,提供的API还是相对比较底层,我们今天在它的基础上做进一步封装。

?

1

2

3

4

5

6

7

8

9

10
<dependency>

<groupId>org.apache.commons</groupId>

<artifactId>commons-compress</artifactId>

<version>1.19</version>

</dependency>

<dependency>

<groupId>log4j</groupId>

<artifactId>log4j</artifactId>

<version>1.2.17</version>

</dependency>

  工具类

  其实,在通常情况下,我们都是在磁盘上进行压缩解压操作的,这样虽然增加了操作的复杂度,但是却无形中避免了一些问题。

  工具类针对.tar.gz格式提供了compressByTar、decompressByTar、compressByGZip、decompressByGZip四个方法,用于处理.tar.gz格式压缩文件,代码如下:

?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195
package com.arhorchin.securitit.compress.gzip;

import java.io.BufferedInputStream;

import java.io.BufferedOutputStream;

import java.io.File;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import org.apache.commons.compress.archivers.tar.TarArchiveEntry;

import org.apache.commons.compress.archivers.tar.TarArchiveInputStream;

import org.apache.commons.compress.archivers.tar.TarArchiveOutputStream;

import org.apache.commons.compress.compressors.gzip.GzipCompressorInputStream;

import org.apache.commons.compress.compressors.gzip.GzipCompressorOutputStream;

import org.apache.commons.compress.utils.IOUtils;

import org.apache.log4j.Logger;

/**

* @author Securitit.

* @note 基于磁盘以GZIP算法进行压缩和解压工具类.

*/

public class GZipDiskUtil {

/**

* logger.

*/

private static Logger logger = Logger.getLogger(GZipDiskUtil.class);

/**

* UTF-8字符集.

*/

public static String CHARSET_UTF8 = "UTF-8";

/**

* 使用TAR算法进行压缩.

* @param sourceFolderPath 待进行压缩的文件夹路径.

* @param targetTarFilePath 压缩后的TAR文件存储目录.

* @return 压缩是否成功.

* @throws Exception 压缩过程中可能发生的异常.

*/

public static boolean compressByTar(String sourceFolderPath, String targetTarFilePath) throws Exception {

// 变量定义.

File sourceFolderFile = null;

FileOutputStream targetTarFos = null;

TarArchiveOutputStream targetTartTaos = null;

TarArchiveEntry targetTarTae = null;

try {

// 压缩变量初始化.

sourceFolderFile = new File(sourceFolderPath);

targetTarFos = new FileOutputStream(new File(targetTarFilePath));

targetTartTaos = new TarArchiveOutputStream(targetTarFos);

// 将文件添加到ZIP条目中.

for (File file : sourceFolderFile.listFiles()) {

try (FileInputStream fis = new FileInputStream(file);

BufferedInputStream bis = new BufferedInputStream(fis);) {

targetTarTae = new TarArchiveEntry(file);

targetTarTae.setName(file.getName());

targetTartTaos.putArchiveEntry(targetTarTae);

targetTartTaos.write(IOUtils.toByteArray(bis));

targetTartTaos.closeArchiveEntry();

}

}

} catch (Exception ex) {

logger.info("GZipDiskUtil.compressByTar.", ex);

return false;

} finally {

if (targetTartTaos != null)

targetTartTaos.close();

if (targetTarFos != null)

targetTarFos.close();

}

return true;

}

/**

* 使用TAR算法进行解压.

* @param sourceTarPath 待解压文件路径.

* @param targetFolderPath 解压后文件夹目录.

* @return 解压是否成功.

* @throws Exception 解压过程中可能发生的异常.

*/

public static boolean decompressByTar(String sourceTarPath, String targetFolderPath) throws Exception {

// 变量定义.

FileInputStream sourceTarFis = null;

TarArchiveInputStream sourceTarTais = null;

TarArchiveEntry sourceTarTae = null;

File singleEntryFile = null;

try {

// 解压定义初始化.

sourceTarFis = new FileInputStream(new File(sourceTarPath));

sourceTarTais = new TarArchiveInputStream(sourceTarFis);

// 条目解压缩至指定文件夹目录下.

while ((sourceTarTae = sourceTarTais.getNextTarEntry()) != null) {

singleEntryFile = new File(targetFolderPath + File.separator + sourceTarTae.getName());

try (FileOutputStream fos = new FileOutputStream(singleEntryFile);

BufferedOutputStream bos = new BufferedOutputStream(fos);) {

bos.write(IOUtils.toByteArray(sourceTarTais));

}

}

} catch (Exception ex) {

logger.info("GZipDiskUtil.decompressByTar.", ex);

return false;

} finally {

if (sourceTarTais != null)

sourceTarTais.close();

if (sourceTarFis != null)

sourceTarFis.close();

}

return true;

}

/**

* 使用GZIP算法进行压缩.

* @param sourceFilePath 待进行压缩的文件路径.

* @param targetGZipFilePath 压缩后的GZIP文件存储目录.

* @return 压缩是否成功.

* @throws Exception 压缩过程中可能发生的异常.

*/

public static boolean compressByGZip(String sourceFilePath, String targetGZipFilePath) throws IOException {

// 变量定义.

FileInputStream sourceFileFis = null;

BufferedInputStream sourceFileBis = null;

FileOutputStream targetGZipFileFos = null;

BufferedOutputStream targetGZipFileBos = null;

GzipCompressorOutputStream targetGZipFileGcos = null;

try {

// 压缩变量初始化.

sourceFileFis = new FileInputStream(new File(sourceFilePath));

sourceFileBis = new BufferedInputStream(sourceFileFis);

targetGZipFileFos = new FileOutputStream(targetGZipFilePath);

targetGZipFileBos = new BufferedOutputStream(targetGZipFileFos);

targetGZipFileGcos = new GzipCompressorOutputStream(targetGZipFileBos);

// 采用commons-compress提供的方式进行压缩.

targetGZipFileGcos.write(IOUtils.toByteArray(sourceFileBis));

} catch (Exception ex) {

logger.info("GZipDiskUtil.compressByGZip.", ex);

return false;

} finally {

if (targetGZipFileGcos != null)

targetGZipFileGcos.close();

if (targetGZipFileBos != null)

targetGZipFileBos.close();

if (targetGZipFileFos != null)

targetGZipFileFos.close();

if (sourceFileBis != null)

sourceFileBis.close();

if (sourceFileFis != null)

sourceFileFis.close();

}

return true;

}

/**

* 使用GZIP算法进行解压.

* @param sourceGZipFilePath 待解压文件路径.

* @param targetFilePath 解压后文件路径.

* @return 解压是否成功.

* @throws @throws Exception 解压过程中可能发生的异常.

*/

public static boolean decompressByGZip(String sourceGZipFilePath, String targetFilePath) throws IOException {

// 变量定义.

FileInputStream sourceGZipFileFis = null;

BufferedInputStream sourceGZipFileBis = null;

FileOutputStream targetFileFos = null;

GzipCompressorInputStream sourceGZipFileGcis = null;

try {

// 解压变量初始化.

sourceGZipFileFis = new FileInputStream(new File(sourceGZipFilePath));

sourceGZipFileBis = new BufferedInputStream(sourceGZipFileFis);

sourceGZipFileGcis = new GzipCompressorInputStream(sourceGZipFileBis);

targetFileFos = new FileOutputStream(new File(targetFilePath));

// 采用commons-compress提供的方式进行解压.

targetFileFos.write(IOUtils.toByteArray(sourceGZipFileGcis));

} catch (Exception ex) {

logger.info("GZipDiskUtil.decompressByGZip.", ex);

return false;

} finally {

if (sourceGZipFileGcis != null)

sourceGZipFileGcis.close();

if (sourceGZipFileBis != null)

sourceGZipFileBis.close();

if (sourceGZipFileFis != null)

sourceGZipFileFis.close();

if (targetFileFos != null)

targetFileFos.close();

}

return true;

}

}

工具类测试

  在Maven依赖引入正确的情况下,复制上面的代码到项目中,修改package,可以直接使用,下面我们对工具类进行简单测试。测试类代码如下:

?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19
package com.arhorchin.securitit.compress.gzip;

import com.arhorchin.securitit.compress.gzip.GZipDiskUtil;

/**

* @author Securitit.

* @note GZipDiskUtil工具类测试.

*/

public class GZipDiskUtilTester {

public static void main(String[] args) throws Exception {

GZipDiskUtil.compressByTar("C:/Users/Administrator/Downloads/个人文件/2020-07-13/files", "C:/Users/Administrator/Downloads/个人文件/2020-07-13/disk.tar");

GZipDiskUtil.compressByGZip("C:/Users/Administrator/Downloads/个人文件/2020-07-13/disk.tar", "C:/Users/Administrator/Downloads/个人文件/2020-07-13/disk.tar.gz");

GZipDiskUtil.decompressByGZip("C:/Users/Administrator/Downloads/个人文件/2020-07-13/disk.tar.gz", "C:/Users/Administrator/Downloads/个人文件/2020-07-13/disk-untar.tar");

GZipDiskUtil.decompressByTar("C:/Users/Administrator/Downloads/个人文件/2020-07-13/disk-untar.tar", "C:/Users/Administrator/Downloads/个人文件/2020-07-13/disk-untar");

}

}

  运行测试后,通过查看disk.tar、disk.tar.gz、disk-untar.tar和解压的目录,可以确认工具类运行结果无误。

总结

  1) 在小文件、文件数量较小且较为固定时,提倡使用内存压缩解压方式。使用内存换时间,减少频繁的磁盘操作。《Java GZip 基于内存实现压缩解压

  2) 在大文件、文件数量较大时,提倡使用磁盘压缩解压方式。过大文件对服务会造成过度的负载,磁盘压缩解压可以缓解这种压力。

原文链接:https://blog.csdn.net/securitit/article/details/108156025

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

快网idc优惠网 建站教程 Java GZip 基于磁盘实现压缩和解压的方法 https://www.kuaiidc.com/118565.html

相关文章

发表评论
暂无评论