ZipInputStream解压中文文件名失败？如何正确设置字符集？-小浪学习网

ZipInputStream解压中文文件名失败？如何正确设置字符集？

ZipinputStream解压中文文件名问题及解决方案

许多开发者在使用ZipInputStream解压包含中文文件名或文件夹名的Zip压缩包时，常常遭遇字符编码问题，导致解压失败，并提示类似“malformed input off : 1, Length : 1”的错误。本文将深入分析此问题，并提供有效的解决方案。

问题根源在于ZipInputStream构造方法中指定的字符集并非用于解压文件内部文件名编码，而是用于读取Zip文件本身的中央目录信息。中央目录的编码取决于压缩包的创建环境和操作系统。windows系统通常使用GB2312或GBK编码，而macos和linux系统通常使用UTF-8编码。

因此，如果一个Zip压缩包是在Windows系统下创建的，其中央目录很可能使用GBK编码。即使代码中指定了UTF-8编码，ZipInputStream仍然无法正确解析GBK编码的中央目录，从而导致解压失败。

解决方案：

针对Windows系统创建的Zip包，建议使用GBK编码读取中央目录：

FileInputStream input = new FileInputStream(targetPath); ZipInputStream zipInputStream = new ZipInputStream(new BufferedInputStream(input), Charset.forName("GBK"));

由于GBK编码兼容GB2312，此方法同样适用于GB2312编码的中央目录。

跨平台解决方案：

为了编写更健壮的跨平台兼容代码，推荐使用apache Commons Compress库。该库提供更强大的压缩/解压缩功能，能够自动处理不同编码的Zip压缩包，有效避免因字符集差异导致的解压失败。它能自动检测并处理不同编码的中央目录信息，简化开发流程，并提升代码的可靠性。

文章版权归作者所有，未经允许请勿转载。

THE END