转载
Python中ZipFile解压文件名中文乱码的问题
分类:python 740人阅读 IT小君 2022-10-05 20:18

原因分析

zipfile.py中ZipFile在初始化时执行了_RealGetContents方法，目的是读取目录结构，其中关于文件名编码的处理是这样的：

# 第42行
if flags & 0x800:
    # UTF-8 file names extension
    filename = filename.decode('utf-8')
else:
    # Historical ZIP filename encoding
    filename = filename.decode('cp437')

要么是utf-8要么是cp437，然而咱们在windows平台上压缩包文件名编码大多是gbk，这里用cp437解码了，所以会乱码

解决办法

只需要将filename重新编码cp437解码成gbk就好了，网络上大多数做法是对解压后的文件和目录操作，不太优雅。优雅一点点的方式是直接修改ZipFile对象中的filename

首先找到filename存在于哪里，同样在_RealGetContents这个函数中找到如下代码

# 第49行
x = ZipInfo(filename)
... # 省略若干行
# self是ZipFile对象
# 第67行
self.filelist.append(x)
self.NameToInfo[x.filename] = x

所以至少有两处存在filename

列表filelist存储的ZipInfo对象的filename属性
字典NameToInfo的键

加个补丁函数把这两处改了试试，代码如下：

from zipfile import ZipFile


def support_gbk(zip_file: ZipFile):
    name_to_info = zip_file.NameToInfo
    # copy map first
    for name, info in name_to_info.copy().items():
        real_name = name.encode('cp437').decode('gbk')
        if real_name != name:
            info.filename = real_name
            del name_to_info[name]
            name_to_info[real_name] = info
    return zip_file


with support_gbk(ZipFile(r'./里面有中文.zip')) as zfp:
    zfp.extractall(r'./中文不乱码')

赏

支付宝打赏

微信打赏

如果文章对你有帮助，欢迎点击上方按钮打赏作者

博文推荐更多»

Monorepo 前端模块化多项目开发管理告别项目碎片化，拥抱高效开发！

学习搭建网站

web 产品需求挖掘方法1

MCP 实战之从0开始实现MCP server

cloudflare IP优选配置实战（tunel和正常域名解析两种），网上坑很多,网站加速

我的学习笔记

免费代理网站

最热实例源代码更多»

android.view.animation.AnticipateOvershootInterpolator#android.view.WindowManager实例Demo源码 6654阅

android.view.View实例Demo源码 5254阅

org.springframework.web.bind.annotation.RequestBody实例Demo源码 4867阅

org.springframework.web.bind.annotation.GetMapping实例Demo源码 4312阅

org.springframework.boot.context.embedded.tomcat.TomcatEmbeddedServletContainerFactory实例Demo源码 4208阅

org.springframework.web.bind.annotation.PostMapping实例Demo源码 4085阅

工具推荐更多»

chromedriver win64 133 谷歌浏览器版本2025

淘宝商品上架1比1（1:1）图片批量一键调整工具，好用哭了

TTF字体抽取压缩、JSON格式化、qrcode 二维码生成解码工具windows桌面版

视频&图片水印免费除

frp0.53.2下载备份

免费录屏工具

自动必应刷搜索积分插件 auto get Microsoft Rewards chrome/edge plugin

chromedriver win64 116.0.5845.96 (r1160321) 下载

notepad++ 下载备份 npp.8.4.6.Installer.x64版本

Git-2.38.1-64-bit 下载备份

java17 jdk-17_windows-x64_bin 下载备份

java JDK1.8 x64 下载

notepad++ 二维码生成插件nppqrcode

站酷小薇LOGO体 ttf

spacedesk，将你的移动设备（手机或者平板）转变成你电脑的第二个显示器的软件(apk、win10 客户端下载)

idisplay，将你的移动设备（手机或者平板）转变成你电脑的第二个显示器的软件

sqlmap：开源的sql 自动注入、渗透测试工具

中文字体songti.ttf

IA图片助手(ImageAssistant)，轻松下载网页所有图片

微软雅黑体(msyh.ttf)字体

tinymce_5.8.2 编译版本和开发版本包含汉化脚本

LICEcap GIF 视屏截图、屏幕录制工具

ScreenToGif gif 录屏工具 v2.32.1 绿色免安装中文版

截图录制编辑GIF工具GifCam免安装中文绿色版和英文最新版

GC日志可视化分析工具GCViewer1.36

JAVA内存分析工具（Memory Analyzer Tool，MAT）独立安装版

VisualVM Java 程序性能分析、虚拟机GC分析工具-visualvm_207.zip

JClassLib开源的字节码阅读和编辑器器-jclasslib_win64_5_8.exe

Git-2.31.1 windows 下载

SoapUI-5.3.0 windows免安装版