应用场景
应用场景是程序整合第三方库多平台运行,第三方库window平台编译,代码移植到linux出现bom问题
思考解决
windows使用utf-8编码,linux使用utf-8无bom编码
工具主要针对utf-8编码文件,能够批量添加删除BOM,无识别转化ASIIC功能,添加BOM时,如果文件是utf-8(BOM)。
实际情况
我们填单有个批量采集文本导出再导入,全部都是txt文件,数据达到几千条放置在不同的文件夹下面,他们都是utf-8编码格式存储的txt文件,现在作为迁移需要导入到库里面需要utf-8 bom 编码格式
代码编译
基于python开发的编码转换工具,图形化界面基于pyside2(也就是qt5)开发。支持批量转换任意格式的文件编码;可将文件编码转为UTF-8 BOM 、UTF-8、GB2312中的任意一种格式;src文件夹下是源码,exe文件夹下是打包好可直接在windows下运行的exe程序。
$ python --version
Python 3.10.7
$ pip install pyside2
$ pip install chardet
$ pip install pyinstaller
$ pyinstaller -w -F mainwindow.py