通过python实现办公流程自动化,经常遇到从网页上下载的excel文件为html格式的表格(或者后缀为xls/xlsx,实际依旧为html格式),无法通过python处理文件数据,比如合并excel文件,此时就需要将文件另存为excel格式,手动操作过于繁琐,可以通过以下代码进行自动化实现
import os
import win32com.client as win32
excel = win32.gencache.EnsureDispatch('Excel.Application')
wb=excel.Workbooks.Open(os.path.abspath('./test.html'))
wb.SaveAs(os.path.abspath('./test.xlsx'), FileFormat=51) # 51 represents xlsx format
wb.Close()
excel.Application.Quit()
部分电脑可能只安装了office2003等低版本软件,不支持xlsx格式文件,可以将第5行代码进行修改:
import os
import win32com.client as win32
excel = win32.gencache.EnsureDispatch('Excel.Application')
wb=excel.Workbooks.Open(os.path.abspath('./test.html'))
wb.SaveAs(os.path.abspath('./test.xls'), FileFormat=43) # 43 represents xls format
wb.Close()
excel.Application.Quit()
如果还无法操作,或者需要另存为其他格式文件,可以参考以下链接:XlFileFormat 枚举 (Excel) | Microsoft Learn