将 Markdown 表格结构转换为Excel 文件

news2025/4/1 1:00:25

在数据管理和文档编写过程中,我们经常使用 Markdown 来记录表格数据。然而,Markdown 格式的表格在实际应用中不如 Excel 方便,特别是需要进一步处理数据时。因此,我们开发了一个使用 wxPython 的 GUI 工具,将 Markdown 表格结构转换为 Excel 文件。
C:\pythoncode\new\MarkdownToExcel.py
在这里插入图片描述

所有代码

import wx
import re
import openpyxl
import logging

class MarkdownToExcelApp(wx.Frame):
    def __init__(self):
        super().__init__(parent=None, title='Markdown 转 Excel', size=(800, 600))
        
        # 配置日志
        logging.basicConfig(level=logging.DEBUG, 
                            format='%(asctime)s - %(levelname)s - %(message)s',
                            filename='markdown_to_excel_debug.log',
                            filemode='w')
        
        # 创建面板
        panel = wx.Panel(self)
        
        # 创建垂直布局
        main_sizer = wx.BoxSizer(wx.VERTICAL)
        
        # 输入标签
        input_label = wx.StaticText(panel, label='请输入Markdown表格结构:')
        main_sizer.Add(input_label, 0, wx.ALL | wx.EXPAND, 10)
        
        # 输入文本框
        self.input_text = wx.TextCtrl(panel, style=wx.TE_MULTILINE)
        main_sizer.Add(self.input_text, 1, wx.ALL | wx.EXPAND, 10)
        
        # 转换按钮
        convert_btn = wx.Button(panel, label='转换为Excel')
        convert_btn.Bind(wx.EVT_BUTTON, self.on_convert)
        main_sizer.Add(convert_btn, 0, wx.ALL | wx.CENTER, 10)
        
        # 日志文本框
        self.log_text = wx.TextCtrl(panel, style=wx.TE_MULTILINE | wx.TE_READONLY)
        main_sizer.Add(self.log_text, 1, wx.ALL | wx.EXPAND, 10)
        
        # 设置面板的布局
        panel.SetSizer(main_sizer)
        
        # 创建菜单栏
        menubar = wx.MenuBar()
        file_menu = wx.Menu()
        exit_item = file_menu.Append(wx.ID_EXIT, '退出', '退出应用程序')
        menubar.Append(file_menu, '文件')
        self.SetMenuBar(menubar)
        
        # 绑定菜单事件
        self.Bind(wx.EVT_MENU, self.on_exit, exit_item)
        
        # 居中显示
        self.Centre()
    
    def log_and_display(self, message):
        """记录日志并在界面显示"""
        logging.debug(message)
        self.log_text.AppendText(message + '\n')
    
    def parse_markdown_structure(self, markdown_text):
        """解析Markdown表格结构"""
        self.log_and_display("开始解析Markdown表格结构")
        
        # 存储表格信息的字典
        table_structure = {}
        
        # 按表格分割
        table_blocks = markdown_text.split('* **')
        
        for block in table_blocks[1:]:  # 跳过第一个空元素
            # 分割表格名称和字段
            lines = block.split('\n')
            table_name = lines[0].strip()
            
            # 提取字段
            fields = []
            for line in lines[1:]:
                line = line.strip()
                if line.startswith('* '):
                    # 移除 '* ' 前缀
                    fields.append(line[2:].strip())
            
            self.log_and_display(f"表格: {table_name}")
            self.log_and_display(f"字段: {fields}")
            
            # 存储表格结构
            table_structure[table_name] = fields
        
        self.log_and_display(f"解析完成,总表格数: {len(table_structure)}")
        return table_structure
    
    def on_convert(self, event):
        """转换Markdown结构到Excel"""
        # 清空之前的日志
        self.log_text.Clear()
        
        markdown_text = self.input_text.GetValue()
        
        if not markdown_text.strip():
            wx.MessageBox('请输入Markdown表格结构', '错误', wx.OK | wx.ICON_ERROR)
            return
        
        try:
            # 解析Markdown结构
            table_structure = self.parse_markdown_structure(markdown_text)
            
            # 创建工作簿
            wb = openpyxl.Workbook()
            
            # 为每个表格创建sheet
            first_sheet = True
            for table_name, fields in table_structure.items():
                self.log_and_display(f"创建sheet: {table_name}")
                
                if first_sheet:
                    # 重命名第一个sheet
                    ws = wb.active
                    ws.title = table_name.split(' ')[0][:31]  # Excel sheet名称长度限制
                    first_sheet = False
                else:
                    ws = wb.create_sheet(title=table_name.split(' ')[0][:31])
                
                # 写入表头
                for col, field in enumerate(fields, start=1):
                    ws.cell(row=1, column=col, value=field)
                
                # 添加一个示例行(可选)
                for col, field in enumerate(fields, start=1):
                    ws.cell(row=2, column=col, value=f"示例{field}")
            
            # 保存文件
            save_dialog = wx.FileDialog(
                self, 
                "保存Excel文件", 
                wildcard="Excel文件 (*.xlsx)|*.xlsx", 
                style=wx.FD_SAVE | wx.FD_OVERWRITE_PROMPT
            )
            
            if save_dialog.ShowModal() == wx.ID_OK:
                filename = save_dialog.GetPath()
                wb.save(filename)
                self.log_and_display(f'Excel文件已保存:{filename}')
                wx.MessageBox(f'Excel文件已保存:{filename}', '成功', wx.OK | wx.ICON_INFORMATION)
            
            save_dialog.Destroy()
        
        except Exception as e:
            error_msg = f'转换出错:{str(e)}'
            self.log_and_display(error_msg)
            wx.MessageBox(error_msg, '错误', wx.OK | wx.ICON_ERROR)
    
    def on_exit(self, event):
        """退出应用程序"""
        self.Close(True)

def main():
    app = wx.App()
    frame = MarkdownToExcelApp()
    frame.Show()
    app.MainLoop()

if __name__ == '__main__':
    main()

1. 项目概述

本项目提供一个图形界面,用户可以输入 Markdown 格式的表格结构,程序解析后生成 Excel 文件。该应用具备以下功能:

  • 支持 Markdown 格式的表格结构解析。
  • 生成 Excel 文件,每个表格对应一个工作表。
  • 记录日志,方便调试。
  • 提供 GUI 界面,用户体验友好。

2. 代码解析

2.1 依赖库
import wx
import re
import openpyxl
import logging
  • wx 用于创建 GUI 界面。
  • re 用于正则表达式解析 Markdown 表格。
  • openpyxl 用于创建 Excel 文件。
  • logging 记录调试信息。
2.2 GUI 设计
class MarkdownToExcelApp(wx.Frame):
    def __init__(self):
        super().__init__(parent=None, title='Markdown 转 Excel', size=(800, 600))
  • wx.Frame 创建主窗口,标题为“Markdown 转 Excel”。
  • 设置窗口大小为 800x600。
# 配置日志
logging.basicConfig(level=logging.DEBUG, 
                    format='%(asctime)s - %(levelname)s - %(message)s',
                    filename='markdown_to_excel_debug.log',
                    filemode='w')
  • 记录日志到 markdown_to_excel_debug.log,用于调试。
# 创建面板
panel = wx.Panel(self)
# 创建垂直布局
main_sizer = wx.BoxSizer(wx.VERTICAL)
  • wx.Panel 是 GUI 的容器。
  • wx.BoxSizer(wx.VERTICAL) 采用垂直布局管理组件。
2.3 解析 Markdown 结构
def parse_markdown_structure(self, markdown_text):
    self.log_and_display("开始解析Markdown表格结构")
    table_structure = {}
    table_blocks = markdown_text.split('* **')
    for block in table_blocks[1:]:
        lines = block.split('\n')
        table_name = lines[0].strip()
        fields = [line[2:].strip() for line in lines[1:] if line.startswith('* ')]
        self.log_and_display(f"表格: {table_name}")
        self.log_and_display(f"字段: {fields}")
        table_structure[table_name] = fields
    self.log_and_display(f"解析完成,总表格数: {len(table_structure)}")
    return table_structure
  • split('* **') 将 Markdown 文本按表格名称分割。
  • 逐行解析字段。
  • 记录日志信息。
2.4 生成 Excel
def on_convert(self, event):
    markdown_text = self.input_text.GetValue()
    if not markdown_text.strip():
        wx.MessageBox('请输入Markdown表格结构', '错误', wx.OK | wx.ICON_ERROR)
        return
    try:
        table_structure = self.parse_markdown_structure(markdown_text)
        wb = openpyxl.Workbook()
        first_sheet = True
        for table_name, fields in table_structure.items():
            ws = wb.active if first_sheet else wb.create_sheet(title=table_name.split(' ')[0][:31])
            first_sheet = False
            for col, field in enumerate(fields, start=1):
                ws.cell(row=1, column=col, value=field)
                ws.cell(row=2, column=col, value=f"示例{field}")
        save_dialog = wx.FileDialog(self, "保存Excel文件", wildcard="Excel文件 (*.xlsx)|*.xlsx", style=wx.FD_SAVE | wx.FD_OVERWRITE_PROMPT)
        if save_dialog.ShowModal() == wx.ID_OK:
            filename = save_dialog.GetPath()
            wb.save(filename)
            self.log_and_display(f'Excel文件已保存:{filename}')
            wx.MessageBox(f'Excel文件已保存:{filename}', '成功', wx.OK | wx.ICON_INFORMATION)
    except Exception as e:
        self.log_and_display(f'转换出错:{str(e)}')
        wx.MessageBox(f'转换出错:{str(e)}', '错误', wx.OK | wx.ICON_ERROR)
  • openpyxl.Workbook() 创建 Excel 文件。
  • create_sheet() 创建多个表格,每个表格对应一个工作表。
  • wx.FileDialog 让用户选择文件保存路径。
  • logging 记录转换过程。
2.5 退出应用
def on_exit(self, event):
    self.Close(True)
  • 关闭应用。

3. 运行程序

def main():
    app = wx.App()
    frame = MarkdownToExcelApp()
    frame.Show()
    app.MainLoop()

if __name__ == '__main__':
    main()
  • 启动 wxPython GUI。

4. 总结

本项目通过 wxPython 构建用户界面,并结合 openpyxl 解析 Markdown 表格并生成 Excel 文件。它适用于希望从 Markdown 结构化数据导出 Excel 的用户,简化了手动整理表格的过程。

你可以进一步优化该项目,如:

  • 增加 Markdown 语法校验。
  • 允许用户调整 Excel 文件格式。
  • 增加数据预览功能。

运行结果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2323855.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微信小程序逆向开发

一.wxapkg文件 如何查看微信小程序包文件: 回退一级 点击进入这个目录 这个就是我们小程序对应的文件 .wxapkg概述 .wxapkg是微信小程序的包文件格式,且其具有独特的结构和加密方式。它不仅包含了小程序的源代码,还包括了图像和其他资源文…

Spring Data审计利器:@LastModifiedDate详解!!!

🕒 Spring Data审计利器:LastModifiedDate详解🔥 🌟 简介 在数据驱动的应用中,记录数据的最后修改时间是常见需求。Spring Data的LastModifiedDate注解让这一过程自动化成为可能!本篇带你掌握它的核心用法…

wms窗口/多窗口/自由窗口systemui侧边栏手势退出实战-学员作业

背景: 再学习了马哥的分屏自由窗口专题课程时候,有一个需求就是实现自由窗口置顶的功能,这个需求实现后,自由窗口就会一直处于顶端,不会因为打开其他Activity导致自由窗口退出。 不会因为打开了其他Activity而导致短…

服装零售行业数据分析方案

在数据洪流的时代,大数据分析已成为服装产业的强大引擎,助力企业飞速提升运营效率,削减成本,并优化资源配置。在服饰行业的生产运营链中,商业智能(BI)工具扮演着至关重要的角色,它们…

基于大模型的pc版语音对话问答

Vosk基础知识: Vosk 是一个强大的开源语音识别工具包,以下是对它的详细介绍: 特点 离线识别:Vosk 的显著特点是支持离线语音识别。这意味着在没有网络连接的情况下,也能进行语音识别操作,避免了因网络问…

深入理解 Linux 内核中的 GPU 子系统:从 DRM 到 NXP 驱动架构全解读

本文不仅为 GPU 子系统的深入复习笔记,更是一本面向 Linux 内核开发者、嵌入式图形系统开发人员的实践指南。本文围绕 drivers/gpu 展开,特别聚焦 NXP i.MX 系列平台的 GPU 架构和 Linux-imx 的实现方式,内容超 5000 字,适合收藏学…

Allegro界面颜色改变设置

概述:本文主要讲解如何改变allegro的背景颜色,改为自己喜欢的颜色 1、 打开Allegro文件 2、 Setup—User Preference—UI—General—Allegro_theme选择Light即可 改变前 改变后

ThreadLocal与Cookie + Session?

这篇文章主要在做 Echo 社区项目的时候写的,在保持用户登录态的这个需求下,为啥要用 ThreadLocal 存储用户信息,而不是采用常见的 Cookie Session。 Cookie Session 由于 HTTP 协议是无状态的,完成操作关闭浏览器后,…

【算法】二分查找(下)

一、山峰数组的峰顶索引 题目链接:852. 山脉数组的峰顶索引 - 力扣(LeetCode) 题目描述: 给定一个长度为 n 的整数 山脉 数组 arr ,其中的值递增到一个 峰值元素 然后递减。 返回峰值元素的下标。 你必须设计并实现时…

【动手学深度学习】#6 卷积神经网络

主要参考学习资料: 《动手学深度学习》阿斯顿张 等 著 【动手学深度学习 PyTorch版】哔哩哔哩跟李牧学AI 由于本系列一开始跳过了第一章引言部分,因此系列编号比书本章节编号提前。现改为和书本统一(因为之前自己的原始笔记也是按照书本章节编…

认识一家公司:瑞芯微(Rockchip Electronics Co., Ltd.)以及旗下的两款芯片RK3288\RK3588

瑞芯微(Rockchip Electronics Co., Ltd.)简介 一、公司概况 瑞芯微电子股份有限公司(简称“瑞芯微”)成立于2001年,总部位于中国福建省福州市,是一家专注于集成电路设计与研发的高新技术企业。公司采用Fa…

Netty——零拷贝

文章目录 1. 什么是零拷贝?2. 为什么需要零拷贝?2.1 传统 I/O 的拷贝流程2.2 零拷贝的优化2.2.1 通过 sendfile 系统调用2.2.2 通过 mmap (内存映射) 系统调用 3. Netty 实现零拷贝的方式3.1 文件传输优化:FileRegion 封装3.2 直接内存 (Dire…

Java制作简单的聊天室(复习)

设计的知识点:几乎包含java基础的全部知识点(java基础语法,java基础进阶:双列集合,io流,多线程,网络编程等) 代码如下 客户端: 服务器采用的时多线程的循环多线程的方式…

内核、进程和线程---操作系统

操作系统 操作系统位于用户程序和硬件之间,通过系统调用提供接口可以让应用程序去使用硬件,但是硬件资源的管理和安全控制由操作系统负责。 用户空间和内存空间 在计算机系统中,内存可以分为两大区域:内核空间(Ker…

如何在 Postman 中上传图片并在请求中正确引用?

Postman 是一款常用的 API 测试工具,它不仅可以测试 API 的请求和响应,还支持多种数据格式包括图片。如何在 Postman 中传输图片? Postman 如何上传图片并在请求中使用教程

安全+低碳+高效:Acrel-3000助力企业打造未来型电能管理体系-安科瑞黄安南

一 背景 电能因为方便传输、易于转换、便于控制等特性,成为广大企事业单位生产、办公最主要的能量来源。双碳背景下,由于电能清洁、高效、零排放的特点,能源消费侧将逐步以电代煤、以电代油、以电代气,形成以电为中心的能源消费体…

专注自习室:番茄工作法实践

专注自习室:番茄工作法实践 我需要一个任务管理工具,但在网上找了很多都找不到合适的工具。市面上的大多数产品过于强调任务完成性,给我带来了很强的心理压力,这种压力最终反而降低了我的工作效率。于是我决定自己动手&#xff0…

LeetCode算法题(Go语言实现)_16

题目 给定一个二进制数组 nums 和一个整数 k&#xff0c;假设最多可以翻转 k 个 0 &#xff0c;则返回执行操作后 数组中连续 1 的最大个数 。 一、代码实现 func longestOnes(nums []int, k int) int {left, zeroCnt, maxLen : 0, 0, 0for right : 0; right < len(nums); …

CORDIC算法:三角函数的硬件加速革命——从数学原理到FPGA实现的超高效计算方案

计算机该如何求解三角函数&#xff1f;或许你的第一印象是采用泰勒展开&#xff0c;或者采用多项式进行逼近。对于前者&#xff0c;来回的迭代计算开销成本很大&#xff1b;对于后者&#xff0c;多项式式逼近在较窄的范围內比较接近&#xff0c;超过一定范围后&#xff0c;就变…

JVM 面经

1、什么是 JVM? JVM 就是 Java 虚拟机&#xff0c;它是 Java 实现跨平台的基石。程序运行之前&#xff0c;需要先通过编译器将 Java 源代码文件编译成 Java 字节码文件&#xff1b;程序运行时&#xff0c;JVM 会对字节码文件进行逐行解释&#xff0c;翻译成机器码指令&#x…