Python 读取 Excel 表格并导出为 DBF 文件

news2025/1/9 18:35:26

以下是将上述代码封装为函数的版本。函数接收 input_excel_pathsheet_nameoutput_dbf_path 作为参数,按照需求读取 Excel 表格并导出为 DBF 文件。

封装函数代码

import pandas as pd
import dbf

def excel_to_dbf(input_excel_path, sheet_name, output_dbf_path):
    """
    将 Excel 的指定工作表导出为 DBF 文件,保留数据类型和列名格式。

    参数:
        input_excel_path (str): 输入的 Excel 文件路径。
        sheet_name (str): 需要读取的工作表名称。
        output_dbf_path (str): 导出的 DBF 文件路径。
    """
    # 读取 Excel 的指定表
    df = pd.read_excel(input_excel_path, sheet_name=sheet_name)

    # 定义字段字符串列表,根据数据类型进行动态判断
    def get_field_definition(column):
        if df[column].dtype == 'object':  # 字符类型
            return f"{column} C(255)"
        elif pd.api.types.is_integer_dtype(df[column]):  # 整型
            return f"{column} N(10,0)"  # 整型无需小数位,最大宽度10
        elif pd.api.types.is_float_dtype(df[column]):  # 浮点型
            # 判断小数位数
            max_decimal_places = df[column].apply(
                lambda x: len(str(x).split(".")[1]) if pd.notnull(x) and "." in str(x) else 0
            ).max()
            return f"{column} N(18,{min(max_decimal_places, 5)})"  # 浮点型设置小数位,限制最大5位
        elif pd.api.types.is_datetime64_any_dtype(df[column]):  # 日期类型
            return f"{column} D"
        else:
            raise ValueError(f"Unsupported column type for {column}")

    # 生成字段定义,确保列名格式不变
    field_definitions = ";".join([get_field_definition(col) for col in df.columns])

    # 使用指定编码创建 DBF 表
    table = dbf.Table(output_dbf_path, field_definitions, codepage="utf8")
    table.open(dbf.READ_WRITE)

    # 写入数据
    for _, row in df.iterrows():
        row_data = tuple(row.fillna("").to_list())  # 用空值填充 NaN
        table.append(row_data)

    table.close()
    print(f"The table {sheet_name} exported to {output_dbf_path}.")

# 使用示例
if __name__ == "__main__":
    input_excel_path = r"E:\_OrderingProject\F_IslandsBoundaryChange\c_GeeData\Tif_Thumbnail_check\_check.xlsx"
    sheet_name = "fix_v1"
    output_dbf_path = r"E:\_OrderingProject\F_IslandsBoundaryChange\c_GeeData\Tif_Thumbnail_check\fix_v1.dbf"
    
    excel_to_dbf(input_excel_path, sheet_name, output_dbf_path)

函数说明

  1. 函数参数:

    • input_excel_path:输入的 Excel 文件路径。
    • sheet_name:Excel 文件中需要导出的工作表名称。
    • output_dbf_path:目标 DBF 文件的输出路径。
  2. 动态字段定义:

    • 根据列数据类型(字符、整型、浮点型、日期等)生成适当的 DBF 字段定义。
    • 确保小数位数动态调整(浮点型最多保留 5 位小数)。
  3. 自动填充缺失值:

    • 用空字符串填充 NaN 值,确保写入 DBF 时不会出错。
  4. 编码:

    • 使用 utf8 编码创建 DBF 表,保证支持中文字符。
  5. 异常处理:

    • 如果遇到不支持的数据类型,会引发 ValueError,提示用户检查输入数据。

示例输出

假设输入的 fix_v1 工作表数据如下:

IDNameScoreDate
1Alice95.02024-12-09
2Bob892024-12-08
3Carol82.52024-12-07

导出的 fix_v1.dbf 文件会保留字段类型和格式一致。

如果这对您有所帮助,希望点赞支持一下作者! 😊

详细全文-点击查看

file

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2257203.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用 ASP.NET Core HttpLoggingMiddleware 记录 http 请求/响应

我们发布了一个应用程序,该应用程序运行在一个相当隐蔽的 WAF 后面。他们向我们保证,他们的产品不会以任何方式干扰我们的应用程序。这是错误的。他们删除了我们几乎所有的“自定义”标头。为了“证明”这一点,我构建了一个中间件&#xff0c…

EasyExcel改名为FastExce做了那些改变呢

回到:github原作者地址:https://github.com/CodePhiliaX/fastexcel 中文 |English | 什么是 FastExcel FastExcel 是由原 EasyExcel 作者创建的新项目。2023 年我已从阿里离职,近期阿里宣布停止更新 EasyExcel,作者他本人决定继…

TCP/IP协议详解(小白)

TCP/IP协议详解 TCP/IP协议包含了一系列的协议,也叫TCP/IP协议族(TCP/IP Protocol Suite,或TCP/IP Protocols),简称TCP/IP。TCP/IP协议族提供了点对点的连结机制,并且将传输数据帧的封装、寻址、传输、路由…

【工具】音频文件格式转换工具

找开源资源、下载测试不同库的效果,然后找音频、下载音频、编写代码、测试转换、流程通畅。写一个工具花的时间越来越多了!这个 5 天 这个工具是一个音频文件格式转换工具,支持对 mp3.aac.wav.caf.flac.ircam.mp2.mpeg.oga.opus.pcm.ra.spx.…

Vue智慧商城项目

创建项目 vue组件库 — vant-ui(常用于移动端) Vant 2 - 轻量、可靠的移动端组件库 安装vant npm i vantlatest-v2 -S 引入组件 按需导入和全部导入 全部导入 整个组件库的所有组件都导进来,缺点是增加了代码包体积 main.js import…

探索CSS中的背景图片属性,让你的网页更加美观

导语:在网页设计中,背景图片的运用能够丰富页面视觉效果,提升用户体验。本文将详细介绍CSS中背景图片的相关属性,帮助大家更好地掌握这一技能。 一、背景图片基本属性 1、background-image 该属性用于设置元素的背景图片。语法如…

C#实时监控指定文件夹中的动态,并将文件夹中生成的新图片显示在界面上(相机采图,并且从本地拿图)

结果展示 此类原理适用于文件夹中自动生成图片,并提取最新生成的图片将其显示, 如果你是相机采图将其保存到本地,可以用这中方法可视化,并将检测的结果和图片匹配 理论上任何文件都是可以监视并显示的,我这里只是做了…

通过PS和Unity制作2D动画之一:创建形象

1、通过路径画出轮廓 使用路径的过程中,需要注意: 1)如果使用形状工具作图,比如使用椭圆工具画正圆形,需要设置其属性为“路径”。 2)使用路径选择工具,再按住Alt键点击某个路径,可…

Spark实训

实训目的: 介绍本实训的基本内容,描述知识目标、,以及本实训的预期效果等。 1、知识目标 (1)了解spark概念、基础知识、spark处理的全周期,了解spark技术是新时代对人才的新要求。 (2)掌握Linux、hadoop、spark、hive集群环境的搭建、HDFS分布文件系统的基础知识与应用…

PDF提取文本

1.环境配置 !pip install PyPDF2 pdfplumber PyPDF2 是用来处理 PDF 文件的库,主要功能包括PDF 文件读取、合并、拆分、旋转,可以从 PDF 中提取纯文本,尽管它的提取效果有限,特别是对于扫描版 PDF 文件。 pdfplumber 是比 PyPDF2…

如何在手机上玩电脑pc游戏,通过termux安装mobox教程说明

如何在手机上玩电脑pc游戏,通过termux安装mobox教程说明 所需软件 1.Termux 或改版 zeroTermux 2.Termux:X11 3.Inputbridge 以下为网盘链接 https://pan.baidu.com/s/1foEY0djqJTCrtYES9nE66g?pwd2ji2 提取码:2ji2 123 网盘 https://www.123pan.com/s/l5mlV…

create-react-app react19 搭建项目报错

报错截图 此时运行会报错: 解决方法: 1.根据提示安装依赖法 执行npm i web-vitals然后重新允许 2.删除文件法 在index.js中删除对报错文件的引入,删除报错文件

【Qt移植LVGL】QWidget手搓LVGL软件仿真模拟器(非直接运行图形库)

【Qt移植LVGL】QWidget手搓LVGL软件仿真模拟器(非直接运行图形库) 打包开源地址: Qt函数库gitee地址 更新以gitee为准 移植后的demo工程: gitee 有些没实现的 后续我会继续优化 文章目录 别碰瓷看清楚:是移植&#…

Python、R循环神经网络RNN、指数平滑ETS、ARIMA模型预测网络流量、ATM机取款、旅游需求时间序列数据...

全文链接:https://tecdat.cn/?p38496 分析师:Pengyuan Wen 在当今经济研究与商业决策领域,精准的时间序列预测具有极为关键的意义。社会消费品零售总额作为反映人民消费水平以及国民经济状况的核心指标,其发展趋势的精准把握对中…

甘肃美食之选:食家巷方形饼

甘肃食家巷方形饼,顾名思义,其形状呈规整的方形。这种独特的外形并非偶然,而是源于当地传统的制作工艺。制作方形饼的师傅们,精心挑选优质的面粉,加入适量的水和其他配料,揉成光滑的面团。经过一段时间的发…

linux——挂载nfs网络硬盘

(一)安装nfs服务 1、查看系统是否已经安装nfs rpm -qa | grep nfs rpm -qa | grep rpcbind 2、安装nfs 服务 yum -y install nfs-utils yum -y install rpcbind nfs 固定端口号 2049 rpc 固定端口号 111 (二)centos中服务…

网络安全中大数据和人工智能应用实践

传统的网络安全防护手段主要是通过单点的网络安全设备,随着网络攻击的方式和手段不断的变化,大数据和人工智能技术也在最近十年飞速地发展,网络安全防护也逐渐开始拥抱大数据和人工智能。传统的安全设备和防护手段容易形成数据孤岛&#xff0…

共筑数字安全防线,2024开源和软件安全沙龙即将启幕

随着数字化转型进程的加快以及开源代码的广泛应用,开源凭借平等、开放、协作、共享的优秀创作模式,逐渐成为推动数字技术创新、加速传统行业转型升级的重要模式。但随着软件供应链日趋复杂多元,使得其安全风险不断加剧,针对软件供…

4K高清壁纸网站推荐

1. Awesome Wallpapers 官网: https://4kwallpapers.com/ 主题: 创意、摄影、人物、动漫、绘画、视觉 分辨率: 4K Awesome Wallpapers 提供了丰富的高质量图片,分为通用、动漫、人物三大类,可以按屏幕比例和分辨率检索,满足你对壁纸的各种…

Java阶段三06

第3章-第6节 一、知识点 理解MVC三层模型、理解什么是SpringMVC、理解SpringMVC的工作流程、了解springMVC和Struts2的区别、学会使用SpringMVC封装不同请求、接收参数 二、目标 理解MVC三层模型 理解什么是SpringMVC 理解SpringMVC的工作流程 学会使用SpringMVC封装请求…