【毕业设计】后端实现——账单通过关键词简单分析收支

news2024/11/20 6:36:36

🌈据说,看我文章时 关注、点赞、收藏帅哥美女们 心情都会不自觉的好起来。

前言:
🧡作者简介:大家好我是 user_from_future ,意思是 “ 来自未来的用户 ” ,寓意着未来的自己一定很棒~
✨个人主页:点我直达,在这里肯定能找到你想要的~
👍专栏介绍:个人记账分析系统 ,专门记录制作过程,每天进步一点点~

想看往期历史文章,可以浏览此博文: 历史文章目录,后续所有文章发布都会同步更新此博文~

人生苦短,我用python

后端实现——账单通过关键词简单分析收支

  • 说明
  • 预设计
  • 设计规则
  • 设计处理函数

说明

在上一次获取到的数据中,不难发现不是所有都被列为收入/支出的,还有一部分比如花呗的还款成功实际上算是第二次记录了,之前每次花呗消费已经在账单里了,这些是要去除,还有收/支为其他的,要结合其他列的关键词进行判断,本文就是来处理这里数据的。

预设计

先客观尝试判断这样是否可以实现:

wx = alipay_analysis(open('data/微信支付账单(XXXXXXXX-XXXXXXXX).csv', 'r').read())
for w in wx['data']:
    if w[4] == '收入':
        print('+' + w[5])
    elif w[4] == '支出':
        print('-' + w[5])
    else:
        if '充值' in w[1]:
            print('+' + w[5])
        else:
            print(w)
zfb = alipay_analysis(open('data/alipay_record_XXXXXXXX_XXXXXX.csv', 'r').read())
for z in zfb['data']:
    if z[0] == '收入':
        if z[6] != '交易关闭':
            print('+' + z[5])
        else:
            print(z)
    elif z[0] == '支出':
        if z[6] != '交易关闭':
            print('-' + z[5])
        else:
            print(z)
    else:
        if z[6] in ['退款成功'] or z[7] in ['投资理财']:
            print('+' + z[5])
        elif z[6] in ['还款成功', '信用服务使用成功', '解冻成功']:
            print('-' + z[5])
        else:
            print(z)

简单处理后,发现满足我们的需求了,所有账单已经明确是收入还是支出了,接下来就设计通用规则,并能方便修改。

设计规则

由于涉及到每一列关键词判断,所以设计了一套判断规则:

{
    title: {  # 标题
        '+in': []  # 完全相等时判断为收入
        '+have': []  # 部分匹配时判断为收入
        '-in': []  # 完全相等时判断为支出
        '-have': []  # 部分匹配时判断为支出
        'ignore': []  # 忽略交易的关键字(比如交易关闭)
    }
}

这样包括了各种目前发现的可能的情况,如果不够,以后可以添加条目。
优先级为 ignore > in > have
ignore 为忽略账单的部分,比如花呗还款;
in 为固定账单中的词语,可以判断固定类别;
have 为账单中可能包含的关键词,可以灵活判断。
+ 代表收入,- 代表支出。
默认在 “ 收/支 ” 列判断有没有收入和支出作为判断:

def check_in_out_default(alipay: list):
    """
    生成默认的规则字典
    :param alipay: alipay_analysis 中的 table
    :return: 默认的规则字典(优先级:ignore > in > have)
        {
            title: {  # 标题
                '+in': []  # 完全相等时判断为收入
                '+have': []  # 部分匹配时判断为收入
                '-in': []  # 完全相等时判断为支出
                '-have': []  # 部分匹配时判断为支出
                'ignore': []  # 忽略交易的关键字(比如交易关闭)
            }
        }
    """
    # print(json.dumps(check_in_out_default(table), indent=4, ensure_ascii=False))
    # return {title: {'+in': ['收入'] if title == '收/支' else [], '+have': [], '-in': ['支出'] if title == '收/支' else [], '-have': [], 'ignore': []} for title in alipay[0]}
    return {title: {'+in': ['收入'], '+have': [], '-in': ['支出'], '-have': [], 'ignore': []} for title in alipay[0] if title == '收/支'}

默认一般返回 {'收/支': {'+in': ['收入'], '+have': [], '-in': ['支出'], '-have': [], 'ignore': []}} ,根据这个拓展就可以。
我目前的规则设置为:

# 微信规则
wx_rules = {
    "交易类型": {
        "+in": [],
        "+have": ["充值"],
        "-in": [],
        "-have": [],
        "ignore": []
    },
    "收/支": {
        "+in": ["收入"],
        "+have": [],
        "-in": ["支出"],
        "-have": [],
        "ignore": []
    }
}
# 支付宝规则
zfb_rules = {
    "收/支": {
        "+in": ["收入"],
        "+have": [],
        "-in": ["支出"],
        "-have": [],
        "ignore": []
    },
    "交易状态": {
        "+in": ["退款成功"],
        "+have": [],
        "-in": ["信用服务使用成功", "解冻成功"],
        "-have": [],
        "ignore": ["交易关闭", "还款成功"]
    },
    "交易分类": {
        "+in": ["投资理财"],
        "+have": [],
        "-in": [],
        "-have": [],
        "ignore": []
    }
}

目前用这套规则后,数据分类正常,打算在个人用户里可以设置处理这个。

设计处理函数

def check_in_out(alipay: list, rules: dict = None):
    """
    分析收入支出数据
    :param alipay: alipay_analysis 中的 table
    :param rules: 规则字典(优先级:ignore > in > have)
    :return: table, unchecked_table
    """
    if not rules:
        rules = check_in_out_default(alipay)
    titles = alipay[0]
    table = [titles]
    indexs = {titles.index(title): rules[title] for title in rules}
    for row in alipay:
        for index in indexs:
            if row[index] in indexs[index].get('ignore', []):
                continue
            if row[index] in indexs[index].get('+in', []):
                row[titles.index('收/支')] = '+'
                table.append(row)
                continue
            if row[index] in indexs[index].get('-in', []):
                row[titles.index('收/支')] = '-'
                table.append(row)
                continue
            for item in indexs[index].get('+have', []):
                if item in row[index]:
                    row[titles.index('收/支')] = '+'
                    table.append(row)
                    break
            else:
                continue
            for item in indexs[index].get('-have', []):
                if item in row[index]:
                    row[titles.index('收/支')] = '-'
                    table.append(row)
                    break
            else:
                continue
    return table, [a for a in alipay[1:] if a[titles.index('收/支')] not in ['+', '-']]


ok, failed = check_in_out(alipay_analysis(open('data/alipay_record_20221104_173011.csv', 'r').read())['data'], zfb_rules)
ok, failed = check_in_out(alipay_analysis(open('data/微信支付账单(20220904-20221104).csv', 'r').read())['data'], wx_rules)

返回处理好的列表和未被处理的列表,然后前端可以根据未处理列表信息进行判断修改规则。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/10889.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++ STL中的set详解

前言 在学习csp题解的时候接触到这个数据结构&#xff0c;故在此记录一下其概念及应用。 基本概念 set的底层采用的是红黑树&#xff0c;所有元素都会根据元素的键值自动排序&#xff0c;方便管理元素&#xff0c;但不支持直接修改键值。 应用 头文件调用 #include <i…

python中is和==的区别,地址和重新复制后,地址变化

简单总结 现象描述&#xff1a;一、“编辑器“中和把赋值语句放在”同一行的cmd环境“中&#xff0c;相同值的不同变量会指向同一个地址 二、交互式/cmd环境中&#xff0c;若赋值相同值的变量在不同行输入&#xff0c;那么变量也会指向不同地址 三、程序编辑器的程序运行就相当…

B2B撮合管理系统优势有哪些?如何助力传统仪器仪表制造业企业数字化转型

仪器仪表制造业是我国制造业的重要组成部分&#xff0c;经过多年的快速发展&#xff0c;我国仪器仪表制造业生产和开发能力产业体系日趋庞大&#xff0c;产销增幅也是高歌猛进&#xff0c;对推动国民经济发展具有重要意义。 然而&#xff0c;随着我国仪器仪表制造业的发展&…

GAN模型1

本次是用GAN模型弄出时光机效果~ 穿越时空的人脸 得到你100年前的样子~~ 时光穿梭第一步&#xff1a;解决数据集难题 鉴于最近StyleGAN在高质量人脸合成和编辑方面的成功&#xff0c;许多工作都集中在使用预先训练好的StyleGAN模型进行人像编辑。 然而&#xff0c;现有的技术…

[附源码]计算机毕业设计JAVA儿童资源教育网站

[附源码]计算机毕业设计JAVA儿童资源教育网站 项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybati…

聚观365|抖音上线“防打扰保护工具”;亚马逊拟计划裁员1万人

今日要闻&#xff1a;抖音上线“防打扰保护工具”&#xff1b;亚马逊拟计划裁员1万人&#xff1b;苹果为iPhone14提供同机维修&#xff1b;美国硅谷裁员潮蔓延&#xff1b;乔布斯拖鞋拍卖融入NTF元素 抖音上线“防打扰保护工具” 11月15日&#xff0c;抖音上线“防打扰保护工具…

【数据结构与算法】第一章 绪论 2-数据结构的基本概念

第一章 绪论 2-数据结构的基本概念 思考&#xff1f; 程序 算法数据结构&#xff0c;算法 逻辑控制数据结构有两大用途&#xff1a; 一是用于存放要处理的数据&#xff0c;如迷宫地图二是用于实现算法策略&#xff0c;如迷宫例子中探索方向增量数组&#xff0c;回溯的栈&am…

如何深度自定义mybatis

回顾mybatis的操作的核心步骤 编写核心类SqlSessionFacotryBuild进行解析配置文件 深度分析解析SqlSessionFacotryBuild干的核心工作 编写核心类SqlSessionFacotry 深度分析解析SqlSessionFacotry干的核心工作 编写核心类SqlSession 深度分析解析SqlSession干的核心工作 …

物联网电池产品硬件电路设计思维

最近在整改之前工程师设计的电路板&#xff0c;是采用18650电池供电的一个物联网小板。 像这种电池供电的产品&#xff0c;很重要的一点就是要保证其低功耗&#xff0c;才得以提高续航&#xff0c;因此&#xff0c;对于这类电路板的对外接口的设计&#xff0c;对供电的控制尤其…

Arch Linux 的安装

Arch Linux 的安装 作者&#xff1a;Grey 原文地址&#xff1a; 博客园&#xff1a;Arch Linux 的安装 CSDN&#xff1a;Arch Linux 的安装 版本 Arch Linux&#xff1a;2022.07.01 VMware workstation&#xff1a; 16.2 安装步骤 下载 Arch Linux 并记录其 kernel 版…

【考研英语语法】口语语法

区别一&#xff1a;句子结构 口语中结构更为简单&#xff0c;较少使用从句 只有少量高频连词&#xff08;and / but / or / so / because / if / when&#xff09;正式&#xff1a; While the region was remarkable for its natural beauty, the family experienced seriousl…

法国博士后招聘|国家健康与医学研究院(INSERM)-计算化学

【国外博士后招聘-知识人网】法国国家健康与医学研究院&#xff08;INSERM&#xff09;计算化学博士后 法国国家健康与医学研究院&#xff08;法文为&#xff1a;Institut national de la sant et de la recherche mdicale&#xff09;&#xff0c;简称“Inserm”&#xff0c;成…

软件测试有哪些原则?

软件产品从开发到发布的过程中有一道至关重要的程序—软件测试&#xff0c;也就是验证软件系统的正确性、完整性、安全性和质量的过程。在规定的条件下对程序进行操作&#xff0c;以发现程序错误&#xff0c;衡量软件质量&#xff0c;并对其是否能满足设计要求进行评估的过程。…

股票如何量化选股?

量化选股是通过数量分析的方法去评价某一上市公司的发展前景&#xff0c;以及它的股票是否值得买入&#xff0c;一般采用多因子选股策略&#xff1a;假设有多种因子共同对股票资产收益产生了作用&#xff0c;且这些作用满足线性关系&#xff0c;那么我们就可以通过计算因子的值…

【pymysql的基本使用】

0. 介绍 本文主要介绍如何使用pymysql库来操作mysql数据库&#xff0c;包含docker安装MySQL和对Mysql的各种操作。 参考链接&#xff1a; Welcome to PyMySQL’s documentation! — PyMySQL 0.7.2 documentation Python3 MySQL 数据库连接 – PyMySQL 驱动 | 菜鸟教程 Pyt…

聚焦“生态化”,e签宝讲好电子签名的“中国故事”

文丨智能相对论 作者丨沈浪 电子签名&#xff0c;终于在政企数字化转型的浪潮里得到了认可&#xff0c;正在快速破圈&#xff0c;从过去名不见经传的小赛道成长为了今天的数字化基建工程。 在今年的“科技向实&#xff0c;万物生长“钉钉2022发布会上&#xff0c;e签宝再度亮…

ADC噪声系数 —— 一个经常被误解的参数

噪声系数(NF)是RF系统设计师常用的一个参数&#xff0c;它用于表征RF放大器、混频器等器件的噪声&#xff0c;并且被广泛用作无线电接收机设计的一个工具。许多优秀的通信和接收机设计教材都对噪声系数进行了详细的说明(例如参考文献1)&#xff0c;本文重点讨论该参数在数据转换…

MySQL-事务隔离机制的实现

目录一、MySQL事务1、什么是事务2、事务的四个特性3、MySQL事务使用1、显式启动事务语句2、关闭事务自动提交二、MySQL事务隔离机制1、四种隔离级别2、并发事务引起的问题3、隔离级别问题1 、查看mysql事务隔离级别2、脏读问题3、不可重复读一、MySQL事务 1、什么是事务 事务…

通过股票数据接口如何看懂Level-2行情?

交易用户在进行投资的时候&#xff0c;通过股票数据接口来实现自己的盈利目标&#xff0c;今天来聊聊如何看懂Level-2行情&#xff1f; 在交易开盘之后某股快速杀跌&#xff0c;但杀跌后盘面缺不跌反涨&#xff0c;甚至一度差点翻红&#xff0c;如果是五档行情&#xff0c;我们…

高数 | 【数一】 多元函数积分学预备知识 —— 总复习框架总结

自用复习笔记框架整理。 整理参考于 2023版张宇高数18讲、李林讲义等资料。 空间曲线的切线与法平面 曲线由参数方程给出 曲线由方程组给出 空间曲面的切平面与法线 曲面由隐式方程给出 曲面由显式函数给出