Python数据分析实战-给定JSON格式的数据提取所需字段并转换为DataFrame(附源码和实现效果)

news2025/1/19 2:56:39

实现功能

给定JSON格式的数据提取所需字段并转换为DataFrame

实现代码

import pandas as pd
import json

# 假设给定的JSON数据已经存储在data变量中
data = [
    {
        "title": "Data Source Adapter for Excel Sheets",
        "project_code_url": "https://github.com/polypheny/Polypheny-DB/pull/418",
        "date_created": "2022-05-17T23:30:01.526934Z",
        "tech_tags": [
            "java",
            "typescript"
        ],
        "topic_tags": [
            "database"
        ],
        "status": "passed",
        "program_slug": "2022",
        "contributor_display_name": "Kelly Xie",
        "mentor_names": [
            "Marc Hennemann",
            "Isabel"
        ],
        "abstract_short": "This project will allow Polypheny to interact with Excel sheets by adding a data source adapter. The Excel adapter enables Polypheny to query the...",
        "abstract_html": "This project will allow Polypheny to interact with Excel sheets by adding a data source adapter. \nThe Excel adapter enables Polypheny to query the mapped data using available query languages of Polypheny-DB and the imported tables can be joined with other tables.",
        "date_archived": "2022-05-17T23:30:01.526934Z",
        "id": "axdeCi5w",
        "organization_name": "Polypheny",
        "organization_slug": "polypheny"
    },
    {
        "title": "Admin Web Portal: New Features Support and Spam Mitigation",
        "project_code_url": "https://docs.google.com/document/d/1KiEZaYkCz7olJ5OeUJKcmuRn1C0qiUJ4UaHvesbcmgc/edit?usp=sharing",
        "date_created": "2022-05-17T23:30:01.954880Z",
        "tech_tags": [
            "node.js",
            "typescript"
        ],
        "topic_tags": [
            "New Features Support",
            "Spam Mitigation"
        ],
        "status": "passed",
        "program_slug": "2022",
        "contributor_display_name": "Asmit Kumar Sirohi",
        "mentor_names": [
            "Yasharth Dubey",
            "Jason Gayle"
        ],
        "abstract_short": "My idea for this GSoC period is basically about improving the UI/UX of the admin portal and making it according to the design standards that are...",
        "abstract_html": "My idea for this GSoC period is basically about improving the UI/UX of the admin portal and making it according to the design standards that are defined in talawa docs, also I will make it mobile responsive. Another focus I have this summer is to make all the screens (components) of talawa-admin functional i.e. No more hard-coded values in the admin portal, all the data will be live from talawa-API. I will also implement a way so that users can select or use talawa-admin in their preferred language and I will be implementing a feature for detecting whether a user is spamming a chat or not. Below are the features for talawa-admin that I am going to add this summer that will boost its usability, user experience, and its use cases.\n\nTalawa-admin Features: \n\nInteractive UI/UX.\nMultiple screens (Mobile or Tablet) are responsive.\nFunctional screens (components).\nImplementing the support for different languages.\nFeature to detect whether the user is spamming the chat or not.\nMigration from redux-routing to react-routing. *",
        "date_archived": "2022-05-17T23:30:01.954880Z",
        "id": "hMUkWQlA",
        "organization_name": "The Palisadoes Foundation",
        "organization_slug": "the-palisadoes-foundation"
    }
]

# 提取所需字段
df_data = []
for d in data:
    df_data.append({
        'title': d['title'],
        'project_code_url': d['project_code_url'],
        'tech_tags': d['tech_tags'],
        'topic_tags': d['topic_tags'],
        'status': d['status'],
        'contributor_display_name': d['contributor_display_name'],
        'mentor_names': d['mentor_names'],
        'id': d['id'],
        'organization_name': d['organization_name']
    })

# 转换为DataFrame
df = pd.DataFrame(df_data)

# 查看结果
print(df)

实现效果

本人读研期间发表5篇SCI数据挖掘相关论文,现在某研究院从事数据挖掘相关科研工作,对数据挖掘有一定认知和理解,会结合自身科研实践经历不定期分享关于python机器学习、深度学习、数据挖掘基础知识与案例。

致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。

邀请三个朋友关注V订阅号:数据杂坛:即可在后台联系我获取相关数据集和源码,送有关数据分析、数据挖掘、机器学习、深度学习相关的电子书籍。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/907185.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Mac下Jmeter安装及基本使用

本篇文章只是简单的介绍下Jmeter的下载安装和最基本使用 1、初识Jmeter 前一段时间客户端app自测的过程中,有偶现请求某个接口返回数据为空的问题,领导让我循环100次请求这个接口,看看有没有结果为空的问题。听同事说有Jmeter的专业测试工具…

Java数据结构学习和源码阅读(线性数据结构)

线性数据结构 链表 LinkList 链表的数据结构 一组由节点组成的数据结构,每个元素指向下一个元素,是线性序列。 最简单的链表结构: 数据指针(存放执行下一个节点的指针) 不适合的场景: 需要循环遍历将…

【C++】 使用红黑树模拟实现STL中的map与set

文章目录 前言1. 对之前实现的红黑树进行一些补充和完善1.1 析构1.2 查找 2. STL源码中map和set的实现3. 改造红黑树封装map和set3.1 红黑树结构修改3.2 map、set的结构定义3.3 insert的封装3.4 insert测试3.5 发现问题并解决3.6 红黑树迭代器实现3.7 封装set和map的迭代器并测…

uniapp scroll-view横向滚动无效,scroll-view子元素flex布局不生效

要素排查: 1.scroll-x属性需要开启,官方类型是Boolean,实际字符串也行。 2scroll-view标签需要给予一个固定宽度,可以是百分百也可以是固定宽度或者100vw。 3.子元素需要设置display: inline-block(行内块元素&#x…

国标GB28181视频平台EasyGBS通过对应密钥上传到其他平台展示的详细步骤来啦!

国标GB28181协议视频平台EasyGBS是基于国标GB28181协议的视频云服务平台,支持多路设备同时接入,并对多平台、多终端分发出RTSP、RTMP、FLV、HLS、WebRTC等格式的视频流。平台可提供视频监控直播、云端录像、云存储、检索回放、智能告警、语音对讲、平台级…

项目管理实战笔记:硬技能(下)

需求变更: pmp里面涉及需求变更的很多,尤其是CCB 对于CCB的需求变更,可能需要以下步骤: 1. 确定变更的原因和必要性:需要了解变更是因为业务需求的变化、技术方案的变更还是其他原因,以及变更是否是必要的…

内行才知道的新闻稿发布技巧,媒介盒子为你揭秘

不知道最近其他小伙伴有没有遇上以上说的一些情况,必须借助新闻稿发布达到营销推广的目的。 可是对于新闻稿发布这一块却不知道应该怎么办,尤其是新手上任,对于如何发布新闻稿是一头雾水。 新闻稿的发布是企业在公关传播中重要的一环&#…

如何将PDF文件转换为PPT文件?

如何将pdf转换成ppt?PDF文件作为常用的文件格式,不仅可以在教学过程中使用,还可以在营销展会、培训讲座等过程中使用。欧迪芬文件的使用,能够在一定程度上提升我们的办公效率。对于PDF文件来说,其中包含的元素非常多&a…

【算法刷题之数组篇(2)】

目录 1.leetcode-35. 搜索插入位置(简单)2.leetcode-74. 搜索二维矩阵(中等)3.leetcode-73. 矩阵置零(中等)4.leetcode-56. 合并区间(中等)5.leetcode-54. 螺旋矩阵(中等…

水溶性试剂Hexynoic acid STP ester,炔酸STP酯,NHS酯的极好替代品

产品简介:炔酸STP酯是一种具有末端炔丙基和STP酯基的水溶性试剂。STP酯是在水性环境中进行偶联反应的传统N-羟基琥珀酰亚胺(NHS)酯的极好替代品。炔丙基通过铜催化的叠氮化物-炔烃点击化学与含叠氮化物的化合物或生物分子反应,产生…

leetcode303. 区域和检索 - 数组不可变(java)

前缀和数组的应用 区域和检索 - 数组不可变题目描述前缀和数组代码演示 区域和检索 - 数组不可变 难度 - 简单 原题链接 - 区域和检索 - 数组不可变 题目描述 给定一个整数数组 nums,处理以下类型的多个查询: 计算索引 left 和 right (包含 left 和 righ…

解决运行在微信小程序中报[ app.json 文件内容错误] app.json: app.json 未找到(env: Windows,mp,1.05.2204

找到project.config.json文件夹 添加 "miniprogramRoot": "unpackage/dist/dev/mp-weixin/", 即可

发展全球电商业务,为什么首选Facebook Messenger电子商务?

Facebook Messenger电子商务就是使用Facebook的消息传递渠道Messenger来购买和销售产品或服务。通过将 Messenger与客户服务平台,例如SaleSmartly(SS客服)集成,企业可以利用渠道强大的消息传递功能为客户提供更加个性化和对话式的…

这个免费全景网站你知道吗,多篇教程教您如何创作全景作品

引言: 随着科技的不断进步,虚拟现实(VR)技术正逐渐融入我们的日常生活,为我们带来了没有过的沉浸式体验。其中,VR全景网站作为一种引领人们身临其境体验的创新方式,正在逐渐受到大众的关注。 蛙…

androidStudio或IDEA的通过gitBash打开插件

本人,一个资深的命令行,业余爱好者。常年直接vim,或者shell上服务器阅读代码。比较偏好使用GitBash来打开项目,进行git status,git diff,git add,commit等动作。 基于以上原因,本人开…

怎样通过本地电脑搭建SFTP服务器,并实现公网访问?

本地电脑搭建SFTP服务器,并实现公网访问 文章目录 本地电脑搭建SFTP服务器,并实现公网访问1. 搭建SFTP服务器1.1 下载 freesshd 服务器软件1.3 启动SFTP服务1.4 添加用户1.5 保存所有配置 2. 安装SFTP客户端FileZilla测试2.1 配置一个本地SFTP站点2.2 内…

SecureCRT 备份Button Bar中所有Button

一、前言 Button Bar功能可以保存一些常用命令避免重复输入,但是有时候secureCRT的button bar经常莫名其妙消失,重装系统或软件后,也都需要重新一个个添加Button,如果能备份就能减少这些费时间的操作 二、备份步骤 在面板Optio…

江西南昌电气机械三维测量仪机械零件3d扫描-CASAIM中科广电

精密机械零部件是指机械设备中起到特定功能的零件,其制造精度要求非常高。这些零部件通常由金属、塑料或陶瓷等材料制成,常见的精密机械零部件包括齿轮、轴承、螺丝、活塞、阀门等。精密机械零部件的制造需要高精度的加工设备和工艺,以确保其…

我们可能要为ChatGPT的谢幕做好准备

ChatGPT的未来:悬念仍存 ​ 人工智能已经成为我们生活不可或缺的一部分。在众多AI应用中,OpenAI研发的ChatGPT凭借其极强的语言理解和生成能力脱颖而出,是一项划时代的变革性创新,帮助了无数企业和个人,改变了我们与技…

【Apollo】自动驾驶感知——毫米波雷达

作者简介: 辭七七,目前大一,正在学习C/C,Java,Python等 作者主页: 七七的个人主页 文章收录专栏: 七七的闲谈 欢迎大家点赞 👍 收藏 ⭐ 加关注哦!💖&#x1f…