文本挖掘 day4 基于PMC知识框架文本挖掘的新能源汽车政策动态评价

news2025/1/18 9:11:29

基于PMC知识框架文本挖掘的新能源汽车政策动态评价

  • 2. 研究设计
    • 2.1 研究技术路线
    • 2.2 数据采集
    • 2.3 动态分相
  • 3. 基于PMC知识框架的策略动态挖掘
    • 3.1 PMC知识框架的建立
    • 3.2 基于PMC知识框架的策略挖掘字典
      • 3.2.1 字典建立步骤
      • 3.2.2 建立经验证据的词典
    • 3.3 策略动态挖掘分析
      • 3.3.1 发行主题(issuing subjects)的动态挖掘
      • 3.3.2 政策措施(policy measure)的动态挖掘
  • 4. 基于策略挖掘的动态评估
    • 4.1 基于PMC知识框架的多输入-输出表
    • 4.2 基于策略挖掘的PMC指标计算
  • 5. 结论和政策含义
    • 5.1 结论

2. 研究设计

2.1 研究技术路线

image-20230713161852977

本研究路线如图1所示,分为以下几个步骤:

首先,在梳理PMC指标相关文献的基础上,结合新能源汽车产业发展的应用场景,建立了定量分析新能源汽车政策的PMC知识框架

然后,基于上述PMC知识框架建立策略挖掘字典。新能源汽车政策文献从官方网站、专业数据库和资源网站收集,参考新能源汽车政策研究的相关文献进行补充;对策略文本语料库进行清理,去除空值和停止词,建立新能源汽车策略挖掘字典,提高分词准确性;基于PMC知识框架提取关键词,并结合专家知识进行补充和分类,完成PMC知识框架各维度的策略挖掘字典。

其次,基于策略字典对策略文档进行动态挖掘,对PMC知识框架各维度中策略文本的外部属性和内部属性进行动态挖掘分析。

最后,基于PMC知识框架挖掘对策略进行动态评价。采用文本匹配技术,将策略文本与PMC知识框架各维度的字典进行匹配,通过机器赋值计算出各策略的PMC指标得分,并将各阶段PMC指标的平均值可视化,实现基于PMC指标知识挖掘的动态评价。

2.2 数据采集

考虑到地方政策主要是中央政策的具体回应和延续,本文主要选取中央部委发布的国家政策文件作为政策数据样本。首先从国务院、工信部等官方网站收集,以“新能源汽车”为标题关键词进行搜索;然后,我们通过专业数据库如中国知网的政府文献数据库和资源网站如北京大学的法宝进行了进一步的搜索。最后,我们补充了现有文献中提出的政策,以确保政策样本的全面性。选定的政策从2001年1月1日至2021年12月31日发布,最终筛选确定了265个政策。

2.3 动态分相

新能源汽车政策的挖掘与评价需要在产业发展阶段的背景下进行动态分析。根据现有文献研究(Zhang and Fang, 2022;庞等,2022),新能源汽车产业的发展阶段可分为以下几个阶段:

(1) 启动阶段(2001—2008)

(2) 试点示范阶段(2009—2013年)

(3) 推广阶段(2014—2016年)

(4) 过渡阶段(2017—2019年)

(5) 高质量发展阶段(2020—至今)

第五阶段,我国新能源汽车进入高质量发展阶段。逐步取消购货补贴,进一步修订完善相关政策。此外,产业“十四五”规划提出,到2025年,将形成包括技术创新和产业生态在内的多维度新能源汽车产业体系。发展新能源汽车规模,重点支持产业发展,提高技术创新和产品质量。

3. 基于PMC知识框架的策略动态挖掘

3.1 PMC知识框架的建立

基于相关研究文献和新能源汽车政策应用场景中的实际问题,建立了新能源汽车政策的PMC知识框架。

政策的外部属性包括:政策的性质(P1)、签发主体(P2)、有效性水平(P3)和政策的时限(P4)。

政策的内部属性包括:政策目标(P5)、政策功能(P6)、政策措施(P7)、政策工具(P8)和政策受体(P9)。

如**表1(部分)**所示,一共有9个主要维度变量和42个子维度变量。

image-20230718094935608

3.2 基于PMC知识框架的策略挖掘字典

3.2.1 字典建立步骤

基于PMC知识框架建立策略挖掘字典的主要步骤如下:

(1)将收集到的策略样本语料库导入python中进行数据清理,包括去除空值、去除不激活词等。

(2)将文本挖掘机器识别与本体语义相结合,创建新能源汽车策略词典。

首先,对新能源汽车产业政策相关文献进行梳理,将学者分析新能源汽车产业政策内容的关键词进行归纳,形成初步的政策词汇。然后利用文本挖掘技术识别关键字,通过高频词挖掘等方法提取并输出策略语料库中的高频词,从而更新初步的策略词汇。最后,基于专家知识对政策内容进行理解和分析,厘清政策内容维度,并对各内部维度的关键词进行改进。

(3)基于上述过程,迭代优化新能源汽车政策词汇。最后,根据PMC知识框架对字典中的关键词进行分类,并对各个次级变量的关键词进行专家知识补充,最终建立基于PMC知识框架的更完整的新能源汽车策略字典(如表2所示)。

image-20230718101007410

3.2.2 建立经验证据的词典

首先,对现有文献中关于新能源汽车政策挖掘的关键词进行整理,包括热点话题关键词,如基础设施建设中的“基础设施”、“建设”。利用供给侧政策工具的“研发补贴”、“经营补贴”和“财政支持”三种类型的政策工具的关键词建立政策字典。

然后,将收集到的新能源汽车政策语料库导入python文本挖掘中,并将TF-IDF (Wang and Stewart, 2015;采用KIM D et al., 2019)算法提取分词后的高频关键词,并进行人工筛选和过滤,剔除“新能源”、“汽车”等通用词。剔除对政策特征分析无明显影响的词,并整理出政策各维度中需要分析的有效高频词。

最后,专家根据PMC知识框架对关键词进行分类。专家对各子维的关键词进行补充,如“充电成本”、“利息补贴”等,最终完成基于PMC知识框架的新能源汽车政策挖掘字典。如表2所示的dic - tionary摘录。由于篇幅限制,附录A是完整的字典。

3.3 策略动态挖掘分析

3.3.1 发行主题(issuing subjects)的动态挖掘

政策发布主体的维度反映了政策的外部属性,挖掘分析主要采用Ucinet、Gephi等社会网络分析方法和软件对政策发布主体的政府间合作网络指标进行分析。各演化阶段政策发布主体共现网络的可视化分析如图2所示。

image-20230718103039807

通过计算网络平均度、网络图密度等指标,量化新能源汽车政策发布主体各阶段共现网络,网络指标统计如表3所示。

image-20230718103051076

由图2和表3可以看出发行主体多元化的趋势。网络的平均度数和密度呈逐渐增加的趋势。新能源汽车政策发放主体数量的增长表明,发放主体之间的联系日益紧密。模块化指数呈现出由下降到上升的趋势,说明发行主体之间的合作范围呈现先扩大后缩小的趋势。平均聚类系数呈波动上升趋势,平均路径长度指标整体呈下降趋势,说明新能源汽车发行主体间合作不断深化。在现阶段的发展中,以财政部、工信部、科技部、发改委为核心节点的网络基本形成,四部委之间的合作比较密切,但四部委与其他部门之间的合作网络相对松散。

3.3.2 政策措施(policy measure)的动态挖掘

基于PMC知识框架的策略挖掘字典,对策略度量维度的样本策略语料库进行动态挖掘。将样本政策语料库按新能源汽车产业发展阶段进行时间切片,分阶段进行政策措施的LDA主题建模,包括单词、主题和文档三层结构(Tazibt and Aoughlis, 2019)。首先,根据主题一致性算法确定LDA主题的最优数量;然后,对建模的主题进行专家过滤,以删除那些不重要和与研究相关性较小的主题。最后,基于PMC知识框架的子维度对主题进行命名。各阶段的LDA挖掘结果如表4所示。由于篇幅限制,完整的开采结果见附录B。

4. 基于策略挖掘的动态评估

首先,基于PMC政策分析知识框架(表1),建立多投入产出表,对政策进行多维量化。然后,基于PMC知识框架的字典(表2),对PMC指标进行机器赋值,完成客观定量评分。最后,通过PMC曲面和凹指数图对政策动态评价结果进行可视化分析。

4.1 基于PMC知识框架的多输入-输出表

image-20230718104353918

为了更好地量化政策各维度的价值,基于新能源汽车产业政策PMC知识框架(表2),构建多投入产出表(表5),其中9个主维度变量权重相等,共42个子维度变量,通过这一定量分析框架,从多个维度对政策进行了评价。每个个体变量都可以通过存储大量的数据来度量,从而实现从不同维度对政策的评价,反映一定的政策维度的演变。

4.2 基于策略挖掘的PMC指标计算

5. 结论和政策含义

5.1 结论

考虑新能源汽车产业政策面临的复杂应用场景,从政策的外部属性和内部属性多维度出发,建立了基于PMC知识边缘框架的政策挖掘知识字典,采用文本挖掘技术,通过机器赋值完成265个新能源汽车政策PMC评价分数的计算。通过动态挖掘和评价分析,多维度探索新能源汽车产业政策中存在的问题,并提出相应的优化对策。具体研究结论如下:

结论1:由于各阶段政策的逐步分化和发展,政策内部一致性水平不够,呈现下降趋势。PMC指标评分结果(表5)和分数泡图(图4)显示出完美评分时pol - ies不足,PMC有阶段性下降的趋势。反映了新能源汽车政策从粗略的总体布局到亚维度政策的细化和完善的逐步发展,新能源汽车政策的出台力度逐步增强,但目前实现全面深化发展仍有差距。因此,子维度政策需要进一步完善,增加优级政策数量,深化新能源汽车产业高质量发展。

结论2:政策平衡差距明显,政策内外属性之间的良性协同效应较弱,政策各维度之间的组合效应较低。通过对PMC曲面的凹度分析(图5),可以发现PMC曲面的最高点和最低点之间存在明显的空隙。其中,谷点政策维度包括政策发布机构和政策有效性水平,峰值点政策维度包括政策工具和政策措施。因此,需要平衡政策的外部属性和内部属性,完善和优化政策设计,加强政策发布部门和政策措施的协调,提高政策的有效性,促进政策更有效的实施。

**结论3:**政策凹度加剧,政策创新程度与政策可持续性之间存在一定的不平衡。通过计算各阶段政策的PMC凹度指数(图6)可以发现,凹度显著恶化的主要维度主要是目前的政策函数、政策目标和政策措施。因此,政策功能维度侧重于市场链和产业链,而创新链存在结构性缺陷;政策目标层面侧重于社会目标,但缺乏经济目标和生态目标;政策工具供给层面不足,对企业的资源支持相对不足。要强化创新链、经济目标、生态目标和供给维度的隐性政策,不断完善政策规则和标准,推动新能源汽车产业高质量发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/768943.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python实现接口压力测试

python实现接口压力测试 直接上代码: # -*- coding: utf-8 -*-import json import requests import logginglogging.basicConfig(levellogging.INFO, format%(asctime)s - %(name)s - %(levelname)s - %(message)s) logger logging.getLogger(__name__)restime …

linux sed命令巨好用

sed命令介绍 find ./ -type d | grep rtos-kitfind ./ -type d 是一个在Linux终端中使用find命令的示例。让我们逐步解释这个命令: find: 这是用于在文件系统中查找文件和目录的Linux命令。 ./: 这是指当前目录(工作目录),fin…

Java - List

List 接口基本介绍 1、List集合类中的元素是有序的,即添加顺序和取出顺序一致,先进先出。List中的元素可重复 2、List集合中的每个元素都有其对应的顺序索引,即支持索引 3、List容器中的元素都对应一个整数型的序号,记载其在容…

全国首个!武大又一新地标,有大势智慧的身影...

本文转载自武汉大学 数字缔造平行时空 古今交汇,千里相约 在武汉大学月湖旁的文科大楼里 藏着一个神秘的剧场 历史厚重的“文化遗产” 性能卓越的“智能计算” 据说这里有很多“新奇”剧目 见你所未见 闻你所未闻 快和珞珞珈珈一起去看看! 珞珈…

重新设置mysql的root用户密码

创建一个txt文档,定义修改密码的SQL语句 ALTER USER rootlocalhost IDENTIFIED BY 1234567; 这里的localhost 表示只允许本地登录,如果改成%表示允许本地登录,也允许远程登录。 1234567就是新密码 管理员身份打开Windows PowerShell&#x…

【重温篇】八大排序——堆排序

完全二叉树 首先复习一下完全二叉树:数据从上到下,从左到右依次进行排列 堆排序 第一步 利用完全二叉树构建大顶堆 大顶堆:父节点的值大于或等于其左右孩子的值(构建方法如下) 1.定义一个parent游标,…

MyBatisPlus数据自动加解密存取和字段防篡改有效性校验码自动生成存储处理器

整体原理:用Mybatis拦截器拦截ResultSetHandler,做属性解密和完整性校奏。替换默认的ParameterHandler处理器。做属性加密存储和完整性加密存储。 代码结构如下: 各功能类解释: 1、EntityClassResolver:用于解析当前M…

Spring创建Ajax和接受Ajax数据-spring20

建一个AJAX.jsp页面 发送Ajax请求一般用jQuery 引入jQuery 引入文件: 弄一个请求 获得集合参数第二种应用场景 requestBody 的意思请求体 为什么找不到JQuery文件,原因是:前端控制器的配置:缺省,客户端发送请求&…

postgresql 数据库 面试题整理

postgresql 数据库 面试题整理 文章目录 postgresql 数据库 面试题整理前言pg数据库的特点:pg的优点pg的核心优势pg数据库的一些缺点PostgreSQL支持的各种数据类型pg的模式pg的多版本并发控制pg多版本并发控制(MVCC)介绍pg如何提供安全性Post…

vue3+vite配置 unplugin-vue-component 找不到 Vant 组件的问题

使用 vue3 vite Vant 搭建移动端项目,为了避免全量引入 vant 导致打包体积过大,又不想一个一个组件手动导入,所以就选择了 vant 官方推荐的方法,使用 unplugin-vue-components 插件自动引入组件,并按需引入组件的样式…

需求条目化与自动估算强强联合 助力软件估算自动化

痛点: 需求是产品的源头,是项目规模估算的基石。而传统的软件规模估算是由项目成员手工进行,对人员能力、经验、方法都有一定的要求,但是效果不好而且耗时费力,不能保持规模估算的一致性。 而导致这些问题的原因&#…

A plugin must either be a function or an object with an “install“ function

前言: 最近一个项目使用了vue3tsvite模型框架,在框架的基础之上进行的开发,开发过程中遇到一个问题,控制台有提示信息,如下图: 小小一行黄字,恶心人呀。。。 这话的意思大概是:插件…

中国人民大学与加拿大女王大学金融硕士--中外合作办学硕士领域的宝藏项目

大多数读研人都知道,从办学方式来看,中外合作办学硕士可以分为两种: 一是双学位教育项目,颁发的是外方高校硕士学位证书,同时还可以申请国内高校的硕士学位证书,同时教育部中留服还可以做学历学位认证。 二…

有哪些屏幕录制软件?这几种录屏工具了解一下

有哪些好用的屏幕录制软件呢?如果我们需要教别人如何使用某个软件或者如何完成某个任务,录屏也是非常有用的。可以通过录屏记录下整个过程,然后用于制作教程视频。也有小伙伴在打游戏时,遇到精彩操作有录屏的习惯,那么…

一文解惑mybatis中的#{}和${}

目录 基本概述 #{}的基本使用 ${}的基本使用 ${}使用情况 sql排序asc|desc 拼接表名 批量删除 模糊查询 基本概述 #{}:先编译sql语句,再给占位符传值,底层是PreparedStatement实现。可以防止sql注入,比较常用。 ${}&…

在Windows下安装Anaconda平台

Anaconda介绍 安装Python的方法有很多,其中利用Anaconda来安装,是最为安全和便捷的方法之一。在Python中安装类库,各个类库之间可能存在相互依赖、版本冲突等问题。为了解决这个问题,Python社区提供了方便的软件包管理工具&#…

css背景毛玻璃效果

一、结论:通过 css 的 backdrop-filter 属性设置滤镜函数 blur 一般会是有 背景色、透明度 的容器,如: /* 宽高等其他设置这里省略没写 */ background:rgba(3, 87, 255, 0.3); backdrop-filter: blur(10px);二、backdrop-filter 的其他用法…

ffmpeg学习之音频解码数据

音频数据经过解码后会被保存为,pcm数据格式。而对应的处理流程如下所示。 avcodec_find_encoder() /*** 查找具有匹配编解码器ID的已注册编码器.** param id AVCodecID of the requested encoder* return An encoder if one was found, NULL otherwise.*/ const A…

C# 移除链表元素

203 移除链表元素 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 示例 1: 输入:head [1,2,6,3,4,5,6], val 6 输出:[1,2,3,4,5] 示例 2&#x…

机器学习(14)--XGBoost

目录 一、概述 二、CART、GB、GBDT 1、CART 2、BT(Boosting Tree提升树) 3、GBDT(梯度提升树) 4、GBDT在sklearn中的损失函数 三、Sklearn中的GBDT 1、加载模块 2、划分数据集 3、建模 4、与随机森林和线性回归对比 5…