【数字基础设施1007】探索数字基础设施的影响:宽带政策变量数据集来了!

news2024/10/7 16:18:51

今天给大家分享的是国内顶级期刊2023年发表论文《数字基础设施与代际收入向上流动性——基于“宽带中国”战略的准自然实验》使用到的重要数据集——“宽带中国”政策变量数据、互联网发展指数以及工具变量(所在城市到杭州市的球面距离和到“八纵八横”政策节点城市距离)数据,该文章研究了数字基础设施对农村人口代际收入向上流动的影响,在新古典增长模型和代际收入流动分析框架基础上,从理论上探讨了数字基础设施对代际收入向上流动的影响以及作用机制,然后将“宽带中国”政策外生冲击与CFPS数据相结合,利用DID模型以及包括工具变量法在内的多种内生性分析方法从实证角度检验了这一影响,并探讨了其中的作用机制。该论文在研究过程中使用到了宽带中国政策变量数据、数字基础设施代理变量互联网发展指数数据以及内生性检验中的工具变量数据(所在城市到杭州市的球面距离和到“八纵八横”政策节点城市距离),我们对这些数据进行了整理,并进行了适当的拓展方便大家研究,,数据获取请关注公众号“明天科技屋”,打开公众号文章获取文末数字关键词并回复,在该数据发布24小时之内可以通过分享获得。

一、论文讲解  

 该文章将宽带中国政策与CFPS数据相结合,采用双重差分模型研究数字基础设施对代际收入向上流动的影响,并进行了更换被解释变量和核心解释变量、遗漏变量分析、平行趋势检验、稳定单元处理效果假设检验以及工具变量法等一系列稳健性检验,结果仍然保持文件,并且从提高父代对子代的人力资本投资回报、减少子代对父代社会资本继承、增加子代的“市场运气”等方面进行了机制分析,最终得出结论,给出相应的政策建议。

(一)基准模型

y_{ict}=\beta _{1}D_{c(i)}\cdot T_{t}+{w}'_{ict}\beta +\delta _{i}+\tau _{t}+\varepsilon _{ict} 

其中,y_{ict}为被解释变量,定义为c市农村户籍的i子代在t时是否实现了代际收入的向上流动,如果父代收入位于同代收入分布的后50%,而子代收入位于同代收入的前50%,则认为子代实现了代际收入的向上流动,取值为1,否则为0。D_{c(i)}\cdot T_{t}是文章关注的DID项,即个体i所在城市在t时刻是否开始实施政策的处理变量。w_{ict}是个体、父母、家庭和省市层面的控制变量。\delta _{i}\tau _{t}分别是个体以及时间固定效应。\varepsilon _{ict}是随机扰动想。

(二)数据介绍 

宏观数据主要包括数字基础设施发展状况、省市层面的控制变量、机制变量等。其中数字基础设施发展状况代理变量的“宽带中国”政策数据来源于工信部。省市层面的控制变量以及机制变量数据来源于CEIC数据库、复旦大学和第一财经研究院等发布的数据。微观数据来源于中国家庭追踪调查(CFPS)。

(三)实证分析 

        1. 基准回归

        2.更换被解释变量结和核心解释变量 

论文中在这一块研究中对被解释变量和核心解释变量均进行了更换,被解释变量更换请查看论文,核心解释变量采用了互联网发展指数来代理数字基础设施发展状况,互联网发展指数由移动电话用户数、互联网宽带接入用户数、信息传输、计算机服务和软件业的就业人员、电信收入以及普惠金融指数等指标通过主成分分析得到,我们对这部分数据进行了收集整理,具体数据详情和合成步骤请查看后文。

        3.遗漏变量分析

        4.平行趋势检验 

        5.稳定单元处理效果假设检验

        6.工具变量法 

 该论文研究过程中主要使用了两个工具变量(所在城市到杭州市的球面距离和到“八纵八横”政策节点城市距离),我们根据论文中的参考文献,找到了这两部分数据的原始信息,并进行这部分数据的收集整理,数据详情请阅读后文

(四)作用机制

        1.数字基础设施有助于提高父代对子代对人力资本投资回报 

        2.数字基础设施减少了子代对父代社会资本继承

        3.数字基础设施增加了子代的“市场运气” 

(五)结论与政策含义 

以上就是本篇论文的大致框架结构和内容,接下来给大家介绍重点内容我们收集整理的数据。

二、重要数据 

该论文因为是和CFPS微观个体层面数据相结合,论文只提到了“宽带中国”政策相关的执行年份,研究样本大致上也是政策实施年份左右,即2013-2016年左右,政策变量的使用也是以地级市城市与个体进行匹配,我们收集整理了“宽带中国”政策实施的地级市数据,并考虑到大家会进行省级或地级市的其他层面研究,将数据区间进行了拓展,得到了2008年-2022年“宽带中国”政策地级市实施数据,同时论文中使用到了我们上述提到的两个工具变量数据,我们也进行了整理,同时论文研究过程中使用到了互联网发展指数的指标,我们也进行了收集整理,结合实际数据情况得到了2011-2021年地级市城市的互联网发展指标数据,方便大家研究。

(一)宽带中国政策原始数据 

“宽带中国”政策名单是从2014年开始发布的,一共三个批次名单,时间区间为2014年-2016年,包含地级市、城市群、自治州以及县级市多种类型名单,其中长株潭城市群包括长沙市、株洲市以及湘潭市三个城市,名单中我们进行了拆分,我们收集整理名单数据,数据保留在“原始数据”表中,具体展示如下:

(二)宽带中国面板数据 

在原始名单基础上,我们将数据转换成了面板数据,其中,重庆市的试点都是辖区进行试点,我们考虑在地级市层面的研究应该将重庆市纳入处理组更为合理,同时我们将数据进行了延伸拓展,数据区间为2008-2022年,没有生成2023年的数据是因为大家在实际研究过程中2023年的其他数据经常会缺失,同时也不会延伸到最近年份进行研究,我们的数据是可以满足大家的实际研究需求的,大家不要盲目追求数据数量,寻找适合自己研究的数据最好,这一点我们会在将互联网发展指数的时候谈到这点,最终得到了2008年-2022年300个地级市层面面板数据,政策实施的虚拟变量保留在DID中,数据保存在“宽带中国面板数据”表中,数据展示如下:

(三)工具变量数据 

论文在进行内生性检验的时候使用到了工具变量数据,我们找到了论文中提到到的参考文献,并根据原参考文献中使用的工具变量进行分析,即所在地到杭州市的球面距离(张勋等(2019))和 所在地到“八纵八横”光缆骨干网络节点城市的球面距离(田鸽和张勋(2022)),其中在《干线光缆传输网与中国信息网络城市节点体系》中讲到北京和南京是“八纵八横”光缆骨干网络节点城市,因此我们取所在地到北京和南京球面距离最小距离为该工具变量距离(论文作者回答),同时我们保存了到北京和南京的球面距离数据以及最终的最小距离数据,方便大家检查,最终得到了2008-2022年300个地级市数字基础设施工具变量面板数据,保存在“工具变量数据”表中,数据展示如下:

(四) 互联网指数原始数据

论文中使用到了互联网发展指数指标,该指标由移动电话用户数、互联网宽带接入用户数、在信息传输、计算机服务和软件业的就业人数、电信业务收入以及普惠金融指数等指标通过主成分分析得到,我们收集整理了这些数据,最终得到了2011-2021年互联网发展指数原始数据指标,数据中存在少量缺失值,我们对这些缺失值数据按照统计年鉴等数据源进行了核对,均为正常缺失,官方也没有公布,为什么我们的数据是从2011年开始的呢?是因为普惠金融指标是从2011年开始更新的,所以数据也只能从2011年开始,在这里我特地强调一下,目前市面上存在一些使用普惠金融指标进行合成的数据,最终的数据区间是从2000年开始的,这是非常严重的错误,他们常用的办法是将2011年之前的指标全部设置为0,不谈他们最终合成方法是否正确,连最基本的数据质量都无法保证,而且价格非常贵,动不动就70、80甚至上百,非常气愤,希望大家注意一下数据质量,不要被骗。原始数据保存在“互联网原始数据”表中,数据展示如下:

 (五)互联网发展指数

在原始数据的基础上,我们按照要求采用主成分分析对数据进行合成,首先我们对缺失值数据进行了处理,对数据严重缺失的城市以及涉及撤销的城市,我们进行了剔除,剔除数据都是合理的,大家可以使用原始数据进行对照,剩余数据采用stata中线性插值的方法填充缺失值数据,填充结果均以“填充数据-”开头保存在相应的列中,我们对填充数据进行了核查,与数据原始趋势大致一致,说明填充没有什么问题,填充完成之后我们开始使用主成分分析进行指标合成,合成方法参考国内顶级期刊数量经济技术经济研究中《中国金融稳定指数构建、形势分析与预判》中采用的指标合成方法,使用stata完成指标合成,参考论文的主成分选择标准,根据PCA分析结果,我们确定选择为3个主成分。

同时,我们参考论文进行了KMO和Bartlett's 球形检验,检验结果说明,数据总体上适合进行主成分分析,检验结果如下:

最终我们开始进行指标合成,合成的结果存在负值,按照我们实际分析需求以及参考论文中的处理办法,将指标进行了归一化处理,映射到0-1区间上的正值数据,最终合成指标保存在“总互联网发展指数”列中,全部数据保存在“互联网发展指数”表中,如果大家选择我们的数据,还会将主成分分析的代码一起发送给大家,数据展示如下: 

以上就是本次分享的全部内容,大家可以看到我们对分享的数据是十分认真和用心的,并且站在使用者的角度考虑,所以大家完全可以相信数据的质量,最后,数据在发布时间起24小时内通过关键词指示操作即可免费获取,关注公众号“明天科技屋”并回复数字关键词了解数据获取方式,该数据由明天科技屋一手整理,版权归明天科技屋所有,未经允许,不得用于商业盈利,否则将追随法律责任!!!    

文章关键词为:“1007”    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1874738.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分享6个安卓手机上比较小众冷门还没烂大街的应用

简单分享6个比较小众冷门还没烂大街的应用。 1.GIF工具箱 一款功能全面的GIF动图编辑工具,支持视频转GIF、GIF透明背景、GIF转视频,还能合成动图,输出效果没有水印,唯一不足的一点是页面有广告,不过并不密集。 2.一键…

在Mac上恢复丢失或未保存的Word文档的5种有效方法

“救命!我想在Mac上恢复丢失的Word文档。就在 1 小时前,我错误地删除了它们,并清空了垃圾桶。这些Word文档对我来说非常重要。我不知道如何恢复它们,谁能帮我?提前致谢! 没有什么比忘记保存 Word 文档或在…

富唯智能推出的AMR复合机器人铝板CNC上下料方案

随着科技的不断进步,CNC加工行业正面临着前所未有的变革。传统的CNC上下料方式已无法满足现代生产对效率、精度和安全性的高要求。在这样的背景下,富唯智能推出的AMR复合机器人铝板CNC上下料方案,以其智能化、自动化的特点,引领了…

技术学习的奥秘与乐趣

人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 在当今快速发展的科技时代,学习技术已经成为了许多人追求的重要目标之一。无论是为了个人发展&#…

极限竞速地平线4卡顿?这样做快速解决地平线4卡顿问题

极限竞速地平线4全新开放式剧情的设计让玩家的每一次行动都能推动游戏的进程。时间、天气和四季的变化,都将在极限竞速地平线4这里得到真实的呈现。玩家将有机会在壮丽的原生4K和HDR画质下,欣赏到英国那湖泊、山谷、城堡和无数美景,体验一段从…

无需向量量化的自回归图像生成

摘要 https://arxiv.org/pdf/2406.11838 传统观点认为,用于图像生成的自回归模型通常伴随着向量量化的标记。我们观察到,尽管离散值空间可以方便地表示分类分布,但它对于自回归建模来说并不是必需的。在这项工作中,我们提出使用扩…

数据恢复篇:适用于Windows 的顶级数据恢复软件

适用于Windows的免费和付费的最佳数据恢复软件 **嘿,我要和大家一起泄露所有的测试工具。在评论中留下您的想法和最喜欢的选择! 适用于 Windows 的最佳数据恢复软件 1.奇客数据恢复 奇客数据恢复版是Microsoft操作系统的顶级数据恢复软件应用程序之一&a…

第四节:如何使用注解方式从IOC中获取bean(自学Spring boot 3.x的第一天)

大家好,我是网创有方,上一节学习了如何理解Spring的两个特性IOC和AOP,这一节来基于上节的内容进行一个简单实践。这节要实现的效果是通过IOC容器获取到Bean,并且将Bean的属性显示打印出来。 第一步:创建pojo实体类stu…

怎么加快音频播放速度?加快音频播放器的四种方法介绍

怎么加快音频播放速度?许多音乐爱好者对各种类型的歌曲充满了热情,这些歌曲节奏轻快或者缓慢不一,但通常默认的播放速度都是一倍速。有时候,一些旋律悠扬的曲子可能听起来有些慢,这时候一些朋友可能想要尝试加快节奏&a…

若依项目实战之代码生成功能

1.楠哥版 在已有大菜单下新建一小菜单 重新构建后台项目 他的 我的 包路径:com.ruoyi.test …

vue3 动态配置element 的table

需求 合并行、合并标题、列宽可调整、列顺序可调整、可以控制列是否显示、列布局可保存、导出excel… 参考效果 代码 引入 npm i xlsx npm install element-plus --savetable组件 <template><div><div class"table-btn"><el-tooltip conte…

Java学习笔记(一)Java内容介绍、程序举例、DOS命令、Java跨平台特性的本质、课后练习

Hi i,m JinXiang ⭐ 前言 ⭐ 本篇文章主要介绍Java内容介绍、程序举例、DOS命令、Java跨平台特性的本质还有几道课后练习详细介绍以及部分理论知识 🍉欢迎点赞 👍 收藏 ⭐留言评论 📝私信必回哟😁 🍉博主收将持续更新学习记录获,友友们有任何问题可以在评论区留言 …

互联网信任危机:Perplexity搜索引擎如何破坏内容创作者的权益

前段时间&#xff0c;Perplexity搜索引擎还是一颗冉冉升起的明日之星&#xff0c;手握巨额投资&#xff0c;有很美好的未来前景&#xff0c;这时&#xff0c;如果不出意外的话&#xff0c;要出意外。 喜好儿网 Perplexity这家公司&#xff0c;它正试图通过创建一个新型的“答…

使用python基于经纬度获取高德地图定位地址【逆地址解析】

一、高德地图api申请 1. 高德开放平台注册&#xff0c;登录 进入网址&#xff1a;高德开放平台 | 高德地图API 注册 -- 支付宝扫码认证 -- 完善个人信息 -- 登录 2. 申请API &#xff08;1&#xff09;点击头像 -- 应用管理 -- 我的应用 -- 创建新应用 &#xff08;2&…

【小程序静态页面】猜拳游戏大转盘积分游戏小程序前端模板源码

猜拳游戏大转盘积分游戏小程序前端模板源码&#xff0c; 一共五个静态页面&#xff0c;首页、任务列表、大转盘和猜拳等五个页面。 主要是通过做任务来获取积分&#xff0c;积分可以兑换商品&#xff0c;也可用来玩游戏&#xff1b;通过玩游戏既可能获取奖品或积分也可能会消…

C++再谈构造函数、隐式类型转换、static成员、友元函数、内部类等的介绍

目录 前言一、再谈构造函数1. 构造函数体赋值2. 初始化列表3. 初始化列表初始化顺序4. 初始化隐式类转换 二、static成员1. 概念2. 特性 三、 友元1. 友元函数2. 友元类 四、内部类总结 前言 C再谈构造函数、隐式类型转换、static成员、友元函数、内部类等的介绍 一、再谈构造…

Go 实现SFTP连接服务

我们将SFTP连接和处理逻辑&#xff0c;以及登录账户信息封装&#xff0c;这样可以在不同的地方重用代码&#xff0c;并且可以轻松地更改登录凭据。下面我将演示如何使用Go语言中的结构体来封装这些信息&#xff0c;并实现一个简单的SFTP服务器&#xff1a; package mainimport…

亚太杯赛题思路发布(中文版)

导读&#xff1a; 本文将继续修炼回归模型算法&#xff0c;并总结了一些常用的除线性回归模型之外的模型&#xff0c;其中包括一些单模型及集成学习器。 保序回归、多项式回归、多输出回归、多输出K近邻回归、决策树回归、多输出决策树回归、AdaBoost回归、梯度提升决策树回归…

3d模型里地毯的材质怎么赋予?---模大狮模型网

在进行3D建模时&#xff0c;赋予地毯逼真的材质是营造现实感和增强场景氛围的重要步骤。模大狮将介绍在常见的3D建模软件中&#xff0c;如何有效地为地毯赋予各种材质&#xff0c;以及一些实用的技巧和注意事项。 一、选择合适的地毯材质 在3D建模中&#xff0c;地毯的材质选择…

【ai】tx2 nx: trition client安装nvidia-pyindex 一直失败

系统版本的pip和python虚拟环境的pipyolov4-triton-tensorrt的master分支 官方client jetson:pip3 install --user nvidia-pyindex 不成功啊 这个是让nvidia-pyindex 拉取nvidia@tx2-nx:~$ pip3 install --user nvidia-pyindex Collecting nvidia-pyindexDownloading https://…