李雨浛:在数据、网络与民意之间——用计算社会科学方法探讨数字媒体与可持续未来 | 提升之路系列(八)...

news2024/9/28 3:27:28

76ceb1f1dea888ea33c0eef5915d7059.png

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

作为一名文科生,我在学习统计和编程语言的路上一直以来都磕磕绊绊,十分艰难。我以文科生的身份考入武汉大学新闻与传播学院,大二时的“媒介调查与统计”一门课的分数只有82分;直到本科毕业时,我仍然对基本的统计方法一无所知,更不要说在我看来是天方夜谭的R与Python语言编程,所以在作本科毕业论文时,虽然我想实施一些更有意思的选题,却因方法受限而不得不作罢,最后只选取最为基础的手工编码方法完成了一个不同媒体之间叙事比较的案例研究。2020年考入清华大学新闻与传播学院读硕士研究生后,我只知道自己朦朦胧胧对社交媒体和环境议题感兴趣:在社交媒体和气候变化问题都十分重要的当下,人们的环境认知和实践无疑受到社交媒体上的信息和周边社会网络的影响。具体而言,缺少传播资源与能力的非政府组织如何利用社交媒体的特性达成自己的环境倡导目标、触及更大范围的受众并使公众态度和行为向环境友好方向转变?在社交媒体越来越重要的今天,是谁在这一平台上占据主导、影响人们对气候变化的感知和理解?媒体或者结构化的社会网络如何影响人们的环境认知?

这些问题激发着我想要从事社会科学研究的兴趣。因此,我在硕士的第一学期完成了一项关于环保非政府组织在社交媒体上如何进行环境倡导的研究。当时,我使用深度访谈的方法采访了大概十位环境公益组织的负责人。研究做得很辛苦,整理录音和访谈资料花费的时间也很长,但在访谈过程中了解到的各种细节、接触到不同组织负责人却让我非常兴奋。但当我最后把文章拿给我的导师审阅时,她给了很多批评和建议,告诉我质化研究有时候甚至比量化研究更难做,并且委婉地让我多上一些研究方法类课程,争取做出一个扎实规范的研究。对于想走上学术道路的初学者而言,最好的方法是学习并复制一个可操作性强的量化论文,使用规范的量表和现成的统计工具。但我研究和自学了很久,始终觉得自己对心理模型和量表难以提起兴趣。此外,我并不想放弃质化研究中那些有趣的、丰富和翔实的细节,同时又对如何提升自己的归纳和推断能力非常困惑:如果既想要使用量化方法来做出规范的好上手的研究,又想要保留研究的诸多细节,怎么做才是最好的做法?如果想要做出严谨的、具有信度和效度的归纳和推断,我们应该采用什么样的统计学手段去说服自己、说服审稿人、说服读者?

偶然之间,我从身边同学的推荐之下了解到大数据能力提升项目,在某种程度上,大数据能力提升项目让我看到了在量化和质化研究中找到中间道路的可能性——或者说,计算方法是一种另类的量化手段。其实,在进入研究生学习的第一年,我就通过读文献了解到“计算社会科学”这一领域的存在。当时,我内心虽然觉得那些采用大数据和计算方法的社交媒体研究非常吸引人,却觉得如果自己想要上手计算方法,几乎是不可能完成的事情。而大数据能力提升项目恰好给了我这个尝试的机会,我也真正是在项目的一系列课程中,逐渐感受到计算方法的魅力,以及找到嫁接自身领域和计算方法的可能性。在孟天广老师开设的政务大数据应用与分析课程上,我初步接触了因果推论、实验方法、机器学习等前沿研究方法。因为这门课还配套有相应的工作坊指导,我几乎每节工作坊都没有缺席,在课后按照助教分享的代码和范例一步步复制。课余时间,我还报名参加了Coursera上提供的一系列Python编程入门、社会网络分析和机器学习等入门课程。这些都为我后来将这些方法逐步应用到自己的研究之中打下了坚实的基础。

对于孟天广老师在课程上介绍过的两个观点,我一直记忆犹新,这也间接塑造了我对计算社会科学方法的认识和学习方法:第一,大数据方法可能会成为量化和质化研究的桥梁。这是因为大数据方法采用的文本和图片数据,在过去几十年的研究中可能更多被归类于定性素材,而机器学习实质上是采用计算机辅助的定量化分析,研究者在解读结果的过程中,可以采取定性或定量的多元路径。另外,传统的定量研究由于采取问卷的形式,所得到的研究数据通常是结构化的,抛弃了大量文本和图片等非结构化数据中的丰富内容,而计算方法恰好能够帮我们分析出大数据中隐藏的特征和模式。虽然大数据存在改变数据驱动、缺少问题和理论导向的缺陷,也需要在信度、效度和因果推断上给出进一步的解释和改进,但总体而言,大数据方法仍然极大地拓宽了传统量化研究的选题宽度,给包括传播学在内的许多学科都注入了新的实践和理论活力。

第二,学习计算工具的方法无他,最重要的是“learning by doing”(做中学)。如果一个人能够清晰地把自己所学的内容和知识传授给其他人,那这个人一定就深入掌握了这一方法。

受这两个观点的启发,我开始在自己主导的一项社交媒体与气候变化讨论的研究中采取语义网络和情绪分析的计算方法,探讨气候变化相关视频的内容框架和用户气候变化感知之间的关联。最后,论文获得了由国际传播学会(International Communication Association)环境传播分会颁发的最佳学生论文奖。这些经历真正让我感受到采用大数据方法从事社会科学研究的潜力,也坚定了我想要成为环境传播和计算社会科学这一交叉领域的出色学者的决心。

09d0d7680dc381ad2e31b4267d6130d8.png

5e42ae2816be986e0c63d2e982995ea3.png 2022年国际传播学会环境传播分会最佳学生论文奖奖状

在2022年春季学期,受学院学生会的邀请,我在学院的“量化学习小组”里分享了使用有监督机器学习和社会网络分析做研究的经验和代码。在有监督机器学习的讲座里,我介绍了机器学习分类算法,逻辑斯蒂回归模型、朴素贝叶斯模型原理,并带领大家完成数据处理、模型训练与应用等任务;在社会网络分析的讲座里,介绍社会网络分析的基础概念、方法应用、相关理论,并带领大家完成处理数据、建立网络、分析网络等任务,前后一共有五十余位同学到场参加讲座。在这两次的分享中,我也逐步加深了对计算方法的原理及应用的认识。

2022年暑假,不满足于已经学完的大数据能力提升项目课程和Coursera上能够获取到的免费资源,我想要进一步提升自己的大数据编程能力。于是,我报名参加了由密歇根大学每年定期举办的“校际政治学和社会学研究联盟”暑校(Inter-university Consortium for Political and Social Research Summer Program, 简称ICPSR)。我一共参加了“网络分析:前沿话题”、“社会科学中的因果推断”和“面板数据和序列分析”等三门为期四周的方法论课程,并获得了由EITM研究所颁发的成绩证书。

835f57d81bf28e0b4c2f9a0d4e6b539c.png 

1f916df9a5bc3af8f18ccc26c5c8eb79.png

EITM(Empirical Implications of Theoretical Methods)研究所颁发的证书

我很感谢大数据能力提升项目,也十分感谢在这个项目中遇到的孟天广老师,他在我学做研究的路上、以及后续申请密歇根大学ICPSR暑校和申请国外博士项目的过程中都给予了我非常大的启发和帮助;我也想感谢我在上课过程中结识到的合作者和朋友,与优秀之人同行,使我有了更多进步的动力。可以说,是大数据能力提升项目让我的研究能力不断成长,使我的职业目标和学术方向更加清晰,而我也立志于在未来成为一名优秀的计算社会科学研究者,在未来的博士研究期间做出更多结合理论与实证的优秀作品,为计算方法的推广和应用贡献自己的力量。

编辑:于腾凯

校对:林亦霖

e4f3918524cc20c1ee0924c0a27e92bf.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/487288.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

创建并使用shell脚本

1,查询 bash解释器 所在位置 创建前,我们需要先知道 bash 解释器所在的位置,以方便在头部写声明。一般位置是在 /bin/bash 但是有的是在 /usr/bin/bash ,所以需要查找一下。 文件位置查找命令:whereis xxx rootarmb…

Probabilistic and Geometric Depth: Detecting Objects in Perspective 论文学习

论文地址:Probabilistic and Geometric Depth: Detecting Objects in Perspective Github 地址:Probabilistic and Geometric Depth: Detecting Objects in Perspective 1. 解决了什么问题? 3D 目标检测在许多应用中发挥着重要作用&#xf…

分析的四个维度

我们都听过这句格言“数据是新石油”——一种宝贵、丰富的资源,只有提炼后才有用。然而,最引人注目但又令人望而生畏的比较之一是将船只送入海洋进行石油勘探。有些会失败,有些会有重大发现。 深海勘探和钻探取决于精确测绘和对海底的清晰认…

【计算机网络】图解内容分发网络 CDN

【计算机网络】图解内容分发网络 CDN 参考资料: 用了CDN就一定比不用更快吗? 什么是内容分发网络 高性能利器:CDN我建议你好好学一下! 文章目录 【计算机网络】图解内容分发网络 CDN一、CDN 概述1.1、什么是 CDN1.2、为什么需要 …

数字化转型导师坚鹏:数字化转型背景下的企业人力资源管理

企业数字化转型背景下的企业人力资源管理 课程背景: 很多企业存在以下问题: 不清楚企业数字化转型目前的发展阶段与重要应用? 不知道企业数字化转型给企业人力资源管理带来哪些机遇与挑战? 不知道企业数字化转型背景下如何…

SpringBoot 项目如何实现动态配置多数据源?

简介: dynamic-datasource-spring-boot-starter 是一个基于springboot的快速集成多数据源的启动器。 其支持 Jdk 1.7, SpringBoot 1.4.x 1.5.x 2.x.x。 特性: 支持 数据源分组 ,适用于多种场景 纯粹多库 读写分离 一主多从 混合模式。支持…

认识JavaBean

什么是JavaBean? JavaBean是指符合特定规范以及定义的Java类,通常用于封装数据,提供访问数据的方法和属性,并且可以被其他程序重用。它具有以下特点: 遵循特定编程规范:JavaBean必须要遵循JavaBean编程规范&#xff…

分层领域模型相关总结(DO/PO/VO/BO/DTO/Query等概念)

分层领域模型(DO/PO/VO/BO/DTO/Query等概念) 1. 为什么会有这么多O的概念? 各种分层概念的提出都是为了解耦,增加逻辑/代码的复用,便于后期维护/开发,提高团队开发效率;but,过多的细分也会使得开发过程相对…

Chrome 113 发布,默认启用 WebGPU

经过四周时间开发,Chrome 113 稳定版正式推出,新版本包括用于视频电话会议的 AV1 视频编码、WebGPU,以及其他增强功能。 默认启用 WebGPU WebGPU 是用于 Web 的新 API,它使用了现代的硬件功能,允许在 GPU 上进行渲染和…

Unable to import maven project: See logs for details错误的多种解决方法

文章目录 1. 复现错误2. 分析错误3. 解决问题3.1 解决方法一3.2 解决方法二 4. 补充说明 1. 复现错误 今天从gitlab上下载完项目后,无法启动项目,留意到右下角的Evnet Log,点开如下图所示: 即Unable to import maven project: See…

vue-element-admin快速搭建后台模板

快速搭建后台模板 环境以及会出现的问题安装目录结构基本配置路由配置 环境以及会出现的问题 node版本17.0.0 python版本2.7.10(node-sass依赖) 运行项目报错Error: error:0308010C:digital envelope routines::unsupport 请看这篇文章 https://blog.cs…

FM33A048B I2C

I2C 模块实现MCU 与外部I2C 接口器件之间的同步通信,硬件实现串并转换。支持I2C 的主机模式,不支持从机模式和多主机模式。 特点: ⚫ 只支持I2C 主机模式, 不支持从机模式和多主机模式 ⚫ 支持7 位或10 位从机地址 ⚫ 传输速度支持标准模式(1…

Java面试题总结 | Java面试题总结10- Feign和设计模式模块(持续更新)

文章目录 Feign项目中如何进行通信Feign原理简述 设计模式spring用到的设计模式项目的场景中运用了哪些设计模式写单例的时候需要注意什么工厂模式的理解设计模式了解么工厂设计模式单例设计模式代理设计模式策略模式**模板方法模式**观察者模式**适配器模式**观察者模式**适配…

TimeScaleDB食用手册

TimescaleDB食用手册 一 TimescaleDB介绍 TimescaleDB是一种用于处理时间序列数据的开源时序数据库,它是PostgreSQL的扩展。它可以处理大量的时间序列数据,并且支持SQL查询和连续聚合功能。 1.TimescaleDB的优点 分布式架构:TimescaleDB利…

类和对象上

文章目录 一、类的定义1、声明和定义全部放在类体中2、 类声明放在.h文件中,成员函数定义放在.cpp文件中 二、类的访问限定符三、类的作用域类及其实例化1、作用域2、实例化 四、类对象大小的计算1、计算对象(仅成员变量)2、计算方式&#xf…

iMazing2官方下载最新iPhone/iPad手机设备管理工具

iMazing 2最新版它可以完美地在 iOS 设备之间传输数据。 该软件专门设计用于为用户提供对 iPhone、iPod 和 iPad 的更多控制和管理能力。 它将所有这些高价值设备变成了外部存储,以便您可以交换各种数据,例如短信、通话记录、视频或照片。值得信赖的是&a…

学习k近邻算法(KNN)【自学且自用】

文章目录 1 概念2 原理及举例3 KNN中最常用的距离度量——欧式距离4 K值的选择5 knn和k-means的区别 参考的一些网页: https://zhuanlan.zhihu.com/p/143092725 1 概念 k近邻算法(k-nearest neighbour,k-NN)是一种基本分类与回归…

JavaEE-HTML常用标签了解(二)

目录 表格标签合并单元格 列表标签表单标签无语义标签HTML特殊字符 表格标签 table 标签: 表示整个表格tr: 表示表格的一行td: 表示一个单元格th: 表示表头单元格. 会居中加粗thead: 表格的头部区域(注意和 th 区分, 范围是比 th 要大的)tbody: 表格得到主体区域. <table …

CAS简介

文章目录 前言一、锁&#xff1f; CAS?二、juc--java.util.concurrent1.CAS思想的落地2 ABA问题出现3 可以解决的问题 总结 前言 CAS的全称是&#xff1a;比较并交换&#xff08;Compare And Swap&#xff09;。在CAS中&#xff0c;有这样三个值&#xff1a; V&#xff1a;要…

基于YOLOv5的目标检测系统详解(附MATLAB GUI版代码)

摘要&#xff1a;本文重点介绍了基于YOLOv5目标检测系统的MATLAB实现&#xff0c;用于智能检测物体种类并记录和保存结果&#xff0c;对各种物体检测结果可视化&#xff0c;提高目标识别的便捷性和准确性。本文详细阐述了目标检测系统的原理&#xff0c;并给出MATLAB的实现代码…