非专业人士如何完成数据采集?纯干货,一文看懂

news2024/11/15 23:22:09

写在前面:

本教程能够解决大部分人的数据采集及分析需求,实用、简单,尤其适合Excel大户、办公族、业务人员,或者不会编程、不懂数据分析理论的技术小白……

来不及看的可以先点赞收藏!

01 点对点的采集:直接采集数据

02 点对线的采集:采集流程中的数据

03 进行权限设置,限制采集群体

04 数据管理并清洗

05 数据分析并展示


01 点对点的采集:直接采集数据

所用工具:简道云表单(协同收集+隐私保护)

首先想好需要收集哪些数据,添加字段制作表单。

表单创建方式有两种,一种是「创建空白表单」,根据自己的需求,自定义添加字段,操作步骤如图:

如果有部分数据已经存储在Excel中,可以直接选择「从Excel创建表单」,配置好字段标题名称即可一键导入,操作步骤如图:

  

表单设计主要分为3个步骤:

  1. 添加字段,把需要收集哪些数据都列出来做成字段。
  2. 配置数据联动、公式、选项关联设置等等功能,使得数据收集过程更加方便。
  3. 设置表单属性。

收集上来的数据,存储在表单后台中,在数据管理中可以看到所有的数据,拉出一个仪表盘即可一键生成数据分析报表。


02 点对线的采集:采集流程中的数据

所用工具:流程表单

当表单需要多方参与、按一定顺序提交数据时,那么上一步的表单创建时,就要选择「流程表单」来创建。

比如,报销数据采集的步骤:链接发给各部门——提交采集表——财务审核确认——汇总处理完成。

所以在“流程设定”里,我们需要提前设置好提交流程的节点、负责人和数据流转的路径。只要数据提交,就会进入流程,按照设计进行流转。

ps:表单与流程表单可以相互切换

普通表单切换为流程表单后需要重新设置流程;

流程表单切换为普通表单后,则流程将失效,数据提交后将不再按设定流转。

 

03 进行权限设置,限制采集群体

所用工具:权限管理

表单设计好以后:

可以发布给成员,并分配不同的数据处理权限(直接提交、管理全部数据、查看全部数据、管理本人数据)。

也可以点击公开发布,将采集表的链接/二维码发出去,进行数据采集。或者设置“凭密码填写”,只有输入正确密码,才能打开采集表。

 

04 数据管理并清洗

我们采集的对象可以根据我们分配的权限,去查看全部或部分数据;

我们自己则可以在后台数据管理处查看所有提交上来的数据,并直接可以数据进行筛选、批量导入/导出、删除、修改等操作,进行数据的快速清洗。

 

对大规模数据/多级的数据进行快速计算

如果之前了解过大数据/数据分析,一定听说过数据仓库这个词。

我们可以把数据工厂理解为数据仓库技术中的ETL工具。

ETL ,用来描述将数据从来源端经过抽取、转换、加载至目的端的过程。

它的好处是什么呢?

就是可以快速计算很多维度,比如每月计算工资和绩效,可能包含很多影响因素,但每个月都要手动把这些因素一一算好,再盘起来,非常麻烦且耗时。

但是在数据工厂设置好计算流程后,之后只需要采集好每个维度的数据,数据自己就能自动进入数据工厂进行加工计算,这样就完全省掉了每月的计算工作。

简言之,数据工厂是加工和处理数据的工具,通过数据工厂处理、计算得到的数据,可以用仪表盘(仪表盘下一节就会说到)进行数据分析。

05 数据分析并展示

所用工具:仪表盘

数据分析仪表盘

在表单中收集得到的数据,可通过仪表盘来进行查看、分析和处理。仪表盘中提供了多种样式的图表。比如:

  • 通过明细表、数据透视表等查看表单数据的明细和汇总;
  • 通过柱形、折线、图形、雷达图等可以对数据进行处理,显示出数据的发展趋势、分类对比等结果;
  • 通过饼图体现数据中每个部分的比例……等等

把做好的仪表盘发出去,别人也可以看到你的统计分析结果。

下面教一下怎么用仪表盘统计分析数据:

按照需求,添加对应的图表组件,比如:统计表、明细表、数据管理表格、日历组件等等。

添加好图表组件以后,我们就可以对整个数据分析看板进行布局调整,再明确一下打开的步骤:

新建仪表盘 >> 数据组件 >> 统计表/明细表/数据管理组件/日历组件

数据分析的仪表盘就做好了:

 

​总结一下

  • 通过表单来收集、管理数据;
  • 通过仪表盘来展示、分析数据;
  • 通过把表单、仪表盘发布出去,大家可以打开填写/查看数据;
  • 通过设置数据权限,实现更精细的分享、采集

是不是很简单?

文中使用工具:简道云

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/141206.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

吴恩达《机器学习》——欠拟合与过拟合

欠拟合与过拟合1. 方差与偏差模型的容量、过拟合和欠拟合2. Python代码实践2.1 拟合直线2.2 拟合多项式数据集、源文件可以在Github项目中获得 链接: https://github.com/Raymond-Yang-2001/AndrewNg-Machine-Learing-Homework 1. 方差与偏差 在数学上,估计的偏差…

Java基础漏洞(二)

继续填补自己的知识漏洞 1.&、&&、|、||之间的区别 &是逻辑与,而&&则是短路与。&和&&之间的区别是,在短路与&&的情况下,两个条件当第一个条件为假时,则不再执行第二个条件&#xf…

java学习之类方法

目录 一、基本介绍 二、类方法的调用 三、类方法的应用实例 代码 内存分析 运行结果 四、类方法的经典使用场景 五、类方法使用细节 第一条 第二条 第三条 第四条 第五条 第六条 六、练习 第一题 考察点 分析 结果 第二题 代码 考察点 结果 第三题 类方法 …

LeetCode498. 对角线遍历

LeetCode刷题记录 文章目录📜题目描述💡解题思路⌨C代码📜题目描述 给你一个大小为 m x n 的矩阵 mat ,请以对角线遍历的顺序,用一个数组返回这个矩阵中的所有元素。 示例1 输入:mat [[1,2,3],[4,5,6],[…

VUE2使用浏览器缓存的方法

分两种:localStorage和sessionStorage,它两统称webStorage 注意点1:localStorage对象和sessionStorage对象都是window对象下的,且方法都是一样的,默认”window.”可以省略,添加可用setItem(K,V),查询可用ge…

数据库|scMethBank:单细胞全基因组 DNA 甲基化图谱数据库

甲基化是DNA的一种重要化学修饰,可调节基因的表达和关闭,与癌症、衰老、老年痴呆等许多疾病密切相关,是表观遗传学的重要研究内容之一。测序技术的发展,极大促进了单细胞DNA甲基化研究。然而大量数据的不断积累,对单细…

《HTTP权威指南》----HTTP报文

目录 报文流 报文的组成部分 报文语法 1.起始行 2.首部 通用首部,既可以出现在请求报文中也可以出现在响应报文中。 请求首部,提供更多有关请求的信息。 响应首部,提供更多有关响应的信息。 实体首部,描述主题的长度和内…

2022年,一个技术账号的年终独白,满篇都写着2个字:真难。

2022年,梦想橡皮擦这个账号经历了成长,突破,回归 2023年,适应改变 文章目录序2022年,梦想橡皮擦账号整体汇总原创博客KPI计划与完成总排名KPI计划与完成2022年,橡皮擦获得的荣誉2022年,做技术博…

日志收集系统架构

背景 应用服务器多,日志文件被分散在各个应用服务器上,需要依次登录每台设备才能查看日志,效率低下,且不利于服务器安全管控,加大生产服务器的风险;日志文件不统一,各项目日志没有统一的规范&a…

Python Django教程之实现天气应用程序

基本设置 将目录更改为天气 cd weather启动服务器 python manage.py runserver要检查服务器是否正在运行,请转到 Web 浏览器并输入为 URL。现在,您可以通过按以下命令停止服务器http://127.0.0.1:8000/ ctrl-c 实现 python manage.py startapp main…

Vehicle Speed Forecasting Based On GCN-LSTM Combined Model

GCN-LSTM模型预测道路交通车辆速度 Vehicle Speed Forecasting Based On GCN-LSTM Combined Model Summary This research offers a multistep traffic flow forecasting framework relying on interest spatial-temporal-graph neural network-long short-term memory neura…

【阅读】《MYSQL技术内幕:innodb》索引

概念 索引的类型 聚集索引:叶子节点包含行记录的全部数据辅助索引:叶子节点不包含行记录的全部数据,除了键值以外,还包含指向索引行的书签。 堆表和索引组织表 堆表 无论是主键索引还是普通索引都是辅助索引。数据是按照插入…

​力扣解法汇总2042. 检查句子中的数字是否递增

目录链接: 力扣编程题-解法汇总_分享记录-CSDN博客 GitHub同步刷题项目: https://github.com/September26/java-algorithms 原题链接:力扣 描述: 句子是由若干 token 组成的一个列表,token 间用 单个 空格分隔&…

微信小程序实战十五:Https服务搭建及Nginx配置

文章目录 1.最终效果预览2.后端jar包部署及启动3.前端管理系统部署4.Nginx的配置5.https证书申请6.小程序后台中配置子域名这篇文章重点介绍下微信小程序正式版上线前https服务的搭建及配置过程,之前整个流程都操作过,时隔一年再次从零开始操作有些地方的印象已经模糊了,好记…

Java Swing五子棋项目

一、项目简介 本项目为Java Swing五子棋项目,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。 包含:项目源码、数据库脚本等,该项目附带全部源码可作为毕设使用。 项目都经过严格调试,eclipse 确保可…

ArcGIS基础实验操作100例--实验50以栅格分区裁剪面要素

本实验专栏参考自汤国安教授《地理信息系统基础实验操作100例》一书 实验平台:ArcGIS 10.6 实验数据:请访问实验1(传送门) 高级编辑篇--实验50 以栅格分区裁剪面要素 目录 一、实验背景 二、实验数据 三、实验步骤 &#xff0…

Vulkan PBR与IBL实践

对我来说,每天能过得心情舒畅,有酒喝有美味佳肴吃,必要时工作一会儿,晚上睡得舒舒服服,就行了。 ——迪希亚 序 说实话我已经记不清上一篇文章是什么时候的事情了,感觉得有好几个月了,但其实我…

【Linux】【信号】

文章目录一、信号是什么1.生活中的信号2.什么是Linux信号3.信号处理的常见方式4.Linux当中的信号二、信号的产生1.signal函数2.核心转储3.验证进程等待中的core dump标记位三、信号的系统调用接口1.kill2.raise3.abort四、由软件条件产生信号alarm五、硬件异常产生信号1.除零异…

从编译到可执行,eBPF 加速容器网络的原理分析 | 龙蜥技术

编者按:eBPF(extended Berkeley Packet Filter) 是一种可以在 Linux 内核中运行用户编写的程序,而不需要修改内核代码或加载内核模块的技术。简单说,eBPF 让 Linux 内核变得可编程化了。本文整理自龙蜥大讲堂第 57 期,浪潮信息 SE…

HTML防数据采集

什么是防采集 就是我们想利用爬虫工具采集某个网站的数据(前提当然是公开合法数据),但网站不想给你采集而设置的技术阻挡措施。 常见的防止采集方案 利用输入验证码框验证,在采集某些网站过程中,要求你输入验证码&a…