当前内容所在位置(可进入专栏查看其他译好的章节内容)
- 第一部分 D3.js 基础知识
- 第一章 D3.js 简介(已完结)
- 1.1 何为 D3.js?
- 1.2 D3 生态系统——入门须知
- 1.3 数据可视化最佳实践(上)
- 1.3 数据可视化最佳实践(下)
- 1.4 本章小结
- 第二章 DOM 的操作方法(已完结)
- 2.1 第一个 D3 可视化图表
- 2.2 环境准备
- 2.3 用 D3 选中页面元素
- 2.4 向选择集添加元素
- 2.5 用 D3 设置与修改元素属性
- 2.6 用 D3 设置与修改元素样式
- 2.7 本章小结
- 第三章 数据的处理 ✔️
- 3.1 理解数据(已完结)
- 3.2 准备数据(已完结)
- 3.3 将数据绑定到 DOM 元素(已完结)
- 3.3.1 利用数据给 DOM 属性动态赋值
- 3.4 让数据适应屏幕 ✔️
- 3.4.1 比例尺简介(上篇) ✔️
- 3.4.2 线性比例尺(中篇,精译中 ⏳)
- 3.4.3 分段比例尺(下篇,待翻译 ⏳)
- 3.5 加注图表标签
- 3.6 本章小结
文章目录
- 3.4 让数据适应屏幕 Adapting data for the screen
- 3.4.1 比例 Scales
《D3.js in Action》全新第三版封面
译者按
上一节介绍了 D3 数据绑定相关的知识,并将整理好的数据集绑定到本章的示例条形图中。这一节就来看看 D3 在调整数据以适配屏幕显示方面有什么独道之处。由于篇幅较长,这一节拟分为上、中、下三篇进行介绍。本篇为上篇,主要介绍 D3 比例尺相关的内容。一起来看看吧。
3.4 让数据适应屏幕 Adapting data for the screen
创建数据可视化时,通常会将数据转化为 视觉变量(visual variables),例如元素的大小、颜色或者屏幕上的位置等。这种转换在 D3 项目中通常是由各类 比例尺(scales) 实现的,如图 3.22 中的最后一步所示:
图 3.22 D3 数据工作流最后一步:使用比例尺实现数据值到屏幕属性值(长度、位置、颜色等)的转换
3.4.1 比例 Scales
比例尺是将数据中的一个值作为输入(input)并返回一个输出值的函数。该输出值可以直接用来设置数据可视化元素的尺寸大小、位置或者颜色。说得再具体些,输入数据是 定义域(domain) 中的一份子;定义域是该数据能取到的值的某个范围。在屏幕上,定义域又被映射到某个 值域(range) 上;而值域则是输出值能取到的值的某个范围。
D3 提供了多个比例尺函数,它们各自接收不同种类的定义域与值域。以线性比例尺 d3.scaleLinear()
为例,要初始化该比例尺函数,需要链式调用 domain()
和 range()
方法,并将包含所有可能性的数值范围作为参数传入,参数类型为一个有序数组,里面分别包含一个最小值与一个最大值:
const myScale = d3.scaleLinear()
.domain([0, 200])
.range([0, 20]);
得到的比例尺函数与 JavaScript 其他函数相比没什么不同。将定义域中的某个值作为参数传入,函数则会从值域中返回一个对应的结果:
myScale(100) => 10
比例尺的输入与输出值既可以是 连续的(continuous) 也可以是 离散的(discrete)。连续值可以在预定范围内的任意位置存在,例如 0 到 100 之间的某个浮点数,或者介于 2020 年 6 月到 2021 年1 月之间的某个日期等等。一个连续的定量型数据可被视为一个可滑动的刻度尺;另一方面,离散型输入与输出则对应一组预设值,例如现有 T 恤的尺码型号一般为 XS 特小号、S 小号、M 中号、L 大号以及 XL 加大号,或者颜色类型包含蓝色、绿色、黄色和红色等等。定性型数据就如同将物品放入不同的盒子,每个物品只能放入一个盒子。
在 D3 中,定量数据往往与一个有着连续型定义域(continuous domain)的比例尺相关联;相反,定性数据则对应某个离散型定义域(discrete domain),通常是一个由所有可能的值所构成的数组。同理,一个有着连续型输出结果的比例尺可在指定的值域内取到任意值;而离散型输出只能返回预设值列表中的某个结果。
根据连续与离散、输入与输出等概念,可将 D3 比例尺分为以下四类:
- 具有连续型输入、连续型输出的比例尺;
- 具有离散型输入、离散型输出的比例尺;
- 具有连续型输入、离散型输出的比例尺;
- 具有离散型输入、连续型输出的比例尺。
假设我们在谷歌上搜索 2021 年推出的电视剧,并将前 10 个结果汇总到一个数据集中(即撰写本章时笔者进行的一个练习操作),然后分别搜集每部电视剧的体裁、“烂番茄”热度得分(译注:“烂番茄”即 Rotten Tomatoes,一个专注于影视节目评价的知名网站,1998 年成立于美国。)、专业影评人综合评分、以及可收看平台,将得到一个如下表 3.2 所示的数据集。其中既包含连续型数据(如观众评分和影评人评分),同时也有离散型数据(如体裁与可收看平台)。要绘制如图 3.23 所示的条形图,需要利用 D3 比例尺分别对上述每个维度进行处理。请注意,该条形图旨在演示 D3 比例尺的不同类型及其用法,您无需亲自创建。
译注
烂番茄(Rotten Tomatoes) 网站是美国一家专注于线上影视评论的知名网站,于 1998 年 8 月由加州大学伯克利分校的三名本科生 Senh Duong、Patrick Y. Lee 和 Stephen Wang 联合创办。虽然“烂番茄”一名与观众投掷烂番茄以反对拙劣的舞台表演的做法有关,但三人起这个名字的直接灵感据称来自 1992 年的一部加拿大电影《Léolo》中的一个类似场景。(摘自 维基百科)
表 3.2 谷歌推荐的 2021 年度热播电视剧
剧名 * | 体裁 | 大众评分 (%) | 专业评分 (%) | 观看平台 |
---|---|---|---|---|
Nine Perfect Strangers | Drama | 59 | 62 | Prime |
Maid | Drama | 88 | 94 | Netflix |
Katla | Drama | 78 | 100 | Netflix |
Jupiter’s Legacy | Action | 73 | 40 | Netflix |
Hit & Run | Action | 72 | 82 | Netflix |
The Irregulars | Crime | 54 | 80 | Netflix |
Shadow and Bone | Action | 89 | 88 | Netflix |
Clickbait | Crime | 64 | 56 | Netflix |
Sex/Life | Comedy | 34 | 23 | Netflix |
The Wheel of Time | Action | 64 | 82 | Prime |
数据来源:www.rottentomatoes.com(*
:为演示起见,剧名、体裁、观看平台等维度均不作翻译)
图 3.23 2021 年度热播剧专业点评与大众评分对比:四个维度均由相应的比例尺处理绘制而成
条形图中的每个矩形都对应一部热播剧,其长度与专业影评人给出的平均得分成正比。为了计算各矩形条的长度,需要使用上述 D3 比例尺中的第一类。其输入参数为专业影评人评分,输出则是一个连续型数值,对应该矩形条长度。
这个比例的定义域为 0% 到 100% 之间(即专业评分的取值范围),与之对应的矩形条长度值域为(以像素为单位):
定义域 => [0, 100] 输入的最小值和最大值,单位:%
值域 => [0, 500] 对应输出的最小值和最大值,单位:像素
再来看矩形条的颜色。它代表每部剧的体裁。要给不同的热播剧上色,需要用到第二类比例尺:输入数据为离散型数值(即体裁),输出为离散型数值(即对应的颜色)。该比例尺的定义域是一个由不同体裁构成的数组,值域则是一个对应的颜色名称数组:
定义域 => ["Drama", "Action", "Crime", "Comedy"] 输入值的取值范围
值域 => ["purple", "blue", "green", "yellow"] 对应输出的取值范围
此外,每个矩形条的末端还用了一个表情符号来表示大众热度评分情况。热度得分超过 80% 的电视剧将显示成一个“心形眼”表情符号(♥‿♥
);热度在 70% 到 80% 之间的,则显示一个微笑表情(⌒‿⌒
);热度在 60% 到 70% 的,则显示为一个中性表情(●_●
);而热度不足 60% 的电视剧则会得到一个苦闷的表情(⊙﹏⊙
)。于是我们就得到了一组连续的输入,即大众热度评分;以及一组离散的输出,即对应的表情符号:
定义域 => [60, 70, 80] 输入值的临界点
值域 => ["⊙﹏⊙", "●_●", "⌒‿⌒", "♥‿♥"] 对应的输出结果
最后要处理的,是矩形条的方位计算——各矩形条沿图表纵轴均匀分布。方位的计算,需要借助上述第四类 D3 比例尺:接受离散型输入(即剧名),并返回一个连续型输出(即纵轴坐标值):
定义域 => ["Nine Perfect Strangers", "Maid", "Katla", ...] 输入值列表
值域 => [0, 500] 对应输出的最小值和最大值,单位:像素
由此可见,每一类比例尺都包含多个比例尺函数,撰写本书时,d3-scale
模块已经提供了 20 个以上的现成比例尺函数(详见 https://d3js.org/d3-scale)。本章将重点介绍 d3.scaleLinear()
和 d3.scaleBand()
函数,因为它们在 D3 开发中最常用,并且本章的示例条形图也需要依靠它们来实现。本书还将介绍许多其他的比例尺工具。想了解更多 D3 现有比例尺函数的概述性介绍、以及有利于手头项目比例尺函数合理选型的决策树,详见本书 附录 B(待翻译)。