文章目录
- 标度
- 标度种类
- 名义标度
- 序级标度
- 等距标度
- 比率标度
- 常用标度方法
- 不足
- 标度不变性
- 标度不变(Scale-invariant)曲线和自相似性(self-similarity)
- 射影几何
- 分形
- 随机过程中的标度不变性
- 标度不变的 Tweedie distribution
- 普适性(Universality)
- 统计力学中的普适性
- 例子
- 理论概述
- 其他领域的应用
- 普适类(Universality class)
- 临界指数列表
- 无标度网络(Scale-free network)
无标度(scale-free)主要侧重在幂指数
β
\beta
β 不同条件下,其均值、方差和不同的矩 moments 的 infinty 情况。
标度不变(scale invariance)则从函数构造的角度,当因变量 x x x 比例缩放时,自变量幂函数本身会比例的标度缩放,即 f ( a x ) = b f ( x ) f(ax)=bf(x) f(ax)=bf(x), 因此,每个幂指数对应的幂律函数都只是其他情况的缩放而已。
国内复杂网络教材有时候基本一个意思,没有太多的区分,都说是无标度。在国外专门的数学统计书或者期刊上有这层意思。
简单来说:scale-free 和 scale invariant 表达的是同一定义。即一个:
‘property invariant under scale transformations’ or ‘property free from scale transformations’。
实际上在早于复杂网络的研究之前统计物理学界里 scale-free 和 scale invariant就常常混着用了。
在复杂网络的研究当中,scale-free 就比较特指幂率分布的 scale-free network。个人认为是因为最早 Barabasi & Albert 的文章中使用了 scale-free network 的命名。而 scale invariant 就泛指 scale invariance 这一个更加大的概念了。
标度
在感官检验中,标度方法是感官体验的量化方式,通过这种数字化的处理,感官评价可以成为基于统计分析、模型、预测等理论的定量科学。
标度方法广泛应用于需要量化感觉、态度或喜好倾向性等各种场合。标度技术基于感觉强度的心理物理学模型。即增强物理刺激的能量或增加食品组分的浓度或含量,会导致其在感觉、视觉、嗅觉或味觉方面有多大程度的增强。
从感官检验的定义中我们知道,它是一门度量的科学,度量是将感官体验进行量化的关键一步, 在此基础上才能将数据进行统计分析。标度法中既使用数据来表达样品性质的强度(甜度、硬度、柔软度),也是用词汇来表达对该性质的感受(太软、正合适、太硬)。如果使用词汇,应该将词汇和数字对应起来,比如非常喜欢 =9,非常不喜欢 =1,这样就可以将这些数据进行统计分析。
标度种类
有 4 种对事件的标度种类,通常是指名义标度、序级标度、等距标度和比率标度。这几种标度是根据测量理论中测量水平提出的,适用于各个水平的各类统计分析和不同的建模水平。
名义标度
名义标度中,对于事件的赋值仅仅是作为标记。数值赋值仅仅是用于分析的一个标记、类项或种类,不反应序列特征。对这类数据的适当分析是进行频率计算并报告的结果。
序级标度
序级标度中,赋值是为了对产品的一些特性、品质或观点(如偏爱)标示排列的顺序,该方法赋给产品的数值增加标示感官体验的数量或强度增加。
等距标度
当反应的主观间距相等时会出现等距标度。在该标度水平下,赋值的数据可以表示实际的差别程度。那么这种差别程度就是可以比较的,成为等距水平测量。
比率标度
在比率标度下,0 点不是任意的,而是数值反映了比例。
常用标度方法
常用的标度方法有第三种,最古老也是最广为使用的标度方法是类项标度,评价员根据特定而有限的反应,将数值赋予察觉到的感官刺激。第二种的方法与此相应,是量值估计法,这种方法评价员可以对感觉赋予任何数值来反映其比率。第三种常用的方法是线性标度法。该方法是评价员采用在一条线上做标记来评价感觉强度或喜爱程度。
不足
标度法存在自身的不足,那就是品评人员容易只选择中间的数值,比如要求对某种苹果汁按照从 0-9 的标尺对其苹果风味进行评价。品评员一般不会选用 0、1 和 2,因为他们总以为还会有风味更低的样品,而这样的样品可能不会出现在试验中,同样,他们也不太会选择 7、8 和 9 这几个数值,这样就会造成标尺不准确。
标度不变性
图 Wiener process 是标度不变的
在物理学、数学和统计学中,标度不变性(或尺度不变性)是物体或定律的一个特征,如果长度、能量或其他变量的尺度乘以一个公因数,这些物体或定律不会改变,因此代表了一种普适性。
这种变换的技术术语是扩张(dilatation or dilation)。扩张可以形成更大的共形对称性(conformal symmetry)的一部分。
- 在数学中,标度不变性通常是指单个函数或曲线的不变性。 一个密切相关的概念是自相似性,其中函数或曲线在扩张的离散子集下是不变的。随机过程的概率分布也有可能表现出这种标度不变性或自相似性。
- 在经典场论中,标度不变性最常用于整个理论在膨胀下的不变性。这些理论通常描述没有特征长度尺度的经典物理过程。
- 在量子场论中,标度不变性有粒子物理学的解释。在标度不变理论中,粒子相互作用的强度不取决于所涉及粒子的能量。
- 在统计力学中,标度不变性是相变的一个特征。关键的观察是,在相变或临界点附近,所有长度尺度都会发生涨落,因此应该寻找一种明确的标度不变理论来描述这种现象。这种理论是标度不变的统计场论(statistical field theories),在形式上与标度不变的量子场论非常相似。
- 普适性(universality)是指观察到广泛不同的微观系统可以在相变时表现出相同的行为。因此,许多不同系统中的相变可以用相同的基础标度不变理论来描述。
- 通常,无量纲量(dimensionless quantities)是标度不变的。统计学中类似的概念是标准化矩(standardized moments),它是变量的标度不变统计,而非标准化矩(unstandardized moments)则不是。
标度不变(Scale-invariant)曲线和自相似性(self-similarity)
在数学中,可以考虑函数或曲线 f ( x ) f (x) f(x) 在变量 x x x 重新缩放下的缩放属性。也就是说,人们对某个比例因子 λ \lambda λ 下的 f ( λ x ) f (\lambda x) f(λx) 的形状感兴趣,可以将其视为长度或大小重新缩放。 f ( x ) f(x) f(x) 在所有重新缩放下都不变的要求通常被认为是:
f ( λ x ) = λ Δ f ( x ) f(\lambda x)=\lambda ^{\Delta }f(x) f(λx)=λΔf(x)
其中指数 Δ \Delta Δ 与函数 f ( x ) f(x) f(x) 有关,缩放的系数 λ \lambda λ 是任意的(除了后续的分形外),这相当于 f f f 是次数为 Δ \Delta Δ 的齐次函数。
标度不变函数的例子是单项式 f ( x ) = x n f(x)=x^{n} f(x)=xn, 其中 Δ = n \Delta = n Δ=n,很明显:
f ( λ x ) = ( λ x ) n = λ n f ( x ) f(\lambda x)=(\lambda x)^{n}=\lambda ^{n}f(x) f(λx)=(λx)n=λnf(x)
标度不变曲线的一个例子是对数螺线,这是自然界中经常出现的一种曲线。在极坐标 ( r , θ ) (r, \theta) (r,θ) 中,螺旋可以写为:
θ = 1 b ln ( r / a ) \theta ={\frac {1}{b}}\ln(r/a) θ=b1ln(r/a)
考虑到曲线的旋转,它在所有重新缩放 λ \lambda λ 下都是不变的;也就是说, θ ( λ r ) \theta(\lambda r) θ(λr) 与 θ ( r ) \theta(r) θ(r) 的旋转形式相同。
射影几何
单项式的标度不变性的思想在更高维度上推广到齐次多项式的思想,更一般地推广到齐次函数。齐次函数是射影空间(projective space)的自然存在,齐次多项式在射影几何(projective geometry)中作为射影变体(projective varieties)进行研究。射影几何是一个特别丰富的数学领域。在其最抽象的形式中,格式(schemeshttps://en.wikipedia.org/wiki/Scheme_(mathematics))的几何,它与弦理论中的各种主题都有联系。
分形
有时说分形是标度不变的,但更准确地说,应该说它们是自相似的。分形通常仅对于一组离散值 λ \lambda λ 等于自身,即使这样,也可能必须应用平移和旋转以使分形与自身匹配。
图 自相似的 Koch curve
因此,例如,Koch curve 随 Δ = 1 \Delta = 1 Δ=1 缩放,但缩放仅适用于 n n n 为整数时, λ = 1 3 n \lambda = \frac{1}{3}^{n} λ=31n 值。此外,Koch curve 不仅在原点缩放,而且在某种意义上“无处不在”:沿着曲线可以找到它自己的微型副本。
注意在研究 Koch curve 的自相似中,横坐标和纵坐标都需要放大,两者放大的倍数不同也会影响最终的相似性,在 Koch curve 中横纵坐标都是按照相同倍数(离散的)放大,此时呈现严格的自相似性,以为每个被放大的细节都可充当原始图像的精确副本。但在其他函数曲线中,可能需要横纵坐标放大倍数不同,才能直观看到曲线的自相似性。比如函数曲线 f ( x ) = x 2 f(x)=x^{2} f(x)=x2 中,如果将函数缩放 λ \lambda λ,则 f ( λ x ) = λ 2 x 2 f(\lambda x)=\lambda^{2}x^{2} f(λx)=λ2x2,即横坐标缩放 λ \lambda λ 的时候,纵坐标需要缩放 λ 2 \lambda^{2} λ2,才能保持曲线在缩放的过程中保持不变(自相似),否则曲线就会变形。
注意上述有关自相似的缩放操作,本质上是基于朴实的视觉感受得到的,从这种朴实的视觉角度出发,会更好的理解自相似概念。
一些分形可能同时具有多个比例因子;这种缩放是通过多重分形分析(multi-fractal analysis)研究的。
周期性的外部和内部射线(external and internal rays)是不变曲线。
随机过程中的标度不变性
如果 P ( f ) P(f) P(f) 是频率 f f f 下的平均期望功率,则噪声按比例缩放:
P ( f ) = λ − Δ P ( λ f ) P(f)=\lambda ^{-\Delta }P(\lambda f) P(f)=λ−ΔP(λf)
Δ = 0 \Delta = 0 Δ=0 表示白噪声, Δ = − 1 \Delta = −1 Δ=−1 表示粉红噪声, Δ = − 2 \Delta = −2 Δ=−2 表示布朗噪声(更一般地说,布朗运动)。之所以这样定义,是因为上述几种噪声形式都是幂指数的(或单项式)。
更准确地说,随机系统中的缩放涉及从所有可能的随机构型集(random configurations)中选择特定构型的可能性。这种可能性由概率分布给出。
标度不变分布的示例是 Pareto distribution 和 Zipfian distribution。
标度不变的 Tweedie distribution
Tweedie 分布是指数分散模型(exponential dispersion models)的一个特例,它是一类统计模型,用于描述广义线性模型(generalized linear model)的误差分布,其特点是在加法和再生卷积(reproductive convolution)以及标度变换下具有闭合性。其中包括许多常见的分布:正态分布、泊松分布和伽马分布,以及更不寻常的分布,如 compound Poisson-gamma distribution、positive stable distributions 和 extreme stable distributions。由于其固有的标度不变性,Tweedie 随机变量 Y Y Y 给出方差 var ( Y ) \text{var}(Y) var(Y) 与 E ( Y ) \text{E}(Y) E(Y) 之间的幂律关系:
var ( Y ) = a [ E ( Y ) ] p {\text{var}}\,(Y)=a[{\text{E}}\,(Y)]^{p} var(Y)=a[E(Y)]p
其中 a a a 和 p p p 是正常数。这种方差与均值之间的幂律关系,在物理学文献中称为涨落标度(fluctuation scaling),在生态学文献中称为泰勒定律(Taylor’s law)。
由 Tweedie 分布支配并通过扩展箱的方法评估的随机序列,在方差与均值幂律和幂律自相关之间表现出双条件关系。 Wiener-Khinchin 定理进一步暗示,对于在这些条件下表现出均值幂律方差的任何序列,也将表现出 1/f 噪声。
Tweedie 收敛定理为波动缩放和 1/f 噪声的广泛表现提供了假设解释。 [5] 从本质上讲,它要求任何渐进地表明均值幂律方差的指数分散模型都需要表达一个方差函数,该方差函数位于 Tweedie 模型的吸引力域内。 几乎所有具有有限累积量生成函数的分布函数都符合指数离散模型的条件,并且大多数指数离散模型都表现出这种形式的方差函数。 因此,许多概率分布具有表示这种渐近行为的方差函数,并且 Tweedie 分布成为各种数据类型的收敛焦点。 [4]
就像中心极限定理要求某些类型的随机变量具有作为收敛焦点的高斯分布并表达白噪声一样,Tweedie 收敛定理要求某些非高斯随机变量表达 1/f 噪声和波动尺度。 [4] ]
宇宙学
在物理宇宙学中,宇宙微波背景空间分布的功率谱接近标度不变函数。 虽然在数学中这意味着光谱是幂律,但在宇宙学中术语“尺度不变”表示作为波数 k 函数的原始涨落的振幅 P(k) 近似恒定,即 平坦的光谱。 这种模式与宇宙膨胀的提议是一致的。
普适性(Universality)
在统计力学中,普适性是指观察到一大类系统的属性独立于系统的动态细节。当大量相互作用的部分聚集在一起时,系统在缩放限制中显示出普适性。该术语的现代含义由 Leo Kadanoff 在 1960 年代引入,但该概念的更简单版本已经隐含在范德瓦尔斯方程和较早的朗道相变理论中,后者没有正确地包含缩放。
这个术语在数学的几个领域中逐渐得到更广泛的使用,包括组合学和概率论,只要结构的定量特征(例如渐近行为)可以从定义中出现的几个全局参数推导出来,而不需要了解系统的细节。
重整化群(renormalization group)提供了一种直观的、吸引人的、尽管在数学上并不严格的普适性解释。它将统计场论中的算子分为相关和不相关。相关算子负责扰动自由能,虚时间拉格朗日,这将影响连续极限,并且可以在远距离看到。不相关的算子是那些只改变短距离细节的算子。标度不变统计理论的集合定义了普适类(universality classes),相关算子的有限维系数列表参数化了近临界行为(near-critical behavior)。
统计力学中的普适性
普适性的概念起源于统计力学中相变的研究。当材料以急剧的方式改变其特性时,就会发生相变:水在加热时沸腾并变成蒸汽;或磁铁在加热时会失去磁性。相变的特征在于有序参数,例如密度或磁化强度,其作为系统参数(例如温度)的函数而变化。系统改变其所在相的参数的特殊值是系统的临界点(critical value)。对于表现出普适性的系统,参数越接近其临界值,序参量对系统细节的依赖就越不敏感。
如果参数 β \beta β 在值 β c \beta_{\mathrm{c}} βc 处是临界的,那么序参量 a a a 将很好地近似为:
a = a 0 ∣ β − β c ∣ α {\displaystyle a=a_{0}\left\vert \beta -\beta _{c}\right\vert ^{\alpha }} a=a0∣β−βc∣α
指数 α \alpha α 是系统的临界指数(critical exponent)。二十世纪下半叶的一项非凡发现是,非常不同的系统具有相同的临界指数。
1975 年,Mitchell Feigenbaum 发现了迭代映射的普适性。
例子
普适性之所以得名,是因为它出现在各种各样的物理系统中。普适性的例子包括:
- 成堆的沙子崩塌。雪崩的可能性与雪崩的大小成幂律比例,并且可以看到雪崩发生在所有大小的尺度上。这被称为“自组织临界性(self-organized criticality)”。
- 从钢铁到岩石再到纸张,各种材料中裂纹和撕裂的形成和传播。撕裂方向的变化,或断口表面的粗糙度,与尺寸比例成幂律比例。
- 电介质的电击穿,类似于裂缝和撕裂。
- 流体通过无序介质的逾渗,例如石油通过破裂的岩床,或水通过滤纸,例如在色谱法中。幂律标度将流速与裂缝分布联系起来。
- 分子在溶液中的扩散,以及扩散限制聚集(diffusion-limited aggregation)现象。
- 不同大小的岩石在被摇动的颗粒混合物中的分布(重力作用在岩石上)。
- 在相变点附近,流体中临界乳光的出现。
理论概述
1970 年代和 80 年代材料科学的重要发展之一是认识到统计场论与量子场论类似,可用于提供普适性的微观理论。核心观察是,对于所有不同的系统,相变时的行为都由连续场描述,并且相同的统计场论将描述不同的系统。所有这些系统中的标度指数(scaling exponents)都可以单独从场论中推导出来,被称为临界指数(critical exponents)。
关键的观察是,在相变或临界点附近,所有尺度都会发生扰动,因此人们应该寻找一种明确的标度不变理论来描述这种现象,这似乎首先被置于一个 Pokrovsky 和 Patashinsky 于 1965 年建立的正式理论框架中。普适性是标度不变理论相对较少这一事实的副产品。对于任何一个特定的物理系统,详细描述可能有许多与尺度相关的参数和方面。然而,随着相变的临近,与尺度相关的参数发挥的重要作用越来越小,物理描述的尺度不变部分占主导地位。因此,可以使用简化且通常可精确求解的模型来近似这些系统在临界点附近的行为。
逾渗可以通过随机电阻网络来建模,电流从网络的一侧流到另一侧。网络的总电阻被视为由网络中电阻器的平均连通性来描述。
撕裂和裂纹的形成可以通过随机的电熔丝网络来模拟。随着流经网络的电流增加,一些保险丝可能会爆裂,但总的来说,电流会在问题区域周围分流,并均匀分布。然而,在某个点(在相变时)可能会发生级联故障(cascade failure),其中一个保险丝弹出的过大电流依次使下一个保险丝过载,直到网络的两侧完全断开并且不再有电流流动。
要对此类随机网络系统进行分析,需要考虑所有可能网络的随机空间(即正则系综),并对所有可能的网络构型进行求和(积分)。与前面的讨论一样,每个给定的随机构型都被理解为是从具有某个给定概率分布的所有构型池中抽取的;温度在分布中的作用通常被网络的平均连通性所取代。
算子的期望值,如流速、热容量等,是通过对所有可能的配置进行积分得到的。这种对所有可能构型的积分行为是统计力学和量子场论系统之间的共同点。特别地,重整化群的语言可以应用于随机网络模型的讨论。在 1990 年代和 2000 年代,人们发现了统计模型与共形场论(conformal field theory)之间更紧密的联系。 普遍性研究仍然是一个重要的研究领域。
其他领域的应用
与统计力学中的其他概念(如熵和主方程)一样,普适性已被证明是一种有用的结构,可用于在更高级别表征分布式系统,如多主体系统(multi-agent systems)。该术语已应用于多主体模拟,其中系统表现出的系统级行为,独立于单个主体的复杂程度,几乎完全由管理它们交互的约束的性质驱动。在网络动力学中,普适性指的是尽管非线性动力学模型在许多细节上存在差异,但观察到的许多不同系统的行为都遵循一组普遍规律。这些定律独立于每个系统的具体细节。
普适类(Universality class)
在统计力学中,普适类是重整化群流(renormalization group flow)过程中,共同遵守单一标度不变限制(single scale invariant limit)的数学模型的集合。虽然同一类中的模型在有限尺度上可能存在显著差异,但随着接近限制尺度,它们的行为将变得越来越相似。特别是,临界指数等渐近现象(asymptotic phenomena)对于类中的所有模型都是相同的。
一些经过充分研究的普适性类是在其各自的相变点,包含伊辛模型或渗流理论的类;这些都是类族(families of classes),每个晶格维度一个。通常,一族普适类将具有较低和较高的临界维数(critical dimension):低于较低的临界维数,普适性类变得退化(对于 Ising 模型或定向渗流,该维数为 2 d 2d 2d,但对于无向渗流为 1 d 1d 1d),并且在上临界维度之上,临界指数稳定并且可以通过平均场理论的模拟来计算(对于 Ising 或定向渗流,该维度为 4 d 4d 4d,对于无向渗流,该维度为 6 d 6d 6d)。
临界指数列表
临界指数是根据系统在其相变点附近的某些物理性质的变化来定义的。这些物理特性将包括其降低的温度 τ \tau τ ,测量系统处于“有序”阶段的程度的序参量,比热等。
- 指数 α \alpha α 是比热 C C C 与降低温度之间相关的指数:我们有 C = τ − α C=\tau ^{-\alpha } C=τ−α。比热在临界点通常是奇异的,但 α \alpha α 定义中的减号允许它保持正值。
- 指数 β \beta β 与序参量 Ψ \Psi Ψ 与温度之间的关系有关。与大多数临界指数不同,它被假定为正,因为序参量在临界点通常为零。所以我们有 Ψ = ∣ τ ∣ β \Psi =|\tau |^{\beta } Ψ=∣τ∣β。
- 指数 γ \gamma γ 将温度与系统对外部驱动力或源场(source field)的响应联系起来。我们有 d Ψ / d J = τ − γ \mathrm{d}\Psi /\mathrm{d}J=\tau ^{-\gamma } dΨ/dJ=τ−γ,其中 J J J 为驱动力。
- 指数 δ \delta δ 将序参量与临界温度下的源场相关联,此时该关系变为非线性。我们有 J = Ψ δ J=\Psi ^{\delta } J=Ψδ(因此 Ψ = J 1 / δ \Psi =J^{1/\delta } Ψ=J1/δ), 含义同上。
- 指数 ν \nu ν 将相关性的大小(即有序相的斑块(patches of the ordered phase))与温度相关联;远离临界点,这些以相关长度(correlation length) ξ \xi ξ 为特征。 我们有 ξ = τ − ν \xi =\tau ^{-\nu } ξ=τ−ν。
- 指数 η \eta η 测量临界温度下相关性的大小。它被定义为相关函数(correlation function)缩放为 r − d + 2 − η r^{-d+2-\eta } r−d+2−η。
- 指数 σ \sigma σ 用于渗流理论,测量在低于临界点的“温度”(连接概率)下最大集团(粗略地说,最大有序块)的大小。 所以 s m a x ∼ ( p c − p ) − 1 / σ s_{\mathrm{max}}\sim (p_{c}-p)^{-1/\sigma } smax∼(pc−p)−1/σ。
- 指数 τ \tau τ 也来自渗流理论,测量大小为 s s s 的集团的数量,其大小远离 s m a x s_{\mathrm{max}} smax(或处于临界状态的集团数): n s ∼ s − τ f ( s / s m a x ) n_{s}\sim s^{-\tau }f(s/s_{\mathrm{max}}) ns∼s−τf(s/smax),其中 f f f 因子在临界概率下被移除。
对于对称性,列出的群给出了序参量的对称性。群 D i h n Dih_{n} Dihn 是二面体群(dihedral group), n n n 多边形的对称群, S n S_{n} Sn 为 n n n 元对称群, O c t Oct Oct 为八面体群, O ( n ) O(n) O(n) 为 n n n 维正交群。1 是平凡群。
图 临界指数列表
无标度网络(Scale-free network)
wiki: Scale-free network
- 参考文献
wiki: Scale invariance
wiki: Scale-free network
百度百科: 标度
wiki: Universality (dynamical systems)
wiki: Universality class