NSGA-II:快速精英多目标遗传算法(论文+代码解读)

news2025/1/2 0:30:53

目录

1.介绍

2. NSGA-II

2.1 快速非支配排序

2.1.1 NSGA的传统非支配排序

2.1.2 NSGA-II的快速非支配排序

2.2 多样性保护(Diversity Preservation)

2.2.1 NSGA的共享函数方法(sharing function)

2.2.2  NSGA-II的拥挤距离方法(crowded-comparison)

2.3 NSGA-II主循环

3. 代码实现

3.1 第三方库

3.2 自定义


NSGA提出原文 Muiltiobjective Optimization Using Nondominated Sorting in Genetic Algorithms | MIT Press Journals & Magazine | IEEE Xplore

Srinivas, N., & Deb, K. (1994). Muiltiobjective Optimization Using Nondominated Sorting in Genetic Algorithms. Evolutionary Computation, 2(3), 221-248. doi:10.1162/evco.1994.2.3.221 

NSGA-II提出原文 A fast and elitist multiobjective genetic algorithm: NSGA-II

Deb, K., Pratap, A., Agarwal, S., & Meyarivan, T. A. M. T. (2002). A fast and elitist multiobjective genetic algorithm: NSGA-II. IEEE transactions on evolutionary computation6(2), 182-197. 

NSGA-II作者实验室:Kalyanmoy Deb, Koenig Endowed Chair Professor 

pymoo库:实验室创建的python第三方库,实现了各种多目标优化算法pymoo: Multi-objective Optimization in Python 

geatpy2库:Geatpy是一个高性能实用型进化算法工具箱,提供许多已实现的进化算法中各项重要操作的库函数​​​​​​​,利用“定义问题类 + 调用算法模板”的模式来进行进化优化,可用于求解单目标优化、多目标优化、复杂约束优化、组合优化、混合编码进化优化等 Geatpy

1.介绍

针对多目标优化问题,可以用一些多目标进化算法(multiobjective evolutionary algorithms (MOEAs))找到多个帕累托最优解(Pareto-optimal),比如非支配排序基因算法(nondominated sorting genetic algorithm (NSGA))。但是NSGA有以下问题

  • 非支配排序时间复杂度太高,为O(MN^{3}),其中M为多目标数,N为种群数
  • 缺少精英保留策略(elitism),研究表明精英策略能提高GA的性能
  • 需要指定共享参数(share parameter)来确保种群多样性

基于上述背景,文章提出NSGA改进版本——NSGA-II,NSGA-II有三个重点的改进:快速非支配排序(fast nondominated sorting),精英保留策略(elitist-preserving),无参数的小生境算子(parameterless niching operator)。文章内容如下:

  1. 重点介绍NSGA-II的改进和流程
  2. 将NSGA-II和其它两种带精英策略的MOEAs比较,Pareto-archived evolution strategy (PAES)和strength- Pareto EA (SPEA),证明NSGA-II在解质量和收敛性表现更好
  3. 强调参数相互作用(parameter interactions)的问题
  4. 扩展NSGA-II处理带约束问题(constraint-handling strategy with NSGA-II)

2. NSGA-II

2.1 快速非支配排序

先明白支配解,非支配解,帕累托前沿(Pareto front)的概念,假设任何二解S1 及S2 对所有目标而言,S1均优于S2,则我们称S1 支配(dominate)S2,若S1 的解没有被其他解所支配,则S1 称为非支配解(不受支配解nondominated),也称Pareto解。这些非支配解的集合即所谓的帕累托前沿(Pareto front)。非支配排序就是将种群分成多个不同水平的帕累托前沿。

2.1.1 NSGA的传统非支配排序

在传统方法中,为了在大小为N的种群中获得第一个非支配前沿,对于每一个解,都需要将其和种群中的其它解比较所有目标值,确定该解是否被支配,因此对每个解时间复杂度为O(MN),那么遍历完所有解找到种群中的第一层非支配集合,时间复杂度为O(MN^{2})。在找到第一个非支配前沿后,这些解就会移除,在剩下的解中继续重复上述操作,找到接下来所有层的非支配前沿。这种排序方法最坏的情况是,有N个前沿,每个前沿只有一个解,意味着上述操作重复了N词,总时间复杂度为O(MN^{3}),空间复杂度为O(N)

2.1.2 NSGA-II的快速非支配排序

NSGA-II中提出的的快速非支配排序将总时间复杂度降到了O(MN^{2}),空间复杂度为O(N^{2})

首先,遍历种群中的所有解,对于每个解,计算两个变量值

  • 支配数n_p:支配解p的解数量
  • 被支配集合S_{p}:解p支配的解集合

如果n_p=0,那么解p在第一层非支配前沿,通过上述操作,找到每个解的支配数和被支配集合以及第一层非支配前沿,时间复杂度为O(MN^{2})

接下来,对于每个支配数为0的的解p,遍历其p的支配集合中的每个成员q,q的支配数减少1,如果出现任何q支配数变成了0,则将其放入单独的列表Q中,Q中的成员便是第二层非支配前沿,对于Q中的每个成员重复上述操作找到第三层。重复以上过程直到所有的解已经排序结束。这样排序实际上是两层循环,外循环遍历最新的非支配前沿,内循环遍历非支配前沿中每个成员的支配集合。由于每个解只能在一层非支配前沿里,因此外循环最多N次,而支配集合最多有N-1个成员,内循环最多N-1次,因此时间复杂度为O(N^{2})。也可以换一种思路理解,支配数最大为N-1,即对于每个解,到其支配数减少0最多遍历到N-1次,所有解的支配数减到0需要O(N^{2})。下面为快速非支配排序的算法流程。

2.2 多样性保护(Diversity Preservation)

2.2.1 NSGA的共享函数方法(sharing function)

在NSGA中,与普通的GA相比,交叉和变异操作相同,区别在于选择操作。首先按照传统非支配排序的方法获得种群的第一非支配前沿(first nondominated front),给第一非支配前沿中的每个个体分配一个相同的大的虚拟适应值(dummy fitness value),也就是最初第一非支配前沿的每个个体选择的可能性相同。接下来为了保留每层前沿解的多样性,使用共享函数方法(sharing function)得到每个解的共享适应值(shared fitness value)。共享函数如下,其中d_{ij}是当前前沿中任何两个个体的表型距离(phenotypic distance),\sigma _{share}为需要设置的共享参数。定义一个变量niche count,niche count为当前前沿所有个体的共享函数值和,最后对于每个解,其共享适应值=虚拟适应值 / niche count。个人通俗理解,同一层的解之间会有相似度,对于每个解,如果与它相似的解很多,那么就降低这个解的适应值,减小它被选择的概率,而同一个生态圈的解数越多,其选择概率越小,但是保留这个生态圈里的解的整体期望还是不变,也维持了解的多样性

2.2.2  NSGA-II的拥挤距离方法(crowded-comparison)

共享函数方法有两个问题

  • 用共享函数维持解的分布的性能很大程度取决于参数\sigma _{share}
  • 每个解都需要和其它所有解比较,共享函数的时间复杂度为O(N^{2})

NSGA-II用拥挤度比较的方法代替共享函数来保持种群的多样性,不仅无参数,还减小了时间复杂度,首先定义一个密度估计度量(density-estimation metric),然后描述拥挤度比较算法

(1)密度估计(density-estimation)

为了估计种群中某个解被其他解包围的密度,引入拥挤距离(crowding distance)i_{distance}​​​​​​​这个概念。计算拥挤距离,先对每一个等级的非支配解集合,按照每个目标函数值的大小升序排列。因此对每个目标函数,都能找到边界解(目标值最大最小的解),设置边界解的距离值为无穷大。每个解的拥挤距离为每个目标函数下的距离值之和,求和前先对距离值进行归一化处理,算法流程如下:\pounds [i].m代表非支配前沿\pounds中第i个解的第m个目标函数值,f_{m}^{max}f_{m}^{min}为第m个目标函数的最大值和最小值。分析时间复杂度:首先排序算法需要logn,外层循环M次,内层循环最多N次,因此总的时间复杂度为O(MNlogN)

从几何角度理解拥挤距离,以两个目标函数为例,下图中黑点和白点分别为两个非支配前沿,对于解i,从与i在同一非支配前沿中选择与解i最相近的两个点i-1和i+1为顶点组成一个长方形(cuboid),拥挤距离即为长方形周长。

 (2)拥挤度比较算子(Crowded-Comparison Operator) 

在计算完每个解的拥挤距离后,从一定程度上来说,某个解的拥挤距离越小,这个解被其他解拥挤的程度越高。接下来通过拥挤度比较算子来选择解实现更广的帕累托最优解分布。种群中的每个个体都有两个属性:

  • 非支配等级i_{rank}:1是最高等级
  • 拥挤距离i_{distance}

定义一个比较顺序\prec _{n},满足一下判断条件。对于不同非支配等级的两个解,倾向于选择rank值更低的解,如果两个解的等级相同,倾向于选择拥挤距离更大或者说拥挤区域更小的解。

​​​​​​​ 

综上,有三个创新点,一个快速非支配排序方法,一个快速估计拥挤距离的方法,一个简单的拥挤度比较算子,接下来描述NSGA-II的主循环。

2.3 NSGA-II主循环

先明确以下概念

  • elitism:精英保留策略,核心思想是把群体在进化过程中迄今出现的最好个体不进行遗传操作而直接复制到下一代中,理论上证明了具有精英保留的标准遗传算法是全局收敛的
  • tournament selection:联赛选择算法,每次从种群中取一定数量(n)的个体(放回抽样),选择其中适应度较好的进入子代种群

随机生成初始种群P(0),基于非支配排序P(0),每个解都赋予一个适应值与其前沿等级相同(1是最好的,2其次....),假设问题是要最小化。起初使用联赛选择,重组和变异获得一个子代Q(0),NSGA-II使用了精英选择策略,因此后面迭代过程会不同。假设现在是第t代种群,下面一步步描述结合了精英选择,快速非支配排序,拥挤距离等方法的NSGA-II算法过程。

首先生成一个基于P(t)和Q(t)得到的组合种群R(t),R(t)大小为2N,N为种群大小。对R(t)执行快速非支配排序,属于R(t)的第一非支配前沿F1中的解是当前最好的解,因此要重点选择。如果F1长度小于N,那么选择F1添加到新一代种群P(t+1)中,同样操作在F2,F3....,直到P(t+1)剩余解数量不足以再合并一个完整的非支配前沿。假设F(i)是最后一个无法容纳的非支配前沿,按照拥挤距离给F(i)中的元素降序排列,选择排序后靠前的元素添加到P(t+1)中直到P(t+1)大小为N。对P(t+1)执行选择,交叉,变异生成新种群Q(t+1),此处的选择虽然也是联赛选择方法,但是选择标准是基于拥挤度比较算子。这个算子需要每个解的等级和拥挤距离,因此在组成种群P(t+1)的时候就可以计算这两个属性。P(t+1)是从大小为2N的R(t)中按照前沿等级和拥挤距离生成的大小为N的种群,而R(t)包含了所有之前和现在的种群成员,确保了精英选择策略。算法流程如下图

 分析整个过程的时间复杂度如下, NSGA-II的整体时间复杂度为O(MN^{2}) 。实际上在对R(t)做快速非支配排序时,并不需要多整个种群排序,只需找到N个解即可。使用拥挤距离选择下一代也避免了人工参数的设置。

  • 快速非支配排序:O(MN^{2})
  • 拥挤距离计算:O(MNlogN)
  • \prec _{n}的排序:O(NlogN)

3. 代码实现

3.1 第三方库

pymoo库了提供最先进的单目标和多目标优化算法,以及与多目标优化相关的更多功能,例如可视化和决策制定。比如用NSGA-II解决一个二元决策问题,示例代码如下

from pymoo.algorithms.moo.nsga2 import NSGA2
from pymoo.problems import get_problem
from pymoo.operators.crossover.pntx import TwoPointCrossover
from pymoo.operators.mutation.bitflip import BitflipMutation
from pymoo.operators.sampling.rnd import BinaryRandomSampling
from pymoo.optimize import minimize
from pymoo.visualization.scatter import Scatter

problem = get_problem("zdt5")

algorithm = NSGA2(pop_size=100,
                  sampling=BinaryRandomSampling(),
                  crossover=TwoPointCrossover(),
                  mutation=BitflipMutation(),
                  eliminate_duplicates=True)

res = minimize(problem,
               algorithm,
               ('n_gen', 500),
               seed=1,
               verbose=False)

Scatter().add(res.F).show()

 和pymmo相比,geatpy2支持自定义问题,提供模块化的算法框架,示例代码如下

import geatpy as ea
import numpy as np

# 构建问题
r = 1  # 目标函数需要用到的额外数据
@ea.Problem.single
def evalVars(Vars):  # 定义目标函数(含约束)
    f = np.sum((Vars - r) ** 2)  # 计算目标函数值
    x1 = Vars[0]
    x2 = Vars[1]
    CV = np.array([(x1 - 0.5)**2 - 0.25,
                    (x2 - 1)**2 - 1])  # 计算违反约束程度
    return f, CV

problem = ea.Problem(name='soea quick start demo',
                        M=1,  # 目标维数
                        maxormins=[1],  # 目标最小最大化标记列表,1:最小化该目标;-1:最大化该目标
                        Dim=5,  # 决策变量维数
                        varTypes=[0, 0, 1, 1, 1],  # 决策变量的类型列表,0:实数;1:整数
                        lb=[-1, 1, 2, 1, 0],  # 决策变量下界
                        ub=[1, 4, 5, 2, 1],  # 决策变量上界
                        evalVars=evalVars)
# 构建算法
algorithm = ea.soea_SEGA_templet(problem,
                                    ea.Population(Encoding='RI', NIND=20),
                                    MAXGEN=50,  # 最大进化代数。
                                    logTras=1,  # 表示每隔多少代记录一次日志信息,0表示不记录。
                                    trappedValue=1e-6,  # 单目标优化陷入停滞的判断阈值。
                                    maxTrappedCount=10)  # 进化停滞计数器最大上限值。
# 求解
res = ea.optimize(algorithm, seed=1, verbose=True, drawing=1, outputMsg=True, drawLog=False, saveFlag=Tr

关于第三方库的内容可自行查阅官方网站

3.2 自定义

按照前面的算法流程分别实现快速非支配排序模块和拥挤距离计算模块

(1)快速非支配排序模块

"""
两个目标函数为例
输入:种群每个解的两个目标函数值
输入:所有非支配前沿
"""
def fast_non_dominated_sort(values1, values2):
    size = len(values1)  # 种群大小
    s = [[] for _ in range(size)]  # 每个解的被支配集合
    n = [0 for _ in range(size)]  # 每个解的支配数
    rank = [0 for _ in range(size)]  # 每个解的等级
    fronts = [[]]  # 所有非支配前沿

    for p in range(size):  # 遍历所有解
        s[p] = []  # 初始化非支配集合和支配数
        n[p] = 0
        for q in range(size):  # 判断p和q支配情况
            # 如果p支配q,增加q到p的被支配集合
            if values1[p] >= values1[q] and values2[p] >= values2[q] \
                    and ((values1[q] == values1[p]) + (values2[p] == values2[q])) != 2:
                s[p].append(q)
            # 如果q支配p,p的支配数+1
            elif values1[q] >= values1[p] and values2[q] >= values2[p] \
                    and ((values1[q] == values1[p]) + (values2[p] == values2[q])) != 2:
                n[p] += 1
        # n[p]=0的解等级设为0,增加到第一前沿
        if n[p] == 0:
            rank[p] = 0
            fronts[0].append(p)
    # 依次确定其它层非支配前沿
    i = 0
    while fronts[i]:
        Q = []
        for p in fronts[i]:
            for q in s[p]:
                n[q] = n[q] - 1
                if n[q] == 0:
                    rank[q] = i + 1
                    if q not in Q:
                        Q.append(q)
        i = i + 1
        fronts.append(Q)

    del fronts[-1]
    return fronts

(2)拥挤距离计算模块

"""
输入:所有解所有目标的函数值,要计算的前沿,目标数
输出:输入前沿每个解的拥挤距离
"""
def crowed_distance_assignment(total_values, front, objective):
    length = len(front)
    distance = [0 for i in range(length)]
    for i in range(objective):
        value = total_values[i]
        sorted_front = sorted(front, key=lambda x: x in value)
        distance[0] = distance[-1] = np.inf
        for k in range(1, length - 1):
            distance[k] = distance[k] + (value[sorted_front[k+1]] - value[sorted_front[k-1]]) / (max(value) - min(value))
    return distance

完整代码待更新

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/134948.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

4类时钟分频【附源码】1.偶数分频;2.奇数分频(占空比50%);3.奇数分频(任意无占空比);4.小数分频;

题目来源于牛客网,完整工程源码:https://github.com/ningbo99128/verilog 目录 VL37 偶数分频 VL40 奇数分频(占空比50%) VL42 奇数分频(任意无占空比) VL41 任意小数分频 VL37 偶数分频 题目介绍 请…

【阶段二】Python数据分析NumPy工具使用04篇:数组常用分析函数、数组广播与数组和矩阵的点积运算

本篇的思维导图: 数组常用分析函数 基本数学函数 函数 描述 abs 求取每个元素的绝对值

1-计算机系统概述

文章目录一.操作系统的基本概念(一)操作系统的特征(二)操作系统的目标和功能二.操作系统的发展与分类(一)手工操作阶段(二)批处理阶段(三)分时操作系统&#…

verilog学习笔记- 1)Quartus软件的使用

目录 新建工程: 设计输入: 配置工程: 编译 : 分配引脚: 编译工程: 下载程序: 固化程序 : 在开始使用 Quartus 软件之前,我们先来了解一下 Quartus 软件的使用流程…

Windows10 下的docker和Kubernetes安装

Docker官网Docker Desktop 安装 Docker官网 进入docker官网,下载windows版 docker desktop建议使用win10专业版在任务管理器查看是否开启了windows虚拟化如果没有开启,则在控制面板,启用或关闭windows功能,勾选Hyper-v&#xff…

面向对象1(类的成员变量的默认值规则、private、this、构造方法、基本数据类型和引用数据类型)

1、定义类的注意事项 类的成员变量的默认值规则 2、private 3、this关键字 语法是this. 4、构造方法 先Constructor生成构造方法,select无参构造,Ctrla全参构造 再Getter and Setter生成每个成员变量的getter 和 setter方法 也可以使用插件右键Ptg To …

java开发的美食菜谱网

简介 Java开发美食菜谱分享网站,健康专题分享,菜谱网源码。用户可以发布菜谱,可以评论,可以发布关于健康饮食的文章,还可以查看自己的主页。管理员可以管理所有的数据,审核数据。 演示视频 https://www.b…

ROS机器人底盘坐标像素变换

对于ROS小车底盘地图数据需要知道的点 1.整幅地图处于第三象限 2.坐标值代表距离,单位米。 3.分辨率单位(米/像素) 因此通过地图坐标得到像素坐标的办法: 像素坐标(实时坐标-初始坐标)/分辨率 实时坐标的获取: 触发条…

20230102单独编译Toybrick的TB-RK3588X开发板的Android12的内核【失败】

20230102单独编译Toybrick的TB-RK3588X开发板的Android12的内核【失败】 现阶段已经验证通过的编译指令: 直接使用build.sh编译了。 rootrootrootroot-adol-ADOLBOOK-I421UAY-ADOL14UA:~/toybrick3588_discrete$ source build/envsetup.sh rootrootrootroot-adol-A…

windows下编译opencv_contrib

文章目录基本环境二. 准备1. 下载所需各软件的安装文件2. 安装所需软件三.编译opencv步骤基本环境 cmaker:3.22.0vs2019:16.11.10CUDA:11.4.1cudnn:8.2.4opencv_source:4.5.4opencv_contrib:4.5.4python&a…

给程序员友人,2022投资总结的6000字评论

程序员友人的2022投资总结 以下是我的评论、回复。 友情提示:不好意思,长篇大论了,先长篇铺垫,再到正题。 下午说道:以我的最新投资原则方法,对你的持股情况,略显忧虑。 “一直放心不下”&#…

Ubuntu 18.04使用CMake编译可执行文件、动态链接库

目录准备新建文件编辑源文件编译生成可执行文件编译生成动态链接库准备 新建文件 在开始之前,我们先准备一个项目所需要的基本结构。 新建一个项目的文件夹test_so在项目文件夹中新建一个src文件夹存放源代码(并新建一个test.cpp文件)&…

基于 Prometheus 的监控平台简介

1. Prometheus 体系架构简介 Prometheus 是 CNCF 基金会的一款开源产品,主要用做监控系统,通常用来和 Zabbix 等监控系统做比较,以其简单易用、架构灵活著称。整个 Prometheus 的架构如上,分为几个重要的部分: 指标收…

Kubernetes:Ingress

文章目录1、安装 Ingress 控制器2、Ingress 扇出3、基于名称的虚拟托管4、Ingress TLSIngress 是一组路由规则,公开从集群外部到集群内服务的 HTTP 和 HTTPS 路由。 Ingress 控制器是一组 pod,负责通过负载均衡器来解析 Ingress 路由规则,将请…

序列到序列学习(seq2seq,BLEU)

根据“编码器-解码器”架构的设计, 我们可以使用两个循环神经网络来设计一个序列到序列学习的模型。 在实现编码器和解码器时,我们可以使用多层循环神经网络。 我们可以使用遮蔽来过滤不相关的计算,例如在计算损失时。 在“编码器&#xf…

crackme01——Acid_burn

最近对逆向稍微有点兴趣,自学了一点。写这个文章主要用于记录学习的过程。 首先看一下这个程序,其实就是个简单的比对程序,主界面按左侧按钮进入Name Serial界面,点击【Check it Baby】,则弹出窗口【Sorry, The seria…

[Java]JDBC学习笔记(尚硅谷康师傅JDBC)

文章目录🥽 视频链接及资源下载🥽 JDBC简介🥽 JDBC程序访问数据库步骤🥽 获取数据库连接🌊 导入jar包🌊 Driver 接口🌊 JDBC URL🌊 方式1:🌊 方式2&#xff1…

educoder数据结构与算法 线性表 第2关:实现一个链接存储的线性表

本文已收录于专栏 🌲《educoder数据结构与算法_大耳朵宋宋的博客-CSDN博客》🌲 目录 本文已收录于专栏 🌲《educoder数据结构与算法_大耳朵宋宋的博客-CSDN博客》🌲 🍐任务描述🍐 🍐相关知识…

Java基础学习笔记(九)—— 常用API(2)

常用API1 Math类2 system类3 Object类3.1 概述3.2 常用方法3.3 常见面试题4 Objects类5 BigDecimal类5.1 构造方法5.2 常用方法6 时间日期类6.1 Date类6.2 SimpleDateFormat类6.3 JDK8新增日期类1 Math类 Math 包含执行基本数字运算的方法 Math中方法的调用方式:M…

Markdown 使用语法(详细)

想要学习Markdown,这篇文章就够了。 Markdow简介 Markdown 是一种轻量级标记语言,创始人为约翰格鲁伯(John Gruber)。 它允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的 XHTML(或者HTML&…