遗传算法

news2026/2/8 2:49:37

遗传算法概念

遗传算法的概念是在 1975 年由密切根大学的 J.Holland 提出的，这是一种通过模拟自然进化过程寻找最优解的方法。它遵循达尔文的物竞天择，适者生存的进化准则。基本思想：

初始一个种群，选择种群中适应度高的个体进行交叉变异。然后再将适应度低的个体淘汰，留下适应度高的个体进行繁殖，这样不断的进化，最终留下的都是优秀的个体。

基因和染色体

在遗传算法中，我们首先需要将要解决的问题映射成一个数学问题，也就是所谓的数学建模，那么这个问题的一个可行解即被称为一条染色体或个体。如：

3x+4y+5z<100

[1,2,3]，[2,3,4]，[3,2,1]均为这个函数的可行解，这些可行解在遗传算法中均被称为染色体，每一个元素就被称为染色体上的一个基因。

染色体编码与解码

遗传算法的运算对象是表示染色体的符号串，所以必须把变量 x，y，z 编码为一种符号串。常见的编码方式如用无符号二进制整数来表示。解码即将二进制整数转换回最初的表现型。

编码： 5 --> 0101。

解码： 0101 --> 5。

初始群体的产生

遗传算法是对群体进行的进化操作，需要给其准备一些表示起始搜索点的初始群体数据。假如群体规模的大小取为 4，即群体由 4 个染色体组成，每个染色体可通过随机方法产生。

如： 011101 ， 101011 ， 011100 ， 111001。

物竞天择

适应度函数：遗传算法中以染色体适应度的大小来评定各个染色体的优劣程度，从而决定其遗传机会的大小。

选择函数：自然界中，越适应的个体就越有可能繁殖后代。但是也不能说适应度越高的就肯定后代越多，只能是从概率上来说更多。常用的选择方法有轮盘赌选择法。

若 $f_i$ 表示每个染色体的适应度，则每个个体遗传下来的概率为：

$p(i)=\frac{f_i}{\sum_i{f_i}}$

由公式可以看出，适应度越高，则遗传下来的概率就越大，好比赌轮盘，轮盘上所占面积越大，则被小球滚到的概率就越大。

交叉与变异

交叉是遗传算法中产生新的个体的主要操作过程，以一定的概率决定个体间是否进行交叉操作。

如上图为父辈染色体进过交叉后产生新的染色体的过程。

变异为另一种产生新个体的操作，它可以为种群带来多样性：

也就是将我的染色体中的基因，随机的由0变成1，或1变成0。

遗传算法流程

初始化种群
计算适应度
选择适应度高的个体
通过交叉变异选择新的染色体
终止进化

使用python实现遗传算法。

本关任务是使用遗传算法求解目标函数最大值，首先需要随机产生很多个解，即初始化种群，代码如下：

#初始化种群
pop = np.random.randint(2, size=(POP_SIZE, DNA_SIZE)) 
# Size函数需要传入两个参数 POP_SIZE为解的个数，即染色体个数。DNA_SIZE为染色体长度

其中POP_SIZE为解的个数，即染色体个数。DNA_SIZE为染色体长度。

由于染色体为二进制编码，所以还需要将二进制转换为浮点数的解码方法：

#解码
def translateDNA(pop): 
    return pop.dot(2 ** np.arange(DNA_SIZE)[::-1]) / float(2**DNA_SIZE-1) * X_BOUND[1]

上述代码中： pop.dot(2 ** np.arange(DNA_SIZE)[ : : -1])已经转换成十进制但是需要归一化到 0~5 ，如有 1111 这么长的 DNA,要产生的十进制数范围是 [0, 15] ，而所需范围是 [-1, 1] ，就将 [0,15] 缩放到 [-1,1] 这个范围。

a[ : : -1]相当于a[-1:-len(a)-1:-1]，也就是从最后一个元素到第一个元素复制一遍。所以你看到一个倒序，np.arange(DNA_SIZE)[ : : -1]得到 10,9,8,...,0 。

如将 10101 转换到 0 到 5 之间：

$x=\frac{2^4+2^2+2+0}{2^5-1}\times 5$

然后计算每个染色体的适应度，由于是求解最大值，函数值越大则越应该被选择，所以，将每个染色体对应的函数值减去最小值作为适应度：

#获取染色体适应度
def get_fitness(pred): 
    return pred + 1e-3 - np.min(pred)

再选择适应度高的染色体：

#选择适应度高的染色体
def select(pop, fitness):    
    idx = np.random.choice(np.arange(POP_SIZE), size=POP_SIZE, replace=True,
                           p=fitness/fitness.sum())
    return pop[idx]

再对染色体进行交叉变异操作：

#交叉
def crossover(parent, pop):     
    if np.random.rand() < CROSS_RATE:
        i_ = np.random.randint(0, POP_SIZE, size=1)                             
        cross_points = np.random.randint(0, 2, size=DNA_SIZE).astype(np.bool)   
        parent[cross_points] = pop[i_, cross_points]                            
    return parent
#变异
def mutate(child):
    for point in range(DNA_SIZE):
        if np.random.rand() < MUTATION_RATE:
            child[point] = 1 if child[point] == 0 else 0
    return child

总流程如下：

def F(x): return np.sin(10*x)*x + np.cos(2*x)*x
def ga(F):
    '''
    F:需要求解的函数
    '''
    #初始化种群
    pop = np.random.randint(2, size=(POP_SIZE, DNA_SIZE))
    #开始进化
    for _ in range(N_GENERATIONS):
        #计算函数值
        F_values = F(translateDNA(pop))
        #计算适应度
        fitness = get_fitness(F_values)
        #选择适应度高的个体
        pop = select(pop, fitness)
        pop_copy = pop.copy()
        #通过交叉变异选择新的染色体
        for parent in pop:
            #交叉产生子代
            child = crossover(parent, pop_copy)
            #变异产生子代
            child = mutate(child)
            #子代代替父代
            parent[:] = child
    #获取最优解
    x = translateDNA(pop)[-1]
    return x

其中：

N_GENERATIONS为进化轮数。
CROSS_RATE为交叉概率。
MUTATION_RATE 为变异概率。
X_BOUND 为函数定义域。

具体例子

实现遗传算法。并求解函数f(x)在区间 [0,5] 上的最大值:

$f(x)=xsin(10x)+xcos(2x)$

函数图像如下：

#encoding=utf8
import numpy as np
DNA_SIZE = 10   
POP_SIZE = 100         
CROSS_RATE = 0.8         
MUTATION_RATE = 0.003    
N_GENERATIONS = 500
X_BOUND = [0, 5] 
#获取染色体适应度
def get_fitness(pred): 
    return pred + 1e-3 - np.min(pred)
#解码
def translateDNA(pop): 
    return pop.dot(2 ** np.arange(DNA_SIZE)[::-1]) / float(2**DNA_SIZE-1) * X_BOUND[1]
#选择适应度高的染色体
def select(pop, fitness):    
    idx = np.random.choice(np.arange(POP_SIZE), size=POP_SIZE, replace=True,
                           p=fitness/fitness.sum())
    return pop[idx]
#交叉
def crossover(parent, pop):     
    if np.random.rand() < CROSS_RATE:
        i_ = np.random.randint(0, POP_SIZE, size=1)                             
        cross_points = np.random.randint(0, 2, size=DNA_SIZE).astype(np.bool)   
        parent[cross_points] = pop[i_, cross_points]                            
    return parent
#变异
def mutate(child):
    for point in range(DNA_SIZE):
        if np.random.rand() < MUTATION_RATE:
            child[point] = 1 if child[point] == 0 else 0
    return child
def ga(F):
    '''
    F:需要求解的函数
    x:最优解
    '''
    #初始化种群
     # 初始化种群（随机生成二进制染色体）
    pop = np.random.randint(2, size=(POP_SIZE, DNA_SIZE))
    #开始进化
    for _ in range(N_GENERATIONS):
        #计算函数值
        F_values = F(translateDNA(pop))
        #计算适应度
        fitness = get_fitness(F_values)
        #选择适应度高的个体
        pop = select(pop, fitness)
        pop_copy = pop.copy()
        #通过交叉变异选择新的染色体
        for parent in pop:
            #交叉产生子代
            child = crossover(parent, pop_copy)
            #变异产生子代
            child = mutate(child)
            #子代代替父代
            parent[:] = child
    #获取最优解
    x = translateDNA(pop)[-1]
    return x

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1531392.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！