遗传算法Github初学

news2024/9/23 23:26:25

遗传算法的理论是根据达尔文进化论而设计出来的算法:人类是朝着好的方向(最优解)进化,进化过程中,会自动选择优良基因,淘汰劣等基因

遗传算法(genetic algorithm——GA)是计算数学中用于解决最佳化的搜索算法,是进化算法的一种。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择、杂交等。

搜索算法的共同特征为:

  1. 首先组成一组候选解
  2. 依据某些适应性条件测算这些候选解的适应度(指个体在种群生存的优势程度度量)
  3. 根据适应度保留某些候选解,放弃其他候选解
  4. 对保留的候选解进行某些操作,生成新的候选解

遗传算法的一般步骤:

  1. my_fitness函数评估每条染色体所对应个体的适应度
  2. 升序排列适应度评估值,选出前parent_number个 个体作为待选parent种群(适应度函数的值越小越好)
  3. 待选parent种群中随机选择2个个体作为父方和母方
  4. 抽取父母双方的染色体,进行交叉,产生2个子代。(交叉概率)
  5. 对子代(parent + 生成的 child)的染色体进行变异(变异概率)
  6. 重复3,4,5步骤,直到新种群(parent_number + child_number)的产生

循环以上步骤直至找到满意的解

交叉概率:两个个体进行交配的概率。例如,交配概率为0.8,则80%的“夫妻”会生育后代。

变异概率:所有的基因中发生变异的占总体的比例。

适应度函数

        适应度函数由解决的问题决定。举一个平方和的例子。

求函数的最小值,其中每个变量的取值区间都是[-1, 1]。问题的最优解:每个x_i 都等于0。

function y = my_fitness(population)
% population是随机数[0,1]矩阵,下面的操作改变范围为[-1,1]
population = 2 * (population - 0.5); 
y = sum(population.^2, 2); % 行的平方和

 适应度函数 my_fitness 的目的是计算一个给定种群(population)中每个个体(individual)的适应度度值,适应度函数是根据个体的特性(在这个案例中是个体的各个维度值)来评估个体在问题域中表现的好坏。

改变范围是为了让个体的特征值落在特定的区间内,这样可以使得不同个体之间比较更加公平,并且有助于算法收敛。行的平方和即每个个体的特征值平方和,适应度值越小说明这个个体越接近于问题的解。

GA函数
function [best_fitness, elite, generation, last_generation] = my_ga( ...
    number_of_variables, ...    % 求解问题的参数个数 也就是每个个体有多少个特征值
    fitness_function, ...       % 自定义适应度函数名
    population_size, ...        % 种群规模(每一代个体数目)
    parent_number, ...          % 每一代中保持不变的数目(除了变异)
    mutation_rate, ...          % 变异概率
    maximal_generation, ...     % 最大演化代数 即算法运行的最大迭代次数
    minimal_cost ...            % 最小目标值(函数值越小,则适应度越高)
                                % 当某一代中的最佳适应度值小于或等于这个值时,算法提前终止 
)

% 累加概率
% 假设 parent_number = 10
% 分子 parent_number:-1:1 用于生成一个数列
% 分母 sum(parent_number:-1:1) 是一个求和结果(一个数)
%
% 分子 10     9     8     7     6     5     4     3     2     1
% 分母 55
% 相除 0.1818    0.1636    0.1455    0.1273    0.1091    0.0909    0.0727    0.0545    0.0364    0.0182
% 累加 0.1818    0.3455    0.4909    0.6182    0.7273    0.8182    0.8909    0.9455    0.9818    1.0000
%
% 运算结果可以看出
% 累加概率函数是一个从0到1增长得越来越慢的函数
% 因为后面加的概率越来越小(数列是降虚排列的)
cumulative_probabilities = cumsum((parent_number:-1:1) / sum(parent_number:-1:1)); % 1个长度为parent_number的数列

% 最佳适应度
% 每一代的最佳适应度都先初始化为1
best_fitness = ones(maximal_generation, 1);

% 精英
% 每一代的精英的参数值都先初始化为0
elite = zeros(maximal_generation, number_of_variables);

% 子女数量
% 种群数量 - 父母数量(父母即每一代中不发生改变的个体)
child_number = population_size - parent_number; % 每一代子女的数目

% 初始化种群
% population_size 对应矩阵的行,每一行表示1个个体,行数=个体数(种群数量)
% number_of_variables 对应矩阵的列,列数=参数个数(个体特征由这些参数表示)
population = rand(population_size, number_of_variables);

last_generation = 0; % 记录跳出循环时的代数


% 后面的代码都在for循环中
for generation = 1 : maximal_generation % 演化循环开始
    
    % feval把数据带入到一个定义好的函数句柄中计算
    % 把population矩阵带入fitness_function函数计算
    cost = feval(fitness_function, population); % 计算所有个体的适应度(population_size*1的矩阵)

    % index记录排序后每个值原来的行数
    [cost, index] = sort(cost); % 将适应度函数值从小到大排序

    % index(1:parent_number) 
    % 前parent_number个cost较小的个体在种群population中的行数
    % 选出这部分(parent_number个)个体作为父母,其实parent_number对应交叉概率
    population = population(index(1:parent_number), :); % 先保留一部分较优的个体
    % 可以看出population矩阵是不断变化的

    % cost在经过前面的sort排序后,矩阵已经改变为升序的
    % cost(1)即为本代的最佳适应度
    best_fitness(generation) = cost(1); % 记录本代的最佳适应度

    % population矩阵第一行为本代的精英个体
    elite(generation, :) = population(1, :); % 记录本代的最优解(精英)

    % 若本代的最优解已足够好,则停止演化
    if best_fitness(generation) < minimal_cost; 
        last_generation = generation;
        break; 
    end
    
    % 交叉变异产生新的种群

    % 染色体交叉开始
    for child = 1:2:child_number % 步长为2是因为每一次交叉会产生2个孩子
        
        % cumulative_probabilities长度为parent_number
        % 从中随机选择2个父母出来  (child+parent_number)%parent_number
        mother = find(cumulative_probabilities > rand, 1); % 选择一个较优秀的母亲
        father = find(cumulative_probabilities > rand, 1); % 选择一个较优秀的父亲
        
        % ceil(天花板)向上取整
        % rand 生成一个随机数
        % 即随机选择了一列,这一列的值交换
        crossover_point = ceil(rand*number_of_variables); % 随机地确定一个染色体交叉点
        
        % 假如crossover_point=3, number_of_variables=5
        % mask1 = 1     1     1     0     0
        % mask2 = 0     0     0     1     1
        mask1 = [ones(1, crossover_point), zeros(1, number_of_variables - crossover_point)];
        mask2 = not(mask1);
        
        % 获取分开的4段染色体
        % 注意是 .*
        mother_1 = mask1 .* population(mother, :); % 母亲染色体的前部分
        mother_2 = mask2 .* population(mother, :); % 母亲染色体的后部分
        
        father_1 = mask1 .* population(father, :); % 父亲染色体的前部分
        father_2 = mask2 .* population(father, :); % 父亲染色体的后部分
        
        % 得到下一代
        population(parent_number + child, :) = mother_1 + father_2; % 一个孩子
        population(parent_number+child+1, :) = mother_2 + father_1; % 另一个孩子
        
    end % 染色体交叉结束
    
    
    % 染色体变异开始
    
    % 变异种群
    mutation_population = population(2:population_size, :); % 精英不参与变异,所以从2开始
    
    number_of_elements = (population_size - 1) * number_of_variables; % 全部基因数目
    number_of_mutations = ceil(number_of_elements * mutation_rate); % 变异的基因数目(基因总数*变异率)
    
    % rand(1, number_of_mutations) 生成number_of_mutations个随机数(范围0-1)组成的矩阵(1*number_of_mutations)
    % 数乘后,矩阵每个元素表示发生改变的基因的位置(元素在矩阵中的一维坐标)
    mutation_points = ceil(number_of_elements * rand(1, number_of_mutations)); % 确定要变异的基因
    
    % 被选中的基因都被一个随机数替代,完成变异
    mutation_population(mutation_points) = rand(1, number_of_mutations); % 对选中的基因进行变异操作
    
    population(2:population_size, :) = mutation_population; % 发生变异之后的种群
    
    % 染色体变异结束
   
end % 演化循环结束

cumulative_probabilities = cumsum((parent_number:-1:1) / sum(parent_number:-1:1));

这段代码是用来计算累加概率分布的。

1.生成递减序列,parent_number:-1:1生成一个从parent_number到1的递减序列。

2.计算总和,sum(parent_number:-1:1)

3.计算概率,(parent_number:-1:1) / sum(parent_number:-1:1) 将序列[10 9 8 7 6 5 4 3 2 1]中的每个元素除以序列的总和55 得到一个新的序列,其中每个元素代表一个概率。例如,对于 parent_number为 10 的情况,新的序列将是

[0.1818 0.1636 0.1455 0.1273 0.1091 0.0909 0.0727 0.0545 0.0364 0.0182]

4.累加概率,((parent_number:-1:1) / sum(parent_number:-1:1))对于上面的概率序列,累加和的结果 每个元素是前面所有元素的概率之和

 [0.1818 0.3455 0.4909 0.6182 0.7273 0.8182 0.8909 0.9455 0.9818 1.0000]

应用场景

        在遗传算法中,累加概率分布通常用于比例选择方法中。这种方法基于个体适应度值的比例来选择父母个体,适应度高的个体有更大的机会被选中吗,成为下一代的父母。

选择过程
  1. 计算适应度:为种群中的每个个体计算适应度值
  2. 归一化适应度:将适应度值转换为概率值。适应度值越大,被选择的概率越高
  3. 累加概率:计算累加概率分布
  4. 随机选择:适应累加概率分布来随机选择父母        

具体来说,当需要从种群中选择一个个体作为父母是,会生成一个介于0到1之间的随机数,然后查找累加概率向量中第一个大于或等于这个随机数的元素的索引。这个索引对应的个体就被选中了。

例如,如果随机生成的数是0.75,那么在累加概率向量[0.1818 0.3455 0.4909 0.6182 0.7273 0.8182 0.8909 0.9455 0.9818 1.0000]中,第一个大于或等于0.75的元素是0.7273,其索引为5,那么第5个个体会被选中。

这种方法确保了适应度较高的个体有更大的机会被选中,从而增加了优秀个体传递给下一代的机会。

        交叉和变异是遗传算法中的两个核心操作,它们模仿了自然界中生物进化的过程,用于在搜索过程中生成新的候选解。

交叉

        交叉操作(也称为杂交)是指在遗传算法中选择两个或多个个体(通常称为父母)并将它们的一部分遗传信息进行交换,以生成新的个体(称为后代或子代)这种操作的目的是探索解空间,通过组合现有个体的有点来创造潜在的更好解。

常见的交叉方法:

  • 单点交叉:选择一个交叉点,然后交换该点之后的基因片段
  • 多点交叉:选择多个交叉点,交替交换交叉点之间的基因片段
  • 均匀交叉:每个基因位点独立决定是否从父母之一继承基因

示例

假设我们有两个二进制编码的个体P1和P2:

P1 = [1 0 1 0 1 1]

P2 = [0 1 0 1 0 0]

使用单点交叉,在第三位交叉,生成的新个体为:

P1 = [1 0 1 1 0 0]

P2 = [0 1 0 0 1 1]

变异

        变异操作是指以一定的概率随机改变个体中的某些基因,以引入新的遗传信息。这种操作的目的是为了维持种群的多样性,防止算法过早二等收敛到局部最优解。

方法

        变异通常是在个体的基因位点上随机地改变其值。例如,对于二进制编码的个体,变异可能是简单地翻转某个位的值。

示例

假设我们有一个二进制编码的个体 Individual = [1 0 1 0 1 1],并在第二位进行变异:

变异前:[1 0 1 0 1 1]

变异后:[1 1 1 0 1 1]

 通过累加概率分布来选择父母

mother = find(cumulative_probabilities > rand, 1);

cumulative_probabilities 是一个长度为parent_number的向量,表示每个父母个体被选中的累加概率。

为了选择一个父母个体,我们生成一个介于0和1 之间的随机数(rand)使用 find函数来找cumulative_probabilities中第一个大于或等于这个随机数的元素的索引。这个索引对应的个体就是被选中的父母个体

mask1 = [ones(1, crossover_point), zeros(1, number_of_variables - crossover_point)];

mask1和mask2是两个掩码向量,用于在交叉操作中区分交叉点之前和之后的基因片段

mask2 = not(mask1);

对mask1中的每个元素进行逻辑取反

mother_1 = mask1 .* population(mother, :); % 母亲染色体的前部分
mother_2 = mask2 .* population(mother, :); % 母亲染色体的后部分

mother_1会保留 mask1中为 1 的位置上的基因值,其余位置上的基因值为 0。

mother_2会保留 mask2 中为 2 的位置上的基因值,其余位置上的基因值为 0。

测试test
clear; 
close all;

% 调用 my_ga 进行计算
% 求解问题的参数个数         10
% 自定义适应度函数名         my_fitness
% 种群规模                  100
% 每一代中保持不变的数目     50 (即交叉率0.5)
% 变异概率                  0.1 (1/10的个体发生变异)
% 最大演化代数              10000 10000代
% 最小目标值                1.0e-6 个体适应度函数值 < 0.000001结束
[best_fitness, elite, generation, last_generation] = my_ga(10, 'my_fitness', 100, 50, 0.1, 10000, 1.0e-6);


% 输出后10行
% disp(best_fitness(9990:10000,:));
% disp(elite(9990:10000,:))
% 这样是不合适的,因为GA常常在中间就跳出循环了

% 这样才是合适的输出
disp(last_generation); 
i_begin = last_generation - 9;
disp(best_fitness(i_begin:last_generation,:));
% 将elite值转化为问题范围内
my_elite = elite(i_begin:last_generation,:);
my_elite = 2 * (my_elite - 0.5);
disp(my_elite);

% 最佳适应度的演化情况
figure
loglog(1:generation, best_fitness(1:generation), 'linewidth',2)
xlabel('Generation','fontsize',15);
ylabel('Best Fitness','fontsize',15);
set(gca,'fontsize',15,'ticklength',get(gca,'ticklength')*2);

% 最优解的演化情况
figure
semilogx(1 : generation, 2 * elite(1 : generation, :) - 1)
xlabel('Generation','fontsize',15);
ylabel('Best Solution','fontsize',15);
set(gca,'fontsize',15,'ticklength',get(gca,'ticklength')*2);

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2105426.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【JavaScript】LeetCode:11-15

文章目录 11 最长连续序列12 移动零13 盛最多水的容器14 三数之和15 接雨水 11 最长连续序列 数组排序、去重遍历数组中的元素&#xff0c;当元素连续时&#xff0c;长度加1&#xff0c;当不连续时&#xff0c;长度设置为1。 /*** param {number[]} nums* return {number}*/ v…

AI科学家:自动化科研的未来之路

随着人工智能&#xff08;AI&#xff09;技术的不断进步&#xff0c;AI已经在众多领域中展现了强大的潜力&#xff0c;尤其是在科研方面的应用正在引起广泛关注。最近&#xff0c;Sakana AI与牛津大学和不列颠哥伦比亚大学联合推出了一款被称为“AI科学家”的自动化科研工具&am…

第4章-01-学会从Chrome浏览器中Network

🏆作者简介,黑夜开发者,CSDN领军人物,全栈领域优质创作者✌,CSDN博客专家,阿里云社区专家博主,2023年CSDN全站百大博主。 🏆数年电商行业从业经验,历任核心研发工程师,项目技术负责人。 🏆本文已收录于专栏:Web爬虫入门与实战精讲,后续完整更新内容如下。 文章…

【Canvas与纹饰】环形小蜜蜂纹饰

【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>环形小蜜蜂纹饰</title><style type"text/css"&g…

Mysql基础练习题 1378.使用唯一标识符替换员工ID (力扣)

1378. 展示每位用户的 唯一标识码&#xff08;unique ID &#xff09;&#xff1b;如果某位员工没有唯一标识码&#xff0c;使用 null 填充即可。 你可以以任意顺序返回结果表。 题目链接&#xff1a; https://leetcode.cn/problems/replace-employee-id-with-the-unique-i…

k8s调度、污点、容忍、不可调度、排水、数据卷挂载

一、Kubernetes的list-watch机制 1、List-watch K8S集群中&#xff0c;通过List-watch机制进行每个组件的协作&#xff0c;保持数据同步。这种设计可以实现每个组件之间的解耦 kubectl配置文件&#xff0c;统一向集群内部apiserver发送命令——通过apiserver把命令发送到各个…

C# 不安全代码

当一个代码块使用 unsafe 修饰符标记时&#xff0c;C# 允许在函数中使用指针变量。不安全代码或非托管代码是指使用了指针变量的代码块。 指针变量 指针 是值为另一个变量的地址的变量&#xff0c;即&#xff0c;内存位置的直接地址。就像其他变量或常量&#xff0c;您必须在…

【系统架构设计师-2022年】综合知识-答案及详解

文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6~7题】【第8题】【第9题】【第10题】【第11~12题】【第13题】【第14题】【第15题】【第16题】【第17~18题】【第19题】【第20题】【第21题】【第22题】【第23题】【第24题】【第25题】【第26题】【第27题】【第28题…

力扣刷题(复习版2)

题目&#xff1a; 计数质数 原题链接&#xff1a; 计数质数 题解 public int countPrimes(int n) {if (n < 2) return 0;// boolean 数组&#xff0c;初始时假设所有数都是质数boolean[] isPrime new boolean[n];Arrays.fill(isPrime, true); // 全部初始化为true// 从 …

网页版修改本地数据器:重新布局,引入 highlight.js高亮显示代码

<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><title>修改数据器</title><!-- 引入 highlight.js 的 CSS 文件 --><link rel"stylesheet" href"https://cdnjs.cloudflare.…

Tauri应用开发实践指南(4)— Tauri 原生能力

本文首发于微信公众号&#xff1a;前端徐徐。欢迎关注&#xff0c;获取更多前端技能分享。 原生能力简介 Tauri 是一个用于构建安全的小型桌面应用程序的框架,它结合了 Web 前端和系统后端技术。Tauri 提供了一些原生能力,让您的 Web 应用程序能够访问本地系统资源和 API,主要…

聚焦新能源未来,望繁信科技邀您共赴CNDS 2024中国新能源产业数智峰会

在全球能源转型的关键时刻&#xff0c;新能源产业正以迅猛的速度向前发展&#xff0c;而数字化技术则为这一产业注入了前所未有的动力。为进一步推动新能源产业与数字化的深度融合&#xff0c;CNDS 2024中国新能源产业数智峰会即将于2024年9月13日在北京盛大举行。作为大数据流…

节日庆典中的白酒文化,传承与创新并存

在中华五千年的文明长河中&#xff0c;白酒文化如同一颗璀璨的明珠&#xff0c;熠熠生辉。它既是历史的见证者&#xff0c;也是文化的传承者。在节日庆典的喜庆氛围中&#xff0c;白酒更是不可或缺的元素&#xff0c;其背后蕴藏着深厚的文化底蕴和时代价值。豪迈白酒&#xff0…

The Llama 3 Herd of Models【论文原文下载】

关注B站可以观看更多实战教学视频&#xff1a;hallo128的个人空间 The Llama 3 Herd of Models【论文原文】 点击下载&#xff1a;原文下载链接 摘要 现代人工智能&#xff08;AI&#xff09;系统由基础模型驱动。本文介绍了一组新的基础模型&#xff0c;称为 Llama 3。它是…

Anaconda最新安装教程

1 概述 1 介绍 Anaconda是一个专注于数据分析的Python发行版本&#xff0c;它为科学计算和数据科学领域提供了强大的支持。Anaconda是一个开源的Python发行版&#xff0c;包含了conda、Python以及超过190个科学包及其依赖项。这些包涵盖了数据分析、机器学习、深度学习等多个…

突破视觉理解极限,Qwen2-VL重磅登场

前沿科技速递&#x1f680; 经过近一年的持续努力&#xff0c;Qwen团队宣布推出最新一代的视觉语言模型&#xff1a;Qwen2-VL。基于Qwen2的基础&#xff0c;Qwen2-VL在多个方面实现了显著提升&#xff0c;相较于前代模型Qwen-VL&#xff0c;它具备以下核心优势&#xff1a; 1. …

24/9/3算法笔记 kaggle泰坦尼克

题目&#xff1a; 这次我用两种算法做了这道题 逻辑回归二分类算法 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LogisticRegression from sklearn.metr…

信息打点day.06

一、知识点 1、黑盒测试 黑盒测试是一种评估网络安全性的方法&#xff0c;它模拟了攻击者在不了解系统内部结构和工作机制的情况下&#xff0c;仅通过外部接口&#xff08;如网络协议、应用程序界面等&#xff09;尝试渗透、攻击或绕过安全控制的行为。通过模拟真实的攻击场景…

心觉:如何填平想象和愿望之间的鸿沟?

愿望是什么&#xff1f; 你想变得富有 你想减掉20斤 你想拥有自己的Dream Car 你想拥有S型身材 这些都是愿望&#xff0c;非常美好的想法或者目标 想象是什么&#xff1f; 我能变得富有吗&#xff0c;我啥也不会&#xff0c;除了上班&#xff0c;就是上班 我怎么可能减肥…

多少次幂的计算器,指数计算器

https://miniwebtool.com/zh-cn/exponents-calculator/?n10.95&n2100&prec10