深入解析素数筛法:从埃氏筛到欧拉筛的算法思想与实现

news2025/3/20 11:31:19

        素数筛法是一种用于高效生成素数的算法。常见的素数筛法包括埃拉托斯特尼筛法(埃氏筛)和欧拉筛(线性筛)。下面我们将详细讲解这两种筛法的思想:

一、 埃拉托斯特尼筛法(埃氏筛)

思想:

        埃氏筛的基本思想是从2开始,将每个素数的倍数标记为合数,直到筛完所有小于等于给定范围的数。具体步骤如下:

  1. 初始化一个布尔数组 isPrime[],大小为 n+1,并将所有元素初始化为 true

  2. 从2开始遍历到 sqrt(n),如果当前数 i 是素数(即 isPrime[i] 为 true),则将其所有倍数标记为合数(即 isPrime[j] 设为 false)。

  3. 最后,所有 isPrime[i] 为 true 的 i 即为素数。

时间复杂度:

埃氏筛的时间复杂度为 O(n log log n)

未优化代码实现:

const int N = 1e7; // 定义空间大小,1e7 约 10MB
int prime[N+1]; // 存放素数,记录 visit[i] = false 的项
bool visit[N+1]; // visit[i] = true 表示 i 被筛掉,不是素数

int E_sieve(int n) { // 埃氏筛法,计算 [2,n] 内的素数
    int k = 0; // 统计素数的个数
    for(int i = 0; i <= n; i++) visit[i] = false; // 初始化
    for(int i = 2; i <= n; i++) { // 从第一个素数 2 开始
        if(!visit[i]) { // 如果 i 是素数
            prime[++k] = i; // 将 i 存入 prime 数组
            for(int j = 2*i; j <= n; j += i) // 筛掉 i 的倍数
                visit[j] = true; // 标记为非素数
        }
    }
    return k; // 返回素数的个数
}

上述代码有两处可以优化:

(1)用来做筛选的数2、3、5等,最多到sqrt(n)就可以了。例如,求n=100以内的素数,用2、3、5、7筛选就足够了。其原理和试除法一样;非素数k,必定可以被一个小于或等于sqrt(k)的素数整除,被筛掉。这个优化很大,缩短了时间复杂度。

(2)for(int j = 2*i; j <= n; j += i)中的j=2*i优化为j=i*i。例如i=5,2*5,3*5,4*5已经在前面i=2,3,4的时候筛过了。这个优化较小,形如一个正方形的数组矩阵被砍成一个三角形

优化代码实现: 

int E_sieve(int n) {
    for(int i = 0; i <= n; i++) visit[i] = false; // 初始化
    for(int i = 2; i <= sqrt(n); i++) // 只需筛到 sqrt(n)
        if(!visit[i]) // 如果 i 是素数
            for(int j = i * i; j <= n; j += i) // 从 i^2 开始筛
                visit[j] = true; // 标记为非素数
    int k = 0;
    for(int i = 2; i <= n; i++)
        if(!visit[i]) prime[++k] = i; // 存素数
    return k; // 返回素数的个数
}

埃氏筛的计算复杂度:

        2的倍数被筛掉,计算n/2次;3的倍数被掉,计算n/3次;5的倍数被筛掉,计算n/5次;……;总计算量等于n/2+n/3+n/5+n/7+n/11+…,约为O(n log log n)。其计算量很接近线性的(n),已经相当好了。


空间复杂度:

        代码用到了bool visit[N+1]数组,当N=10^7时约10MB。由于埃氏筛只能用于处理约n=10^7的问题,10MB空间是够用的。
        埃氏筛可以计算出[2,n]内的素数,不过更常见的应用场景是计算[L,R]区间内的素数,L、R极大,但R一L较小,此时也可以用埃氏筛。

最终C++代码实现:

#include <iostream>  // 引入输入输出流库,用于标准输入输出(如cout)
#include <vector>    // 引入向量库,用于动态数组的实现
#include <cmath>     // 引入数学库,用于数学函数(如sqrt)

// 定义埃拉托斯特尼筛法函数,参数n表示筛选素数的范围
void sieveOfEratosthenes(int n) {
    // 创建一个大小为n+1的布尔向量isPrime,初始值为true,表示所有数默认是素数
    std::vector<bool> isPrime(n + 1, true);

    // 0和1不是素数,手动设置为false
    isPrime[0] = isPrime[1] = false;

    // 从2开始遍历到sqrt(n),因为大于sqrt(n)的数的倍数已经被更小的素数标记过了
    for (int i = 2; i <= std::sqrt(n); ++i) {
        // 如果当前数i是素数(isPrime[i]为true)
        if (isPrime[i]) {
            // 从i的平方开始,将i的所有倍数标记为合数(false)
            // 因为小于i的倍数已经被更小的素数标记过了
            for (int j = i * i; j <= n; j += i) {
                isPrime[j] = false;
            }
        }
    }

    // 输出所有素数
    for (int i = 2; i <= n; ++i) {
        // 如果isPrime[i]为true,说明i是素数,输出i
        if (isPrime[i]) {
            std::cout << i << " ";
        }
    }
    // 输出换行符,使结果更美观
    std::cout << std::endl;
}

// 主函数
int main() {
    int n = 50;  // 定义筛选范围的上限为50
    sieveOfEratosthenes(n);  // 调用埃拉托斯特尼筛法函数
    return 0;  // 程序正常结束
}

二、 欧拉筛(线性筛)

思想:

        欧拉筛是一种改进的筛法,能够在 O(n) 的时间复杂度内筛出所有素数。其核心思想是让每个合数只被其最小的质因数筛掉,从而避免重复标记。具体步骤如下:

  1. 初始化一个布尔数组 isPrime[],大小为 n+1,并将所有元素初始化为 true

  2. 初始化一个数组 primes[] 用于存储素数。

  3. 从2开始遍历到 n,如果当前数 i 是素数,则将其加入 primes[]

  4. 对于每个素数 primes[j],如果 i * primes[j] 超过 n 则停止;否则将 isPrime[i * primes[j]] 设为 false。如果 i 能被 primes[j] 整除,则停止内层循环。

时间复杂度:

欧拉筛的时间复杂度为 O(n)

C++实现:

#include <iostream>
#include <vector>

void eulerSieve(int n) {
    std::vector<bool> isPrime(n + 1, true);
    std::vector<int> primes;

    for (int i = 2; i <= n; ++i) {
        if (isPrime[i]) {
            primes.push_back(i);
        }
        for (int j = 0; j < primes.size() && i * primes[j] <= n; ++j) {
            isPrime[i * primes[j]] = false;
            if (i % primes[j] == 0) {
                break;
            }
        }
    }

    // 输出所有素数
    for (int prime : primes) {
        std::cout << prime << " ";
    }
    std::cout << std::endl;
}

int main() {
    int n = 50;
    eulerSieve(n);
    return 0;
}

总结:

  • 埃氏筛:简单易懂,时间复杂度为 O(n log log n),适合用于较小的范围。

  • 欧拉筛:时间复杂度为 O(n),适合用于较大的范围,且避免了重复标记。

三、 例题讲解

P1835 素数密度 - 洛谷

算法代码: 

#include<bits/stdc++.h> // 包含标准库中的所有头文件
using namespace std; // 使用标准命名空间
const int N=1e6+1; // 定义常量 N,表示数组的最大大小
int prime[50000]; // 用于存储素数的数组
bool vis[N+1]; // 用于标记是否为素数的布尔数组

int E_sieve(int n) // 埃氏筛法函数,用于找出小于等于 n 的所有素数
{
    for(int i=0;i<=n;i++) // 初始化 vis 数组
    {
        vis[i]=false; // 将所有元素初始化为 false,表示初始时都认为是素数
    }
    for(int i=2;i<=sqrt(n);i++) // 从 2 开始筛除非素数
    {
        if(!vis[i]) // 如果 i 是素数
        {
            for(int j=i*i;j<=n;j+=i) // 筛除 i 的所有倍数
            {
                vis[j]=true; // 标记为非素数
            }
        }
    }
    int k=0; // 用于统计素数的个数
    for(int i=2;i<=n;i++) // 遍历所有数
    {
        if(!vis[i]) // 如果 i 是素数
        {
            prime[++k]=i; // 将素数存入 prime 数组
        }
    }
    return k; // 返回素数的个数
}

int main() // 主函数
{
    int cnt=E_sieve(50000); // 调用埃氏筛法函数,找出小于等于 50000 的所有素数,并返回素数的个数
    int L,R; // 定义区间 [L, R]
    cin>>L>>R; // 输入区间 [L, R]
    if(L==1) // 如果 L 为 1,将其调整为 2,因为 1 不是素数
    {
        L=2;
    }
    memset(vis,0,sizeof(vis)); // 初始化 vis 数组为 0
    for(int i=1;i<=cnt;i++) // 遍历所有素数
    {
        int p=prime[i]; // 获取当前素数
        long long start; // 定义筛除的起始位置
        if((L+R-1)/p*p>2*p) // 计算起始位置
        {
            start=(L+p-1)/p*p;
        }
        else
        {
            start=2*p;
        }
        for(long long j=start;j<=R;j+=p) // 筛除当前素数的倍数
        {
            vis[j-L+1]=true; // 标记为非素数
        }
    }
    int ans=0; // 用于统计区间 [L, R] 内的素数个数
    for(int i=1;i<=R-L+1;++i) // 遍历区间 [L, R]
    {
        if(!vis[i]) // 如果当前数是素数
        {
            ans++; // 素数个数加 1
        }
    }
    cout<<ans; // 输出区间 [L, R] 内的素数个数
}

代码思路

        这段代码的主要功能是使用埃氏筛法找出给定区间 [L, R] 内的所有素数,并输出该区间内素数的个数。以下是代码的思路和实现步骤:


1. 包含头文件和定义常量

  • 包含标准库头文件 <bits/stdc++.h>,以便使用所有标准库函数。

  • 定义常量 N 表示数组的最大大小,prime 数组用于存储素数,vis 数组用于标记是否为素数。


2. 埃氏筛法函数 E_sieve

  • 功能:找出小于等于 n 的所有素数。

  • 实现步骤

    1. 初始化 vis 数组,将所有元素标记为 false,表示初始时所有数都被认为是素数。

    2. 从 2 开始遍历到 sqrt(n),筛除非素数:

      • 如果当前数 i 是素数(vis[i] == false),则筛除 i 的所有倍数(从 i*i 开始,步长为 i)。

      • 将筛除的数标记为 true,表示它们是非素数。

    3. 遍历所有数,将未被筛除的数(即素数)存入 prime 数组。

    4. 返回素数的个数。


3. 主函数 main

  • 功能:计算区间 [L, R] 内的素数个数。

  • 实现步骤

    1. 调用 E_sieve 函数,找出小于等于 50000 的所有素数,并返回素数的个数 cnt

    2. 输入区间 [L, R]

    3. 如果 L == 1,将其调整为 2,因为 1 不是素数。

    4. 初始化 vis 数组为 0,用于标记区间 [L, R] 内的数是否为素数。

    5. 遍历所有素数 prime[i]

      • 计算当前素数 p 在区间 [L, R] 内的起始筛除位置 start

      • 从 start 开始,筛除 p 的所有倍数,并将这些数标记为非素数。

    6. 统计区间 [L, R] 内未被标记的数(即素数)的个数 ans

    7. 输出 ans


4. 关键点

  • 埃氏筛法:用于高效找出小于等于 n 的所有素数。

  • 区间筛法:利用埃氏筛法找出的素数,筛除区间 [L, R] 内的非素数。

  • 起始位置计算

    • 对于每个素数 p,筛除的起始位置为 max(p * 2, (L + p - 1) / p * p)

    • 这样可以避免重复筛除已经在之前步骤中处理过的数。


5. 代码优化

  • 空间优化:使用 vis 数组标记区间 [L, R] 内的数是否为素数,而不是整个范围 [1, N]

  • 时间优化:只筛除区间 [L, R] 内的数,避免不必要的计算。


代码流程图

  1. 初始化

    • 定义常量、数组和变量。

    • 调用 E_sieve 函数,找出小于等于 50000 的所有素数。

  2. 输入区间 [L, R]

    • 如果 L == 1,调整为 L = 2

  3. 筛除区间 [L, R] 内的非素数

    • 遍历所有素数 prime[i]

    • 计算起始位置 start

    • 筛除 p 的所有倍数,并标记为非素数。

  4. 统计素数个数

    • 遍历区间 [L, R],统计未被标记的数的个数。

  5. 输出结果

    • 输出区间 [L, R] 内的素数个数。

定位的数学思路:(难想咯) 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2318337.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ubuntu20.04系统没有WiFi图标解决方案_安装Intel网卡驱动

文章目录 1. wifi网卡配置1.1 安装intel官方网卡驱动backport1.1.1 第四步可能会出现问题 1.2 ubuntu官方的驱动1.3 重启 1. wifi网卡配置 我的电脑是华硕天选4&#xff08;i7&#xff0c;4060&#xff09;&#xff0c;网卡型号intel ax201 ax211 ax210通用。 参考文章&#…

网络编程---多客户端服务器

写一个服务器和两个客户端 运行服务器和2个客户端&#xff0c;实现聊天功能 客户端1 和 客户端2 进行聊天 客户端1将聊天数据发送给服务器 服务器将聊天数据转发给客户端2 要求&#xff1a; 服务器使用 select 模型实现 客户端1使用 poll 模型实现 客户端2使用 多线程实现…

LeetCode 2614.对角线上的质数:遍历(质数判断)

【LetMeFly】2614.对角线上的质数&#xff1a;遍历(质数判断) 力扣题目链接&#xff1a;https://leetcode.cn/problems/prime-in-diagonal/ 给你一个下标从 0 开始的二维整数数组 nums 。 返回位于 nums 至少一条 对角线 上的最大 质数 。如果任一对角线上均不存在质数&…

红日靶场(二)——个人笔记

靶场搭建 新增VMnet2网卡 **web&#xff1a;**需要配置两张网卡&#xff0c;分别是外网出访NAT模式和内网域环境仅主机模式下的VMnet2网卡。 **PC&#xff1a;**跟web一样&#xff0c;也是需要配置两张网卡&#xff0c;分别是外网出访NAT模式和内网域环境仅主机模式下的VMn…

实时视频分析的破局之道:蓝耘 MaaS 如何与海螺 AI 视频实现高效协同

一、蓝耘 MaaS 平台&#xff1a;AI 模型全生命周期管理的智能引擎 蓝耘 MaaS&#xff08;Model-as-a-Service&#xff09;平台是由蓝耘科技推出的 AI 模型全生命周期管理平台&#xff0c;专注于为企业和开发者提供从模型训练、推理到部署的一站式解决方案。依托云原生架构、高…

走进Java:String字符串的基本使用

❀❀❀ 大佬求个关注吧~祝您开心每一天 ❀❀❀ 目录 一、什么是String 二、如何定义一个String 1. 用双引号定义 2. 通过构造函数定义 三、String中的一些常用方法 1 字符串比较 1.1 字符串使用 1.2 字符串使用equals() 1.3 使用 equalsIgnoreCase() 1.4 cpmpareTo…

python系列之元组(Tuple)

不为失败找理由&#xff0c;只为成功找方法。所有的不甘&#xff0c;因为还心存梦想&#xff0c;所以在你放弃之前&#xff0c;好好拼一把&#xff0c;只怕心老&#xff0c;不怕路长。 python系列之元组&#xff08;Turple&#xff09; 一、元组是什么&#xff1f;——给新手的…

破解验证码新利器:基于百度OCR与captcha-killer-modified插件的免费调用教程

破解验证码新利器&#xff1a;基于百度OCR与captcha-killer-modified插件的免费调用教程 引言 免责声明&#xff1a; 本文提供的信息仅供参考&#xff0c;不承担因操作产生的任何损失。读者需自行判断内容适用性&#xff0c;并遵守法律法规。作者不鼓励非法行为&#xff0c;保…

批量删除 PPT 中的所有图片、某张指定图片或者所有二维码图片

PPT 文档中的图片如何删除呢&#xff1f;相信很多小伙伴或碰到类似的需求。比如我们需要删除 PPT 文档中的某一张图片或者某张二维码图片&#xff0c;如果每一页都有这张图片&#xff0c;或者有很多 ppt 都有同一张要删除的图片&#xff0c;我们应该怎么快速的完成删除呢&#…

大模型开发(六):LoRA项目——新媒体评论智能分类与信息抽取系统

LoRA项目——新媒体评论智能分类与信息抽取系统 0 前言1 项目介绍1.1 项目功能1.2 技术原理1.3 软硬件环境1.4 项目结构 2 数据介绍与处理2.1 数据集介绍2.2 数据处理2.3 数据导入器 3 模型训练3.1 配置文件3.2 工具函数3.3 模型训练3.4 模型评估 4 模型推理 0 前言 微调里面&…

mysql-innodb存储引擎主键索引叶子结点数据结构(非单纯的双向链表)

我们应该清楚行记录是放在页中的。 compact行记录格式&#xff1a; 主要介绍几个比较重要的参数 heap_no&#xff1a; 页号 record_type&#xff1a; 0 表示普通类型&#xff08;叶子结点&#xff09;&#xff0c;1表示B树的非叶子节点 &#xff0c;2 表示最小记录&#xff…

物联网为什么用MQTT不用 HTTP 或 UDP?

先来两个代码对比&#xff0c;上传温度数据给服务器。 MQTT代码示例 // MQTT 客户端连接到 MQTT 服务器 mqttClient.connect("mqtt://broker.server.com:8883", clientId) // 订阅特定主题 mqttClient.subscribe("sensor/data", qos1) // …

Vmware中的centos7连接上网

有很多刚刚开始配置了centos7&#xff0c;然后发现不能上网现在来解决这个问题。 测试能不能上网 先还原这个设置&#xff0c;如果没有动过的话就不用&#xff0c;连接模式是NAT模式 然后进去设置网络环境&#xff0c;记得是用超级用户设置 vi /etc/sysconfig/network-script…

【AI知识】常见的优化器及其原理:梯度下降、动量梯度下降、AdaGrad、RMSProp、Adam、AdamW

常见的优化器 梯度下降&#xff08;Gradient Descent, GD&#xff09;局部最小值、全局最小值和鞍点凸函数和非凸函数动量梯度下降&#xff08;Momentum&#xff09;自适应学习率优化器AdaGrad&#xff08;Adaptive Gradient Algorithm&#xff09;​RMSProp&#xff08;Root M…

线性规划的标准形式

标准形式的定义 目标函数&#xff1a;最大化线性目标函数 其中&#xff0c;x 是决策变量向量&#xff0c;c 是目标系数向量。 约束条件&#xff1a;等式形式约束 A x b, 其中&#xff0c;A 是约束系数矩阵&#xff0c;b 是常数项向量。 变量非负约束&#xff1a; 。 因此…

网络安全应急入门到实战

奇安信&#xff1a;95015网络安全应急响应分析报告&#xff08;2022-2024年&#xff09;官网可以下载 https://github.com/Bypass007/Emergency-Response-Notes 应急响应实战笔记 网络安全应急响应技术实战指南 .pdf 常见场景 第4章 勒索病毒网络安全应急响应 第5章 挖矿木…

应用程序安全趋势:左移安全、人工智能和开源恶意软件

软件是大多数行业业务运营的核心&#xff0c;这意味着应用程序安全从未如此重要。 随着组织采用云原生架构、微服务和开源组件&#xff0c;攻击面不断扩大。结果是&#xff1a;攻击者渴望利用的易受攻击和恶意依赖项数量不断增加。 2025 年&#xff0c;安全团队将面临日益复杂…

ospf动态路由

一、为什么使用动态路由 OSPF&#xff08;open shortest path first开放最短路径优先&#xff09;是内部网关协议(IGP)的一种&#xff0c;基于链路状态算法(LS)。 OSPF企业级路由协议(RFC2328 OSPFv2)&#xff0c;核心重点协议 OSPF共三个版本&#xff0c;OSPFV1主要是实验室…

基于单片机控制的电动汽车双闭环调速系统(论文+源码)

2.1系统方案 在本次设计中&#xff0c;其系统整个框图如下图3.1所示&#xff0c;其主要的核心控制模块由电源供电模块&#xff0c;晶振电路&#xff0c;驱动电路模块&#xff0c;霍尔传感器&#xff0c;按键模块&#xff0c;复位电路&#xff0c;LCD液晶显示及直流电机等组成。…

【病毒分析】伪造微软官网+勒索加密+支付威胁,CTF中勒索病毒解密题目真实还原!

1.背景 该CTF挑战题目完整复现了黑客的攻击链路&#xff0c;攻击者通过伪造钓鱼页面引导受害者下载恶意软件。用户访问伪造的 Microsoft 365 官网后&#xff0c;在点击“Windows Installer (64-bit)”下载选项时&#xff0c;页面会自动跳转至伪造的 GitHub 项目链接&#xff0…