基于java的fofa爬虫

news2025/2/6 5:48:24

文章目录

    • 下载链接
    • 介绍
    • 使用方法
      • 关键字生成器
      • API爬虫
      • Fofa爬虫
      • 导出功能
      • 修改配置文件

下载链接

  • github : https://github.com/13337356453/FofaSpider
  • csdn : https://download.csdn.net/download/realmels/87320066

介绍

顾名思义,fofa爬虫。可以用api爬,也可以对页面进行爬取。

开发环境是java11,基于maven和javafx做的。

想做这个很久了,但是一直懒得弄。就偶尔写一下,不知不觉就写好了。看下运行效果吧。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

使用方法

关键字生成器

在各个框中按需求输入关键字。点击生成即可。

例如,要获取状态码为200的中国的Tomcat,可在APP处输入Tomcat,点击生成即可。
在这里插入图片描述
若想取消国家的限制,可在Country框中输入*号。状态码同理。

例如要查找任意国家任意状态码的Tomcat
在这里插入图片描述

API爬虫

使用之前请先填入fofa邮箱和APIKey。可点击保存按钮,下次运行程序可自动加载。

填入之后可点击测试API按钮测试API是否可用。
在这里插入图片描述
输入关键词后点击开始爬取,会开始爬取数据。并呈现在表格中。
在这里插入图片描述
双击表格中的数据可快速在浏览器中打开。

点击结束爬取可终止爬虫线程。

Fofa爬虫

首先输入cookie。由于fofa的反爬虫机制,cookie在一天后就会失效,因此当程序检测到时间不为同一天时会自动清空已保存的cookie。请使用前更新cookie。

输入cookie后可点击保存按钮保存当天cookie,点击测试按钮测试cookie是否可用
在这里插入图片描述
在输入关键字后点击开始爬取,首先会获取页数,接着弹出一个对话框,要求获取爬取至多少页。

例如,我想爬取Tomcat从1到10页的数据。
在这里插入图片描述
点击确定即可开始爬取。

由于网络不稳定,爬取大量数据时很可能会发生数据损耗或连接超时。当你看到当前数据量超过一分钟没有变动,则为爬取结束。
在这里插入图片描述

导出功能

当数据表中有数据时,点击导出数据按钮会弹出导出数据对话框
在这里插入图片描述
在此处可选择需要导出的信息,数据源。

导出到文件功能可将数据导出至文件。导出到MySQL功能可将数据导出到MySQL数据库。

在导出至数据库之前请填写数据库连接信息,可点击测试连接按钮测试,可点击保存按钮保存
在这里插入图片描述

修改配置文件

第一次运行程序后,程序同目录下会自动生成一个名为FoSpi.ini的文件,这是该程序的配置文件。

打开编辑该文件,可看到以下内容。
在这里插入图片描述
在此处可修改超时时间,等待时间,单页数量,并可设置代理。

参数介绍:

  • timeout : 超时时间。超时时间越短,越容易出错。
  • timewait : 每爬取一页后的等待时间。防止封ip。
  • pagenum : 单页数据。填入10或20。建议值为20,这样会加快效率
  • ip : 代理服务器的ip地址
  • port : 代理服务器的端口

配置文件中的值不建议修改。如要添加代理可自行修改proxy的内容

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/103002.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

leetcode:1192. 查找集群内的关键连接【tarjan模版 + 找割边】

目录题目截图题目分析割边割点强连通子图ac codetarjan模版总结题目截图 题目分析 找割边 割边 割点 强连通子图 我觉得就是割边左右的两个子图?应该是去掉n条割边后,剩下n 1个强连通子图的意思吧。。。 ac code class Solution:def criticalConne…

【愚公系列】2022年12月 .NET CORE工具案例-多语言离线翻译系统

文章目录前言1.在线翻译2.离线翻译一、多语言离线翻译系统1.开发环境2.准备离线翻译包3.准备python代码4.调试翻译结果5.Python翻译服务对接到.NET Core前言 1.在线翻译 在线翻译,一般是指在线翻译工具,如百度翻译、阿里翻译1688或Google翻译等。这类翻…

计算机毕业设计django基于python的在线教育平台

项目介绍 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,在线教育平台当然也不能排除在外。在线教育平台是以实际运用为开发背景,运用软件工程原理和开发方法,采用django框架构建的一个管理系统。整个开发过程首…

fpga实操训练(小功能到模块开发)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 有过c、java编程语言经验的朋友,是否还记得曾经自己是如何学习编程语言的?一开始的时候,为了学习语法&#xff…

光电传感器调研报告

目录 前言: 一、理论基础——光电效应 二、光电传感器原理 三、光电元件 3.1光电管 3.2光敏电阻 四、光电传感器特性 4.1伏安特性 4.2光电特性 4.3光谱特性 五、光电传感器的应用 LED(发光二极管) 超声波传感器 光纤 六、总结 …

用Python赚钱的方法有哪些?

很多人想知道用Python赚钱的方法有哪些?Python很容易使用,应用性较强。可以通过使用Python开发小程序、抓取数据、游戏开发、兼职编程老师,发展副业的方式来赚钱。 用Python赚钱的方法: 1、某宝搜python程序   可以到某宝上搜&a…

中年人怎么转行做程序员,教你不怕年龄限制奔向高薪之路

网上很多人都说,人到了中年再去学编程已经来不及了,体力和精力都跟不上年轻人,做开发还要经常学习,然而中年人基本上有老下有小,根本没那么多时间去学习新技术,最重要的是,很多公司都有年龄限制…

学会这八个小技巧,让你软文推广更有效果!

软文营销已经出现在了我们的日常生活中,软文对于硬性的广告来说,具有独特的优势以及特殊性,受到了很多企业的青睐,其中还有一个重要的原因软文的花费是非常低的,适合一些中小型企业进行宣传推广,今天这篇文章就给大家讲…

vue学习笔记(五)-vuex

什么是vuex 1.概念:专门在Vue中实现集中式状态(数据)管理的一个Vue插件,对Vue应用中多个组件的共享状态进行集中式的管理(读/写),也是一种组件间通信的方式,且适用于任意组件间通信…

此时此刻此景,“零”就代表着赢

编辑 | 阿冒 设计 | 沐由2022卡塔尔世界杯,终于步入到最强、最美和最终的华章,阿根廷与法兰西共同上演了世界杯决赛史上的一幕奇迹,意想不到的转折和蹉跎而至的结局,让人不得不感慨全球第一运动的巨大魅力。在这种世界顶级水准…

统计学习方法 | 决策树

一.一棵有理想的树 分类决策树模型是一种描述对实例进行分类的树形结构 决策树是通过一系列规则对数据进行分类的过程 步骤 ①构建根节点 ②选择最优特征,以此分割训练数据集 ③若子集被基本正确分类,构建叶结点,否则,继续选…

java实验报告之模拟银行存取款业务

一个不知名大学生,江湖人称菜狗 original author: jacky Li Email : 3435673055qq.com Time of completion:2022.12.20 Last edited: 2022.12.20 目录 一、实验目的 二、实验内容 三、总体设计(设计原理、设计方案及流程等) 四…

医院导诊图怎么做,专业便捷、低成本的室内电子地图绘制平台!

目前的医院综合性强,面积大,科室多,布局复杂,病患在就医过程中,往往因为对医院各科室与区域分布不清晰而找不到方向,多走冤枉路,耗费时间,影响就医体验。上海懒图信息科技有限公司上…

轻量级网络模型MobileNet发展脉络(V1-V2-V3)

卷积神经网络发展 卷积神经网络被广泛应用在图像分类、目标检测等视觉任务中,并取得了巨大的成功。然而,卷积神经网络通常需要较大的运算量和内存占用,在移动端以及嵌入式设备等资源受限的环境中受到限制,因此需要进行网络压缩。从…

虹科案例 | 如何快速精准监测打桩机打桩深度?

想要精准测量打桩设备每个桩的测量深度,以正确设置多排电池板的太阳能农场?但是由于测量环境恶劣,导致普通传感器无法正常工作?那快了解一下我们的虹科Dimetix激光测距传感器吧,它可以完美解决上述问题! 一…

NFC技术的特点与应用

NFC技术能给我们的生活带来极大的便利,能够用于乘车、购物、交换信息、刷门禁卡,可以说它能够应用到我们生活的方方面面。 但是,NFC到底是谁发明的?什么时候发明的?我们就来了解一下。 NFC的中文全称为近场通信技术&…

85%的攻击现在使用加密通道

©网络研究院 加密攻击仍然是全球各国面临的一个重大问题,美国、印度和日本的攻击数量在过去12个月中增长最快。 此外,与2021年相比,南非的TLS/SSL攻击显著增加。 Zscaler的安全研究和运营副总裁表示:“随着组织网络防御的成熟&#x…

22-12-19 西安 vue-cli(01) vue-cli脚手架、组件化编程、vue-router路由

"对A,我还剩一张牌啦!" "呃。。。要不起" 周六(12-03),早上刷到印度的三相神。梵天,毗湿奴,湿婆,看来很多个相关的视频介绍,结果睡觉(不…

蓝桥杯题目类型总结

搜索类 BFS 大胖子走迷宫(简单)(2019国赛) 迷宫与陷阱:(中等2018国赛) 迷宫与陷阱:(中等2018国赛) 迷宫与陷阱:(中等2018国赛&…

安卓PorterDuffXfermode之正片叠底 PorterDuff.Mode.MULTIPLY

setXfermode Paint#setXfermode()接口是在绘制时设置画笔的图形混合模式的,下面是官网的介绍: public Xfermode setXfermode (Xfermode xfermode) Set or clear the transfer mode object. A transfer mode defines how source pixels (generate by a drawing com…