G1D21-作业-AttacKGSVMkg_book偷懒哈哈哈

news2024/11/20 6:24:13

唔~咖啡泡出来好好看呀!

一、写作业

第一件事是将昨天读的NER综述补充到作业之中~大概30min
50分钟,补充完了思维导图和文档,明确了下一步论文的阅读方向——NER的综述/网安NER具体技术类文章(找找最新的叭)。

二、AttacKG

(一)重调代码

昨天代码跑起来啦,但是emm输出结果好奇怪hhh,本以为是源代码的bug,但看了哆啦a梦的blog,emm发现是自己的问题,再看看~预计1小时

1、重新装了coferee,不太管用

2、把图片放大看,好像没有那么荒凉,还是有字的

哈哈哈哈哈在这里插入图片描述
要被蠢死啦hhhh
在这里插入图片描述
不过这也太丑了叭~

(二)改字体大小(小改代码)

借着这个机会,熟悉一下这里面的代码~
1、在main.py找到对应画图函数
在这里插入图片描述
在这里插入图片描述

2、跳进attackGrapg_generating在这里插入图片描述
3、改draw就好啦
在这里插入图片描述
4、文本太长了emm全都重叠了
在这里插入图片描述
5、主要问题在于label太长了,好丑,之后再调,把节点调大了一点
在这里插入图片描述
6、现在觉得git真香哦~

—1402下午场的AttacKG,

(三)梳理代码

1、先磨下刀,看看别人是怎么复现一篇论文的

(1)先看.py文件的结构,一般分为数据预处理、增强、训练、测试
(2)放小批量数据debug,弄清模块之间的顺序,每个模块的大致功能,不需要弄清楚细节
(3)画出流程图,理清每个模块之间的关系。
https://blog.csdn.net/weixin_45638136/article/details/123772812

tips:

(1)勤注释;输入、输出、功能,不熟练时加入输入输出维度

2、梳理.py结构

(1)惊奇地发现了一张图,比论文呢里的详细一点嘿嘿
在这里插入图片描述
(2)大致目录
preprocess是对报告的预处理
在这里插入图片描述

3、main.py

在这里插入图片描述
在这里插入图片描述


    running_mode = arguments.mode
    print(f"Running mode: {running_mode}")
    if running_mode == "iocProtection":
        # 什么是ioc_protection?
        #输入:报告;
        #功能:先使用"./ioc_regexPattern.json" 找到ioc,再用 "./ioc_replaceWord.json"将其换成对应类型(例如"DocumentFile": "document",),
        #不太明白换了有什么用
        #输出:replaced_text
        ioc_identifier = ioc_protection(report_text)
    elif running_mode == "nlpModelTraining":
        # NLP model training dataset's path, default 路径在../ AttacKG / NLP / Doccano / 20210813.json。好像找不到?
        # 输入:训练集路径,找不到数据hh,default="../AttacKG/data/cti/html/003495c4cb6041c52db4b9f7ead95f05.html
        #输出:训练好的模型./new_cti.model
        # 功能:指定训练数据集,进行训练,生成模型
        trainingSet_path = arguments.trainingSetPath
        parsingModel_training(trainingSet_path)
    elif running_mode == "reportParsing":
        # 输入:report_text
        # 输出:(iid, ioc)----doc为标记好的文本;iid为换好词的文本
        # 功能:分析report
        cti_doc = report_parsing(report_text)
    elif running_mode == "attackGraphGeneration":
        # 输入:报告文本,输出地址
        # 输出: 返回ag, ag = AttackGraph(doc, ioc_identifier=iid),
        # draw pdf-----ag.draw(output)
        # 生成json文件,大概是画的内容叭~ag.to_json_file(output + "_artifacts.json")
        # 功能:分析文本+画图啦
        attack_graph = attackGraph_generating(report_text, arguments.outputPath)
    elif running_mode == "techniqueTemplateGeneration":
        # 输入:输出路径
        #输出:
        # 需要仔细再看看
        techniqueTemplate_generating(output_path=arguments.outputPath)
    elif running_mode == "techniqueIdentification":
        # 输入:如下所示
        #输出:
        #功能:发现文本里的technique
        # 需要仔细看看
        attack_matcher = technique_identifying(report_text, picked_techniques, arguments.templatePath, arguments.outputPath)
    else:
        print("Unknown running mode!")

4、最后两个模块没时间好好看啦,要去跑步啦

1606

三、SVM&RF

今天要看看svm调参的问题&RF的原理~

(一)SVM

1、先跑一下~

2、其他笔记写电脑文档上啦

-------1357
上午写着写着被叫去吃饭啦~
简单试了一下核函数
还差一个多项式核没试~试一下,然后就继续去看KG的代码啦

3、没怎么调的情况下,还是高斯核是最好的

4、之后看下别人是怎么调svm的~ 动手试一试~

接着去看AttacKG啦

-----------1851
今天跑了6km欸,速度比昨天还快一点~运动完心情真的会好!磨磨唧唧看视频吃完饭后,没想到这么自觉开始学习emmmm要被自己感动哭了
看会图谱的书叭~明天晚上还有个讲座捏捏捏

四、KGBOOK

—2057
感觉晚上效率不高哇~不过适当休息也蛮好呀!轻松学习!
刚刚看了3.2知识建模和3.3知识抽取,主要讲的是相关工具。
我的重点放在工具实现的原理上,借此机会去了解,这些任务的工程化实现方法~

(一)知识建模(7步)

1、确定本体的领域和范围
2、考虑使用已有本体
3、列举本体中的关键项
4、确定类和类的结构
5、确定类的属性(对象属性、数据属性)
6、确定属性特点(数据属性的数据类型)
7、创建实例(实体)

五、RCE

(一)安装BURPSUITE

我感觉时间会静止在这个安装时刻
先下着叭~
去看看php漏洞视频叭~

emmm为什么56 这么长呀~还是休息叭hhh

(二)知识抽取

1、导入先验数据(labeled)
2、导入待抽取数据
3、文本预处理(token,词根还原,词性标注,ner,依存句法分析)
4、实体抽取(mention_text,doc_id,sentence_index,begin_index,end_index)
5、候选实体对生成
6、特征抽取
7、样本标注(远程监督&启发式)
8、因子图构建(好像就是个模型???用来生成关系的)

好啦好啦,总结完了,我去看看ctf了~

N、杂

(一)spacy

emm一笔都没写哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/29236.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022 IDEA大会引领科技创新趋势 沈向洋团队重磅发布低空经济白皮书

11月22日,2022 IDEA大会在深圳顺利开幕。大会由深圳市科技创新委员会、深圳市人才工作局和深圳市福田区人民政府指导,粤港澳大湾区数字经济研究院(International Digital Economy Academy,简称“IDEA研究院”)主办。 …

leetcode 216. 组合总和 III

文章目录题目思考代码和注释总结题目 找出所有相加之和为 n 的 k 个数的组合,且满足下列条件: 只使用数字1到9 每个数字 最多使用一次 返回 所有可能的有效组合的列表 。该列表不能包含相同的组合两次,组合可以以任何顺序返回。 来源&…

【图像分类】Efficientnet的学习

文章目录1. Efficientnet的学习1.1 网络模型1.2 MBConv卷积块1.3 模型规模1.4 模型训练方式2. Efficientnet-pytorch代码3.参考1. Efficientnet的学习 论文:https://arxiv.org/abs/1905.11946 1.1 网络模型 主要结构: 基线模型EfficientNet-B0Effici…

ImmunoChemistry艾美捷Annexin DNA损伤ELISA试剂盒方案

使用ImmunoChemistry艾美捷DNA损伤(8-OHdG)ELISA试剂盒定量尿液、细胞培养物、血浆和其他样品基质中的8-OHdG。该试剂盒提供了快速的培养时间、稳定的试剂和用户友好的方案。使用吸光度板读取器分析结果。 8-羟基-2-脱氧鸟苷(8-OHdG&#xff…

开放式激光振镜运动控制器:C++ 快速调用图形库应用

今天,正运动小助手给大家分享一下开放式激光振镜运动控制器:C快速调用图形库应用,本文以二维码打标、文本打标、矢量图形打标为例,解决用户在激光打标时需要进行各种复杂的操作和函数库调用时容易出现的错误问题。 01 ZMC408SCAN…

牛客网语法篇练习复合类型(一)

1.试计算在区间1 到n 的所有整数中,数字x(0 ≤ x ≤ 9)共出现了多少次? 例如,在1到11 中,即在1、2、3、4、5、6、7、8、9、10、11 中,数字1 出现了4 次。 n,x list(map(int,input().split())) …

CSS的两种渐变

线性渐变和径向渐变 几个常见的例子效果 <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title><style>.a{font-size: 20px;width: 100%;height: 50px;margin: 10px;background-image: linear-gradient(r…

应急监管双重预防机制数字化管理解决方案

新《安全生产法》&#xff0c;将组织建立并落实双重预防工作机制写入生产经营单位主要负责人职责中&#xff0c;双重预防机制建设已上升到法律的高度。2021 年 12 月 31 日国务院安委会印发《全国危险化学品安全风险集中治理方案》&#xff0c;将推进基于信息化的危险化学品企业…

大二Web课程设计——海贼王中乔巴专题漫画(可以很好的应付老师的作业)HTML+CSS

HTML实例网页代码, 本实例适合于初学HTML的同学。该实例里面有设置了css的样式设置&#xff0c;有div的样式格局&#xff0c;这个实例比较全面&#xff0c;有助于同学的学习,本文将介绍如何通过从头开始设计个人网站并将其转换为代码的过程来实践设计。 精彩专栏推荐&#x1f4…

Baklib帮助中心|如何设置好客户服务帮助您的客户?

在如今这个高度智能化的时代&#xff0c;很多人已经习惯了靠自己解决问题&#xff0c;所以当人们浏览网页、使用某件商品时&#xff0c;首先想到的不是客户服务&#xff0c;而是服务中心。 那么&#xff0c;您如何设计帮助中心帮助您的客户&#xff1f;这是大多数公司希望解决…

工程项目管理的主要内容都是什么?

工程项目资金管理组织工作主要就文本是什么&#xff1f; 1&#xff0e;物业公司的资金管理组织工作&#xff08;工程建设建筑工程&#xff09; 物业公司的资金管理组织工作是全过程的&#xff0c;主要就包括工程项目重大决策和实行期的全过程&#xff0c;也即从基本建设工程项…

【图文教程】Centos 7下安装Hadoop

环境说明&#xff1a; 系统&#xff1a;Centos7 在VM中安装的 hadoop版本&#xff1a;2.7.7 JDK&#xff1a;1.8 注意&#xff1a;Hadoop需要Java环境的。记得安装Java环境 PS&#xff1a;Centos JDK安装 mkdir /data1&#xff1a;上传jdk的tar.解压 2&#xff1a;修改/e…

vulntarget-b靶场详细通关记录

vulntarget-b靶场详细通关记录 前言 这个靶场打了好几天才打下来&#xff0c;在上线msf和免杀过火绒还有psexec横向移动卡中了很久。而且这个靶场的通关资料较少&#xff0c;吐槽一下网上的相关文章很多关键步骤都不写而且复现不成功。以下将记录个人通关vulntarget-b靶场的详…

简述二进制码、十进制码、BCD码、十六进制码转换的算法

进制转换简述二进制码、十进制码、BCD码、十六进制码转换的算法把四字节 BCD 码 5287 转换为十六进制码 14A7H简述二进制码、十进制码、BCD码、十六进制码转换的算法 ①二进制转十进制&#xff1a;把二进制的“1”&#xff0c;从右边第一个开始按2的1次方&#xff0c;2的2次方…

如何使用轻量应用服务器自带的Cloudreve应用镜像搭建属于自己的云网盘?

Cloudreve是一款开源的网盘软件&#xff0c;支持服务器本机、腾讯云COS等多种存储方式&#xff0c;提供离线下载、拖拽上传、在线预览等功能&#xff0c;可以帮助用户快速搭建个人或多人使用的网盘系统。腾讯云轻量应用服务器 Cloudreve应用镜像集合了Cloudreve、Nginx、MariaD…

【Tensorboard】工具使用细节记录,实现训练数据保存及可视化

目录 1 导入tensorboard-前提安装tensorboard&#xff01; 2 确定存储位置 3 作为预训练参数加载函数 4 调用加载函数 5 保存训练模型参数 6 tensorboard可视化-环境&#xff1a;ubuntu 【学习资源】from torch.utils.tensorboard import SummaryWriter导入不成功问题_…

[附源码]计算机毕业设计JAVA考研部落

[附源码]计算机毕业设计JAVA考研部落 项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven…

算法刷题—树

1.什么是树 1.1树的概念 树(Tree)是n(n>0)个节点的有限集,n0称为空树。 在任意一个棵非空树中: 1.有且仅有一个特定的称为根(Root)的结点; 2.当n>1时,其余节点可以分为m个(m>0)互不相交的T1,T2.....Tm其中每一个集合本身也是一课树并且称为根的子树(SubTree) 注: 在一…

分布式文件存储系统minio

结构化数据&#xff1a;也称作行数据&#xff0c;是由二维表结构来逻辑表达和实现的数据&#xff0c;严格地遵循数据格式与长度规范&#xff0c;主要通过关系型数据库进行存储和管理。 特点&#xff1a;高度组织化和格式化&#xff0c;可以用二维表结构来逻辑表达和实现的数据…

5 - 1 判断题

1.一棵有124个结点的完全二叉树&#xff0c;其叶结点个数是确定的。T 什么是完全二叉树&#xff1f;&#xff08;会的可以跳过&#xff09; 完全二叉树&#xff1a;一棵深度为k的有n个结点的二叉树&#xff0c;对其结点按从上至下&#xff0c;从左至右的顺序进行编号&#xff…