ELK日志分析

ELK日志分析

news2026/2/14 7:41:43

目录

1.ELK概述

ELK简述

ElasticSearch

Kiabana

Logstash

可添加其他的组件

Filebeat

filebeat结合logstash带来好处

缓存/消息队列（redis、kafka、RabbitMQ等）

Fluentd

ELK的好处

完整日志系统基本特征

ELK的工作原理

2.ELK Elasticsearch集群部署

环境准备

部署Elasticsearch软件

安装Elasticsearch-head插件

编译安装node

安装phantomjs

安装Elasticsearch-head数据可视化工具

修改Elasticsearch主配置文件

启动elasticsearch-head服务

通过Elasticsearch-head查看Elasticsearch信息

插入索引

3.ELK Logstash 部署（在apache节点上操作192.168.88.40）

安装apache服务

安装Java环境

安装logstash

测试Logstash

定义logstash配置文件

input

filter

output

4.ELK Kiabana部署（在Node1节点上操作/192.168.88.22）

安装 Kiabana

设置Kibana的主配置文件

创建日志文件，启动 Kibana 服务

验证Kibana

将Apache服务器的日志（访问的、错误的）添加到 Elasticsearch 并通过 Kibana 显示

1.ELK概述

ELK简述

ELK平台是一套完整的日志集中处理解决方案，将 ElasticSearch、Logstash 和 Kiabana 三个开源工具配合使用，完成更强大的用户对日志的查询、排序、统计需求。

ElasticSearch

是基于Lucene（一个全文检索引擎的架构）开发的分布式存储检索引擎，用来存储各类日志。
Elasticsearch 是用 Java 开发的，可通过 RESTful Web 接口，让用户可以通过浏览器与 Elasticsearch 通信。
Elasticsearch是一个实时的、分布式的可扩展的搜索引擎，允许进行全文、结构化搜索，它通常用于索引和搜索大容量的日志数据，也可用于搜索许多不同类型的文档。

Kiabana

Kibana 通常与 Elasticsearch 一起部署，Kibana 是 Elasticsearch 的一个功能强大的数据可视化 Dashboard，Kibana 提供图形化的 web 界面来浏览 Elasticsearch 日志数据，可以用来汇总、分析和搜索重要数据。

Logstash

作为数据收集引擎。它支持动态的从各种数据源搜集数据，并对数据进行过滤、分析、丰富、统一格式等操作，然后存储到用户指定的位置，一般会发送给 Elasticsearch。
Logstash 由 Ruby 语言编写，运行在 Java 虚拟机（JVM）上，是一款强大的数据处理工具，可以实现数据传输、格式处理、格式化输出。Logstash 具有强大的插件功能，常用于日志处理。

可添加其他的组件

Filebeat

轻量级的开源日志文件数据搜集器。通常在需要采集数据的客户端安装 Filebeat，并指定目录与日志格式，Filebeat 就能快速收集数据，并发送给 logstash 进行解析，或是直接发给 Elasticsearch 存储，性能上相比运行于 JVM 上的 logstash 优势明显，是对它的替代。常应用于 EFLK 架构当中。

filebeat结合logstash带来好处

通过 Logstash 具有基于磁盘的自适应缓冲系统，该系统将吸收传入的吞吐量，从而减轻 Elasticsearch 持续写入数据的压力
从其他数据源（例如数据库，S3对象存储或消息传递队列）中提取
将数据发送到多个目的地，例如S3，HDFS（Hadoop分布式文件系统）或写入文件
使用条件数据流逻辑组成更复杂的处理管道

缓存/消息队列（redis、kafka、RabbitMQ等）

可以对高并发日志数据进行流量削峰和缓冲，这样的缓冲可以一定程度的保护数据不丢失，还可以对整个架构进行应用解耦。

Fluentd

是一个流行的开源数据收集器。由于 logstash 太重量级的缺点，Logstash 性能低、资源消耗比较多等问题，随后就有 Fluentd 的出现。相比较 logstash，Fluentd 更易用、资源消耗更少、性能更高，在数据处理上更高效可靠，受到企业欢迎，成为 logstash 的一种替代方案，常应用于 EFK 架构当中。在 Kubernetes 集群中也常使用 EFK 作为日志数据收集的方案。
在 Kubernetes 集群中一般是通过 DaemonSet 来运行 Fluentd，以便它在每个 Kubernetes 工作节点上都可以运行一个 Pod。它通过获取容器日志文件、过滤和转换日志数据，然后将数据传递到 Elasticsearch 集群，在该集群中对其进行索引和存储。

ELK的好处

日志主要包括系统日志、应用程序日志和安全日志。系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷，性能安全性，从而及时采取措施纠正错误。
往往单台机器的日志我们使用grep、awk等工具就能基本实现简单分析，但是当日志被分散的储存不同的设备上。如果你管理数十上百台服务器，你还在使用依次登录每台机器的传统方法查阅日志。这样是不是感觉很繁琐和效率低下。当务之急我们使用集中化的日志管理，例如：开源的syslog，将所有服务器上的日志收集汇总。集中化管理日志后，日志的统计和检索又成为一件比较麻烦的事情，一般我们使用 grep、awk和wc等Linux命令能实现检索和统计，但是对于要求更高的查询、排序和统计等要求和庞大的机器数量依然使用这样的方法难免有点力不从心。
一般大型系统是一个分布式部署的架构，不同的服务模块部署在不同的服务器上，问题出现时，大部分情况需要根据问题暴露的关键信息，定位到具体的服务器和服务模块，构建一套集中式日志系统，可以提高定位问题的效率。

完整日志系统基本特征

收集：能够采集多种来源的日志数据

传输：能够稳定的把日志数据解析过滤并传输到存储系统

存储：存储日志数据

分析：支持 UI 分析

警告：能够提供错误报告，监控机制

ELK的工作原理

在所有需要收集日志的服务器上部署Logstash；或者先将日志进行集中化管理在日志服务器上，在日志服务器上部署 Logstash。
Logstash 收集日志，将日志格式化并输出到 Elasticsearch 群集中。
Elasticsearch 对格式化后的数据进行索引和存储。
Kibana 从 ES 群集中查询数据生成图表，并进行前端数据的展示。

总结：logstash作为日志搜集器，从数据源采集数据，并对数据进行过滤，格式化处理，然后交由Elasticsearch存储，kibana对日志进行可视化处理。

2.ELK Elasticsearch集群部署

实验准备：

192.168.88.22          node1/Elasticsearch
192.168.88.40          node2/Elasticsearch
192.168.88.13          node3/Elasticsearch
192.168.88.31          apache/Logstash/Kibana

systemctl stop firewalld
setenforce 0

环境准备

//3个noede节点同时配置
tar -xf jdk-8u361-linux-x64.tar.gz
mkdir -p /usr/java                 #先在此目录下创建一个java目录
mv jdk1.8.0_361/ /usr/java         #将此文件移动过去
 
vim /etc/profile.d/java.sh
 
export JAVA_HOME=/usr/java/jdk1.8.0_361
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH
 
source /etc/profile.d/java.sh      #启动此脚本
java -version

部署Elasticsearch软件

1.安装elasticsearch—rpm包
#上传elasticsearch-6.7.2.rpm到/opt目录下
cd /opt
yum localinstall -y elasticsearch-6.7.2.rpm

2.修改elasticsearch主配置文件
vim /etc/elasticsearch/elasticsearch.yml
--17--取消注释，指定集群名字
cluster.name: yy-elk-cluster
--23--取消注释，指定节点名字：Node1节点为node1，Node2节点为node2，Node3节点为node3
node.name: node1
node.master: true		#是否master节点，false为否
node.data: true			#是否数据节点，false为否
--33--取消注释，指定数据存放路径
path.data: /var/lib/elasticsearch
--37--取消注释，指定日志存放路径
path.logs: /var/log/elasticsearch
--43--取消注释，避免es使用swap交换分区
bootstrap.memory_lock: true
--55--取消注释，设置监听地址，0.0.0.0代表所有地址
network.host: 0.0.0.0
--59--取消注释，ES 服务的默认监听端口为9200
http.port: 9200					#指定es集群提供外部访问的接口
transport.tcp.port: 9300		#指定es集群内部通信接口
--68--取消注释，集群发现通过单播实现，指定要发现的节点
discovery.zen.ping.unicast.hosts: ["192.168.88.22:9300", "192.168.88.40:9300","192.168.88.13:9300"]

grep -v "^#" /etc/elasticsearch/elasticsearch.yml

3.es 性能调优参数
#优化最大内存大小和最大文件描述符的数量
vim /etc/security/limits.conf
......
*  soft    nofile          65536
*  hard    nofile          65536
*  soft    nproc           32000
*  hard    nproc           32000
*  soft    memlock         unlimited
*  hard    memlock         unlimited

vim /etc/systemd/system.conf
DefaultLimitNOFILE=65536
DefaultLimitNPROC=32000
DefaultLimitMEMLOCK=infinity

需重启生效

#优化elasticsearch用户拥有的内存权限
由于ES构建基于lucene, 而lucene设计强大之处在于lucene能够很好的利用操作系统内存来缓存索引数据，以提供快速的查询性能。lucene的索引文件segements是存储在单文件中的，并且不可变，对于OS来说，能够很友好地将索引文件保持在cache中，以便快速访问；因此，我们很有必要将一半的物理内存留给lucene ; 另一半的物理内存留给ES（JVM heap )。所以， 在ES内存设置方面，可以遵循以下原则：
1.当机器内存小于64G时，遵循通用的原则，50%给ES，50%留给操作系统，供lucene使用
2.当机器内存大于64G时，遵循原则：建议分配给ES分配 4~32G 的内存即可，其它内存留给操作系统，供lucene使用

vim /etc/sysctl.conf
#一个进程可以拥有的最大内存映射区域数，参考数据（分配 2g/262144，4g/4194304，8g/8388608）
vm.max_map_count=262144

sysctl -p
sysctl -a | grep vm.max_map_count

4.启动elasticsearch是否成功开启
systemctl start elasticsearch.service
systemctl enable elasticsearch.service
netstat -antp | grep 9200

5.查看节点信息
浏览器访问  http://192.168.88.22:9200  、 http://192.168.88.40:9200 、http://192.168.88.13:9200查看节点 Node1、Node2、Node3的信息。

浏览器访问 http://192.168.88.22:9200/_cluster/health?pretty查看群集的健康情况，可以看到 status 值为 green（绿色）， 表示节点健康运行。

浏览器访问 http://192.168.88.22:9200/_cluster/state?pretty  检查群集状态信息。

#使用上述方式查看群集的状态对用户并不友好，可以通过安装 Elasticsearch-head 插件，可以更方便地管理群集。

安装Elasticsearch-head插件

Elasticsearch 在 5.0 版本后，Elasticsearch-head 插件需要作为独立服务进行安装，需要使用npm工具（NodeJS的包管理工具）安装。
安装 Elasticsearch-head 需要提前安装好依赖软件 node 和 phantomjs。
node：是一个基于 Chrome V8 引擎的 JavaScript 运行环境。
phantomjs：是一个基于 webkit 的JavaScriptAPI，可以理解为一个隐形的浏览器，任何基于 webkit 浏览器做的事情，它都可以做到。

编译安装node

（192.168.88.22/可以在任意一台node节点上安装）

yum install gcc gcc-c++ make -y
cd /opt
tar -xf node-v8.2.1.tar.gz 

cd node-v8.2.1/
./configure
make && make install    #如果电脑内存多 建议多核编译安装 -j 指定核数

安装phantomjs

#上传软件包 phantomjs-2.1.1-linux-x86_64.tar.bz2 到
cd /opt
tar -xf phantomjs-2.1.1-linux-x86_64.tar.bz2
cd /opt/phantomjs-2.1.1-linux-x86_64/bin
cp phantomjs /usr/local/bin

安装Elasticsearch-head数据可视化工具

#上传软件包 elasticsearch-head-master.zip 到/opt
cd /opt
unzip elasticsearch-head-master.zip
cd /opt/elasticsearch-head/
npm install		 //安装依赖包

修改Elasticsearch主配置文件

vim /etc/elasticsearch/elasticsearch.yml
......
--末尾添加以下内容--
http.cors.enabled: true				#开启跨域访问支持，默认为 false
http.cors.allow-origin: "*"			#指定跨域访问允许的域名地址为所有

systemctl restart elasticsearch

启动elasticsearch-head服务

#必须在解压后的 elasticsearch-head 目录下启动服务，进程会读取该目录下的 gruntfile.js 文件，否则可能启动失败。
cd /opt/elasticsearch-head-master/
npm run start &

> elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
> grunt server

Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100

#elasticsearch-head 监听的端口是 9100
netstat -natp |grep 9100

通过Elasticsearch-head查看Elasticsearch信息

通过浏览器访问 http://192.168.88.22:9100/ 地址并连接群集。如果看到群集健康值为 green 绿色，代表群集很健康。

插入索引

#通过命令插入一个测试索引，索引为 index-demo，类型为 test。
curl -X PUT 'localhost:9200/index-demo/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}'
//输出结果如下：
{
"_index" : "index-demo",
"_type" : "test",
"_id" : "1",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 2,
"failed" : 0
},
"created" : true
}

浏览器访问 http://192.168.88.22:9100/ 查看索引信息，可以看见索引默认被分片5个，并且有一个副本。
点击“数据浏览”，会发现在node1上创建的索引为 index-demo，类型为 test 的相关信息。

创建索引
curl -X PUT[|POST] http://IP:9200/<索引名>[/<类型>/<文档ID>?pretty&pretty] \
[-H 'content-Type: application/json' -d '{"键名1":"键值","键名2":"键值"}']

删除索引
curl -X DELETE http://IP:9200/<索引名>[,<索引名2>,....]

查看索引配置
curl -X GET http://IP:9200/<索引名>/_settings

修改索引配置
curl -X PUT http://IP:9200/<索引名>/_settings \
-H 'content-Type: application/json' -d '{"键名":"键值"}'

创建索引别名
curl -X POST http://IP:9200/_aliases \
-H 'content-Type: application/json' -d '{"actions":[{"add":{"index":"索引名","alias":"索引别名"}}]}'

删除索引别名
curl -X POST http://IP:9200/_aliases \
-H 'content-Type: application/json' -d '{"actions":[{"remove":{"index":"索引名","alias":"索引别名"}}]}'

3.ELK Logstash 部署（在apache节点上操作192.168.88.40）

安装apache服务

yum -y install httpd
systemctl start httpd

安装Java环境

tar -xf jdk-8u361-linux-x64.tar.gz
mkdir -p /usr/java                 #先在此目录下创建一个java目录
mv jdk1.8.0_361/ /usr/java         #将此文件移动过去
 
vim /etc/profile.d/java.sh
 
export JAVA_HOME=/usr/java/jdk1.8.0_361
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH
 
source /etc/profile.d/java.sh      #启动此脚本
java -version

安装logstash

#上传软件包 logstash-6.7.2.rpm 到/opt目录下
cd /opt
rpm -ivh logstash-6.7.2.rpm                          
systemctl start logstash.service                      
systemctl enable logstash.service

ln -s /usr/share/logstash/bin/logstash /usr/local/bin/

测试Logstash

Logstash 命令常用选项：
-f：通过这个选项可以指定 Logstash 的配置文件，根据配置文件配置 Logstash 的输入和输出流。
-e：从命令行中获取，输入、输出后面跟着字符串，该字符串可以被当作 Logstash 的配置（如果是空，则默认使用 stdin 作为输入，stdout 作为输出）。
-t：测试配置文件是否正确，然后退出。

定义输入和输出流：
#输入采用标准输入，输出采用标准输出（类似管道），新版本默认使用 rubydebug 格式输出
logstash -e 'input { stdin{} } output { stdout{} }'

#使用 rubydebug 输出详细格式显示，codec 为一种编解码器
logstash -e 'input { stdin{} } output { stdout{ codec=>rubydebug } }'

#使用 Logstash 将信息写入 Elasticsearch 中
logstash -e 'input { stdin{} } output { elasticsearch { hosts=>["192.168.88.22:9200"] } }'
			 输入				输出			对接
......
www.baidu.com										#键入内容（标准输入）
www.sina.com.cn										#键入内容（标准输入）
www.google.com										#键入内容（标准输入）

//结果不在标准输出显示，而是发送至 Elasticsearch 中，可浏览器访问 http://192.168.88.22:9100/ 查看索引信息和数据浏览。

定义logstash配置文件

Logstash 配置文件基本由三部分组成：input、output 以及 filter（可选，根据需要选择使用）。

input

表示从数据源采集数据，常见的数据源如Kafka、日志文件等
file beats kafka redis stdin

filter

表示数据处理层，包括对数据进行格式化处理、数据类型转换、数据过滤等，支持正则表达式
grok 对若干个大文本字段进行再分割成一些小字段 (?<字段名>正则表达式) 字段名: 正则表达式匹配到的内容
date 对数据中的时间格式进行统一和格式化
mutate 对一些无用的字段进行剔除，或增加字段
mutiline 对多行数据进行统一编排，多行合并或拆分

output

表示将Logstash收集的数据经由过滤器处理之后输出到Elasticsearch。
elasticsearch stdout

#格式如下：
input {...}
filter {...}
output {...}

#修改 Logstash 配置文件，让其收集系统日志/var/log/messages，并将其输出到 elasticsearch 中。
chmod +r /var/log/messages					#让 Logstash 可以读取日志

cd /etc/logstash/conf.d/
vim system.conf
input {
    file{
        path =>"/var/log/messages"
        type =>"system"
        start_position =>"beginning"
		# ignore_older => 604800
        sincedb_path => "/etc/logstash/sincedb_path/log_progress"
        add_field => {"log_hostname"=>"${HOSTNAME}"}
    }
}
#path表示要收集的日志的文件位置
#type是输入ES时给结果增加一个叫type的属性字段
#start_position可以设置为beginning或者end，beginning表示从头开始读取文件，end表示读取最新的，这个要和ignore_older一起使用
#ignore_older表示了针对多久的文件进行监控，默认一天，单位为秒，可以自己定制，比如默认只读取一天内被修改的文件
#sincedb_path表示文件读取进度的记录，每行表示一个文件，每行有两个数字，第一个表示文件的inode，第二个表示文件读取到的位置（byteoffset）。默认为$HOME/.sincedb*
#add_field增加属性。这里使用了${HOSTNAME}，即本机的环境变量，如果要使用本机的环境变量，那么需要在启动命令上加--alow-env

output {
    elasticsearch {												#输出到 elasticsearch
        hosts => ["192.168.88.22:9200","192.168.88.40:9200","192.168.88.13:9200"]	#指定 elasticsearch 服务器的地址和端口
        index =>"system-%{+YYYY.MM.dd}"							#指定输出到 elasticsearch 的索引格式
    }
}

mkdir /etc/logstash/sincedb_path/
touch /etc/logstash/sincedb_path/log_progress
chown logstash:logstash /etc/logstash/sincedb_path/log_progress

logstash -f system.conf

浏览器访问 http://192.168.88.22:9100/ 查看索引信息

4.ELK Kiabana部署（在Node1节点上操作/192.168.88.22）

安装 Kiabana

#上传软件包 kibana-6.7.2-x86_64.rpm 到/opt目录
cd /opt
rpm -ivh kibana-6.7.2-x86_64.rpm

设置Kibana的主配置文件

vim /etc/kibana/kibana.yml
--2--取消注释，Kiabana 服务的默认监听端口为5601
server.port: 5601
--7--取消注释，设置 Kiabana 的监听地址，0.0.0.0代表所有地址
server.host: "0.0.0.0"
--28--取消注释，配置es服务器的ip，如果是集群则配置该集群中master节点的ip
elasticsearch.url:  ["http://192.168.88.22:9200","http://192.168.88.40:9200","http://192.168.88.13:9200"] 
--37--取消注释，设置在 elasticsearch 中添加.kibana索引
kibana.index: ".kibana"
--96--取消注释，配置kibana的日志文件路径（需手动创建），不然默认是messages里记录日志
logging.dest: /var/log/kibana.log
--113--取消注释,设置为中文
i18n.locale: "zh-CN"

创建日志文件，启动 Kibana 服务

touch /var/log/kibana.log
chown kibana:kibana /var/log/kibana.log

systemctl start kibana.service
systemctl enable kibana.service

netstat -natp | grep 5601

验证Kibana

浏览器访问 http://192.168.88.22:5601
第一次登录需要添加一个 Elasticsearch 索引：
Management -> Index Pattern -> Create index pattern
Index pattern 输入：system-*	#在索引名中输入之前配置的 Output 前缀“system”

Next step -> Time Filter field name 选择 @timestamp -> Create index pattern

单击 “Discover” 按钮可查看图表信息及日志信息。
数据展示可以分类显示，在“Available Fields”中的“host”，然后单击 “add”按钮，可以看到按照“host”筛选后的结果

将Apache服务器的日志（访问的、错误的）添加到 Elasticsearch 并通过 Kibana 显示

vim /etc/logstash/conf.d/apache_log.conf
input {
    file{
        path => "/etc/httpd/logs/access_log"
        type => "access"
        start_position => "beginning"
    }
    file{
        path => "/etc/httpd/logs/error_log"
        type => "error"
        start_position => "beginning"
    }
}
output {
    if [type] == "access" {
        elasticsearch {
            hosts => ["192.168.88.22:9200","192.168.88.40:9200","192.168.88.13:9200"]
            index => "apache_access-%{+YYYY.MM.dd}"
        }
    }
	if [type] == "error" {
        elasticsearch {
            hosts => ["192.168.88.22:9200","192.168.88.40:9200","192.168.88.13:9200"]
            index => "apache_error-%{+YYYY.MM.dd}"
        }
    }
}

cd /etc/logstash/conf.d/
/usr/share/logstash/bin/logstash -f apache_log.conf

浏览器访问 http://192.168.88.22:9100 查看索引是否创建

浏览器访问 http://192.168.88.22:5601 登录 Kibana，单击“Index Pattern -> Create Index Pattern”按钮添加索引， 在索引名中输入之前配置的 Output 前缀 apache_access-*，并单击“Create”按钮。在用相同的方法添加 apache_error-*索引。
选择“Discover”选项卡，在中间下拉列表中选择刚添加的 apache_access-* 、apache_error-* 索引， 可以查看相应的图表及日志信息。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1395651.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Git提交 ssh: connect to host github.com port 22: Connection timed out解决方案

Git提交 ssh: connect to host github.com port 22: Connection timed out解决方案

你们好，我是金金金。场景之前都是好好的，不知道今天为什么提交代码就这样了排查根据英文可以看出，ssh端口号被拒绝了，22号端口不行，那就换一个端口造成error的原因 ssh端口被拒绝解决找到.ssh文件&#xff…

阅读更多...

Producer源码解读

Producer源码解读

Producer源码解读在 Kafka 中, 我们把产生消息的一方称为 Producer 即生产者, 它是 Kafka 的核心组件之一, 也是消息的来源所在。它的主要功能是将客户端的请求打包封装发送到 kafka 集群的某个 Topic 的某个分区上。那么这些生产者产生的消息是怎么传到 Kafka 服务端的呢&a…

阅读更多...

Linux系统三剑客之grep和正则表达式的介绍(一)

Linux系统三剑客之grep和正则表达式的介绍(一)

1.正则表达式目录 1.正则表达式 1.什么是正则表达式 ？ 2.正则表达式的使用场景 3.正则表达式字符表示 4.它们之间的区别 2.grep命令作用： 语法： 说明： 选项：options 重点实例 3.后面的下次再更新。 …

阅读更多...

hanlp,pkuseg,jieba,cutword分词实践

hanlp,pkuseg,jieba,cutword分词实践

总结：只有jieba,cutword,baidu lac成功将色盲色弱成功分对,这两个库字典应该是最全的 hanlp[持续更新中] https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/tok_stl.ipynb import hanlp # hanlp.pretrained.tok.ALL # 语种见名称最…

阅读更多...

统计学-R语言-6.3

统计学-R语言-6.3

文章目录前言总体方差的区间估计总体方差的区间估计(一个总体方差的估计)总体方差的区间估计(两个总体方差比的估计) 总结前言本篇文章是最后一个介绍参数估计的章节。总体方差的区间估计研究一个总体时，推断总体方差使用的统计量为样本方差。研究两个总体…

阅读更多...

MacOS受欢迎的数据库开发工具 Navicat Premium 15 中文版

MacOS受欢迎的数据库开发工具 Navicat Premium 15 中文版

Navicat Premium 15 Mac是一款数据库管理工具，提供了一个全面的解决方案，用于连接、管理和维护各种数据库系统。以下是Navicat Premium 15 Mac的一些主要功能和特点： 软件下载：Navicat Premium 15 中文版下载多平台支持&#xff…

阅读更多...

代码、课程、教学的一些思考-2024

代码、课程、教学的一些思考-2024

1 代码、算法、艺术品 1.1 代码最典型的C代码示例。以下是一个简单的C代码示例，它打印出“Hello, World!”： #include <iostream> int main() { std::cout << "Hello, World!"; return 0; } 这段代码定义了一个程序&a…

阅读更多...

2024年美国各州即将生效的新隐私保护法（上）

2024年美国各州即将生效的新隐私保护法（上）

2024年美国各州即将生效的新隐私保护法（上） 文章目录 2024年美国各州即将生效的新隐私保护法（上）前言一、2023年隐私保护法开始生效的五个州二、2023年通过了新的隐私保护法的八个州三、2024年确定截止的州及法律法规（…

阅读更多...

Python GUI 新手入门教程：轻松构建图形用户界面

Python GUI 新手入门教程：轻松构建图形用户界面

Python 凭借其简单性和多功能性，已经成为最流行的编程语言之一。被广泛应用于从 web 开发到数据科学的各个领域。在本教程中，我们将探索用于创建图形用户界面（GUIs）的 Python 内置库： Tkinter：无论你是初…

阅读更多...

深入学习卷积神经网络（CNN）的原理知识

深入学习卷积神经网络（CNN）的原理知识

在深度学习领域中，已经经过验证的成熟算法，目前主要有深度卷积网络（DNN）和递归网络（RNN），在图像识别，视频识别，语音识别领域取得了巨大的成功，正是由于这些成…

阅读更多...

gitlab 命令执行漏洞（CVE-2022-2992）

gitlab 命令执行漏洞（CVE-2022-2992）

1.漏洞影响版本 GitLab CE/EE 中的一个漏洞影响从 11.10 开始到 15.1.6 之前的所有版本、从 15.2 开始到 15.2.4 之前的所有版本、从 15.3 开始到 15.3.2 之前的所有版本。允许经过身份验证的用户通过从 GitHub API 端点导入实现远程代码执行。查看 gitlab 版本。(登录后才能…

阅读更多...

keil logic analyzer使用

keil logic analyzer使用

DARMSTM.DLL--- -pSTM32F103VC ---- TRAMSTM.DLL ------ -pSTM32F103VC 然后点击DEBUG按钮用上面的名称USART1_SR 点击STUP 不同的引脚，用不同的名称，通过放大缩小来查看波形。当前串口用的是USART1_SR，只能用这个名称，…

阅读更多...

海思刷机注意事项

海思刷机注意事项

目录为什么写这个文档海思SOC刷机原理1.串口缓冲区关闭2.IP地址自动更改导致无法烧录3.烧录完成后找不到根文件系统4.由于电源设计不合理导致无法烧录为什么写这个文档海思SOC刷机时,偶然会遇到奇奇怪怪的问题,会刷机不上.现在总结一下. 海思SOC刷机原理如果没有任何程序…

阅读更多...

VUE--组件通信（非父子）

VUE--组件通信（非父子）

一、非父子通信 --- event bus 事件总线作用：非父子组件之间进行简易的消息传递步骤： 1、创建一个都能访问到的事件总线（空vue实例）--- utils/EventBus.js import Vue from vue export default new Vue({}) 2、接收方&…

阅读更多...

day5：IO多路复用

day5：IO多路复用

思维导图 TCP并发服务器的IO复用poll函数实现 #include <head.h> #define SER_PORT 8888 #define SER_IP "192.168.232.133" int main(int argc, const char *argv[]) {int sfdsocket(AF_INET,SOCK_STREAM,0);if(sfd-1){perror("sfd error:");retur…

阅读更多...

【正点原子STM32】Cortex-M系列介绍(ARM、Cortex、DMIPS/MHz和CoreMark/MHz*)

【正点原子STM32】Cortex-M系列介绍(ARM、Cortex、DMIPS/MHz和CoreMark/MHz*)

一、ARM公司二、Cortex内核分类及特征三、Cortex-M3/4/7介绍四、总结 ARM官网 ARM开发者官网 CoreMark分数一、ARM公司 ARM架构特点 ARM（Advanced RISC Machine）架构是一种RISC（Reduced Instruction Set Computing）架构&…

阅读更多...

【征服redis2】redis的事务介绍

【征服redis2】redis的事务介绍

目录 1.redis事务介绍 2 事务出错的处理 1.redis事务介绍在前面我们介绍了redis的几种典型数据结构和应用，本文我们来看一下redis的事务问题。事务也是数据库的重要主题，熟悉关系型数据库的读者应该对事务比较了解，简单地说，事…

阅读更多...

第四期——kali

第四期——kali

文章目录 12.4kali安装内网主机发现探测 12.5nmapnccdnzenmapdocker启动redisredis命令vulhub启动redispython爆破redis密码密码攻击——九头蛇hydra密码攻击——美杜莎medusa 12.6rsyncgobyMongoDBmongodb命令hydra爆破python脚本爆破 12.7Elasticsearchpython连接esMetasploi…

阅读更多...

系分备考计算机网络传输介质、通信方式和交换方式

系分备考计算机网络传输介质、通信方式和交换方式

文章目录 1、概述2、传输介质3、网络通信4、网络交换5、总结 1、概述计算机网路是系统分析师考试的常考知识点，本篇主要记录了知识点：网络传输介质、网络通信和数据交换方式等。 2、传输介质网络的传输最常见的就是网线，也就是双绞线&…

阅读更多...

蓝天采集器，功能逆天的网站数据抓取神器，轻松助你成为采集达人，附带搭建配置文档

蓝天采集器，功能逆天的网站数据抓取神器，轻松助你成为采集达人，附带搭建配置文档

源码介绍蓝天采集器是一款专为web服务器打造的数据采集神器。与市面上常见的桌面端采集工具（如火车头等）相比，蓝天采集器在易用性、上手成本和灵活性方面更胜一筹。它部署简便，无需复杂的设置，即可迅速融入您的web服…

阅读更多...

推荐文章

最新文章