【分布式技术专题】「分布式技术架构」MySQL数据同步到Elasticsearch之N种方案解析,实现高效数据同步

news2025/1/9 16:57:54

MySQL数据同步到Elasticsearch之N种方案解析,实现高效数据同步

  • 前提介绍
  • MySQL和ElasticSearch的同步双写
    • 优点
    • 缺点
      • 针对于缺点补充优化方案
  • MySQL和ElasticSearch的异步双写
    • 优点
    • 缺点
  • 定时延时写入ElasticSearch数据库机制
    • 优点
    • 缺点
  • 开源和成熟的数据迁移工具选型
    • Logstash组件同步数据机制
      • Logstash是什么
      • 配置过程
        • **配置Logstash的input插件**
        • **配置Logstash的filter插件**
        • **配置Logstash的output插件**
        • 启动Logstash并确认同步
    • Elasticsearch JDBC同步数据
      • Elasticsearch JDBC插件
        • 安装Elasticsearch和JDBC插件
          • 安装JDBC插件
          • 验证插件安装
        • 配置JDBC插件
          • JDBC配置选项
        • 配置Elasticsearch的mapping和index
        • 启动JDBC插件并同步数据
      • Elasticsearch JDBC插件同步的问题
    • 使用Canal进行数据同步
      • Canal的原理分析
      • 主要流程如下
      • 配置安装流程
        • 安装Canal和Elasticsearch
        • 配置Canal
          • 创建Canal的实例
          • 配置Canal的规则
        • 配置Canal的filter插件
          • 配置Canal的步骤
            • 设置数据库的正则表达式,用于匹配需要同步的数据库
          • 设置表的正则表达式,用于匹配需要同步的表
        • 配置Canal的output插件
          • 配置流程
    • 使用Debezium同步数据
      • 配置Debezium的同步体系的流程
        • 配置Debezium
        • 配置Kafka
        • 配置Logstash
        • 配置Elasticsearch
        • 配置Debezium连接到MySQL
        • 配置Debezium发送到Kafka
        • 配置Logstash发送到Elasticsearch(可选)

前提介绍

在现代数据处理中,将MySQL数据同步到Elasticsearch(ES)是一项常见的任务。本文将深入分析MySQL数据同步到ES的四种常见解决方案,并为您提供详细的解释和比较。无论您是使用Logstash、MySQL binlog、MySQL插件还是开源工具,我们将为您提供深入的技术分析和实现细节。通过本文,您将了解每种方案的优缺点、适用场景以及如何选择最适合您需求的方案。让我们一起探索如何实现高效的MySQL数据同步到Elasticsearch!
在这里插入图片描述

MySQL和ElasticSearch的同步双写

MySQL数据同步到Elasticsearch(ES)的双写机制是一种常见的数据处理方式,用于确保MySQL和ES之间的数据一致性。通过这种双写机制,可以确保MySQL和ES之间的数据保持一致性,使得应用程序可以同时从MySQL和ES中获取准确的数据。
在这里插入图片描述

  • 第一步:数据写入MySQL:应用程序将数据写入MySQL数据库,确保数据在MySQL中持久化。

  • 第二步:数据同步到ES:触发器或存储过程将数据同步到ES,可以使用适当的工具或自定义脚本来实现数据同步,通过调用ES的API将数据插入、更新或删除到ES中。

注意,由于异步的特性,可能会导致主备数据不一致的情况发生

优点

  • 业务逻辑简单:MySQL数据同步到Elasticsearch的双写机制相对简单,易于实现和维护。
  • 实时性高:通过双写机制,可以实现MySQL和Elasticsearch之间的实时数据同步,保持数据的及时性。

缺点

  • 硬编码:需要在每个需要写入MySQL的地方都添加写入Elasticsearch的代码,导致代码的耦合性增加。
  • 业务强耦合:双写机制使得业务与Elasticsearch强耦合,增加了系统的复杂性和维护成本。
  • 存在双写失败丢数据风险:如果写入MySQL成功但写入Elasticsearch失败,可能会导致数据不一致或丢失的风险。
  • 性能较差:由于双写机制需要同时写入MySQL和Elasticsearch,会增加系统的负载和延迟,导致性能下降。

针对于缺点补充优化方案

  • 解耦业务:将MySQL和Elasticsearch的写入操作解耦,使用消息队列或异步任务来处理Elasticsearch的写入,减少对业务代码的侵入。
  • 性能优化:通过优化MySQL和Elasticsearch的配置、增加硬件资源或使用缓存等手段,提升系统的性能,减少性能下降的影响。

MySQL和ElasticSearch的异步双写

通过上面说的解耦业务,因此我们可以通过消息队列(MQ)来实现异步的多源写入,就作为了异步双写。异步双写是指在主库上进行数据修改操作时,将数据异步写入备库。这种方式可以降低主库的写入延迟,并且备库出现问题时不会影响主库的性能。
在这里插入图片描述
通过借助消息队列实现异步的多源写入,可以提高系统的性能、可扩展性和可靠性,同时降低数据源之间的耦合度。这种方案适用于需要将数据写入到多个数据源的场景,如日志记录、数据同步和数据分发等。

优点

  • 高性能:通过使用消息队列,应用程序可以将数据异步地发送到消息队列中,而不需要等待数据写入到多个数据源。通过使用消息队列(MQ)进行异步写入,可以提高系统的吞吐量和响应速度

  • 解耦和扩展性:使用消息队列可以将数据源之间的耦合度降低,使得应用程序更加灵活和可扩展。可以根据需要增加或减少数据源,而不需要修改应用程序的代码。

  • 容错和可靠性:消息队列通常具有持久化和消息重试机制,可以确保数据的可靠传输和处理。即使某个数据源不可用,数据仍然可以在消息队列中等待处理。

  • 异构数据源支持:通过使用消息队列,可以将数据写入到不同类型的数据源,如关系型数据库、NoSQL数据库或其他存储系统,从而实现异构数据源的支持。

注意,使用消息队列进行异步写入需要考虑一些因素,如消息队列的性能、消息的顺序性和一致性等。此外,需要确保消息队列和数据源之间的数据一致性,并处理可能出现的错误和异常情况。

缺点

  • 硬编码问题:接入新的数据源需要实现新的消费者代码,这可能增加开发和维护的复杂性。

  • 系统复杂度增加:引入了消息中间件,增加了系统的复杂性和部署的难度。

  • 延时控制:由于MQ是异步消费模型,用户写入的数据不一定能立即在ES中看到,可能会造成一定的延时。

定时延时写入ElasticSearch数据库机制

上面两种方案在处理MySQL数据同步到Elasticsearch,开发以及硬编码问题会导致代码的侵入性过强。如果对实时性要求不高,可以考虑使用定时器来处理数据同步。
在这里插入图片描述

  1. 在数据库表中添加一个名为timestamp的字段,该字段会在任何CURD操作发生时自动更新。

  2. 原有的程序中的CURD操作保持不变。

  3. 添加一个定时器程序,定期扫描指定的表,并提取在指定时间段内发生变化的数据。

  4. 将提取的数据逐条写入到Elasticsearch中,以保持数据的同步性。

注意,由于定时器的方式是异步的,所以对于实时性要求较高的场景可能不适用。但对于一些不需要实时同步的情况,定时器方案可以提供一种简单有效的数据同步方式。

优点

通过这种方式,可以避免对原有程序进行大量修改,减少硬编码的问题。定时器程序可以根据需求设置合适的时间周期,将变化的数据同步到Elasticsearch中。

缺点

定时任务是指在固定的时间点或时间间隔内将主库中的数据同步到备库中。这种方式可以避免主库的写入延迟,同时保证备库中的数据与主库中的数据一致,但是可能会存在备库中数据的滞后问题。

开源和成熟的数据迁移工具选型

当开发时间比较紧张,以及针对于开发的进度要求必须快速落地的时候,那么我们是没有那么多的时间去设计和开发迁移组件的,那么这个时候我们就需要寻找站在巨人的肩膀上去实现和使用了,我们去

Logstash组件同步数据机制

Logstash是什么

Logstash是一种出色的开源数据收集引擎,能够从各种不同的来源(如MySQL)高效地采集数据,并将其转换为Elasticsearch可索引的格式。
在这里插入图片描述

配置过程

首先,你需要根据你的操作系统,下载并安装Logstash和Elasticsearch。可以从官方网站或软件包管理器获取安装程序。配置对应的Logstash的插件配置信息:input插件、filter插件和output插件。

配置Logstash的input插件

在Logstash的配置文件中,你需要指定一个input插件,用于从MySQL读取数据。例如,可以使用jdbc插件来连接MySQL数据库。在配置文件中,你需要提供数据库的连接信息,例如主机、端口、数据库名称、用户名和密码,以及要读取的数据表和字段。

配置Logstash的filter插件

接下来,你需要配置filter插件来转换数据格式。可以通过添加filter插件来实现各种转换规则和筛选条件。例如,你可以使用mutate过滤器来对字段进行重命名、删除或重新格式化。还可以使用grok过滤器来解析复杂的日志行。根据你的需求,可以添加多个filter插件到配置文件中。

配置Logstash的output插件

最后,你需要配置output插件,以将转换后的数据发送到Elasticsearch。为此,你需要指定Elasticsearch的连接信息,如主机、端口和索引名称。可以使用elasticsearch插件作为output插件。根据需要,你还可以设置其他选项,例如数据批处理大小、并发请求数量等。

启动Logstash并确认同步

保存并关闭Logstash的配置文件后,可以通过运行Logstash来启动同步过程。可以使用命令bin/logstash -f <config_file>来运行Logstash,其中<config_file>是你的配置文件路径。Logstash将连接到MySQL数据库,并将数据转换为Elasticsearch可索引的格式,并通过output插件将其发送到Elasticsearch。确保Logstash正确运行,并监视其输出,以确保数据正确地同步到了Elasticsearch。

Elasticsearch JDBC同步数据

Elasticsearch JDBC插件

Elasticsearch JDBC插件是一种强大的工具,可以将MySQL数据导入到Elasticsearch中实现数据同步。该插件通过JDBC连接器从MySQL数据库中提取数据,并将其转换为Elasticsearch文档格式,然后将这些文档插入到Elasticsearch索引中。

在这里插入图片描述

安装Elasticsearch和JDBC插件

首先,确保你已经安装了Elasticsearch,并根据操作系统配置好相关环境。接下来,通过Elasticsearch的插件管理命令来安装JDBC插件,以便能够使用JDBC连接器。

安装JDBC插件

使用插件管理命令来安装JDBC插件。命令可能类似于elasticsearch-plugin install <plugin_name>,其中<plugin_name>是JDBC插件的名称。执行该命令后,Elasticsearch会自动下载并安装JDBC插件。

验证插件安装

完成插件安装后,可以通过运行以下命令来验证插件是否成功安装:

bin/elasticsearch-plugin list

此命令将显示已安装的插件列表,你应该能够在列表中找到刚刚安装的JDBC插件。

配置JDBC插件

在Elasticsearch的配置文件中,你需要指定JDBC插件的连接信息,如MySQL数据库的主机、端口、数据库名称、用户名和密码。此外,你还可以配置其他JDBC插件选项,如表过滤、列选择等。通过这些配置,JDBC插件将能够从MySQL读取数据。

JDBC配置选项

一旦配置完成并重启Elasticsearch,JDBC插件将会使用你指定的连接信息从MySQL数据库中读取数据,并将其同步到Elasticsearch中。

  • 打开Elasticsearch的配置文件:使用文本编辑器打开Elasticsearch的配置文件,其路径通常为 <ES安装目录>/config/elasticsearch.yml

  • 配置JDBC插件的连接信息:在配置文件中找到JDBC插件相关的配置项,一般以 jdbc. 开头。根据你的MySQL数据库的连接信息,进行如下配置:

    • jdbc.driver: 设置MySQL的JDBC驱动类名,例如 com.mysql.cj.jdbc.Driver
    • jdbc.url: 设置MySQL数据库的连接URL,包含主机、端口和数据库名称等信息。
    • jdbc.userjdbc.password: 设置连接MySQL数据库所需的用户名和密码。
  • 配置其他选项(可选):根据你的需求,还可以配置其他选项来进一步调整JDBC插件的行为。例如,你可以设置表过滤器(jdbc.sql)来选择你要读取的特定表,或者指定列选择(jdbc.columns)来限制读取的数据列。

注意,重启Elasticsearch,在修改配置文件后,重启Elasticsearch以使配置生效。你可以通过运行相应的启动命令或使用启动脚本来重启

配置Elasticsearch的mapping和index

在Elasticsearch中,定义Mapping和Index是为了正确地索引从MySQL读取的数据。Mapping用于定义数据字段的类型和属性,而Index则用于定义数据索引的方式。根据数据的结构,你需要创建并配置适当的Mapping和Index,以确保数据被正确地索引到Elasticsearch中。

启动JDBC插件并同步数据

启动Elasticsearch后,你可以通过运行JDBC插件来启动同步过程。

JDBC插件将连接到MySQL数据库,并将数据以Elasticsearch可索引的形式发送到Elasticsearch。你可以使用JDBC插件的命令行工具或API来启动同步,并监视同步的进展和状态。

Elasticsearch JDBC插件同步的问题

使用Elasticsearch JDBC插件同步MySQL和ES的好处是它非常易于设置,并且能够高效地处理大量数据。然而,需要注意的是它可能会对MySQL的性能产生一定的影响,并且无法处理复杂的数据转换。

使用Canal进行数据同步

Canal是阿里巴巴开源的一个MySQL数据库增量数据同步工具。通过解析MySQL的binlog日志,Canal能够捕获并获取增量数据,然后将这些数据发送到指定的位置,包括Elasticsearch(ES)。

使用Canal同步MySQL和Elasticsearch的好处在于它能够处理大量数据,并且提供灵活的数据转换能力。

Canal的原理分析

Canal是一种基于数据库增量日志解析的工具,它提供了增量数据的订阅和消费功能,并主要支持MySQL数据库。Canal的工作原理是通过伪装成MySQL的从节点,来订阅并获取MySQL主节点的Binlog日志。
在这里插入图片描述

主要流程如下

  1. Canal服务端与MySQL的主节点建立连接,并发送dump协议请求。

  2. MySQL的主节点接收到dump请求后,开始将Binlog日志推送给Canal服务端。Canal服务端会解析这些Binlog日志,将其转换成可读的JSON格式。

  3. Canal客户端通过TCP协议或消息队列(MQ)的形式监听Canal服务端,并从中同步获取数据。一旦数据被获取,它可以被进一步处理和存储,例如同步到Elasticsearch(ES)中。

配置安装流程

安装Canal和Elasticsearch

开始之前,请确保Canal和Elasticsearch已经正确地安装并配置在你的系统中。

配置Canal

在Canal的配置中,你需要提供MySQL的连接信息以及增量日志同步的规则。通过这些配置,Canal能够与MySQL建立连接并读取增量日志。

创建Canal的实例

在Canal的服务端中,执行canal.deployAll.sh脚本命令,根据实际需求设置Canal的实例名称、MySQL主节点的IP地址和端口等参数。

配置Canal的规则

在Canal的实例目录中,打开instance.properties文件,根据你的MySQL数据库实例进行配置,包括MySQL的连接信息(主机、端口、用户名、密码等)。

配置Canal的filter插件

Canal的filter插件可以将增量日志转换为JSON格式。你可以根据需求设置过滤规则,选择需要同步的特定数据,并将其转换为符合你需求的JSON格式。

配置Canal的步骤
  • 打开Canal的配置文件:使用文本编辑器打开Canal的配置文件,其路径通常为 <Canal安装目录>/conf/example/instance.properties。

  • 查找并配置filter插件:在配置文件中找到名为 canal.instance.filter.* 的相关配置项。这些配置项控制着filter插件的行为,可以根据你的需求进行配置。

  • 配置过滤规则:根据你需要过滤的数据,可以使用正则表达式来设置过滤规则。可用的过滤规则包括数据库名、表名、字段名等。

设置数据库的正则表达式,用于匹配需要同步的数据库
canal.instance.filter.database.regex=^(db1|db2)$
设置表的正则表达式,用于匹配需要同步的表
canal.instance.filter.table.regex=^(tbl1|tbl2)$

根据上面的案例,只有数据库名为db1或db2,且表名为tbl1或tbl2的数据才会被同步到Elasticsearch。

注意,配置filter插件需要谨慎操作,确保符合你的具体需求,并避免过滤掉必要的数据。记得重启Canal服务以使配置生效。

配置Canal的output插件

通过配置Canal的output插件,你可以将转换后的JSON格式增量日志发送到Elasticsearch。在配置output插件时,你需要提供Elasticsearch的连接信息以及索引的名称,确保增量日志能够准确地发送到Elasticsearch中。

配置流程
  • 打开Canal的配置文件:使用文本编辑器打开Canal的配置文件,通常可以在 <Canal安装目录>/conf/example/instance.properties 中找到。

  • 查找并配置output插件:在配置文件中,找到名为 canal.instance.customize.properties 的配置项,并在这里添加output插件的相关配置。如果该配置项不存在,可以手动添加。

添加以下配置项来启用Elasticsearch的output插件:

canal.instance.customize.properties = esIndex:my_index, esType:my_type, esClusterName:my_cluster, esAddresses:localhost:9200

在上面的示例中,配置了如下参数:

  • esIndex:要发送数据的Elasticsearch索引名称。
  • esType:要发送数据的Elasticsearch类型名称。(ElasticSearch6以上可以忽略)
  • esClusterName:Elasticsearch集群的名称。
  • esAddresses:Elasticsearch集群的地址,以逗号分隔。

注意,配置output插件需要确保能够正确连接到Elasticsearch集群,并确保所配置的索引、类型等参数与Elasticsearch的配置相匹配。

使用Debezium同步数据

Debezium是一种开源的分布式平台,用于捕获数据库更改并将其以流式传输的方式发送到消息代理或存储。对于MySQL数据库,Debezium可以捕获其变更,并将其发送到Kafka消息代理,最后可以使用Logstash或其他工具将数据发送到Elasticsearch。

配置Debezium的同步体系的流程

安装Debezium、Kafka、Logstash和Elasticsearch:首先,确保你已经正确地安装和配置了Debezium、Kafka、Logstash和Elasticsearch。根据你的系统环境,选择适合的版本进行安装。

配置Debezium

配置Debezium:在Debezium的配置文件中,设置连接到MySQL数据库的相关信息。配置Debezium的任务,指定要捕获的数据库和表,以及要发送到Kafka的主题。

配置Kafka

配置Kafka的相关参数,包括主题、分区数和副本数等。确保Debezium可以将捕获的MySQL更改发送到Kafka中。

配置Logstash

在Logstash的配置文件中,设置从Kafka中读取Debezium数据并将其转换为Elasticsearch可索引的格式。根据数据结构,可以定义映射和字段类型等配置。

配置Elasticsearch

在Elasticsearch中,创建适当的索引,并定义字段映射。确保索引的设置符合数据的结构和需求。

之后启动服务并监控同步过程:启动Debezium、Kafka、Logstash和Elasticsearch服务,并监控同步过程,确保MySQL的更改能够同步到Elasticsearch中。

配置Debezium连接到MySQL

在Debezium的配置文件中,你需要提供MySQL的连接信息,例如主机名、端口、用户名和密码等。这样,Debezium可以与MySQL数据库建立连接,并实时捕获数据库的变更。

配置Debezium发送到Kafka

将配置修改为将捕获的数据库变更发送到Kafka消息代理。你需要指定Kafka的连接信息,包括主机名、端口和topic等。这将使得数据库变更以更易处理的方式被发送到Kafka上。

配置Logstash发送到Elasticsearch(可选)

如果你想要将数据从Kafka发送到Elasticsearch,你可以使用Logstash或其他ETL工具来实现。在Logstash配置文件中,你需要指定Kafka和Elasticsearch的连接信息,并定义数据的处理和映射规则。

本文旨在介绍MySQL和其他多维数据同步方案,并提供一些常用的数据迁移工具,以帮助你做出更合适的选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1128565.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

arcgis js api FeatureLayer加载时返回数据带*问题

接着这一问题衍生出来的问题 arcgis的MapServer服务查询出来的结果geometry坐标点带*的问题-CSDN博客 个人感觉像是server版本的问题&#xff0c;具体不清楚&#xff0c;pg数据库里面的shape点集合坐标点的精度是8&#xff0c;但是server服务查出来的默认都十几位。所以存在一…

使用达梦数据库的总结

–修改当前会话所在模式&#xff1a; set schema 模式名;–创建表空间、用户名并为用户指定表空间&#xff0c;并为用户授权 create tablespace "RSGL_BZK" datafile REGL_BZK.DBF size 7488 autoextend on next 128 maxsize 33554431 CACHE NORMAL; create user …

制作macOS Ventura U盘启动盘教程

macOS 14更新一段时间了&#xff0c;发现某些应用不适配想要无损降级&#xff0c;如何进行macOS的降级呢&#xff0c;除了备份好的时间机器备份&#xff0c;还需要一个可以引导的macOS U盘安装器&#xff0c;如何制作macOS 13 Ventura 系统启动U盘呢&#xff0c;小编带来对新手…

webGL编程指南 第四章 旋转+平移.TanslatedRotatdTriangle

我会持续更新关于wegl的编程指南中的代码。 当前的代码不会使用书中的缩写&#xff0c;每一步都是会展开写。希望能给后来学习的一些帮助 git代码地址 &#xff1a;git 本篇文章将把旋转和平位移结合起来&#xff0c;因为矩阵的不存在交换法则 文章中设计的矩阵地址在这里​…

苹果cms模板MXone V10.6魔改版网站源码短视大气海报样式

安装模板教程说明&#xff1a; 1、将模板压缩包上传到苹果cms程序/template下解压 2、网站板选择mxone 模板目录填写html 3、网站模板选择好之后一定要先访问前台&#xff0c;然后再进入后台设置 4、主题后台地址&#xff1a; 苹果cms后台点击&#xff0c;自定义菜单配置 …

6.6 Elasticsearch(六)京淘项目改造

文章目录 1.项目准备2.基础配置2.1 添加pom.xml依赖2.2 yml配置es服务器地址列表 3.具体实现3.1 item实体类封装3.2 添加接口3.3 SearchController 4.search.jsp界面4.1 搜索内容展示4.2 高亮内容样式设置4.3 搜索框内容回填4.4 添加上下页按钮 1.项目准备 我们切换回到此前的…

【C++】继承 ⑨ ( 继承中成员变量同名的处理方案 )

文章目录 一、继承中成员变量同名的处理方案1、继承中成员变量同名的场景说明2、使用域作用符区分同名成员变量 二、代码示例 - 继承中成员变量同名的处理方案 一、继承中成员变量同名的处理方案 1、继承中成员变量同名的场景说明 子类 继承 父类 的 成员 , 如果 子类 中定义了…

[数据分析与可视化] 基于Python绘制简单动图

动画是一种高效的可视化工具&#xff0c;能够提升用户的吸引力和视觉体验&#xff0c;有助于以富有意义的方式呈现数据可视化。本文的主要介绍在Python中两种简单制作动图的方法。其中一种方法是使用matplotlib的Animations模块绘制动图&#xff0c;另一种方法是基于Pillow生成…

2023年腾讯云双11活动入口及内容详细解读

2023年腾讯云11.11云上盛惠活动&#xff0c;海量产品轻松上云&#xff0c;免费领取9999元代金券礼包&#xff1b;云服务器、云数据库、COS等上云必备产品&#xff0c;低至1.8折起&#xff1b;云产品助力企业和开发者轻松上云&#xff01; 下面给大家分享腾讯云双11活动入口及活…

Android Jetpack重要吧?需要学习有这么多

Jetpack简单理解 2018年谷歌I/O 发布了一系列辅助Android开发者的实用工具&#xff0c;合称Jetpack&#xff0c;以帮助开发者构建出色的 Android 应用。 官方JetPack介绍 大体上&#xff0c;JetPack是Google推出的一些库的集合。是Android基础支持库SDK以外的部分。包含了组…

问题:Uncaught Error: “xxx“ is read-only

文章目录 问题分析 问题 控制台报错如下 分析 在这里使用了 const 定义常量 const声明一个只读的常量。一旦声明&#xff0c;常量的值就不能改变。 let是块级作用域&#xff0c;函数内部使用let定义后&#xff0c;对函数外部无影响。

【人工智能专栏】(2)知识表示方法 I

目录 1. 知识与知识表示1.1 什么是知识&#xff1f;1.2 什么是数据-信息-知识&#xff1f;1.3 人工智能系统所关心的知识1.4 什么是知识表示&#xff1f;1.5 知识表示要注意的问题1.6 AI对知识表示方法的要求 2. 状态空间法2.1 什么是状态空间法&#xff1f;2.2 状态空间法三要…

数据挖掘和大数据的区别

数据挖掘 一般用于对企业内部系统的数据库进行筛选、整合和分析。 操作对象是数据仓库&#xff0c;数据相对有规律&#xff0c;数据量较少。 大数据 一般指对互联网中杂乱无章的数据进行筛选、整合和分析。 操作对象一般是互联网的数据&#xff0c;数据无规律&#xff0c;…

关于Fragment的生命周期,你知道多少?

Fragment生命周期 Fragment是Android中用于构建用户界面的一种组件。 Fragment具有自己的生命周期&#xff0c;包括以下几个阶段&#xff1a; onAttach(): 当Fragment与Activity关联时调用&#xff0c;可以通过该方法获取到所关联的Activity的引用。 onCreate(): 在Fragment创…

13.4web自动化测试(Selenium3+Java)

一.定义 用来做web自动化测试的框架. 二.特点 1.支持各种浏览器. 2.支持各种平台(操作系统). 3.支持各种编程语言. 4.有丰富的api. 三.工作原理 四.搭环境 1.对照Chrome浏览器版本号,下载ChromeDriver,配置环境变量,我直接把.exe文件放在了jdk安装路径的bin文件夹下了(j…

最新Python深度学习技术进阶与应用

最新Python深度学习技术进阶与应用&#xff08;图神经网络&#xff09; 近年来&#xff0c;伴随着以卷积神经网络&#xff08;CNN&#xff09;为代表的深度学习的快速发展&#xff0c;人工智能迈入了第三次发展浪潮&#xff0c;AI技术在各个领域中的应用越来越广泛。为了帮助广…

网络第一课

✍ 如何理解局域网和广域网&#xff1f; ✍ 路由器和交换机是怎样工作的&#xff1f; ✍ 三层交换机能不能代替路由器&#xff1f; -- 1.局域网 2. 广域网 -- -- 企业网络 运营商架构 数据中心架构 -- 局域网 - 内网 - 私网 -- 通过交换机连接的 转发相同IP地址段的…

若依和芋道

国外卷技术,国内卷业务,做管理业务通常使用开源框架就可以快速满足,若依和芋道都是开源二开工具较为流行的框架,芋道是基于若依的,基本上是开发人员自己写业务开发框架的天花板,两者的前端都是基于vue-element-admin的,使用Gitee上两者的SpringBoot的最轻量化版本进行对…

Transformer 简单理解

文章目录 一、Transformer的架构一、编码1.1 词向量编码&#xff08;Input Embedding&#xff09;1.2 位置编码&#xff08;Positional Encoding&#xff09; 二、Mask2.1 PAD Mask2.2 上三角Mask 二、注意力计算2.1 Q、K、V 向量的生成2.2 自注意力计算流程2.2 单头注意力和多…

MTK OEM解锁步骤

1.在win10 首选安装驱动 插入usb线后&#xff0c;进入在设备管理器 里面看到 未识别黄色图标的 android 以后&#xff0c;右击点击更新驱动&#xff0c;然后安装解压后的驱动 同时在开发者模式里面的 oem解锁开关打开 2. adb 命令解锁步骤 1.adb reboot bootloader 2.fastbo…