概述：

1、kafka使用规范主要从，生产、可靠性、和消费为轴线定义使用规范，另外Kafka建议核心业务系统不要使用（对数据可靠性要求高），因为Kafka高效性能源于批量设计思想，要充分利于Kafka高效性能，前提是要允许部分数据丢失。

2、kafka使用核心：削峰、解耦、向下游并行广播通知（无可靠性保证）和分布式事务，本规范仅从削峰、解耦、向下游并行广播通知论述。

1、可靠性（强制）：

可靠性包括Producer发送消息机制的可靠性，Kafka Server(Broker)消息持久化刷盘机制和Broker主从节点消息同步机制，Consumer消息的消费机制。

1.1、Producer发送消息的可靠性：

1.1.1、核心参数设置：

acks：用于Producer指明Broker主从节点消息同步的机制，有如下三个设置：

acks=0，表示生产者在成功写入消息之前不会等待任何来自服务器的响应。说白了就是Producer只负责消息发送，不管消息是否成功到达Broker，消息可靠性极低，但发送效率极高;
acks=1，表示只要集群的Leader分区接收到了消息，就会向生产者发送一个成功响应的ack。说白了就是Producer只确保消息发送到了Leader，消息可靠性不太高，发送效率一般；
acks=all，表示只有所有参与复制的节点(ISR和min.insync.replicas综合决定)全部收到消息时，生产者才会接收到来自服务器的响应ack。说白了就是Producer发送的消息会从Leader同步到Slave，具体同步多少Slave节点？可以通过min.insync.replicas指定；

min.insync.replicas：用于指明Producer发送的消息，Leader收到消息后，会同步到Slave节点的个数，该值默认是1，值越大，消息可告性越高，但发送效率极低。同时该参数控制消息至少被写入到多少个Leader才算是"真正写入"，acks=all需要考虑真正写入；

replica.lag.time.max.ms：Kafka判断ISR中的Follower和Leader是否需要同步？根据是参数 replica.lag.time.max.ms （主从之间同步落后时间差），首先ISR 的全称是：In-Sync Replicas ISR是一个Follower的列表，里面存储的是能跟Leader数据同步一致的Follower，确定一个Follower在ISR列表中，有3个判断条件:

根据Follower和Leader的交互时间差，如果大于某个时间差就认定这个Follower不行了，就把此Follower从ISR中剔除，此时间差根据rerplica.lag.time.max.ms指定，如：rerplica.lag.time.max.ms=10000，单位ms，也就是默认10s，ISR中的Follower没有向ISR发送心跳包就会被移除；
根据Leader和Follower的消息条数差值决定是否从ISR中剔除此Follower，此消息条数差值根据配置参数。如：rerplica.lag.max.messages=4000 ，即：消息条数差大于4000会被移除。该参数Kafka 0.10.0已弃用；
Follower所在的Broker节点的确不可用，如：网络不可达，或直接宕机。就把此Follower从ISR中剔除；

注意：剔除不是意味着不可用，Follower还是会去默默同步数据，随着Follower不断与Leader进行消息同步， Leader副本的 LEO也会逐渐后移，并最终追赶上Leader，此时该Follower就有资格进入ISR集合。另外从消息投递的效率和可靠性综合考虑，建议asks设置为1。如果设置为all（或-1），建议min.insync.replicas取Topic分区数（Partition）的1/2或者1/3，replica.lag.time.max.ms可以使用默认10s。

retries：用于指明生产者可以重发消息的次数，如果达到这个次数，最终还是失败，生产者会放弃重试并返回错误。默认情况下，生产者会在每次重试之间等待100ms ，可以通过retry.backoff.ms 参数来配置时间间隔。

1.1.2、刷盘机制（broker节点配置）：

kafka的刷盘机制是通过以下三个参数确定：

log.flush.interval.ms：在刷新到磁盘之前，日志分区上消息保留在内存中的最长时间；
log.flush.interval.messages：在将消息刷新到磁盘之前，日志分区上累积的消息数量；
log.flush.scheduler.interval.ms：日志刷新器检查是否需要将所有日志刷新到磁盘的频率（一个Broker上可能有很Partition）；

我们可以把log.flush.interval.messages值设为1，实现同步刷盘，同步刷盘对性能影响极大，而且现在Kafka统一由集团管理，应该不会随意改配置。

注：如果未设置log.flush.interval.ms，则使用log.flush.scheduler.interval.ms中的值。

1.1.3、消息生产（producer）：

消息生产，指Kafka生产投递消息的方式，分为同步和异步两种方式。

1.1.3.1、同步发送：

同步发送的意思就是，一条消息发送之后，会阻塞当前线程，直至返回ack。同步发送效率不高，数据可靠性高。

1.1.3.2、异步发送：

异步发送数据可靠性不高，异步发送效率较高，不会阻塞发送工作线程，但有其它开销。因此在谈异步发送方式之前，先看看异步发送的底层原理。

Kafka的Producer发送消息采用异步发送的方式时，在消息发送的过程中，涉及到了两个线程——main线程和Sender线程，以及一个线程共享变量——RecordAccumulator【记录累计器，充当一个队列】。main线程将消息发送给RecordAccumulator，Sender线程不断从RecordAccumulator中拉取消息发送到Kafka broker。

1.1.4、消息消费（consumer）：

消息消费包话消费方式，和消息消费提交方式。

1.1.4.1、消费方式：

消费方式包括消息拉取方式，点对点消费和广播消费。

1.1.4.1.1：消息拉取方式：

Kafka目前已发布的版本仅支持，pull方式获取消息。

1.1.4.1.2：点对点消费：

Kafka其实不支持点对点对消费，它是以消费组的发布订阅模式消费，即：消费组消费模式是点对点。

注：关于消费组的个数，与Topic分区数的关系，具体一点来说是主分区数。

消费组由多个consumer组成，每一个消费组，只能有一个消费者消费同一topic下的的主分区，复制分区在Kafka里，只做备份数据的功能，只有当主挂了，选举成主时，才提供消费服务。

同一组中当消费者数大于分区数时，多余的消费者不会接收消息，但可以作为备用消费者，当处理的消费者挂掉后，备用消费者可以继续进行处理；
同一组中当消费者数小于分区数时，一个消费者将会消费多个主分区，此时Kafka会尽量负载消费；
对于消费者来说，在每个分区上实际上是单线程消费；

1.1.4.1.3：广播消费：

Kafka不支持广播消费，若要实现，消费端可以用动态生成消费组实现。

注：动态生成消费组，很多Kafka生产环境是禁止的，主要以下三点不足：

消费组每次动态生成，不好管理维护；
Kafka后端要维护消费组消费的Offset，但重启后又无意义，记而不用(因为每次重启应用都会生成新的消费组)；
Kafka要明配置 auto.offset.reset，配置为 earliest 会有重复消费的可能，需要实现消费逻辑幂等，配置为 latest 会有漏消费的可能；

auto.offset.reset有以下三个可选值：