什么是零拷贝
零拷贝(Zero-Copy)是一种计算机操作技术,旨在减少数据在内存之间的拷贝次数,以提高数据传输的效率和性能。
传统的IO模式:
模拟网络传输数据运行过程:
- 用户态read()发起系统调用,进入内核态等待从硬件上读取到数据拷贝(第一次)到内核缓冲区中,再将缓冲区中的数据拷贝(第二次)到用户态。
- 用户态拿到数据后调用write()发起系统调用,将数据拷贝(第三次)到socket缓冲区中,再将缓冲区的数据拷贝(第四次)到网卡把数据发送出去。
- 传统模式下涉及到了四次用户态和内核态的切换和四次数据拷贝
在传统的数据传输过程中,数据可能需要在不同的缓冲区之间多次复制,这会消耗大量的 CPU 时间和系统资源。而零拷贝技术通过避免或减少这些不必要的数据拷贝操作,直接将数据从数据源传输到目标位置,例如从磁盘直接传输到网络,而无需经过应用程序的缓冲区。
Mmap技术
Mmap模式下模拟网络传输数据运行过程:
- 用户态mmap()发起系统调用,进入内核态等待从硬件上读取到数据拷贝(第一次)到内核缓冲区中,此时切换回用户态,数据只是被映射到用户空间,没有进行拷贝。
- 用户态调用write()发起系统调用进入内核态,此时只需要将内核缓冲区的数据拷贝(第二次)到socket缓冲区中,再将缓冲区的数据拷贝(第三次)到网卡把数据发送出去。
- Mmap模式下只涉及到了四次用户态和内核态的切换和三次数据拷贝
Mmap技术与传统IO模式相比虽然说只省下了一次数据拷贝次数,但是用户态和内核态之间是没有发生数据拷贝的。那有没有更高效的方式呢?有就是SendFile
SendFile技术
SendFile模式下模拟网络传输数据运行过程:
- 用户态SendFile()发起系统调用,进入内核态等待从硬件上读取到数据拷贝(第一次)到内核缓冲区中,此时不切换到用户态。
- 只需要将内核缓冲区的数据拷贝(第二次)到socket缓冲区中,再将缓冲区的数据拷贝(第三次)到网卡把数据发送出去即可。
- SendFile模式下只涉及到了两次用户态和内核态的切换和三次数据拷贝
SendFile技术与Mmap技术相比又少了两次上下文切换的过程。
应用场景
所以Kafka的性能比RocketMQ要高!