哈喽,我是子牙,一个很卷的硬核男人。喜欢研究底层,聚焦做那些大家想学没地方学的课程:手写操作系统、手写虚拟机、手写编程语言…目前做了两门课:手写OS、手写JVM
今天想跟大家聊一个黑科技:手写网络协议栈。为什么说它是黑科技呢?因为这玩意是网络黑客从事一切网络保(破)护(坏)活动的基础应用!一般黑客手里都有一个自实现的网络协议栈!有了此绝技,就可以来无影去无踪了…
为了让大家更深刻的感受到我在说什么,我录了个视频演示,enjoy
【全网独家手写操作系统课】手把手带你用汇编+C语言一步一步实现操作系统,让你成为技术领域的顶尖专家!
技术生涯十几年,尝试过各种学习方式,但是我发现,手写是最有效也是最高效的学习方式。你觉得你已经懂了的东西,一写就发现人废了;你觉得理所当然的东西,一写就发现人大意了;你觉得很easy的东西,一写就发现人肤浅了…
比如网络协议栈,一问,都能讲几句:OSI七层模型、TCP/IP五层模型、数据链路层、网络层…如果从实战的角度去问,可能就有点懵了,比如:如何防止TCP包伪造、TCP包不带timestamps会出现问题吗,什么问题;网络协议栈底层是如何保证TCP包的顺序问题的,要细节;如何隐藏TCP连接;如何捕获隐藏的TCP连接…
你自己写一遍TCP建立连接三次握手、断开连接四次挥手、模拟数据发送、与Linux socket建立全双工通信通道,TCP协议于你,就没有秘密可言了!相反,你能hold住它,能熟练使用它达到你不可告人的秘密。学习操作系统同样如此,光学csapp,在Windows或Linux上做点小实验,是不可能真正学会操作系统的
技术圈有一句很有名的话:不要重复发明轮子,这句话其实是针对工作的,就是说有得用就尽量用,不要自己瞎折腾去自己整一个,拖(浪)慢(费)进(时)度(间)。针对学习,这句话是不适用的。绝知此事要躬行,学习,求真理,就是要折腾,要站在设计者的角度去思考问题!
为什么黑客自实现了网络协议栈就可以来无影去无踪了呢?我来揭秘一下
我们平时写的网络应用是基于Linux socket实现的,当你与服务器建立连接,Linux是可以通过命令查看到的
但是你基于网卡自实现的网络协议栈,与服务器建立连接,除非你察觉到不对劲,抓tcp包,否则是看不到连接的。但是在你察觉到不对劲的时候,其实黑客把该干的事都干完了。。
所以说,攻防其实是相对的,就是说你有攻的方式,就有对应的守的手段,就看攻防双方是否在同一个维度。比如你写的游戏辅助只针对应用层,那玩内核的在内核态限制你,你就GG了!同样的,你入侵服务器基于自实现的网络协议栈,防守的一方从Linux socket的角度去找答案,自然是找不到的
这!就是提升实力的重要性!如果面试不在同一个维度、竞争不在同一个维度、攻防不在同一个维度…你毫无招架之力!
接下来详细说说如何手写网络协议栈,你可以按照我说的去做,不过坑很多很多,比如构建的数据包一个位不对,服务端就不响应,超级难排查…
如果你想节省时间、不踩坑、不差钱,欢迎跟我学习。手写OS三期新增的专题就是手写网络协议栈。我的直播课程+答疑,能让你在最短的时间内,学到最多的关于OS与网络协议栈的硬核知识。你掉坑里,可能我的一句话就让你爬出来了。
先上图,再说话
说下应用场景,比如我们通过浏览器访问网页,大家都知道走的是http协议,http协议属于应用层协议,它是在TCP协议的基础上实现的,所以我们最终的问题还是落到,如何构建TCP包并发送
一个完整的TCP包包含以太网首部+IP首部+TCP首部+数据,其中这里面还有个隐藏款:TCP伪头部,计算tcp checksum用的,这里是个巨坑!
看下以太网首部的构成,可以看出,里面有两个MAC地址,如何获取呢?
本机网卡的MAC地址,你可以通过读网卡的datasheet了解如何操作网卡获得,比如我写的OS获取到的MAC地址,这个属于协议栈中的物理层了
服务器网卡的MAC地址我要如何获得呢?通过ARP协议,这个属于网络层协议
获得了这两个MAC地址,以太网首部包就可以构建出来了
构建IP首部、TCP首部没啥难度,就是坑比较多,想自己研究的小伙伴可自行踩坑爬坑,也是一种成长
看下我最终实现的效果:通过我自实现的网络协议栈与服务端建立连接,但是是看不到连接的
我写的网络协议栈,除了可以与Linux socket模拟三次握手建立连接,建立全双工通道通信,还可以侵入正常的socket client与socket server建立的连接进行通信,意思就是我写的协议栈可以冒充客户端与服务端通信!有趣不?^_^
如果你也像我一样,喜欢研究计算机底层,并乐此不疲,无论多难,都不曾想过放弃,欢迎跟我学习。我是子牙老师,下期再见!