目录
认识端口号
认识TCP协议
认识UDP协议
网络字节序
socket编程接口
socket 常见API
sockaddr结构
认识端口号
端口号(port)是传输层协议的内容
端口号是一个2字节16位的整数;
端口号用来标识一个进程, 告诉操作系统, 当前的这个数据要交给哪一个进程来处理;
IP地址 + 端口号能够标识网络上的某一台主机的某一个进程;
一个端口号只能被一个进程占用
理解 "端口号" 和 "进程ID"
pid 表示唯一一个进程; 此处我们的端口号也是唯一表示一个进程. 那么这两者之间是怎样的关系?
另外, 一个进程可以绑定多个端口号; 但是一个端口号不能被多个进程绑定;
拿10086(IP)的例子,你可以直接拨打10086,然后就有客服(进程)来服务,10086很多个工号(端口号)和客服,但是每一个客服只有一个工号,这样我们用指定客服的工号就可以找到10086这个里面的唯一的客服
传输层协议(TCP和UDP)的数据段中有两个端口号, 分别叫做源端口号和目的端口号. 就是在描述 "数据是谁发的, 要发给谁";“A到B,A绑定的就是源端口,B绑定的就是目的端口”
认识TCP协议
此处我们先对TCP(Transmission Control Protocol 传输控制协议)有一个直观的认识;
传输层协议
有连接
可靠传输 -- 由操作系统来实现
面向字节流
认识UDP协议
此处我们也是对UDP(User Datagram Protocol 用户数据报协议)有一个直观的认识;
传输层协议
无连接
不可靠传输
面向数据报
这里的可靠不可靠是一个中性词,可靠就是它会不会对诸如网络异常导致数据没有发送过去,或者发了两份数据之类的问题进行异常处理,但是可靠是有成本的,所以这样的协议写出来往往是比较复杂,并且在维护上(操作系统)和编码上(程序员使用)
但是不可靠是比较简单的 -- 维护&&使用
所以在使用的时候我们需要挑选合适的场景,比如直播的时候就比较适合UDP协议,还有视频的清晰度也是与UDP协议有关的,可以直接调整高清或者超清
网络字节序
我们已经知道,内存中的多字节数据相对于内存地址有大端和小端之分, 磁盘文件中的多字节数据相对于文件中的偏移地址也有大端小端之分, 网络数据流同样有大端小端之分. 那么如何定义网络数据流的地址呢?
这里有一个很现实的问题,比如计算机怎么知道自己接受到的数据是大端的还是小端?很显然我们自己可以知道自己主机是大端还是小端,但是我们是不知道其他的主机是大端还是小端,所以基于这一点,在早期设计的时候就规定网络数据流应采用大端字节序,即低地址高字节.
发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出;
接收主机把从网络上接到的字节依次保存在接收缓冲区中,也是按内存地址从低到高的顺序保存;
因此,网络数据流的地址应这样规定:先发出的数据是低地址,后发出的数据是高地址.
TCP/IP协议规定,网络数据流应采用大端字节序,即低地址高字节.
不管这台主机是大端机还是小端机, 都会按照这个TCP/IP规定的网络字节序来发送/接收数据;
如果当前发送主机是小端, 就需要先将数据转成大端; 否则就忽略, 直接发送即可;
为使网络程序具有可移植性,使同样的C代码在大端和小端计算机上编译后都能正常运行,可以调用以下库函数做网络字节序和主机字节序的转换
函数名很好记,h表示host,n表示network,l表示32位长整数,s表示16位短整数。
例如htonl表示将32位的长整数从主机字节序转换为网络字节序,例如将IP地址转换后准备发送。
如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回;
如果主机是大端字节序,这些 函数不做转换,将参数原封不动地返回
socket编程接口
socket:套接字;插口;套接口
IP + port 我们就将器较为socket(套接字)
socket 常见API
// 创建 socket 文件描述符 (TCP/UDP, 客户端 + 服务器)
int socket(int domain, int type, int protocol);
// 绑定端口号 (TCP/UDP, 服务器)
int bind(int socket, const struct sockaddr *address,socklen_t address_len);
// 开始监听socket (TCP, 服务器)
int listen(int socket, int backlog);
// 接收请求 (TCP, 服务器)
int accept(int socket, struct sockaddr* address,socklen_t* address_len);
// 建立连接 (TCP, 客户端)
int connect(int sockfd, const struct sockaddr *addr,socklen_t addrlen);
sockaddr结构
socket API是一层抽象的网络编程接口,适用于各种底层网络协议,如IPv4、 IPv6,以及后面要讲的UNIX Domain Socket. 然而, 各种网络协议的地址格式并不相同
那么为什么不使用viod*呢?
历史遗留问题,因为这条约定早就设定好了,在C语言标准还没有出现的时候就已经有了,并且这一层已经用了很久,也没啥问题,假如改的话,就算是向上兼容的思想也会造成很大的麻烦,于是就保留下来了
IPv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址用sockaddr_in结构体表示,包括16位地址类型, 16位端口号和32位IP地址.
IPv4、 IPv6地址类型分别定义为常数AF_INET、 AF_INET6. 这样,只要取得某种sockaddr结构体的首地址,不需要知道具体是哪种类型的sockaddr结构体,就可以根据地址类型字段确定结构体中的内容.
socket API可以都用struct sockaddr *类型表示, 在使用的时候需要强制转化成sockaddr_in; 这样的好处是程序的通用性, 可以接收IPv4, IPv6, 以及UNIX Domain Socket各种类型的sockaddr结构体指针做为参数;
关于这三个结构知道就行了,因为很复杂
下一篇:简单的UDP网络程序
未完持续……