IM即时通讯开发之常用加解密算法与通讯安全讲解

平时开发工作中，我们会经常接触加密、解密的技术。尤其在今天移动互联网时代，越来越多的用户会将数据存储在云端，或使用在线的服务处理信息。这些数据有些涉及用户的隐私，有些涉及用户的财产，要是没有一套的方案来解决用户的数据安全问题的话，这将是一个多么可怕的事儿。同时，我们作为开发者，也会经常遇到用户对数据安全的需求，当我们碰到了这些需求后如何解决，如何何种方式保证数据安全，哪种方式最有效，这些问题经常困惑着我们。

一般的，我们在网络中传输的数据，都可以认为是存在这潜在的风险的。用一句话来概括就是：“任何在网络中传输的明文数据都存在安全性威胁。”

下面就列举下我们通信中面临的四种威胁：

- 第一，中断。攻击者有意破坏和切断他人在网络上的通信，这是对可用性的攻击。
- 第二，截获。属于被动攻击，攻击者从网络上qie听他人的通信内容，破坏信息的机密性。
- 第三，篡改。攻击者故意篡改网络上传送的报文，这是对完整性的攻击。
- 第四，伪造。攻击者伪造信息在网络传送，这是对真实性的攻击。

我们经常说加密解密算法是数据安全领域里的“剑”，是一种主动的防护，对数据进行必要的加密处理，以保证其在数据传输、存储中的安全。

严谨的说，base64并不是加密算法，这里提到他是因为他的实现比较简单，通过他的实现，我们可以更好的理解加密解密的过程。

下面看下他是如何“加密”的。假设我们要对“BC”字符串进行加密。现将其转换为二进制表达方式，并连起来：01000010 01000011，接下来对二进制按6位分组，不够6位补0，得到010000、100100、001100（最后两位补0）。下面查表，找到对应的值“QKM”。那么“QKM”就是“BC”用base64“加密”后的值了。即时通讯聊天软件app开发可以加小蓝豆的v：weikeyun24咨询

值得注意的是，base64里有一张映射表，如果改变映射表的顺序，最终得到的结果就会跟着改变。有点类似烹调，在相同原料、相同烹调方式下，我们改变加入的调料，最终做出的东西将会也不一样。这里的映射表，我们叫之为“密钥”。

通过base64算法，可以看出，一个加密算法会有两部分组成：密钥、算法。两者不能都公开，都公开的话，就可以被人逆向运算，进行解密。一般的，我们将密钥进行保密，将算法进行公开。算法的公开，有利于算法的推广，普及，更有利于寻找算法中的漏洞。也就是因为base64同时公开了算法、密钥，所以我们说他并不是真正的加密算法。当然如果你调整了上面映射表，那么也能做到加密算法的目的，不过base64加密的强度比较差，所以不建议在实际应用中作为加密算法使用。

我们在平时的工作中经常听到MD5算法。比如在一些下载页面里会给出一个md5的作为文件验证串，在迅雷下载中作为文件的唯一标识。这类算法严格上来说也不是加密算法，是一种叫做摘要算法的算法，不过在平时的使用中，我们经常将摘要算法混合使用，所以在广义上来说也可以将他叫为加密算法。

摘要算法的特点是可以将任意长度的字符串，给转换为定长的字符串。可以意料的是，在这个转换过程中，一定是一共单向的过程。打个比方，我们将一个256长度的字符串转换为128长度的字符串，转换前有N^256种可能，转换后有N^128种可能，这一定不可能是1对1的对应关系。

所以我们只要保证摘要串（转换后的串）位数只够的长，使得“给定一个字符串A，经过摘要算法处理后的串B，很难找到一个字符串C，其摘要后的串和串B相同” 即可。所以目前主流的摘要算法MD/SHA的摘要串长度都在128位以上。而正是出于这个原因，美国还对长摘要串的加密算法进行了出口的限制。

摘要算法在平时的使用中，经常以如下的形式进行：

假设客户端需要传输一段信息data给服务器端，为了data在网络中数据的完整性，或者说防止信息data被恶意的用户篡改，可以始终这种安全通信模型：客户端与服务器端实现确定了加密密钥key，一段任意的字符串，客户端将key与数据data拼接在一起，进行摘要得到摘要串C，将data、C传给服务器端，服务器端得到data和C后，同样使用与客户端相同的方法，计算摘要串S，如果S等于C的话，就说明A在传输中，没有被人篡改。

对于我们在通信的面临的四种威胁，摘要算法是否能防范呢：

截获：由于网络中传输的数据依然的明文的，对于攻击者来说暴露无遗，所以摘要算法对于这种威胁，没什么办法。中断：摘要算法，是对数据的验证，对整个网络的可用性方面的攻击，无法防范。篡改：客户端发出的数据，中途被攻击者进行了修改，由于攻击者并不知道密钥key，将无法生成正确的摘要串。所以，摘要算法可以防范篡改威胁。伪造：攻击者伪造成客户端，给服务器端发数据，但由于拿不到密钥key，伪造不出摘要串。所以，在这种情况下，摘要算法是有一定的防范作用的。但是，在伪造威胁中，还有一种是重放攻击，攻击者事先将客户端发给服务器端的包截下来，然后重复发送。例如：客户端发给服务器端密码时，被攻击者记录了下来，当下次，服务器端再向客户端询问密码时，攻击者只需将记录下来的包发给服务器端即可。所以摘要算法对于伪造威胁的防范是不彻底的，其只可以辨别伪造的内容，不能辨别伪造的发送方。

常见的摘要算法有MD5/MD4/SHA-1/SHA-2等，其摘要串长度也不尽相同。现在MD4/MD5/SHA-1等一些摘要串长度128比特的摘要算法已不再安全，山东大学的王小云教授已经证明MD4/MD5/SHA-1已经可以快速生成“碰撞”。所以在真正的对安全性要求极高的场所还是使用长摘要串的摘要算法来的靠谱一些。

理论上说对称加密算法，才是我们真正说的加密算法。所谓对称加密算法，通俗的讲，就是使用密钥加密，再使用密钥解密的加密算法的总称。也就是平时我们说到加密算法，脑子里第一个跳出来的加密方式一般都是对称加密算法。上面将的base64其实也是一种“对称加密算法”，只是其密钥公开了而已。

同样的场景：客户端要将数据data发给服务器端。客户端对使用密钥key，对数据data加密，生成加密串C，通过网络将C传输为服务器端，服务器端，使用密钥key对C解密，获取数据data，做自己的业务逻辑。

简单直接的一种加密方式，与摘要算法不同的地方是，加密过程其是双向的，C由data加密而来，同样可以解密获得data，前提条件是加密解密时的key相同。而摘要算法无法从C解密得到data。

加密过程简单，那么其在对抗通信中面临的四种威胁的作用有怎么样呢：

截获：这么在网络中传输的内容为密文，即使攻击者截获了报文，由于没有密钥，也无法解析。所以，这次对称加密算法在防范截获威胁方面有这很大的优势。中断：和摘要算法一样，无法防范。篡改：由于数据是密文传输的，攻击者，无法解析，更无法伪造了。所以，可以防范。伪造：对于数据的伪造，和摘要算法一样，可以防范，但对于伪造的发送方，对称加密算法和摘要算法一样，比较的无力。

对称加密算法有着很多的好处，比较加密速度快，算法简单，安全模型的安全性较高等，但在正式中使用时，却不得不解决一个问题：密钥如何传递。如果将密钥在网络中传递，势必有被截获的风险。由于这个问题的存在，导致单纯的使用对称加密算法的通讯模型，并不是一个通用的模型，只在一些特殊的场合中使用，例如：客户端/服务器端为同一端点，或者线下合作的场景——双方将密钥写入合同中，线下传递。

不过对于密钥，还是建议经常的更换，密钥的破解是一个耗时的过程，长时间不变的密钥，无遗对攻击者创造了破解的机会，当有一天攻击者破解了密钥，灭顶之灾也就来到。

说了这么多的对称加密算法，还没有说对称加密算法有哪些，比较常用的对称加密算法有DES/3DES/AES/IDEA/RC4/RC2等。其加密强度，可以从其支持的密钥长度看出，密钥越长，加密强度越好；同时，加密过程越慢。