IM技术的整理

2019-08-04

通信协议

一套典型的IM通信协议设计分为三层：应用层、安全层、传输层

IM应用层协议

应用层协议选型，常见的有三种：

文本协议
二进制协议
流式XML协议

1. 文本协议

文本协议是指 “贴近人类书面语言表达”的通讯传输协议，典型的是http

Accept: */*
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36

文本协议的特点

可读性好，便于调试
解析效率一般（按照:分割，key value形式）
对二进制支持不好(图片 / 视频 / 语音)

2. 二进制协议

二进制协议一般定长包头和可扩展变长包体，每个字段固定了含义例: IP协议的前4个bit表示协议版本号（Version）

二进制协议特点

可读性差，难于调试
扩展性不好，如果要扩展字段，旧版协议就不兼容了，所以一般设计时会有一个Version字段
解析效率高(没有解析代价)
对二进制支持不好(图片 / 视频 / 语音)

3. XML协议

XMPP使用XML协议，但XML使用太消耗流量

<message
to=’[url=mailto:romeo@example.net]romeo@example.net[/url]’
from=’[url=mailto:juliet@example.com]juliet@example.com[/url]’
type=’chat’
xml : lang=’en’>
<body>Wherefore art thou, Romeo?</body>
</message>

XML协议特点

a. 它是准标准协议，可以跨域互通
b. XML的优点，可读性好，扩展性好
c. 解析代价超高（dom解析）
d. 有效数据传输率超低（大量的标签）

4. 实际使用协议

一般常见的做法是：

定长二进制包头，可扩展变长包体。包体可以使用用文本、XML等扩展性好的协议。
包头负责传输和解析效率，与业务无关。包体保证扩展性，与业务相关。

//sizeof(cs_essay-header)=16
struct cs_essay-header{
    uint32_t version;
    uint32_t magic_num;
    uint32_t cmd;
    uint32_t len;
    uint8_t data[];
}__attribute__((packed));

前4个字节是version
接下来的4个字节是个“魔法数字（magic_num），包头放几个约定好的特殊字符，包尾放几个约定好的特殊字符约定好，发给你的协议，某几个字节位置，是0x 01020304 ，才是正常报文
接下来是command（命令号），用来区分是keepalive报文、业务报文、密钥交换报文等
len（包体长度），告知服务端要接收多长的包体

Google开源的ProtoBuf协议具有更多有点

现成的解析库种类多
现成的解析库种类多
在工业界已广泛应用

例：登录请求包传入的是用户名与密码，登录响应包返回的是用户的uid

message CUserLoginReq{
    optional string username = 1;
    optional string passwd = 2;
}

message CUserLoginResp{
    optional uint64 uid =1;
}

IM安全层

im协议，消息的保密性非常重要，谁都不希望自己聊天内容被看到，所以安全层是必不可少的

SSL加密

证书管理麻烦，代价比较高

自定义加密策略

自定义加密核心在于秘钥的生成，管理，秘钥的管理大概有三种方式

固定秘钥

服务端和客户端约定好一个密钥，同时约定好一个加密算法（eg：AES ），每次客户端im在发送前，就用约定好的算法，以及约定好的密钥加密再传输，服务端收到报文后，用约定好的算法，约定好的密钥再解密。这种方式，密钥和算法对程序员都是透明的。

一人一秘钥

简单说来就是每个人的密钥是固定的，但是每个人之间又不同，其实就是在固定密钥的算法中包含用户的某一特殊属性，比如用户uid、手机号、qq号等。

动态秘钥

动态密钥，一Session一密钥的安全性更高，每次会话前协商密钥。密钥协商的过程要经过2次非对称密钥的随机生成，1次对称加密密钥的随机生成

IM传输层

TCP / UDP

一般大厂的做法的TCP和UDP混合使用

“无线环境下，UDP更好，可以做到状态无关，而TCP不稳定，进出电梯就要断线，用户体验不好”