使用redis实现5万人同服的“相位技术”

发表于2020-08-03

魔兽世界和EVE服务器能够同时支持5万人在线的技术肯定让很多人流口水吧。今天我用redis来模拟实现“相位技术”。所谓“相位技术”就是将服务器分为多个并行的空间。是对传统分割成多个地图场景技术的升级。这个技术通过创建多个并行时空的概念。将多个时空分配到不同的服务器。在客户端请求数据时再将多个时空的数据整合在一起。这样理论上就可以将地图场景再次无限分割。所以理论上使用“相位技术”的服务器承载人数可以达到非常恐怖的5万人。

传统的一个地图一个服务器的做法。如果玩家过多就会大量消耗服务器CPU资源。直到CPU资源耗尽达到服务器人数上限。因为所有逻辑运算都拥挤在一个线程。这种多个功能间资源抢夺的现象会非常明显。而其中玩家移动是最消耗资源的功能。在每一帧中移动的数据都需要同时广播给其他的玩家。这样其他的玩家才能看到这个玩家在移动。

如果屏幕内有１千个玩家，哪么就需要广播１千次。相当于每次移动的数据都放大了１千倍。而移动同步的频率通常在每秒１次到６０次。同步频率越高在客户端表现越细腻。如果每秒同步频率是１次，哪么每个用户每秒钟就要发送一次千人的广播。１千个用户在服务器一共要发送１百万次的同步信息。也就是说移动同步信息如果不加限制，哪么将会成指数级别的增加。

每秒消息总数量=同步频率* (提交消息数量+(玩家数量)2)

在实际应用中因为受到屏幕的限制，地图远处的玩家并不需要返回给客户端。因为即使返回了也看不到。所以会采用9宫格的方式对返回的数据加以过滤。也就是将地图划分为多个正方形的格子。每次只返回包括当前格子和周围共9个格子的玩家总数。像魔兽世界这样的扁平地图就可以采用这样的方式。游戏服务器的地图格子会比较大，通常在10米到50米左右。而高度不固定能达到100米甚至更高。

使用9宫格的方式可以很好的处理扁平地图的状况。但像eve这种空间上相对自由的游戏也可以采取81宫的方式。就是将空间划分为多个立方体的格子。每次返回周围空间的81个格子中玩家的数量。

在九宫格方式中玩家的数据被分为两部分。一个是玩家的坐标数据“key:玩家id，value:x和y”。一个是所在格子的中玩家的列表，例如1*1格子中的玩家列表“key：1*1，value：id1， id2，id3...”。

在每一帧中客户端都会向服务器提交玩家的移动数据。服务器会记录玩家的坐标，并根据坐标修改玩家所在的格子信息。例如某一帧中提交玩家坐标“x为2, y为1.8”。服务器查询原来玩家的坐标是“x为1.9， y为1.8”。哪么服务器就要将“玩家1”从“1*1”的格子移动“2*1”使用redis命令如下“SMOV 1*1 2*1 "玩家1"”。

在提交数据后还要取回周围玩家的信息，因为玩家被移动到了2*1，我们使用“SMEMBERS 3*1 3*2 2*1 2*2 1*1 1*2”将返回周围格子3*1，3*2，2*1，2*2，1*1，1*2中所有玩家的数据。

这时redis就可以看做是一个每帧都向用户返回数据的状态机。假如有100个用户在每帧提交数据并返回数据。因为使用了九宫格作为数据的过滤系统。假设用户以比较平均的状态分布在九宫格中。每次都返回10个左右的周围用户。哪么这台状态机就是每帧输入100个用户信息，并返回1000个用户信息。九宫格的所要处理的消息数量就为：

每秒消息总数量=同步频率*玩家总数*(提交消息数量+九宫格返回玩家数量)

我们知道redis处理能力是每秒钟10万次，如果每秒钟60帧，100个用户每秒钟需要的处理量是6千次。远远小于redis的处理能力的上限。对于redis来说非常的轻松。

既然100人非常的轻松，哪么1万人同时在线呢？

突然跨越到这么大的难度可能会让人有点不适应。

1万人以每秒60帧的速度向redis提交数据。每秒钟将会达到60万次提交，远远大于redis的承受能力。这时我们就要使用杀手锏“相位技术”了。我们将1万人平均分配到10台服务器。每台服务器将处理1千人。这样每台服务器每秒将处理6万条数据，在redis的10万条数据处理能力范围内。但我们不但要写入数据还要获取周围玩家的数据。因为现在玩家被随机分配到了10台服务器。这10台服务器就相当于10个独立的平行空间。这样每次我们获取数据就要依次读取10台服务器。这样才能获得周围全部玩家的信息。

注意！因为我们需要在其他10台redis提交请求获得返回数据。哪么相当于每次用户的提交动作将会被放大10倍才能获得返回数据。这样每秒返回数据的请求就变成了600万次。显然每个redis无法承担额外的60万次返回数据的查询请求。所以我们要为每个redis建立10个主从服务器来分担返回数据的查询请求。如下图所示master redis2对于master redis1的返回数据查询可以通过slave1 redis1实现。这样返回数据的查询就被10个slave服务器平摊，每个服务器承担6万次查询小于redis的10万次上限的要求。

因为“相位技术”的引进产生了以10台redis为基础的平行空间服务器。以及平行空间服务器的从服务器组成的返回数据服务器组。哪么可以知为了支持每秒60帧，1万人在线，需要的服务器总数为110台服务器，其公式如下：

服务器总数=主服务器数量+主服务器数量 * 主服务器数量

而主服务器数量的公式为：

主服务器数量=需求在线人数*每秒帧数/redis上限人数

哪么由上述两个公式可以知，在线5万人的服务器需求为，5万*60/10万=30台主服务器。哪么所需服务器总数为30+900=930台redis服务器。因为redis是单核服务器，所以对于硬件来说就是需要930核。就需要标准64核服务器15台。

本来想用golang实现一个演示版本，感觉配置几十个redis还是很麻烦。以后有时间再写代码吧。关注 surparallel.org 获得更多有趣的并行知识。

署名

允许他人重新传播作品，但他人重新传播时必须在所使用作品的正文开头的显著位置，注明用户的姓名、来源及其采用的知识共享协议，并与该作品在磨坊上的原发地址建立链接
可对作品重新编排、修改、节选或者以作品为基础进行创作和发布
可将作品进行商业性使用

如社区发表内容存在侵权行为，您可以点击这里查看侵权投诉指引

标签：

游戏开发服务器性能

首页

出海助力

开发者社区

大奖赛

同行

合作案例

关于我们

使用redis实现5万人同服的“相位技术”