Introduction to Neo

前言

哈喽，好久没有更新博客了! 这次是介绍一下我的兴趣项目：一个Unity客户端 + .net服务器的游戏框架： Neo
Neo暂未开源（主要是考虑到很多第三方的版权问题）但是我会在这篇文章中介绍详细的技术路线以及demo展示，有问题也可以留言联系我！让我们开始吧~

1. 总体架构

Neo是我这两三年来的一个兴趣项目，我的初衷是在这个项目里集成各种好用的第三方技术和第三方插件，让它变成一个“百宝箱”，能在我遇到问题时拿来即用。随着不停地迭代和进化，Neo的基础功能越来越完善，越来越好用，某些模块甚至好过我参与的商业项目。我想主要原因可能是这是由我一个人开发的，思路不会有团队协作时的混乱感，比较方便做相性更好的技术选型。因此我渐渐想把它往更完善的方向去发展，看看自己到底能走多远。

正如上图所示，Neo是C/S双端架构，客户端和服务器都使用C#语言开发。这样设计有一个好处，就是客户端和服务器很容易就可以共用代码。在Neo里，我把共用代码放到一个叫作Shared Core的csproj，Unity客户端和Server Core都依赖于这个工程生成的dll。在Shared Core里有网络框架、背包引擎、C-S共用数据模型、日志、行为树、状态机、Math等模块。
我将服务端的部分抽出成一个Server Core的csproj，然后构建目标也是一个dll，最后ConsoleApp去引用这个dll。这样做的目的是，将来如果有在Unity端运行本地服务器的需求，可以很方便地进行迁移。

2.技术细节

2.1 共享程序集：Shared Core

共享的程序集是客户端和服务器都引用到的，因此只能有纯C#逻辑，而不能使用Unity引擎的API。设计理念上，它的子模块需要遵循依赖倒置原则（DIP），子模块的运行不能依赖于外部的实例类，而是依赖于接口，通过事件与调用者通信。它的子模块如下：

Log：客户端或服务器所有日志都通过这个模块进行，会在当前工作目录下根据日期和pid创建日志文件，写入日志会带有时间戳、调用模块、日志等级等信息。对于Unity来说，需要通过回调与Unity.Debug.Log桥接起来；对于服务器控制台程序，需要通过回调与Console.WriteLine桥接起来。这样Unity的控制台和服务端就都能显示日志了。我们的服务端日志大概长这样：
Util：有一些基础设施适合放在shared模块，这样就不需要同时维护两份。例如：SingletonBase（单例基类）、ListExtension（列表的洗牌、随机采样等）、StringExtension（用正则表达式进行用户名/密码校验等）、Math（浮点数取整、lerp、定点数等）、Random（掷骰子、圆面随机、球面随机）、PerformanceGuard（用RAII的方式监控关键路径的运行时间）、CalculationEngine（字符串公式计算，Neo使用的是第三方库Jace.Net）、EventCore（事件系统）
Shared Data：客户端和服务器在数据定义上，也有一些共有部分。例如：客户端和服务端的共用配置表、客户端与服务端协议、客户端与服务端共用的DataModel。关于这一部分，后续的导表工具与网络模块会介绍更多细节。
Reflection：擅用反射可以将你从繁琐重复的各种Register中解放出来。Neo中广泛使用反射进行事件监听。例如，服务端程序集里所有标记了[REPLCmd](Read-Evaluate-Print-Loop)的static方法，都可以通过控制台的用户输入调用；Shared程序集里所有标记了[UnitTest]的static方法，都会在收到单元测试指令时运行一次；所有网络协议的处理函数注册，是通过反射进行的，例如登录协议的处理函数，需要标记[ProtocolHandler(typeof(Req_Login))]；服务端收到客户端的GM协议时，会查找对应的标记[GMCmd]的函数并分析函数签名，决定是否执行。
下面这个例子展示了反射模块的单元测试：
BehaviourTree：最初的时候，我只把行为树模块放在了客户端，并基于Unity的GraphView写了行为树的图形编辑工具。但是在后来的迭代中，我受到了《守望先锋》的GDC演讲的启发，觉得行为树做成客户端与服务器共用的话，可能会有更多应用场景。《守望先锋》的gameplay脚本State Script，在我看来和一个带有变量系统的行为树差不多，而State Script是在客户端和服务器各运行一份的，带有预测、回滚等等功能。因此，我心中最理想的行为树框架，也是客户端、服务器共同运行的，同时允许一些表现逻辑只在客户端运行；客户端与服务端的行为树状态可以通过协议同步。这样的话，行为树不仅仅可以做AI逻辑，也可以用来做gameplay逻辑。
这是Neo中行为树的编辑界面：服务端运行结果（打印 -> 等待3秒 -> 循环5次，每次90%概率打印）：
InventoryEngine：对于Shared模块的背包引擎，它提供一个类似于《暗黑破坏神》（diablo-like）的背包系统。它最主要的功能是通过外部数据创建一个背包引擎，判断各种item操作的合法性（特殊要求和通用的位置要求，即两个item位置不能重叠，item不能放到背包之外等等），然后给出结果。出于解耦的需要，item的特殊合法性判断需要通过委托去做（例如：是否可以进背包？、是否可以丢弃？、是否可以堆叠？、是否可以交换位置？、是否可以使用？），同时会将操作结果通过事件发出去（例如onItemAdd，onItemRemove，onItemAmountChange，onItemSwap，onItemDrop，onItemUse）。对于客户端与服务器的外部系统如何使用这个模块，我会在第3部分的实例部分进行更多讲解。
其他：我认为寻路也是适合做在Shared模块的，虽然目前Neo暂时没有。如果做的话，技术路线我会选择基于开源的Recast。Neo还有一个GridEngine也放在Shared模块，它主要是做基于格子的（例如战棋类游戏）的寻路、范围查找等等。其实只要是不依赖于引擎并且CS双方都可以使用的功能，都是可以考虑进行解耦然后放在Shared模块里的。

2.2 Unity客户端

对于Unity客户端开发，我偏好以package的形式去开发各个模块，这样模块化的处理其实也是一种解耦，大大增加了代码复用的可能性。这一章节，我将主要介绍一下Neo对于客户端基础设施（例如导表、热更新etc）的技术选型。注意，虽然这些第三方的项目都挺优秀，但并不适合即插即用。为了适配Neo的程序集划分以及目录结构，我花了一些工夫去写一些工具脚本，以及调整了目录结构。

配置工具：配置工具我选用的是luban导表工具，它的功能完善：支持多种编程语言，支持本地化，支持多种导出格式，支持枚举、结构体定义。在Neo中，不仅仅使用luban导出配置表，也使用它导出协议。
例如Neo中装备的定义如下，其中枚举类型使用了中文别名，导出后会是枚举值：再比如Neo中，抽卡协议的定义如下，定义了一个Rpc，以及其arguments和return的结构：
热更新：热更新是一个有趣的话题，我在这篇blog里提到过一些关于Unity的跨平台、热更的知识。基本所有热更框架都是通过内嵌某种语言的虚拟机来解释执行（JIT）从而做到热更的。相信Unity程序员一定接触过各种lua：xlua、tolua、ulua、slua；除了lua，我在网易供职的两年里，还基于网易的in-house引擎NeoX开发过两年的python（苦笑）。
热更新确实是一个很实际的需求，but at what cost？至少从我好几年的弱类型语言的体验来说，我不觉得lua、python这些语言适合开发所有的游戏逻辑，尤其是异步逻辑以及偏底层的逻辑。使用C#这样强类型语言，效率优势是一方面，表达能力优势是另一方面。例如lua下要写复杂一些的异步逻辑，很可能需要用promise这样的编程范式，如果用回调的话，极易掉入回调地狱(callback hell)，即使是这样，debug起来也是十分痛苦；而在C#中，使用async/await的编程范式能更好的处理异步的情况，也容易处理cancellation或者exception。
因此我倾向于可以直接使用C#语言的热更框架（例如早先流行的ILRuntime），并且最好没有过多语言层面的限制，可以像原生C#一样去开发。
最后我选择了HybridCLR这个框架，花了较多的功夫，踩了相当多的坑之后，整合到了Neo中。不过结果我是非常满意的：Shared Core和所有Neo的客户端程序集都是可以热更的，大部分第三方程序集也是可以热更的；Editor模式下正常开发，使用原生dll，不影响debug；PC包则使用打在资源包里的dll，拥有完整的热更功能。
资源加载：这一部分我使用的是YooAsset，在本地用httpFileServer搭建一个文件服务器，就可以测试YooAsset的远程资源包下载。在这里可以介绍一下Neo的游戏启动流程了：Neo有一个引导package，它的代码是不能热更的，它的资源都是built-in打进包的。它的功能就是来做下载的，因此资源量很少，代码也只有资源包下载、热更dll加载等逻辑。
patch界面长这样：下载完最新资源后，会先加载AOT dll的MetaData（HybridCLR用它来生成未出现的泛型类型），再加载普通的热更新dll，然后执行其中的Entry函数。至此之后，所有的逻辑都是可以热更新的了。
Debug控制台：Quantum Console是一个外表非常fancy，功能也非常易用的Unity控制台插件，用来debug非常方便。它也是通过反射扫描dll的方法查找标记了[QFSW.QC.Command]的方法，并为它们生成对应的指令，和我们服务端的console有异曲同工之妙。
这是在登录界面按[Esc]键呼出控制台的样子（开发模式下Shared模块的单元测试每次都会跑一遍）：
场景切换：一个通用的场景切换功能，灵感来自于一个原型制作插件Feel。这个场景切换是一个异步过程：1.用Additive的方式加载过渡场景；2.播放过渡场景的淡入动画与加载circle的动画；3.卸载原场景；4.通过YooAsset的异步加载接口加载目标场景并激活场景；5.播放过渡场景的淡出动画；6.卸载过渡场景。
从登录场景切换到大厅的过渡效果（gif加载较慢）：
UI框架：UI框架是由我自己开发的，主要包含界面加载、层级管理、界面生命周期事件，一个可拖拽的window类，以及Tween动画的处理。实际上界面打开、关闭也是一个异步过程：例如当界面挂载了tween动画组件时，关闭界面就需要先等待动画播放完成，再将它释放回对象池。
这是装备和背包界面的打开/关闭、拖拽、层级处理的效果（gif加载较慢）：
其他模块：Neo还有很多功能完善的基础模块：
- ObjectPoolMgr：通用的游戏物体的对象池系统，支持动态扩容和收缩
- Toast：通用的toast提示
- Plot：基于节点图的剧情系统
- MsgBox：通用弹窗选择，可以适配不同style，是一个异步过程
- AudioMgr：音效管理，支持基于playerPrefs的音量调节，支持背景音淡入淡出切换
- ToolTips：hover在界面上时的提示，支持不同style
- ModelDisplayer：模型显示在界面上，以及拖拽检视
- 集成的第三方库：LoopScrollRect，Translucent Image，Animancer，Odin Inspector，DoTween，A* Pathfinding Project，NodeGraphProcessor，UniTask，UIEffect，Unity UI Extensions，Magica Cloth

2.3 .net服务端

由于我并不是真正意义上的全栈工程师，没有系统了解过服务端的技术栈，因此我的服务端架构设计可能比较随性hhh，不太具有参考价值。不过我也进行过一些压测和性能测试，感觉应该技术路线还是可行的，可以支撑的起一定体量的在线。一个简陋的玩具服务器，对我来说也比较有意义了，未来如果我了解了更多服务器技术，就可以回顾反思现在的设计，应该会有很大的改进空间。

网络通信：这一部分是放在Shared Core中的，但是和网络相关，所以我放在了这里说。我使用的是开源的网络库LiteNetLib。它的封装程度还是比较高的，像NAT穿孔、可靠UDP这些细节用户不需要关心。它还包含自带的一个序列化/反序列化功能，可以手动定义一些通信协议。不过这一部分我没有使用它原生的序列化，我使用的是luban的协议生成，它支持更多高级结构、嵌套结构，可以像protobuf一样定义就行了，不需要手动写各种序列化代码。
在已有的可以互相发协议的NetPeer的基础上，我封装了Protocol和Rpc两种通信的方式。其中Protocol是fire-and-forget的，不需要等回包；而Rpc的调用则是一个async修饰的异步过程，只能由客户端调用，会生成一个rpcId，并等待回包。
DataModel：DataModel是客户端和服务器共用的数据模型，它也是放在Shared Core里的。它包含所有客户端和服务器关心的字段，例如角色信息、用户所有卡牌、用户背包数据。在用户登录或者断线重连时，服务器会全量同步DataModel到客户端。当服务端修改其中的字段或者容器时，会有某种dirty机制，将DataModel中改变的部分生成成为json，并通过协议将json发送给客户端；当客户端收到协议并应用更改后，会发出对应字段的onValueChange事件，之后二者的DataModel将会完全一致。这有些类似于一些网络框架里的SyncList, SyncVar, SyncDict的理念，实际上在实现上我参考了这些类的实现，并使用反射的方式支持了嵌套结构。
下图是在用户两次佩戴装备的日志：一次部位不匹配，穿戴失败；一次穿戴成功，服务端下发delta数据，客户端刷新界面
DB：数据库方面我选用的是MongoDB，对我来说使用简单，学习成本低。在DB模块，需要定义服务端关心的数据，并将它与DataModel对应字段联系起来，并写好初始化逻辑，在创建新账户时会调用到。
Bot：Neo的Bot会跑在另一个进程中，在接受一个bot数量的输入之后，会通过多线程的方式创建并运行所有的bot。一个bot拥有一个NetworkEndpoint，实际上是一个无情的协议通信机器。在运行之后它会发送登录协议，收到回包之后会发送一次GM的rpc，给自己加足够的钻石，然后发送一次抽卡10连的rpc，然后就会等待自然断开连接。
对我来说bot是十分重要的模块，不仅能进行压力测试，还能发现性能热点，对于debug也是大有裨益。使用bot，我发现了很多并发时才会出现的问题。
另外，bot是在同一台电脑跑的，创建线程的消耗是非常可观的，如果要做性能分析最好还是把bot部署到别的物理机器上。经过bot测试，Neo服务端对于上述登录-GM-抽卡的简单流程的响应是没有问题的，在我的机器上抗住1000左右的并发没什么压力。

3.一个实例 - 背包系统

在这一节，我将分析Neo的背包系统，让读者能对这个框架有个更完整的视角。

对于背包、装备和仓库系统，其实三者都可以看作是Inventory的一种。背包的装备、材料、消耗品等页签，可以看作是一个个只接受对应分类item的inventory；而仓库可以看作是接受所有分类item的一种inventory；装备的每一个slot，可以看成一个1x1的只接受对应部位装备的inventory。

因此，我们可以定义一个inventory表来配置上述系统。表里有id字段，作为每个inventory的唯一标识；有group字段，通过检查group，确定每个inventory是背包页、仓库页还是装备格；有width和height字段，决定背包的size大小；有标记了[Flag]的category枚举字段，表示该inventory能接收的item种类。

对于数据部分，在我们的DataModel里，需要新增一个结构在客户端与服务器之间同步所有inventory的信息。这是一个嵌套结构，最外层是id为key、inventoryInfo为value的字典，而inventoryInfo是一个itemPos为key、itemInfo为value的字典。当我们新建账号时，或者检查账号数据完整性时，会根据配置表中的inventory定义初始化我们的DataModel。在用户登录或重连时，DataModel中所有的信息会全量同步给客户端。当因为收到客户端操作，或者其他系统导致背包数据变化时，服务器会存盘背包数据，同时将背包数据的变化的json发送给客户端。客户端无法修改DataModel，完全以服务端作为权威；当客户端收到变化json后，应用到本地的DataModel上，就能保证是与远端是一致的。

对于协议部分，我们只需要新增一个Item操作的rpc。它的Args包含：操作的item所属inventoryId、操作的item位置、目标inventoryId、目标item位置、操作类型（Move/Drop/Use）；而这个rpc的Result则是成功或失败的枚举。

对于客户端界面显示部分，主要是两点：1.）item的拖拽操作会生成对应的rpc，这是一个异步操作，收到rpc回包前应该屏蔽其他背包操作；2.）背包等界面打开时，应该监听DataModel中相应字段的onValueChange事件，当受到事件时，应该用最新的DataModel刷新界面

4. To Be Continued

Neo是一个不断迭代的框架，我也为它制定了一个RoadMap，接下来会做角色相关（模型、动画、控制），以及技能系统。当有更多阶段性的进展之后，我应该会写一些更多关于Neo的博客~

一个兴趣使然的C/S双端游戏框架

前言