OWenT's blog
  • Introduction
  • About Me
  • 2020
    • 近期对libatapp的一些优化调整(增加服务发现和连接管理,支持yaml等)
    • xresloader转表工具链增加了一些新功能(map,oneof支持,输出矩阵,基于模板引擎的加载代码生成等)
    • 在游戏服务器中使用分布式事务
    • libcopp接入C++20 Coroutine和一些过渡期的设计
    • libatbus 的大幅优化
    • nftables初体验
    • 容器配置开发环境小计
  • 2019
    • PALM Tree - 适合多核并发架构的B+树 - 论文阅读小记
    • 跨平台协程库 - libcopp 简介
    • C++20 Coroutine 性能测试 (附带和libcopp/libco/libgo/goroutine/linux ucontext对比)
    • 尝鲜Github Action
    • 一些xresloader(转表工具)的改进
    • protobuf、flatbuffer、msgpack 针对小数据包的简单对比
    • 协程框架(libcopp) 小幅优化
    • Excel转表工具(xresloader) 增加protobuf插件功能和集成 UnrealEngine 支持
    • Anna(支持任意扩展和超高性能的KV数据库系统)阅读笔记
    • C++20 Coroutine
    • libcopp merge boost.context 1.69.0
    • Google去中心化分布式系统论文三件套(Percolator、Spanner、F1)读后感
    • Rust玩具-企业微信机器人通用服务
  • 2018
    • 使用ELK辅助监控开发测试环境服务质量和问题定位
    • Webpack+vue+boostrap+ejs构建Web版GM工具
    • 2018年的新通用伪随机数算法(xoshiro / xoroshiro)的C++(head only)实现
    • Rust的第二次接触-写个小服务器程序
    • 理解和适配AEAD加密套件
    • atsf4g-co的进化:协程框架v2、对象路由系统和一些其他细节优化
    • 协程框架(libcopp)v2优化、自适应栈池和同类库的Benchmark对比
    • 可执行文件压缩
    • 初识Rust
    • 使用restructedtext编写xresloader文档
    • atframework的etcd模块化重构
    • C++的backtrace
  • 2017
    • ECDH椭圆双曲线(比DH快10倍的密钥交换)算法简介和封装
    • protobuf-net的动态Message实现
    • pbc的proto3接入
    • atgateway内置协议流程优化-加密、算法协商和ECDH
    • 整理一波软件源镜像同步工具+DevOps工具
    • Blog切换到Hugo
    • libcopp v2的第一波优化完成
    • libcopp(v2) vs goroutine性能测试
    • libcopp的线程安全、栈池和merge boost.context 1.64.0
    • GCC 7和LLVM+Clang+libc++abi 4.0的构建脚本
    • libatbus的几个藏得很深的bug
    • 用cmake交叉编译到iOS和Android
    • 开源项目得一些小维护
    • atapp的c binding和c#适配
    • 对象路由系统设计
    • 2016年总结
    • 近期的一个协程流程BUG
  • 2016
    • 重写了llvm+clang+libc++和libc++abi的构建脚本
    • atsf4g完整游戏工程示例
    • atframework基本框架已经完成
    • 游戏服务器的不停服更新
    • 对atbus的小数据包的优化
    • Android和IOS的TLS问题
    • pbc的一个陈年老BUG
    • boost.context-1.61版本的设计模型变化
    • 接入letsencrypt+全面启用HTTP/2
    • 理解Raft算法
    • libatbus基本功能及单元测试终于写完啦
    • 博客文章和文档迁移到gitbook
  • 2015
    • 博客文章和文档迁移到gitbook
    • 给客户端写得LRU缓存
    • 近期活动比较零散
    • 关于BUS通信系统的一些思考(三)
    • 针对Java JIT的优化(转表工具:xresloader)
    • libcopp更新 (merge boost 1.59 context)
    • 小记最近踩得两个C++坑
    • Redis全异步(HA)Driver设计稿
    • Vim常用命令
    • 关于firewalld和systemd的一些命令速记
    • Jenkins(hudson)插件记录
    • 我们的Lua类绑定机制
    • LLVM+Clang+Libcxx+Libcxxabi(3.6)工具链编译(完成自举编译)
    • 回顾2014
    • Android NDK undefined reference to ___tls_get_addr 错误
    • gitlab腾讯企业邮箱配置
  • 2014
    • 回顾2013
    • C++11动态模板参数和type_traits
    • C++又一坑:动态链接库中的全局变量
    • tolua++内存释放坑
    • [转]类似github的框架
    • Lua性能分析
    • 集成Qt Webkit 到cocos2d-x
    • Gitlab环境搭建小计
    • 近期研究VPN的一些记录(OpenVPN,pptp,l2tp)
    • LLVM + Clang + Libcxx + Libcxxabi 工具链编译
    • 关于BUS通信系统的一些思考(二)
    • 关于BUS通信系统的一些思考(一)
    • [libiniloader] Project
    • 记录一些在线编辑器
    • [WP Code Highlight.js] Project
    • 再议 C++ 11 Lambda表达式
    • 基于Chrome插件的开发工具链
    • [ACM] HDU 1006 解题报告
    • Linux 编译安装 GCC 4.9
    • 又碰到了这个解谜游戏,顺带记下地址
    • 简单C++单元测试框架(支持一键切到GTest或Boost.Test)
    • 捣鼓一个协程库
  • 2013
    • std和boost的function与bind实现剖析
    • 不知道是哪一年的腾讯马拉松题目 照片评级 解题报告
    • Lua 挺好用的样子
    • VC和GCC成员函数指针实现的研究(三)
    • VC和GCC成员函数指针实现的研究(二)
    • VC和GCC内成员函数指针实现的研究(一)
    • 一个C++关于成员变量偏移地址的小Trick
    • ptmalloc,tcmalloc和jemalloc内存分配策略研究
    • POJ 2192 Zipper HDU 2059 龟兔赛跑
    • 从Javascript到Typescript到Node.js
    • 网络编程小结
    • 试试Boost.Asio
    • Lnmp yum 安装脚本 (for CentOS)
    • ARM 交叉编译环境搭建
    • Linux 编译安装 GCC 4.8
    • [记录]虚拟硬盘的压缩|磁盘写零
  • 2012
    • Boost.Spirit 初体验
    • “C++的90个坑”-阅读笔记
    • AC自动机
    • C++ 标准过渡期
    • 程序员修炼之道 -- 阅读笔记
    • [转载]狼与哈士奇
    • C++ 新特性学习(八) — 原子操作和多线程库[多工内存模型]
    • C++ 新特性学习(七) — 右值引用
    • 理解Protobuf的数据编码规则
    • 忆往昔ECUST的ACM时代
    • Linux编译安装GCC 4.7
    • JSON显示库 -- showJson (Javascript)
    • C++ 新特性学习(六) — 新的字符串编码和伪随机数
    • C++ 新特性学习(五) — 引用包装、元编程的类型属性和计算函数对象返回类型
    • C++ 新特性学习(四) — Bind和Function
  • 2011
    • C++ 新特性学习(三) — Regex库
    • C++ 新特性学习(二) -- Array、Tuple和Hash库
    • C++ 新特性学习(一) -- 概述+智能指针(smart_ptr)
    • Linux 和 Windows PowerShell 常用工具/命令 记录
    • 非常帅气的Linq to sql
    • 2011 Google Code Jam 小记
    • C++总是很神奇
    • 大学生创新项目[国家级]经费使用记录
    • 常用官方文档整理
    • 我们学校的IPV6很不错嘛
  • 2010
    • 线段树相关问题 (引用 PKU POJ题目) 整理
    • 2010 ACM 赛前笔记
    • POJ PKU 2596 Dice Stacking 解题报告
    • POJ PKU 3631 Cuckoo Hashing 解题报告
    • POJ PKU 1065 Wooden Sticks 3636 Nested Dolls 解题报告
    • HDU 3336 Count the string 解题报告
    • Hash模板 个人模板
    • ZOJ 3309 Search New Posts 解题报告
    • POJ PKU Let's Go to the Movies 解题报告
    • 注册表常用键值意义
    • PKU POJ 1724 ROADS 解题报告
    • 《神奇古今秘方集锦》&《民间秘术大全》
    • PKU POJ 1720 SQUARES 解题报告
    • POJ PKU 2155 Matrix 解题报告
    • PKU POJ 1141 Brackets Sequence 解题报告
    • PKU POJ 2728 Desert King 解题报告
    • PKU POJ 2976 Dropping tests 解题报告
    • PKU POJ 3757 Simple Distributed storage system 解题报告
    • GCD Determinant 解题报告
    • Southeastern European 2008 Sky Code 解题报告
    • HDU HDOJ 3400 Line belt 解题报告
    • 线性筛法求质数(素数)表 及其原理
    • HDU HDOJ 3398 String 解题报告
    • 树状数组模块(个人模板)
    • 浙江理工 省赛总结 team62 By OWenT of Coeus
    • POJ PKU 3659 Cell Phone Network 解题报告
    • USACO 2008 March Gold Cow Jogging 解题报告
    • C#格式化输出(记录)
    • 参加有道难题笔记
    • POJ PKU 2446 Chessboard 解题报告
    • POJ PKU 1986 Distance Queries 解题报告
    • 计算几何算法概览[转载]
    • 关于差分约束(转载)
    • POJ PKU 2826 An Easy Problem?! 解题报告
    • 数论模板(个人模板)
    • 简易四则运算(ACM个人模板)
    • Catalan 数
    • The 35th ACM/ICPC Asia Regional Tianjin Site —— Online Contest 1009 Convex 解题报告
    • JQuery扩展插件--提示信息
    • ACM 计算几何 个人模板
    • 解析网站字符串型参数 Javascript QueryString 操作 TQueryString类
    • POJ PKU 1474 Video Surveillance 解题报告
  • 2009
    • 模式匹配(kmp)个人模板
    • 并查集 模板
    • POJ 3267 The Cow Lexicon 解题报告
    • C/C++语言常用排序算法
    • POJ 2606 Rabbit hunt 2780 Linearity 1118 Lining Up 解题报告
    • 打造最快的Hash表(转) [以暴雪的游戏的Hash为例]
    • ECUST 09年 校赛个人赛第六,七场总结
    • ECUST 09年 校赛个人赛第三场部分解题报告(A,D,F,I)
    • 牛顿迭代解方程 ax^3+bX^2+cx+d=0
    • 09年8月9日 ECUST ACM 练习赛总结
    • 连接最多点直线 (OWenT 个人模板)
    • 点到直线距离 和 线段间最短距离 (OWenT 模板)
    • ECUST 09年 校赛个人训练赛第五场总结
    • ECUST 09年 校赛个人赛第八场(最后一场)总结
    • 09年8月14日 ECUST ACM 练习赛总结
    • 矩阵相关 (增强中)
    • Prime最小生成树(个人模板)
    • 最长单调子序列 复杂度nlog(n)
    • POJ PKU 2549 Sumsets 解题报告
    • POJ PKU 3277 City Horizon 解题报告
    • 我的ACM生涯
    • POJ PKU 2528 Mayor's posters 解题报告
    • POJ PKU 2378 Tree Cutting 解题报告
    • POJ PKU 1990 MooFest 解题报告
Powered by GitBook
On this page
  • 前言
  • 协程系统优化
  • 对象路由
  • 优化一: IO排队自动化
  • 优化二: 快队列
  • 设计细节优化
  • 调度系统优化
  • 统一异步指令流程
  • etcd接入抽象层
  • hostname判定优化
  • simulator的优化和配置的时间单位
  • 后记

Was this helpful?

  1. 2018

atsf4g-co的进化:协程框架v2、对象路由系统和一些其他细节优化

Previous理解和适配AEAD加密套件Next协程框架(libcopp)v2优化、自适应栈池和同类库的Benchmark对比

Last updated 6 years ago

Was this helpful?

前言

年前就计划把以前项目的一些理念和设计方案融合到sample里来。但是内容比较多,一直也没太多时间去完成它。所幸虽然断断续续但终归是完成了。并且在之前的一些实现上还做了一些细节的优化。内容比较多我感觉我自己写的也比较乱,仅当作一个参照和小计吧。

协程系统优化

本来想直接写这里,但是写着写着有点长,就专门开了一篇,顺便补了和同类库的性能对比。详见:

对象路由

之前给我的上一个项目设计了对象路由系统,但是直到最近才有时间整理抽象并优化一下合入到 里来。 原来的路由系统的设计见 。

设计对象路由系统的主要目的:其一是统一游戏中不同类型的对象的续期、降级/升级、自动保活、定时保存的功能,这样不需要每种类型都单独实现一遍。当然因为游戏对象的种类非常多,要适应性足够好,就不得不加一些约定,暴露比较多的接口,也导致接入的复杂度稍微高一些;其二是统一转发消息给某个对象时,能够自动发送到对象负载均衡或是容灾、扩容、缩容后所在的节点,并且统一这个流程。

一般像数据库都是行级sharding或者行+部分列sharding的,类型和业务比较单一,而游戏对象就比较复杂。比如公会服务,可加入、可退出、可踢出、可管理还有很多其他游戏业务的逻辑。而且每种不同类型的游戏需要分片的对象差异都很大。在以前的一些解决方案中,有按Hash去静态路由到某些服务节点上,如果这个节点挂了会导致分到这个节点上的对象的服务都暂时不可用。而且扩容或者缩容的时候,需要暂停服务,不然数据迁移过程中可能会在新节点拿到迁移数据前收到服务请求,又或是在老节点已经移交对象数据出去后又收到该对象的服务请求。而使用路由系统就不存在这样的问题,如果某个节点出现故障一段容忍时间后可以自动迁移到可用节点进行服务,而后这个对象的所有服务消息会被转发到新的节点上。扩容和缩容的时候也可以不停服,只要数据转移完了,所有消息都会被转发到新节点上。整体结构的设计思路有点像Redis Cluster(详见: )的结构,但是实现和流程细节有一些差异。

之前介绍过这个对象路由系统的设计了,这里就不重复了,着重说一下在之前的设计上进一步的优化。

优化一: IO排队自动化

第一个优化是IO自动排队。所谓IO就是读取和保存的任务。在之前的设计中,如果缓存不存在的时候同时来多个消息,则会拉取多次。虽然多次取回后会丢弃冗余的数据,逻辑上不会有问题,但是还是不必要地发起了拉取请求。

当然,如果路由缓存本身就存在,就也不需要拉取,直接回并行执行所有的任务。

同时在保存地时候的次序也是依赖了数据库层的顺序。而这里的IO自动排队就是解决这个问题,在拉取和保存的时候收敛到一处,并且还可以自动合并保存版本。

比如上面所示的流程里,针对于某个对象,Task 2和Task 3在准备保存的时候Task 1在执行保存任务,那么Task 2和Task 3会等Task 1返回后再次执行保存。这时候因为Task 2和Task 3的数据都已经更新了,所以只需要保存一次最新的数据到数据库,就同时保证了Task 2和Task 3的保存都成功完成。这种情况下就产生了一次数据的Merge并且减少了一次保存开销。

IO排队后的另一个优势是能很容易地保证和事件的时序。试想假设我们第一个协程执行踢出,第二个协程又执行读入。这时候首先第二个协程会等待第一个协程完成,然后第一个协程内会触发Remove事件,而后第一个协程完成,第二个协程Resume并触发Load事件。这很自然地保证了我们地事件触发流程跟着API调用走。而在从前,要保证这种情况下严格的逻辑时序,要么只能让对一个对象的操作串行化,要么需要编写额外的代码来标记状态。

协程里执行IO还有一个优势就是可以很容易地实现FlagGuard:

int router_object_base::pull_cache_inner(void *priv_data) {
    // 触发拉取缓存时要取消移除缓存的计划任务
    unset_flag(flag_t::EN_ROFT_SCHED_REMOVE_CACHE);

    task_manager::task_ptr_t self_task(task_manager::task_t::this_task());
    if (!self_task) {
        return hello::err::EN_SYS_RPC_NO_TASK;
    }

    int ret = await_io_task(self_task);
    if (ret < 0) {
        return ret;
    }

    // 先等待之前的任务完成再设置flag
    flag_guard fg(*this, flag_t::EN_ROFT_PULLING_CACHE);

    // 执行读任务
    io_task_.swap(self_task);
    ret = pull_cache(priv_data);
    io_task_.reset();

    if (ret < 0) {
        return ret;
    }

    // 拉取成功要refresh_save_time
    refresh_save_time();

    return ret;
}

比如这段代码的 flag_guard fg(*this, flag_t::EN_ROFT_PULLING_CACHE); ,我们就可以很方便地用RAII的方式来设置flag。在 ret = pull_cache(priv_data); 会协程切出,而这个异步流程完成前 flag_guard 都是有效的。

优化二: 快队列

我们在路由系统设计了一个全局定时器管理器,统一管理对象的超时降级、定时保存和缓存淘汰问题。但是当定时器触发的时候可能这个对象正处于某种操作中,比如正在执行IO操作而不能立刻降级或者移除,这时候我们回尝试重新将其插入到下一轮定时器中。但是原先只有一种定时器,也就是下一次定时器操作可能是几分钟以后了。所以这里我又加了一个块队列,这种情况下只要等待很短的时间后就可以重试了。这样可以加快出现冲突时的资源回收。

设计细节优化

洽谈一些细节优化比较零碎了,我就简单记录一下吧。

调度系统优化

首先是消息不再需要全局container。原先协程消息必须全部包在一个叫 message_container 的结构体内,便于不同类型的 dispatcher 之间交互统一同一种message类型。这总归有一定的耦合性,每次增加 dispatcher 还得去加这个 dispatcher 的消息类型进这个公共的 message_container 。现在我抽象了一个 dispatcher_msg_raw_t 来描述消息类型。

struct dispatcher_msg_raw_t {
    uintptr_t msg_type; // 建议对所有的消息体类型分配一个ID,用以检查回调类型转换。推荐是使用dispatcher单例的地址。
    void *msg_addr;
};

然后 msg_type 跟着 dispatcher 走,因为通常每一种 dispatcher 处理的消息类型是确定的,比如 ss_dispatcher 只处理服务器间消息 ss_msg , 而 cs_dispatcher 只处理客户端传上来的消息 cs_msg 。

统一异步指令流程

另外也是给协程的start和resume流程增加了 dispatcher_start_data_t 和 dispatcher_resume_data_t 。

struct dispatcher_resume_data_t {
    dispatcher_msg_raw_t message; // 异步回调中用于透传消息体
    void *private_data;           // 异步回调中用于透传额外的私有数据
};

struct dispatcher_start_data_t {
    dispatcher_msg_raw_t message; // 启动回调中用于透传消息体
    void *private_data;           // 启动回调中用于透传额外的私有数据
};

这也是用于能够在派发消息的时候能够对类型做一次检查和利用编译器帮助执行一些API调用规范上的检查。这些检查以前都依赖于 message_container 里的描述反射。

etcd接入抽象层

整个组件分未三部分 etcd_cluster 、 etcd_keepalive 和 etcd_watcher 。 其中 etcd_cluster 用于维护 [etcd][11] 集群,它会定期向 [etcd][11] 集群拉取节点信息(因为可能对 [etcd][11] 调整部署和扩缩容),并且支持自动更新列表和fallback到配置的服务节点列表。 而 etcd_keepalive 和 etcd_watcher 都必须挂接在 etcd_cluster 里。

启用 etcd_keepalive 的时候会自动打开 etcd_cluster 的租约功能(lease)。当租约功能启用的时候,etcd_cluster 对向 [etcd][11] 集群申请一个租约,并且自动续期。然后所有的 etcd_keepalive 的key都会挂载在这个租约下。如果服务崩溃了会导致租约过期,而后被其他 etcd_watcher 的节点感知到。并且现在我们使用了 [etcd][11] 的v3版 API,不再单独续期key的TTL,只需要续期 lease 即可。这种情况下也不会触发key的变更事件。当然第一次启动的防冲突检查和主动的数据变更也是支持的,前者使用了回调函数来实现,并且提供了一个严格比较内存数据的默认实现。

etcd_watcher 顾名思义就是对某个路径做watch,用于感知集群里其他节点的变更情况。同样现在我们使用了 [etcd][11] 的v3版的流式请求,任何的网络错误都会定时发起带版本号的重试流程。

hostname判定优化

原先的配置生成脚本里的hostname用的是真的hostname 。不使用网卡MAC地址主要是考虑有些虚拟机可能没有配置网卡,或者多个网卡,或者网卡发生变化。但是实际使用过程中发现很多时候运维给的虚拟机都是一套模板出来的,很容易没改hostname,这样不同机器认为自己的hostname都一样了。所以这里调整了策略,还是回归成了取字典序后的网卡的MAC地址。如果没有网卡则可以随机一个UUID,因为这时候反正也访问不了外网节点。

simulator的优化和配置的时间单位

对于客户端模拟器 simulator 。我们新增了一个命令定时器,并且增加了一个内置命令( sleep ),可以延迟一段时间执行命令队列的后续指令。这主要是方便我做长时间多用户在线的稳定性和压力测试。

同时配置和命令系统增加了时间单位的支持,这样我们可以配置和执行类似下面这种命令:

sleep 100ms # 休眠100毫秒
sleep 10m   # 休眠10分钟
sleep 1h    # 休眠1小时

后记

我对 [etcd][11] 的接入也做了一层抽象,现在能更容易地利用现有组件搭建对etcd服务灵活地建立watch、keepalive。实现服务保活和监控,然后atproxy的服务发现、负载均衡和容灾也使用了这个新的套件。 还有一个简单的使用的例子在 。

详情可见:

目前的一大波功能Merge和细节优化就这么多。后面可能还会有陆陆续续的小细节优化,量不大的可能就不写blog了。现在的 应该算是一个很完整并且很多技术细节和设计理念都比较先进同时性能也是属于一线水平的开源游戏服务器解决方案了。

[11]:

https://github.com/atframework/atsf4g-co/blob/sample_solution/src/tools/etcd-watcher/main.cpp
https://owent.net/2018/1802.html
atsf4g-co
https://github.com/coreos/etcd
https://owent.net/2018/1806.html
框架sample
https://owent.net/2017/1342.html
https://redis.io/topics/cluster-spec
1807-01.png
1807-02.png
1807-03.png