OWenT's blog
  • Introduction
  • About Me
  • 2020
    • 近期对libatapp的一些优化调整(增加服务发现和连接管理,支持yaml等)
    • xresloader转表工具链增加了一些新功能(map,oneof支持,输出矩阵,基于模板引擎的加载代码生成等)
    • 在游戏服务器中使用分布式事务
    • libcopp接入C++20 Coroutine和一些过渡期的设计
    • libatbus 的大幅优化
    • nftables初体验
    • 容器配置开发环境小计
  • 2019
    • PALM Tree - 适合多核并发架构的B+树 - 论文阅读小记
    • 跨平台协程库 - libcopp 简介
    • C++20 Coroutine 性能测试 (附带和libcopp/libco/libgo/goroutine/linux ucontext对比)
    • 尝鲜Github Action
    • 一些xresloader(转表工具)的改进
    • protobuf、flatbuffer、msgpack 针对小数据包的简单对比
    • 协程框架(libcopp) 小幅优化
    • Excel转表工具(xresloader) 增加protobuf插件功能和集成 UnrealEngine 支持
    • Anna(支持任意扩展和超高性能的KV数据库系统)阅读笔记
    • C++20 Coroutine
    • libcopp merge boost.context 1.69.0
    • Google去中心化分布式系统论文三件套(Percolator、Spanner、F1)读后感
    • Rust玩具-企业微信机器人通用服务
  • 2018
    • 使用ELK辅助监控开发测试环境服务质量和问题定位
    • Webpack+vue+boostrap+ejs构建Web版GM工具
    • 2018年的新通用伪随机数算法(xoshiro / xoroshiro)的C++(head only)实现
    • Rust的第二次接触-写个小服务器程序
    • 理解和适配AEAD加密套件
    • atsf4g-co的进化:协程框架v2、对象路由系统和一些其他细节优化
    • 协程框架(libcopp)v2优化、自适应栈池和同类库的Benchmark对比
    • 可执行文件压缩
    • 初识Rust
    • 使用restructedtext编写xresloader文档
    • atframework的etcd模块化重构
    • C++的backtrace
  • 2017
    • ECDH椭圆双曲线(比DH快10倍的密钥交换)算法简介和封装
    • protobuf-net的动态Message实现
    • pbc的proto3接入
    • atgateway内置协议流程优化-加密、算法协商和ECDH
    • 整理一波软件源镜像同步工具+DevOps工具
    • Blog切换到Hugo
    • libcopp v2的第一波优化完成
    • libcopp(v2) vs goroutine性能测试
    • libcopp的线程安全、栈池和merge boost.context 1.64.0
    • GCC 7和LLVM+Clang+libc++abi 4.0的构建脚本
    • libatbus的几个藏得很深的bug
    • 用cmake交叉编译到iOS和Android
    • 开源项目得一些小维护
    • atapp的c binding和c#适配
    • 对象路由系统设计
    • 2016年总结
    • 近期的一个协程流程BUG
  • 2016
    • 重写了llvm+clang+libc++和libc++abi的构建脚本
    • atsf4g完整游戏工程示例
    • atframework基本框架已经完成
    • 游戏服务器的不停服更新
    • 对atbus的小数据包的优化
    • Android和IOS的TLS问题
    • pbc的一个陈年老BUG
    • boost.context-1.61版本的设计模型变化
    • 接入letsencrypt+全面启用HTTP/2
    • 理解Raft算法
    • libatbus基本功能及单元测试终于写完啦
    • 博客文章和文档迁移到gitbook
  • 2015
    • 博客文章和文档迁移到gitbook
    • 给客户端写得LRU缓存
    • 近期活动比较零散
    • 关于BUS通信系统的一些思考(三)
    • 针对Java JIT的优化(转表工具:xresloader)
    • libcopp更新 (merge boost 1.59 context)
    • 小记最近踩得两个C++坑
    • Redis全异步(HA)Driver设计稿
    • Vim常用命令
    • 关于firewalld和systemd的一些命令速记
    • Jenkins(hudson)插件记录
    • 我们的Lua类绑定机制
    • LLVM+Clang+Libcxx+Libcxxabi(3.6)工具链编译(完成自举编译)
    • 回顾2014
    • Android NDK undefined reference to ___tls_get_addr 错误
    • gitlab腾讯企业邮箱配置
  • 2014
    • 回顾2013
    • C++11动态模板参数和type_traits
    • C++又一坑:动态链接库中的全局变量
    • tolua++内存释放坑
    • [转]类似github的框架
    • Lua性能分析
    • 集成Qt Webkit 到cocos2d-x
    • Gitlab环境搭建小计
    • 近期研究VPN的一些记录(OpenVPN,pptp,l2tp)
    • LLVM + Clang + Libcxx + Libcxxabi 工具链编译
    • 关于BUS通信系统的一些思考(二)
    • 关于BUS通信系统的一些思考(一)
    • [libiniloader] Project
    • 记录一些在线编辑器
    • [WP Code Highlight.js] Project
    • 再议 C++ 11 Lambda表达式
    • 基于Chrome插件的开发工具链
    • [ACM] HDU 1006 解题报告
    • Linux 编译安装 GCC 4.9
    • 又碰到了这个解谜游戏,顺带记下地址
    • 简单C++单元测试框架(支持一键切到GTest或Boost.Test)
    • 捣鼓一个协程库
  • 2013
    • std和boost的function与bind实现剖析
    • 不知道是哪一年的腾讯马拉松题目 照片评级 解题报告
    • Lua 挺好用的样子
    • VC和GCC成员函数指针实现的研究(三)
    • VC和GCC成员函数指针实现的研究(二)
    • VC和GCC内成员函数指针实现的研究(一)
    • 一个C++关于成员变量偏移地址的小Trick
    • ptmalloc,tcmalloc和jemalloc内存分配策略研究
    • POJ 2192 Zipper HDU 2059 龟兔赛跑
    • 从Javascript到Typescript到Node.js
    • 网络编程小结
    • 试试Boost.Asio
    • Lnmp yum 安装脚本 (for CentOS)
    • ARM 交叉编译环境搭建
    • Linux 编译安装 GCC 4.8
    • [记录]虚拟硬盘的压缩|磁盘写零
  • 2012
    • Boost.Spirit 初体验
    • “C++的90个坑”-阅读笔记
    • AC自动机
    • C++ 标准过渡期
    • 程序员修炼之道 -- 阅读笔记
    • [转载]狼与哈士奇
    • C++ 新特性学习(八) — 原子操作和多线程库[多工内存模型]
    • C++ 新特性学习(七) — 右值引用
    • 理解Protobuf的数据编码规则
    • 忆往昔ECUST的ACM时代
    • Linux编译安装GCC 4.7
    • JSON显示库 -- showJson (Javascript)
    • C++ 新特性学习(六) — 新的字符串编码和伪随机数
    • C++ 新特性学习(五) — 引用包装、元编程的类型属性和计算函数对象返回类型
    • C++ 新特性学习(四) — Bind和Function
  • 2011
    • C++ 新特性学习(三) — Regex库
    • C++ 新特性学习(二) -- Array、Tuple和Hash库
    • C++ 新特性学习(一) -- 概述+智能指针(smart_ptr)
    • Linux 和 Windows PowerShell 常用工具/命令 记录
    • 非常帅气的Linq to sql
    • 2011 Google Code Jam 小记
    • C++总是很神奇
    • 大学生创新项目[国家级]经费使用记录
    • 常用官方文档整理
    • 我们学校的IPV6很不错嘛
  • 2010
    • 线段树相关问题 (引用 PKU POJ题目) 整理
    • 2010 ACM 赛前笔记
    • POJ PKU 2596 Dice Stacking 解题报告
    • POJ PKU 3631 Cuckoo Hashing 解题报告
    • POJ PKU 1065 Wooden Sticks 3636 Nested Dolls 解题报告
    • HDU 3336 Count the string 解题报告
    • Hash模板 个人模板
    • ZOJ 3309 Search New Posts 解题报告
    • POJ PKU Let's Go to the Movies 解题报告
    • 注册表常用键值意义
    • PKU POJ 1724 ROADS 解题报告
    • 《神奇古今秘方集锦》&《民间秘术大全》
    • PKU POJ 1720 SQUARES 解题报告
    • POJ PKU 2155 Matrix 解题报告
    • PKU POJ 1141 Brackets Sequence 解题报告
    • PKU POJ 2728 Desert King 解题报告
    • PKU POJ 2976 Dropping tests 解题报告
    • PKU POJ 3757 Simple Distributed storage system 解题报告
    • GCD Determinant 解题报告
    • Southeastern European 2008 Sky Code 解题报告
    • HDU HDOJ 3400 Line belt 解题报告
    • 线性筛法求质数(素数)表 及其原理
    • HDU HDOJ 3398 String 解题报告
    • 树状数组模块(个人模板)
    • 浙江理工 省赛总结 team62 By OWenT of Coeus
    • POJ PKU 3659 Cell Phone Network 解题报告
    • USACO 2008 March Gold Cow Jogging 解题报告
    • C#格式化输出(记录)
    • 参加有道难题笔记
    • POJ PKU 2446 Chessboard 解题报告
    • POJ PKU 1986 Distance Queries 解题报告
    • 计算几何算法概览[转载]
    • 关于差分约束(转载)
    • POJ PKU 2826 An Easy Problem?! 解题报告
    • 数论模板(个人模板)
    • 简易四则运算(ACM个人模板)
    • Catalan 数
    • The 35th ACM/ICPC Asia Regional Tianjin Site —— Online Contest 1009 Convex 解题报告
    • JQuery扩展插件--提示信息
    • ACM 计算几何 个人模板
    • 解析网站字符串型参数 Javascript QueryString 操作 TQueryString类
    • POJ PKU 1474 Video Surveillance 解题报告
  • 2009
    • 模式匹配(kmp)个人模板
    • 并查集 模板
    • POJ 3267 The Cow Lexicon 解题报告
    • C/C++语言常用排序算法
    • POJ 2606 Rabbit hunt 2780 Linearity 1118 Lining Up 解题报告
    • 打造最快的Hash表(转) [以暴雪的游戏的Hash为例]
    • ECUST 09年 校赛个人赛第六,七场总结
    • ECUST 09年 校赛个人赛第三场部分解题报告(A,D,F,I)
    • 牛顿迭代解方程 ax^3+bX^2+cx+d=0
    • 09年8月9日 ECUST ACM 练习赛总结
    • 连接最多点直线 (OWenT 个人模板)
    • 点到直线距离 和 线段间最短距离 (OWenT 模板)
    • ECUST 09年 校赛个人训练赛第五场总结
    • ECUST 09年 校赛个人赛第八场(最后一场)总结
    • 09年8月14日 ECUST ACM 练习赛总结
    • 矩阵相关 (增强中)
    • Prime最小生成树(个人模板)
    • 最长单调子序列 复杂度nlog(n)
    • POJ PKU 2549 Sumsets 解题报告
    • POJ PKU 3277 City Horizon 解题报告
    • 我的ACM生涯
    • POJ PKU 2528 Mayor's posters 解题报告
    • POJ PKU 2378 Tree Cutting 解题报告
    • POJ PKU 1990 MooFest 解题报告
Powered by GitBook
On this page
  • 目录
  • 概述
  • 静态共享内存通道BUS
  • 单机节点间通信
  • 跨机进程间通信
  • 总结
  • 动态共享内存通道BUS
  • 高性能开源消息队列组件- ZeroMQ
  • 开源BUS组件- D—Bus
  • 其他BUS系统

Was this helpful?

  1. 2014

关于BUS通信系统的一些思考(一)

Previous关于BUS通信系统的一些思考(二)Next[libiniloader] Project

Last updated 6 years ago

Was this helpful?

目录

概述

如何保证一个进程或线程能安全稳定地把一段消息发送到另一个进程和线程,甚至是另一台机器的进程或线程,再或是要通过代理转发到另一个进程或线程,一直是一个比较麻烦的问题。

最近看了一些和BUS系统有关的东西。对于游戏服务器集群所使用的BUS通信系统有一些想法和思路,但是由于我对其他类型的业务和框架不是很熟悉,有些想法可能仅是站在游戏服务端的立场上,所以可能有些地方还有一些局限性。

BUS系统在我最理想的状态是,只需要两方的ID,发送屏蔽消息流转细节(废话,现在是个这种系统就有这功能),连接关系尽量简单,按需可用,尽量保证可靠性,更要的是逻辑简单。但是一直没找到一个特别完美的解决方案。

一些概念性的东西直接维基百科即可,比如,我这里就不再另外贴概念了。

静态共享内存通道BUS

首先是我们公司这里所采用的BUS公共组件是基于共享内存的。 整体的设计结构大致分为两种,一种是同一物理机下的进程间通信,另一种是不同物理机进程间的通信。

单机节点间通信

每个节点都有一个32位的ID,然后每两个节点之间都会建立两条通道。

节点A->节点B: 通道一:消息从A流向B
节点B->节点A: 通道二:消息从B流向A

如上图所展示,对节点A来说,通道一是发送节点,通道二是接收节点;对节点B而言,通道一是接收节点,通道二是发送节点。

同时,这里的通道由共享内存构建,这么做的好处是即便程序崩溃了,消息也不会丢失。另外节点对消息的处理使用无锁队列实现。

但是由于这里的BUS都是单读单写,所以实现起来也比较简单暴力。并且通信和socket一样是面向连接的。

跨机进程间通信

上面已经解决了单机进程间通信,然后要解决跨机器通信的时候不得不借助网络,为了减少网络节点铺成网状,设计了一个代理节点。

代理节点会监听端口,进行消息转发,这样就把内部的多个节点对外都收敛到了代理结点上。同时对每个对外的节点设计了一个缓存通道,并且对消息编号,发出的消息如果没有回执尝试重发,收到重复序号的消息则忽略。 这样保证了只要节点发送接口返回成功,消息就一定不会丢,一定存在再某个信道里,并且消息由序号保证不重复。

节点A->物理机一代理节点: 共享内存通道
物理机一代理节点->物理机二代理节点: 网络通道
物理机二代理节点->节点B: 共享内存通道
节点B->物理机二代理节点: 共享内存通道
物理机二代理节点->物理机一代理节点: 网络通道
物理机一代理节点->节点A: 共享内存通道

总结

这种设计方式非常简单高效,而且最大的优点是保证里消息的可靠性。但是有两个问题,第一个问题是节点间两两互相建立信道,意味着信道很多,而且是网状的。虽然在物理机之间通信的时候做过一次收敛,但是内部还是网状的连接,同时为了维持这些信道,内存开销不小。 另一个问题就是标题里提到的静态,至于为什么叫静态的呢?因为节点连接的每个通道都要事先建立。所以这也就引出了接下来我想谈到的动态共享内存BUS。

动态共享内存通道BUS

为了解决静态的问题,我们这的一位专家设计了动态共享内存BUS系统。其实原理很简单,就是再静态共享内存通道的基础上,给代理节点增加通道管理功能。

首先所有共享内存通道都由代理节点分配和管理,管理过程大致分几步: 1. 代理节点通过网络监听管理端口 2. 当子节点上线时连接到代理节点管理端口,发送注册消息,代理节点分配消息通道 3. 当子节点之间通信时首先检查本地有没有直连通道,有的话通过直连通道发送消息,否则发给代理节点,由代理节点转发 4. 代理节点收到消息转发请求以后先检测两边通信的节点是否都是下属的子节点,如果是就新建两个通道,并通知子节点下次通信用这两个通道作直连通道,然后转发消息。否则就把消息转发到远程机器的代理节点

这么做简单地说就是让代理节点来管理共享内存通道,但是带来地另一个问题就是程序恢复时怎么恢复通道。一种方式时通道信息也记录到共享内存里去,但是这边地实现比较暴力一点,会根据通信双方节点ID和代理节点配置算出来一个唯一共享内存ID。只要配置不变,ID不变,共享内存Key是不变的。

另一个问题就是为了性能这里的实现里网络通信没有把转发消息缓存起来,所以跨机器通信的消息由丢失的风险。

另一个问题就是还是没有解决单机内网状的共享内存通道连接关系。

ZeroMQ最大的特点就是是面向消息的,和前面提到的两种还有socket的通信方式完全不一样。

不过不得不说,ZeroMQ确实把通信模式总结得非常好,支持请求-回应模式、发布-订阅模式、路由消息等。而且它的上层API完成了一个非常重要的功能,就是使用zmq的ROUTER sock可以把接收方路由节点可以收敛到一个端点上。

但是它的面向消息的设计带来一个问题就是,逻辑过于重了。特别是它的很多模式都是基于同步操作的,而且弱化了连接的概念。在要构建服务器的需要的异步操作里不得不用一些底层的操作,并且它的通信模式对消息内容还有些潜规则(比如REQ消息会有一个节点名称包头和一个空包头、路由消息会有一个节点名称包头等)

另一个问题就是跨进程通信只支持网络socket和Unix socket。虽然ZeroMQ内部提供了命名节点的失败重发机制,但是仍然避免不了进程崩溃会导致包丢失的问题。

相对与前面共享内存通信而言,大消息包时性能和前面的接近,小消息包时大约是前面共享内存性能的二分之一到三分之一。而游戏进程间通信的消息体大多数情况下不大。

不过我个人觉得,最重要的问题还是消息的可靠性问题。

D-Bus已经用于Gnome、Qt等一些知名的开源项目。这个组件我没有太深入的研究,一方面是由于其过于复杂了,另一方面虽然他是面向连接的,但是貌似依然不支持共享内存,所以估计性能上不会比ZeroMQ好。另外就是它早期被用作本机进程间通信的,跨机情况下不知道稳定性怎么样。

另外D-Bus通过发送不成功时dump消息到文件以下次发送来保证消息可靠性。这种做法可以很容易想到在连接闪断的时候CPU会飙高。

不过话说回来,D-Bus确实时一个完整的Bus通信系统,有完善的监控机制、完整的消息服务、完善的功能(虽然支持的模式不像ZeroMQ一样那么多)。

其他BUS系统

另外,还看到个Android上的Binder,说是消息也是放在共享内存中,消息传递时是通过切换指针来完成,甚至通道切换都不要进行拷贝。这确实是个比较有意思的做法,但是需要系统提供驱动设备文件支持,并且所有节点共享binder的数据区。这就要求必须由比较复杂的内存管理机制来管理数据节点。而且貌似Android里实现的binder管理的内存也不是很大。

现在无锁队列已经有很多种实现了,云峰曾经写过一些,他的skynet里也有一个GCC下的进程间通信的,这种实现很像zeromq的。

上面这些无锁队列都是运用于进程内存的,还有可以运用于共享内存的例子,具体可以参照gaccob的blog。或是boost库里的部分和部分。

这种模式gaccob也提供了一个简单的例子。

高性能开源消息队列组件-

对于BUS系统和消息队列,也有一些很有名气的开源组件。比如这个,。

再一个问题就是即便使用Unix socket,性能还是比共享内存差不少。在写这篇博文前我按照前面第二种通信模式写了一个对zeromq的压力测试,具体代码可见这里。压测结果在这里。

开源BUS组件-

但是也是因为它太完善了,所以也就太庞大了。导致我不太喜欢。 另外这里有关于D-Bus的性能测试报告,看起来性能不怎么样啊。

Redhat搞了个dbus的分支,貌似把这玩意整进linux内核了,据说性能会进一步提升。但是总感觉还要过内核,再加上上面的D-Bus性能测试报告,略微担忧。

接下文... Written with .

消息队列
分享
无锁队列实现
inproc协议
《游戏服务器系列(1)——无锁的共享内存通信》
进程间通信
无锁容器
《游戏服务器系列(6)——共享内存通信之二》
ZeroMQ
ZeroMQ
https://gist.github.com/owt5008137/72c3fd5f4bb63a863641
http://api.owent.net/resource/doc/link/zerqmq%20%E6%80%A7%E8%83%BD%E6%B5%8B%E8%AF%95%E6%8A%A5%E5%91%8A.xlsx
D—Bus
http://pvanhoof.be/blog/index.php/2010/05/13/ipc-performance-the-report
kdbus
StackEdit