服务器之家:专注于VPS、云服务器配置技术及软件下载分享
分类导航

Mysql|Sql Server|Oracle|Redis|MongoDB|PostgreSQL|Sqlite|DB2|mariadb|Access|数据库技术|

服务器之家 - 数据库 - MongoDB - 面试官:系统有万亿条消息怎么存储?

面试官:系统有万亿条消息怎么存储?

2023-12-26 14:49ByteByteGo MongoDB

2015 年,Discord 的第一个版本建立在单个 MongoDB 之上。2015 年 11 月左右,MongoDB 存储了 1 亿条消息,其内存无法再容纳数据和索引。延迟变得不可预测。消息存储需要转移到另一个数据库。这时 Cassandra 被选中。

我们如何设计一个能存储数万亿条信息的系统?

Discord 的消息存储演进给我们提供了真实案例参考。

下图显示了 Discord 消息存储的演变过程:MongoDB -> Cassandra -> ScyllaDB

面试官:系统有万亿条消息怎么存储?图片

第一阶段

2015 年,Discord 的第一个版本建立在单个 MongoDB 之上。2015 年 11 月左右,MongoDB 存储了 1 亿条消息,其内存无法再容纳数据和索引。延迟变得不可预测。消息存储需要转移到另一个数据库。这时 Cassandra 被选中。

第二阶段

2017 年,Discord 拥有 12 个 Cassandra 节点,存储了数十亿条消息。

2022 年初,Discord 拥有 177 个 Cassandra 节点,存储了数万亿条消息。此时,延迟再次变得难以预测,维护的成本也变得过于昂贵。

造成这一问题有几个原因:

  1. Cassandra 使用 LSM 树作为内部数据结构。读取比写入更昂贵。在一台拥有数百名用户的服务器上,可能会有很多并发读取,从而导致热点问题。
  2. 维护集群(如压缩 SSTables)会影响性能。
  3. 垃圾回收会导致明显的延迟

第三阶段

这时,Discord 重新设计了消息存储的架构:

  1. 采用集中式的数据服务,其使用单体 API来访问,并用 Rust 重写。
  2. 采用基于 ScyllaDB 的存储。ScyllaDB 是用 C++ 编写的 Cassandra 兼容数据库。

新架构的优势在于:

  • 用 C++ 而不是 Java 编写,消除了垃圾回收暂停的干扰。
  • 按核分片模型(Shard-per-Core model)提供更好的负载隔离,防止热分区在节点间产生级联延迟。
  • 优化了反向查询性能,以满足 Discord 的需求。
  • 节点减少到 72 个,同时将每个节点的磁盘空间增加到 9 TB。

为了进一步保护 ScyllaDB,Discord 针对数据服务还做了以下优化:

  • 在 Rust 中构建中间数据服务,限制并发流量峰值。
  • 数据服务位于应用程序接口和数据库之间,可聚合请求。
  • 即使多个用户请求相同的数据,也只需查询一次数据库。
  • Rust 提供了快速、安全的并发功能,是这种工作负载的理想选择。

优化后的系统性能大大提高:

  • ScyllaDB 的 p99 读取延迟为 15 毫秒,而 Cassandra 为 40-125 毫秒。
  • ScyllaDB 的 p99 的写延迟为 5 毫秒,而 Cassandra 为 5-70 毫秒。

该系统可轻松应对世界杯流量高峰。

本文参考 Discord blog。

原文地址:https://mp.weixin.qq.com/s/YWos2DOs5U7-2khrlo7g0w

延伸 · 阅读

精彩推荐
  • MongoDB进大厂必看的 MongoDB 面试题集锦

    进大厂必看的 MongoDB 面试题集锦

    MongoDB是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。在高负载的情况下,添加更多的节点,可以保证服务器性能。MongoDB旨在给Web应用...

    Linux公社10962021-08-01
  • MongoDB老生常谈MongoDB数据库基础操作

    老生常谈MongoDB数据库基础操作

    下面小编就为大家带来一篇老生常谈MongoDB数据库基础操作。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧 ...

    jingxian3162020-05-13
  • MongoDBmongodb增量备份脚本的实现和原理详解

    mongodb增量备份脚本的实现和原理详解

    MongoDB本身不支持增量备份,所以这里介绍我找到的方法,下面这篇文章主要给大家介绍了关于mongodb增量备份脚本的实现和原理的相关资料,文中通过示例...

    hxt1685302020-05-19
  • MongoDBMongoDB为什么比Mysql高效

    MongoDB为什么比Mysql高效

    在当今互联网时代,数据是无价之宝。为了更高效地存储和管理数据,数据库成为了重要的组成部分。MySQL和MongoDB都是常用的数据库,但MongoDB比MySQL更为高...

    码云笔记8512023-10-13
  • MongoDBMongoDB入门教程之细说MongoDB数据库的增删查改操作

    MongoDB入门教程之细说MongoDB数据库的增删查改操作

    这篇文章主要介绍了MongoDB入门教程之细说MongoDB数据库的增删查改操作,本文环境是windows,所以以图片形式讲解,需要的朋友可以参考下 ...

    MongoDB菜鸟教程网2542020-04-27
  • MongoDBMongoDB日志切割的三种方式总结

    MongoDB日志切割的三种方式总结

    mongo默认是没有进行日志分割的,所有的日志持续写到一个文件中,缺点是很明显的,日志文件会越来越大,下面这篇文章主要给大家介绍了关于MongoDB日志切割的...

    自由早晚乱余生9712021-11-14
  • MongoDBmongos崩溃后无法重启问题的解决方法

    mongos崩溃后无法重启问题的解决方法

    这篇文章主要给大家介绍了关于mongos崩溃后无法重启问题的解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值...

    mongoing6622021-05-04
  • MongoDBMongoDB特定类型的查询语句实例

    MongoDB特定类型的查询语句实例

    在关系型数据库中,可以实现基于表的各种各样的查询,下面这篇文章主要给大家介绍了关于MongoDB特定类型查询的相关资料,文中通过实例代码介绍的非常详细...

    Li Guogang3422023-04-14