数据存储技术：分布式篇

发布时间：2022-11-23 11:17:19 所属栏目：大数据来源：

导读：　　当需要存储的数据量变得很大、一台机器的磁盘无法存储下时，就需要将这些数据存储到多台机器上。

　　数据分布

　　将数据分布到不同的节点上的方式有：

　　很多人可能会觉得总控节点会成为分布式系

　　当需要存储的数据量变得很大、一台机器的磁盘无法存储下时，就需要将这些数据存储到多台机器上。

　　数据分布

　　将数据分布到不同的节点上的方式有：

　　很多人可能会觉得总控节点会成为分布式系统的瓶颈，任务P2P架构（无中心节点）架构更有优势。然而事实并非如此，主流的分布式存储系统大多带有总控节点，因为使用总控节点架构更易于维护、且也能够支持成千上万的集群规模。关于总控节点的瓶颈问题优化，后面会展开讲。

　　总控节点主要用于全局调度、元数据管理（分片位置信息等）。

　　当然，也有很多存储系统是无中心架构的大数据分布式存储，比如Redis

　　数据节点高可用

　　数据备份/复制

　　在分布式存储系统中大数据分布式存储，随着集群规模变得越来越大，故障发生的概率也越来越大。大规模集群每天都有故障发生，其中出现故障最高概率的是：单机故障、磁盘故障。

　　为了保证分布式存储系统的高可靠和高可用，需要对每个节点的数据进行多副本复制备份：

　　主备副本之间的数据复制，主要通过同步操作日志（Commit Log）实现：主副本首先将操作日志同步到备副本，备副本回放操作日志，完成后通知主副本。（关于操作日志，更多可以阅读《数据存储技术：单机篇》）

　　分布式存储系统通过复制协议将数据同步到多个存储节点，并确保多个副本之间的数据一致性。

　　复制协议分为2种：强同步复制、异步复制。

　　根据CAP原理，一致性和可用性是矛盾的。存储系统设计时，需要在一致性和可用性之间权衡。根据实际需求，有以下几种模式可用选择：

　　同构复制

　　通常情况下，数据备份时，会将存储节点分为若干组，每个组内的节点服务完全相同的数据，其中有一个节点为主副本节点，其他节点为备副本节点。

　　由于同一个组内的节点服务相同的数据，这样的系统成为同构系统。

　　集中存储与分布式存储_大数据数据存储_大数据分布式存储

　　异构复制

　　同构系统的问题在于：当某个副本节点发生故障，系统需要自动增加新副本，这时需要迁移的数据量太大。假设每个存储节点服务的数据为1TB，内部传输带宽限制为20MB/s，那么增加一个副本节点，需要的拷贝数据时间为1TB / 20MB/s = 50000s，大约十几个小时；由于拷贝数据的过程中存储节点再次发生故障的概率很高，所以这样的架构很难做到自动化，不适用于大规模分布式存储系统。

　　异构系统将数据划分为很多大小接近的分片，每个分片的多个副本可以分布到集群中的任何一个存储节点。如果某个节点发生故障，原有的服务将由整个集群而不是某几个固定的存储节点来恢复。由于整个集群都参与到该故障节点的恢复过程，所以故障恢复时间很短；并且集群规模越大，优势就会越明显。

　　数据节点故障检测与恢复

　　系统检测到故障出现时，自动使用备份数据进行故障恢复。

　　基于总控节点的故障检测与恢复：

　　基于分布式锁选主：

　　使用例子：跨机房部署，当主机房发生故障时，除了手工切换到备机房，还可以采用分布式锁服务实现自动整体切换。

　　集群选主协议自恢复：

　　总控节点高可用

　　总控节点备份

　　除了工作节点需要通过数据备份、故障自动检测与恢复实现高可用外，总控节点自身也同样需要实现高可用。

　　主控节点也需要集群部署，集群选主也可以通过心跳租约、分布式锁等方式实现：

　　总控节点瓶颈

　　QPS瓶颈：

　　分布式存储系统范型

　　分布式文件系统

　　主控节点需要保存文件目录元数据信息；文件被拆分/合并为固定大小的数据分片，分布式异构保存在数据节点中。

　　Google File System

　　Taobao File System

　　分布式键值系统

　　数据分布一般采用一致性哈希

　　淘宝Tair

　　集中存储与分布式存储_大数据分布式存储_大数据数据存储

　　Redis

　　Redis采取的是无中心化架构

　　高可用：Redis Sentinel

　　分布式数据库

　　分布式数据库（分库分表）可以在应用层实现，也可以在中间件层实现。

　　MySQL Sharding

　　中间件层实现

　　Sharding JDBC

　　应用层实现

　　大数据存储

　　Hadoop大数据家族的底层存储，主要使用的是HDFS文件系统。

　　HDFS的关键组件有两个，一个是DataNode，一个是NameNode

　　云存储

　　云存储就是通过网络，将大量普通存储设备构成的集群，虚拟化为易扩展、弹性、透明、具有伸缩性的存储资源池，以统一的接口、按需提供给授权用户；授权用户可以通过网络对存储资源池进行任意的访问和管理，并按使用付费。

（编辑：财气旺网 - 海宁网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

几款日常的开源无代码	为何大厂选择减人而不
为何预测分析对零售企	单张GPU搞定GPT-3超参