数据库基础知识


架构

MPP架构(Massively Parallel Processing,大规模并行处理)是一种分布式数据处理技术,其核心特征包括任务并行执行、私有资源、数据分布式存储(本地化)、分布式计算、横向扩展以及Shared Nothing架构。在这种架构中,每个节点都拥有独立的磁盘存储系统和内存系统,通过专用网络或商业通用网络连接彼此进行协同计算,从而提高数据处理性能。

MPP架构与Hadoop架构的比较:

  • Hadoop架构:是一种分布式计算系统,主要用于处理大规模数据集,它依赖于分布式文件系统(HDFS)进行数据存储和处理。Hadoop架构更侧重于数据的批处理和分布式文件处理,而MPP架构则更侧重于实时或近实时的高性能数据分析。‌
  • MPP架构:如前所述,MPP架构通过将工作负载分散到多个节点上来提高数据处理性能,每个节点独立处理一部分数据,从而实现并行处理,这种架构非常适合需要快速响应和高效数据处理的应用场景。‌

MPP架构非常适合OLAP(在线分析处理)应用,因为它能够处理大量的数据并快速提供分析结果。在OLAP场景中,MPP架构可以通过并行处理多个查询请求,显著提高查询性能,同时优化数据分布与传输,降低系统延迟和吞吐量,从而提供更好的分析体验。‌

分类

OLTP:MySQL、PostgreSQL、PolorDB

OLAP:ClickHouse、AnalyticDB

内存数据库

1、DockDB

2、LevelDB

参考

1、https://blog.csdn.net/fuhanghang/article/details/135421557


文章作者: 王利康
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 王利康 !
  目录