The GreenPlum Master
Master是GP数据库系统的入口。
Master是一个database server,
负责接收客户端连接、执行SQL命令、分发工作量到segments上、协调整合从segments返回的结果集、并将结果集反馈给客户端。
Master维护系统编目(一组系统表,包含了GP数据库系统本身的元数据),不包含任何用户数据。
Master需要高速、专用的CPU,用于数据加载、处理连接、执行计划等等。
The Segments
Segments是数据库存储的位置,以及大多数查询处理执行的地方。
用户定义的表和索引会分布在可用的segments上,每个segment包含了数据的一部分。
客户端不会直接连接segments。
每个segment HOST上可运行的segment primary instance是由HOST CPU决定的。
例如:两个双核CPU,可以运行2/4个实例;三个四核CPU,可以运行3/6/12个实例。
可以为segments配置mirror segments,用于HA。
mirror segments必须放在和其primary segments不同的主机上。
The interconnect
高速传输网络。使用UDP协议。GP会对网络传输包进行额外的校验检查,因此可靠性可以保证。
ETL Hosts for Data Loading
GP通过其外部表的特性,可以支持快速、并行的数据加载工作。