大数据分布式系统四种常见的数据分布方式:
1、哈希方式
哈希方式是最常见的数据分布方式,其方法是按照数据的某一特征计算哈希值,并将哈希值与机器中的机器建立映射关系,从而将不同哈希值的数据分布到不同的机器上。
2、按数据范围分布
按数据范围分布是另一个常见的数据分布方式。将数据按特征值的值域范围划分为不同的区间,使得集群中每台(组)服务器处理不同区间的数据。
3、按数据量分布
按数据量分布数据的方式与哈希方式和按数据范围分布有所区别的是按数据量分布数据与具体的数据特征无关,而是将数据视为一个顺序增长的文件。
4、一致性哈希
一致性哈希的基本方式是使用一个哈希函数计算数据或数据特征的哈希值,使得哈希函数的输出值域为一个封闭的环。