适用于海量数据应用的多维Hash表结构
【作者】
吴泉源
彭灿
郑毅
卜俊丽
国防科技大学计算机学院
长沙410073
【关键词】
多维
Hash表
海量数据存储
【摘要】传统的Hash表通过对目标数据进行Hash计算,可以实现数据的快速存取与检索。为了保持较好的存储性能,需要使整个Hash表保持疏松的状态,从而牺牲掉10%~25%的空间。这对于海量数据存储而言,是一种巨大的空间浪费。该文提出一种多维Hash表结构,通过增加Hash表在逻辑上的维度,大大降低了Hash表的冲突率,实现了在较高的填充率下获得较满意的性能。实验结果表明:在千万的数据量级上,二维Hash表的冲突率比传统Hash表的减小2~4个数量级,总体性能则提升了1个数量级。该文还在原有填充率的基础上,提出失效率的概念,进一步完善和统一了Hash表性能评价指标。
上一篇:铝合金叠层板钻削层间毛刺高度预测模型
下一篇:改进的无线性对固定轮数无证书群组密钥协商协议