散列表总结

核心思想：通过关键字将值映射到一个一维数组上。这个数组通常称之为散列表(HashTable),数组中的索引成为关键字的散列地址(Hash Address),求索引的过程就是建立散列函数(Hash Function)。

散列方法的要求:

1.对于给定的关键字的集合,选择适当的散列函数将关键字映射到散列地址,要求这个地址的分布是比较均匀的.

2.如果散列的过程产生了冲突,那么需要拟定解决冲突的方案.

散列函数的建立:

1.线性函数法 H(KEY) = A*KEY + B 由于线性函数是一一映射的，所以关键字集合有多大，散列表就要多大。那么对于大量数据的话，散列的意思就不是很大了。

2.除留取余法设散列数组大小为m，那么可以取最接近m的素数p作为除数,用关键字除以p，把得到的余数作为散列地址。 H(KEY) = MOD(m,p) 这个是最常用的方法，C#底层Hash Table实现机制就是这个。

3.乘余取整法先让关键字乘以一个常数a(0<a<1),取乘积的小数部分，再用整数n乘以这个小数部分，对于结果按照向下取整，把得到的关键值作为散列地址。 n一般为数组的大小，而a一般是黄金分割数0.618 根号5减1的差除以2 H(KEY) = floor( MOD(akey , 1) n )

4.平方取中法它首先计算关键字的内码(如ASCII码)的平方，然后按照数组的大小决定取几位数，而这几位数来自于平方的正中间。如Ab是065098 平方是4327749604，如果空间大小是1000那么我们可以取774或者749。

解决冲突的方法：

1.开散列法

其中最重要是的拉链法，linux内核中实现哈希表就是用的这种方式。其重要内容是，数组的值是一个表头表头的定义可以如下

typedef struct hash_node{
    struct hash_node * next;//记录下一个不同key但相同散列地址的值
    void * value;//记录值是什么
    char * key;//记录关键字是什么，这个可以区分不同的关键字是不同的值
}HASH_NODE;

2.闭散列法

核心思想就是，如果产生冲突，那么我们再用一个函数计算出新的散列地址，直至不产生冲突为止。

方法有如下几个：

1) 线性探察法如果产生冲突的地址是H0,散列表的大小是m，新的地址Hnew = MOD(H0+i,m) i=1,2,...m-1 定义数组元素为结构体:

typedef struct hash_node{
   char * key;
   void * value;
}HASH_NODE;

这个进行查找的时候才能找到正确的值。（注：网上解释的开放散列法一般指的值就是key，那么你把值存到数组，通过值找值还有意思吗？）

2) 二次探察法 Hnew = MOD(H0+I^2 ， m) i=1,2,...m-1

线性探测法和二次探察法会随着时间的增加出现“群集”现象，导致插入查找的时候确定位置要花很多的时间，所以不太好。

3) 双散列法顾名思义就是冲突后，还有一个新的散列函数，进行计算新的散列地址 H0 = HASH(KEY) 冲突：Hnew = (H0 + i* REHASH(KEY) ,m ) i=1,2...m-1