数据结构:哈希表

1.散列表的概念:

根据要存储的数据记录的关键字值计算出应该存储的位置

基本思想:记录的存储位置关键字之间存在对应关系

Loc(i)=H(keyi)-----等号右边就称之为hash函数.等号左边就是对应的存储位置;

2.哈希表的优缺点

这个就是散列表的特点:查找效率高,空间利用率低;(以空间换时间)

3.使用散列表要解决好两个问题:

(1) 构造好的散列函数:所选函数尽可能简单,以便提高转化速度;

    所选函数对关键码计算出的地址,应在散列地址中均匀分布,以减少空间浪费;

(2) 指定一个好的解决冲突的方案:查找时,如果从散列函数计算出的地址中查不到关键码,则应当依据解决冲突的规则,有规律地查询其他相关单元.

那么构造散列函数需要考虑的因素有哪些呢?(了解)

1.执行速度(即计算散列函数所需的时间); 2,关键字的长度; 3,散列表的大小

4,关键字的分布情况; 5查找频率;

4.构造散列函数的6个方法

1.直接地址法 2数字分析法 3平方取中法 4折叠法 5除留余数法 6随机数法

1.  直接定址法:

H(key)=a*key+b (a,b为常数),

例子:{100,300,500,700,800,900},哈希函数为Hash(key)=key/100,其实就是a=1/100,b=0;

那么以此函数建立的哈希表为:

优点:以关键码Key的某个线性函数值为散列地址,不会产生冲突;

为什么不会产生冲突?

y=ax+b 线性函数,x唯一,那么y唯一

缺点:要占用连续的地址空间,空间效率低.

直接定址法我们也比较常用,因为简单,同时优点是不会产生冲突,缺点是要占用连续的地址空间,空间效率低.

2.除留余数法

用关键字除以p得到的余数作为关键字的存储位置.

Hash(key)=key%p(p是一个整数)

那么关键是怎么取到合适的除数p?

技巧:表长为m,取p<=m且为质数

例如{15,23,27,38,53,61,70},散列函数Hash(key)=key%7,那么哈希表为:

查找的时候同样用这个哈希函数,比如我们要查找70.用10除以7余数为0,直接去0号位置查找.

以上就是我们常用的散列表的构造方法:直接定址法和除留余数法.

5.处理冲突的方法

处理冲突的方法:

1.开放地址法(开地址法) 2.链地址法(拉链法) 3.再散列法(双散列函数法)

4.建立一个公共溢出区;

开地址法:

基本思想:有冲突时就去寻找下一个空的散列地址,只要散列表足够大,空的散列地址总能找到,并将元素存入.(开放地址法的常用方法:线性探测法,二次探测法,伪随机探测法)

Hi=(Hash(key)+di)%m (1<=i<m)

m为哈希表长度,di为增量序列1,2,……m-1,且di=i;

代码实现:

//这是配置好的模板文件
#include <iostream>
#include <string>
using namespace std; 
#define m 16 //哈希表长度
#define NONE -1//初始化哈希表为空
#define p 13 //p<=m,p为质数
//哈希表:除留余数、开地址法(线性探测)

typedef struct Hash
{
	int key;//关键字
	//其他项
}Hash ,HashTable[m];

//初始化
void init_HashTable(HashTable ht)
{
	for (int i = 0; i < m; i++)
	{
		ht[i].key = NONE;
	}
}
static int H(int key)
{
	return key % p;
}
bool Insert(int k, HashTable ht)
{
	int n1 = H(k);
	for (int i = 0; i < m; i++)
	{
		int n = (n1 + i)% m;
		if (ht[n].key == k)
		{
			return true;//此值已经在哈希表中存在,不允许重复
		}
		else if (ht[n].key == NONE)
		{
			ht[n ].key = k;
			return true;
		}
	}
	//满,失败
	return false;
}
void Show(HashTable ht)
{
	for (int i = 0; i < m; i++)
	{
		printf("%d   ", ht[i].key);
	}
}
int main()
{
	HashTable ht;
	init_HashTable(ht);
	int arr[16] = { 3,5,7,1,2,9,28,25,6,11,10,15,17,23,34,19 };
	for (int i = 0; i < m; i++)
	{
		Insert(arr[i], ht);
	}

	Show(ht);
	return 0;
}

二.拉链法

(第二种解决哈希冲突的方法,也更重要)

基本思想:相同散列地址的记录链成一单链表,m个散列地址就设m个单链表,然后用一个数组将m个单链表的表头指针存储起来,形成一个动态的结构.

例如:一组关键字为{19,14,23,1,68,20,84,27,55,11,10,79},散列函数为:Hash(key)=key%13,

就会发现有些元素是同义词,比如14%131,1%131,27%13==1,14,1,27是同义词

上图不好,我们最好能用头插法建立哈希表,头插法速度快,O(1)

最多有m个单链表,编号为0-m-1,用一个数组将m个单链表的表头指针存起来.

代码实现:

//这是配置好的模板文件
#include <iostream>
#include <string.h>
#include<assert.h>
using namespace std; 
#define m 13//哈希表长度
#define None -1
//哈希表:除留余数法+链地址法
typedef struct DateType
{
	int key;//关键字
	
}DateType;
typedef struct Node
{
	DateType date;
	struct Node* next;
}Node;
typedef struct
{
	Node* next;
}Hashtable[m];
//计算key 的哈希值,哈希函数为H(key)=key%m
static int H(int key)
{
	return key % m;
}
//初始化哈希表
void InitHashtable(Hashtable ht)
{
	assert(ht != NULL);
	if (!ht)
	return;

	for (int i = 0; i < m; i++)//将链表制空
	{
		ht[i].next = NULL;
	}
}
//查找关键key,返回节点地址
Node* Search(const Hashtable ht, int key)
{
	int n = H(key);
	for (Node* p = ht[n].next; p != NULL; p = p->next)
	{
		if (p->date.key == key)
			return p;
	}
	return NULL;
}

//插入
bool Insert(Hashtable ht,int key)//不存重复的值
{
	int n = H(key);
	if (Search(ht, key))//找到了相同的哈希值,则不允许存储重复数据,算法可用哈希表去重
	{
		return false;
	}
	Node* node = (Node*)malloc(sizeof(Node));
	assert( node!= NULL);
	
	//头插//时间复杂度O(1);尾插O(n)
	node->date.key = key;
	node->next = ht[n].next;
	ht[n].next = node;
	return true;

}
void Show(Hashtable ht)
{
	for (int i = 0; i < m; i++)
	{
		printf("哈希值为%d有:", i);
		for (Node* p = ht[i].next; p != NULL; p = p->next)
		{
			printf("%d ", p->date.key);
		}
		printf("\n");
	}
}
int main()
{
	Hashtable ht;
	InitHashtable(ht);
	int arr[16] = { 3,5,7,1,2,9,28,25,6,11,10,15,17,23,34,19 };
	//int arr[16] = { 15,19, 14, 23, 1, 68, 20, 84, 27, 55, 11, 10, 79 };
	for (int i = 0; i < m; i++)
	{
		Insert(ht,arr[i] );
	}
	Show(ht);
	return 0;
}

总结

1.链地址法的优点:
  • 非同义词不会冲突,无”聚集”现象;
  • 链表上节点空间动态申请,更适合于表长不确定的情况.

开地址法非同义词也会产生冲突(比如原来需要存储的地址有元素,我们放入下一个地址,那么下一个地址需要存储的元素本来和这个不是同义词,但是也产生冲突了,这种就叫做聚集现象.)

而链地址法不会有这种问题,因为它的同义词都挂在各自的链表上,非同义词之间没有冲突,没有聚集现象;

2.思考:哈希表查找的时间复杂度?

不是O(1),如果完全没有冲突,是O(1),但是一般都会有冲突;

结论:哈希表的查找的时间复杂度不是O(1),但是逼近O(1);

3.影响时间复杂度的因素有散列函数和解决冲突的方法;

散列函数是不是能够让元素比较均匀的分布在散列表中.

解决冲突的方法是看看解决的冲突解决的是不是比较好,如果解决冲突解决的比较好,那么它的时间复杂度就会比较小.

4.几点结论:
  • 散列表技术具有很好的平均性能,优于一些传统的技术;
  • 链地址法于开地址法
    • 查找效率,一个是链地址它是动态的,表的长度是动态的,比较容易修改,而且如果做插入删除的操作也比较方便.所以链地址法优于开地址法.
  • 除留余数法作散列函数于其他类型函数
    • 均匀一些,通常我们的除数取一个质数,取一个小于等于表长的质数更好.这个就会获得一个比较好的散列效果.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/454223.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

java-双列集合

什么是双列集合&#xff1f; 集合中每次存的数据是成对存入的 以及它的特点是什么&#xff1f; 特别注意&#xff1a;键不可重复&#xff0c;值可以 Map是双列集合的顶层接口 Map 它有哪些方法呢&#xff1f; Map的常用API 添加 添加操作的代码如下 我们要明白一些细节&…

ChatGPT浪潮来袭!谁先掌握,谁将领先!

任正非在接受采访时说 今后职场上只有两种人&#xff0c; 一种是熟练使用AI的人&#xff0c; 另一种是创造AI工具的人。 虽然这个现实听起来有些夸张的残酷&#xff0c; 但这就是我们必须面对的事实 &#x1f4c6; 对于我们普通人来说&#xff0c;我们需要努力成为能够掌握…

uniapp开发的跳转到小程序

uniapp开发的h5跳转到小程序 https://www.cnblogs.com/xiaojianwei/p/16352698.html官方&#xff1a;使用 URL Scheme 打开小程序 https://developers.weixin.qq.com/miniprogram/dev/framework/open-ability/url-scheme.html 链接代码 <a href"weixin://dl/business/…

AHU 数据库 实验三

《数据库》实验报告 【实验名称】 实验3 数据库的连接查询 【实验目的】 1. 熟悉基本的连接查询的概念和作用&#xff1b; 2. 了解数据库管理系统DBMS 实现连接查询的基本方法&#xff1b; 3. 掌握SQL语言连接查询语句的语法和功能&#…

备战python蓝桥杯1.0

1.输入输出 1.1输入一行 字符组 # 输入一个字符串&#xff0c;分割成单个字符存到列表a a[i for i input()]1.2输入一行 一组数 #输入一组数&#xff0c;赋值给列表a alist(map(int,input().split()))1.3输入多行 字符串 #先输入n&#xff0c;再输入n行的字符串&#xff0c;…

算法提高之楼兰图腾(树状数组)

楼兰图腾(树状数组) 核心算法&#xff1a;树状数组 将下标转化为二进制 例如11100100 父节点下标x 子节点下标i 由下图可知 每一个数都可以由其子节点**(如果有)**求和得到**由父节点找子节点&#xff1a;**每个子节点下标 –> x – 1 – lowbit(x – 1)由子节点找父节点&am…

前端跨页面通信的几种方式---同源

参考链接 1、LocalStorage:当 LocalStorage 变化时&#xff0c;会触发storage事件。利用这个特性&#xff0c;我们可以在发送消息时&#xff0c;把消息写入到某个 LocalStorage 中&#xff1b;然后在各个页面内&#xff0c;通过监听storage事件即可收到通知。 2、BroadCast C…

SpringBoot+Vue项目报错(问题已解决)

1、错误日志 2、分析原因&#xff1a; JWT strings must contain exactly 2 period characters. Found: 0 JWT字符串必须包含2个句号字符。发现:0 分析&#xff1a;可以判断出大概可能是token格式出现了问题 3、参考 http://t.csdnimg.cn/hfEiY 4、检查后端代码是否出现问…

酷开科技以消费者需求为导向冲刺OTT行业的星辰大海

通过大屏营销、互动营销等方式&#xff0c;提升品牌认知度和市场竞争力。酷开科技始终坚持以消费者的需求为导向&#xff0c;致力于为品牌方和消费者搭建高效、准确的沟通桥梁&#xff0c;开创OTT大屏营销新纪元。 伴随技术发展&#xff0c;智能电视已经从“尝鲜”变成了主流产…

数据结构与算法----复习Part 14 (树与二叉树)

本系列是算法通关手册LeeCode的学习笔记 算法通关手册&#xff08;LeetCode&#xff09; | 算法通关手册&#xff08;LeetCode&#xff09; (itcharge.cn) 目录 一&#xff0c;树&#xff08;Tree&#xff09; 树的相关术语 节点间关系 树的其他术语 二&#xff0c;二叉…

ISIS单区域实验简述

ISIS 中间系统到中间系统&#xff0c;也是链路状态协议&#xff0c;工作在数据链路层&#xff0c;不依赖IP地址&#xff1b;与OSPF一样采用最短路径SPF算法&#xff0c;收敛速度快。 实验基础配置&#xff1a; r1: sys sysname r1 undo info enable int g0/0/0 ip add 12.1.1.1…

使用vue动态在列表中添加或者删除某一行

** 使用vue动态在列表中添加或者删除某一行 ** 先看一下展示的效果&#xff1a; 好了上代码&#xff1a; 样式界面&#xff1a; <template><div class"container"><h4 style"margin-left: 20px;">线路停靠站站点</h4><el-b…

JS ATM练习案例(复习循环知识)

需求&#xff1a;用户可以选择存钱、取钱、查看余额和退出功能。 分析&#xff1a;1循环时反复出现提示框&#xff0c;所以提示框写到循环里面。 2.退出的条件是4&#xff0c;所以是4就会结束循环 3.提前准备一个金额预存储 4取钱为减法操作&#xff0c;存钱为加法操作&#xf…

访问学者申请记|美国首所翻译博士点

N老师出国访学的目的一方面是开拓眼界&#xff0c;另一方面也是为完成翻译方向的博士论文创造更好的条件。最终我们获得美国纽约州立大学宾汉姆顿分校的邀请函&#xff0c;该校的“翻译研究和教学项目”&#xff08;TRIP&#xff09;是美国高校设立的第一个翻译博士学位项目&am…

electron + vtkjs加载模型异常,界面显示类似于图片加载失败的图标

electron vtkjs加载模型显示异常&#xff0c;类似于图片加载失败的效果&#xff0c;如上图。 electron开发版本&#xff1a;13。 解决方法&#xff1a;升级electron版本号。 注意&#xff1a;win7最高兼容electron 22版本。

哪个骨传导蓝牙耳机的好?独家揭秘六大选购技巧

在科技飞速前进的今天&#xff0c;骨传导蓝牙耳机以独特的听觉技术逐渐进入大众视野&#xff0c;赢得了众多消费者的青睐。作为一名资深的数码爱好者&#xff0c;我最近频繁地收到朋友们的咨询&#xff0c;他们希望了解哪个骨传导蓝牙耳机的好&#xff1f;对于初入数码圈的朋友…

AI知识库也太方便了吧,中小型企业都要知道它!

生活在这个信息爆炸的时代&#xff0c;信息的获取变得前所未有的方便&#xff0c;但随之而来的却是信息筛选和管理的难题。对于中小型企业来说&#xff0c;如何有效运用自身积累的各类信息&#xff0c;直接影响着企业的运营效率和市场竞争力。而这&#xff0c;正是AI知识库可以…

linux驱动——中断

1.Cortex-A系列的中断的简介 中断的基本概念&#xff1a;(interrupt) 中断本质上是系统内部的异常机制,当中断产生之后&#xff0c;他会停下当前正在执行的任务&#xff0c;转而去做其他的事情,在停下当前正在执行的任务之前,要先入栈&#xff08;保护现场,其他的事情做完之后…

智慧城市大模型来啦!港大百度推出UrbanGPT

论文作者解读链接&#xff1a;https://blog.csdn.net/qq_42715656/article/details/136681839 项目链接&#xff1a;https://urban-gpt.github.io/ 代码链接&#xff1a;https://github.com/HKUDS/UrbanGPT 论文链接&#xff1a;https://arxiv.org/abs/2403.00813 研究实验室链…

CMake 编译 raylib 程序

CMakeLists.txt 内容如下&#xff1a; cmake_minimum_required(VERSION 3.0) project(t001) # 搜索指定目录下源文件 file(GLOB SRC_LIST ${CMAKE_CURRENT_SOURCE_DIR}/*.cpp) # 包含头文件路径 include_directories(F:/vclib/raylib-5.0_win64_mingw-w64/include) # 包含静态…