【C++】关联式容器——map和set

1 关联式容器

STL中我们常用的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。
那什么是关联式容器呢?它与序列式容器有什么区别?
关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是**<key, value>结构的键值对**,在数据检索时比序列式容器效率更高。

2 键值对(pair)

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。
比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。

stl中关于键值对的定义

template <class T1, class T2>
struct pair
{
	typedef T1 first_type;
	typedef T2 second_type;
	T1 first;
	T2 second;
	pair() : first(T1()), second(T2())
	{}
	pair(const T1& a, const T2& b) : first(a), second(b)
	{}
};

![[Pasted image 20240324204650.png]]

可见,pair内有两个成员变量,一个是first,即key;一个是second,即value。

pair的构造函数:
![[Pasted image 20240324204901.png]]

在C++98中,pair共有三个构造函数。

  1. 无参构造函数,根据模板参数推导出类型,调用该类型的默认构造函数生成key和value的值。
  2. 拷贝构造函数
  3. 通过两个值来构造,以key、value的顺序。

此外,C++中还提供了一种构造键值对的方法,利用make_pair函数
![[Pasted image 20240324205256.png]]

可以看到,make_pair函数本质上是创建一个键值对对象并返回其拷贝。使用make_pair的好处是不用我们显示写模板参数。
在map的插入操作中,就需要插入一个一个的键值对。此时我们可以利用匿名对象构造插入,也可以使用make_pair函数。此外,C++11中还支持了多参数构造函数的隐式类型转换,为插入键值对提供了一种更新的方式,将在下文中演示。

3 树形结构的关联式容器

根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构
树型结构的关联式容器主要有四种:map、set、multimap、multiset。
这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

4 set

4.1 set

set的文档介绍如下:
![[Pasted image 20240324210048.png]]

翻译:

  1. set是按照一定次序存储元素的容器
  2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
  3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
  4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
  5. set在底层是用二叉搜索树(红黑树)实现的。

注意:

  1. 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
  2. set中插入元素时,只需要插入value即可,不需要构造键值对。
  3. set中的元素不可以重复(因此可以使用set进行去重)。
  4. 使用set的迭代器遍历set中的元素,可以得到有序序列
  5. set中的元素默认按照小于来比较
  6. set中查找某个元素,时间复杂度为: l o g 2 n log_2 n log2n
  7. set中的元素不允许修改(文档最后一句,set底层是搜索二叉树,如果允许修改整个树的大小关系就乱套了)
  8. set中的底层使用二叉搜索树(红黑树)来实现

注意set的模板参数中有一个Compare,这个是用于比较的仿函数,在priority_queue中也用到过仿函数这一工具。

4.2 set的使用

知晓了set的作用,set的使用其实非常简单,有了前面stl容器的使用经验,非常方便上手。
首先是set的构造函数,根据之前的经验,无非就是全缺省的默认构造函数、迭代器区间构造和拷贝构造。
![[Pasted image 20240324210831.png]]

不过要注意的是,由于set底层是一颗树,在执行拷贝构造和赋值时代价是比较大的,因为要进行深拷贝

4.2.1 insert

下面是比较重要的insert
![[Pasted image 20240324211508.png]]

对于set,常用的插入操作时第一个函数。我们可以看见返回值是一个键值对,这是什么意思呢?
其实,这里牵扯到map实现方面的问题。在map中的insert需要设计成这样以支持[]运算符重载,这里是为了统一风格而设计。

由于set内不允许有重复元素,当插入元素并不存在于set中时才能执行插入,此时返回一个键值对,键值对中的key是插入元素的迭代器,value是一个bool值,如果插入成功则为true;当插入元素已经存在于set,此时键值对中的key是那个重复元素的迭代器,而value就为false。

其他的一些操作,命名也都沿袭了stl一贯的风格,看一眼大概就知道其功能。
![[Pasted image 20240324212146.png]]

4.2.2 erase和find

想要删除一个元素可以用erase。可以直接以待删除元素的值作为参数。

// 在就删除,不在就不做任何处理
s.erase(3);
s.erase(30);
for (auto e : s)
{
	cout << e << " ";
}
cout << endl;

但是要注意的是,如果在set中没有找到要删除的值,是什么都不会发生的。
我们也可以用迭代器进行删除,用find搜索待删除元素。

// 这个值在,找到有效位置,再进行删除
pos = s.find(5);
s.erase(pos);

两种方式的区别是,find如果没有找到,而直接对其erase,是会报错的。

这是由于如果find找不到,将会返回end位置的迭代器,导致越界相关的问题。

此外,我们知道算法库里面也有一个find,通过一段迭代器区间来进行查找,但是这个find的效率不如set内置的效率高,因为set中时根据红黑树来查找的,而算法库中的find是根据迭代器一个一个的找。时间复杂度是对数级别和线性级别的差别。

4.2.3 count

count也可以用于查找一个元素在不在set中,如果在返回1,不在返回0。

4.2.4 lower_bound和upper_bound

![[Pasted image 20240324213219.png]]

返回迭代器到下界
返回一个迭代器,该迭代器指向容器中的第一个元素,该元素不被认为位于val之前(即,它要么等价,要么在val之后)。
该函数使用其内部比较对象(key_comp)来确定这一点,并返回一个迭代器,指向key_comp(element,val)将返回false的第一个元素。
如果用默认比较类型(less)实例化set类,则该函数返回一个指向不小于val的第一个元素的迭代器。(即>=val的第一个值)
类似的成员函数upper_bound具有与lower_bound相同的行为,只是set包含一个与val等效的元素:在这种情况下,lower_bound返回一个指向该元素的迭代器,而upper_bound返回一个指向下一个元素的迭代器。(即>val的第一个值)
![[Pasted image 20240324213237.png]]

5 multiset

multyset和set非常类似,其区别是multiset允许键值冗余,即允许存在重复的元素,其余操作都是一样的。
此时如果我们再对multiset执行count操作,那么返回值就可能大于1了。

  1. multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
  2. 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。
  3. 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
  4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。
  5. multiset底层结构为二叉搜索树(红黑树)。

注意:

  1. multiset中再底层中存储的是<value, value>的键值对
  2. mtltiset的插入接口中只需要插入即可
  3. 与set的区别是,multiset中的元素可以重复,set是中value是唯一的
  4. 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列
  5. multiset中的元素不能修改
  6. 在multiset中找某个元素,时间复杂度为 O ( l o g 2 N ) O(log_2 N) O(log2N)
  7. multiset的作用:可以对元素进行排序

6 map

6.1 map

先来看看map的介绍
![[Pasted image 20240324213920.png]]

  1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
  2. 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair:typedef pair<const key, T> value_type;
  3. 在内部,map中的元素总是按照键值key进行比较排序的。
  4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
  5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
  6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

map内部的成员变量中,有如下三个是最为关键的
![[Pasted image 20240324214143.png]]

由上到下分别是:
键(key)类型
值(value)类型(map有映射的意思,即key映射(mapped)之后的值为value)
键值对(key,value)类型

在map中,键值通常用于排序和唯一标识元素,而映射值存储与该键相关联的内容。键和映射值的类型可能不同,组合在成员类型value_type中,这是一种组合了两者的pair类型:

typdef pair<const Key, T> value_type;

其实,map和set本质上是非常接近的,区别在于存储的数据不同而已。map存放的是<key,value>,而set存放的是<value,value>

6.2 常用接口

![[Pasted image 20240324214445.png]]

map大多数接口和set也很类似。先来看insert。
![[Pasted image 20240324214646.png]]

这里对于最常用的第一个,其返回值的意义同set是一样的。
对于map的insert,支持以下几种方式。

pair<string, string> p("banana", "香蕉");
m.insert(p);
m.insert(pair<string, string>("apple", "苹果"));
m.insert(make_pair("orange", "橙子"));
m.insert({ "blue","蓝色" });    // C++11新增,多参数构造函数的隐式类型转换

还需要注意的是,如果插入的时候,key相同,但是val不相同,是不会插入进去的,也不会覆盖进去的。即插入过程中,只比较key。key相同就不插入了。

删除操作也与set类似,需要注意的是,同样是以key作为标识。

6.3 map的[]运算符重载

map的[]运算符重载跟之前的序列容器(如vector,string)等实现方式有比较明显的区别。先来看文档说明。
![[Pasted image 20240324220558.png]]

可以看到,是以key为参数,返回值为该key对应的value的引用。这是为什么呢?
其实官方还给了一个非常重要的解释。
![[Pasted image 20240324220739.png]]

我们把中间部分拆开来看
![[Pasted image 20240324220812.png]]

会发现调用的是insert函数,而insert函数的返回值是一个pair
![[Pasted image 20240324220850.png]]

再来看函数功能的介绍
![[Pasted image 20240324221050.png]]

访问元素
如果k与容器中某个元素的键匹配,则该函数返回对其映射值的引用。
如果k与容器中任何元素的键不匹配,则该函数用该键插入一个新元素,并返回对其映射值的引用。注意,这总是将容器的大小增加1,即使没有将映射值赋给元素(元素是使用其默认构造函数构造的)。
类似的成员函数map::at在具有键的元素存在时具有相同的行为,但在不存在时抛出异常。

简而言之, 原理就是用<key, T()>构造一个键值对,然后调用insert()函数将该键值对插入到map中

  • 如果key已经存在,插入失败,insert函数返回该key所在位置的迭代器
  • 如果key不存在,插入成功,insert函数返回新插入元素所在位置的迭代器
  • operator[]函数最后将insert返回值键值对中的value返回
    有了这种机制,就可以利用下面的代码统计关键词的个数.
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countMap;
	for (auto e : arr)
	{
		countMap[e]++;
	}
	map<string, int>::iterator it = countMap.begin();
	while (it != countMap.end())
	{
		cout << it->first << ":" << it->second << endl;
		it++;
	}

countMap对象中,它的两个参数是string和int,第一次的时候不存在,所以会创建一个pair<string,int>对象。int则会调用它的默认构造函数,即结果为0。然后有一个++,所以最终会将这个值给插入进去。

由于[]运算符重载返回的是value的引用,那么就可以实现以下几种功能:

  1. 插入
  2. 查找
  3. 修改
  4. 插入+修改
    ![[Pasted image 20240324222612.png]]

7 multimap

类比multiset,multimap即允许一个键对应多个值。
这个在实际生活中也是有意义的,比如一个英文单词可能有多个中文意思。
但是与map在使用上还是有一些区别,比如这个容器没有提供[]运算符重载,因为无法根据一个key确定需要取的是哪个value。
同时,insert函数和erase函数也有一些变化。
insert不会再返回键值对,因为插入永远是成功的,只需要返回迭代器就可以了
![[Pasted image 20240324222707.png]]

而对于erase,由于一个key对应多个value,此时对一个key进行删除,会将所有value一并删除。

总结

  1. Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key,value>,其中多个键值对之间的key是可以重复的。
  2. 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;
  3. 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
  4. multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
  5. multimap在底层用二叉搜索树(红黑树)来实现。

注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/484409.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯G431RBT6——定时器中使用led冲突以及led与lcd冲突等一系列问题

本文是解决 同时在 定时器中点灯 与 LCD屏幕显示 冲突异常的问题 我们大家都知道&#xff0c;G431RBT6开发板上led与lcd是冲突的&#xff0c;所以在lcd.c文件中的这三个函数中 void LCD_WriteReg(u8 LCD_Reg, u16 LCD_RegValue) void LCD_WriteRAM_Prepare(void) void LCD_Wr…

移动0【双指针】

移动零 cur每次走一步&#xff0c;dest走不走取决于cur有没有找到非0值&#xff0c;一旦找打非0值&#xff0c;交换。不是非0值&#xff0c;dest不动。》【非零&#xff0c;dest】【dest&#xff0c;0】 class Solution { public:void moveZeroes(vector<int>& num…

算法第三十二天-最长公共子序列

最长公共子序列 题目要求 解题思路 求这两个数组或者字符串的最长公共子序列问题&#xff0c;肯定要用到动态规划。 首先区分两个概念&#xff1a;子序列可以是不连续的&#xff1b;子数组&#xff08;子字符串&#xff09;是需要连续的&#xff1b;另外&#xff0c;动态规划…

制冷设备之转子式压缩机

滚动转子式压缩机又称活塞式压缩机&#xff0c;属于回转式压缩机。 转子压缩机结构 滚动转子式压缩机与往复活塞式压缩机相比&#xff0c;具有下列特点 1.零部件少&#xff0c;尺寸紧凑&#xff0c;结构简单&#xff0c;重量轻易损零件少&#xff0c;运行可靠&#xff1b; 2.…

C语言动态内存的管理

前言 本篇博客就来探讨一下动态内存&#xff0c;说到内存&#xff0c;我们以前开辟空间大小都是固定的&#xff0c;不能调整这个空间大小&#xff0c;于是就有动态内存&#xff0c;可以让我们自己选择开辟多少空间&#xff0c;更加方便&#xff0c;让我们一起来看看动态内存的有…

Vue3 上手笔记

1. Vue3简介 2020年9月18日&#xff0c;Vue.js发布版3.0版本&#xff0c;代号&#xff1a;One Piece&#xff08;n 经历了&#xff1a;4800次提交、40个RFC、600次PR、300贡献者 官方发版地址&#xff1a;Release v3.0.0 One Piece vuejs/core 截止2023年10月&#xff0c;最…

Linux的一些基本指令

​​​​​​​ 目录 前言&#xff1a; 1.以指令的形式登录 2.ls指令 语法&#xff1a; 功能&#xff1a; 常用选项&#xff1a; 3.pwd指令 4.cd指令 4.1 绝对路径与相对路径 4.2 cd .与cd ..&#xff08;注意cd后先空格&#xff0c;然后两个点是连一起的&#xff0…

Git bash获取ssh key

目录 1、获取密钥 2、查看密钥 3、在vs中向GitHub推送代码 4、重新向GitHub推送修改过的代码 1、获取密钥 指令&#xff1a;ssh-keygen -t rsa -C "邮箱地址" 连续按三次回车&#xff0c;直到出现类似以下界面&#xff1a; 2、查看密钥 路径&#xff1a;C:\U…

复旦EMBA参访娃哈哈:交流企业创新转型、家族企业管理之道

早在多年前&#xff0c;复旦EMBA同学曾参访娃哈哈集团&#xff0c;与宗庆后先生对话&#xff0c;就国内企业创新转型、家族企业管理之道、“企二代”的成长、企业社会责任等热点问题向其探讨交流。通过面对面的实地企业参访和行业领袖的深入交流&#xff0c;亲身触摸中国科创的…

车辆信息查询API:高效获取车牌号对应车辆的实时信息

随着汽车的普及和交通管理的加强&#xff0c;对于车辆信息的查询需求也越来越大。车辆信息查询API就是为了满足这一需求而开发的&#xff0c;它可以通过输入车牌号&#xff0c;快速获取车辆的相关信息&#xff0c;包括初始登记日期、上险日期、保险到期时间、车架号、品牌等。但…

判断隔离纸到钢壳边缘的距离,燕尾是否超标

方法如下: 方法1:通过找圆工具上的点求解隔离纸边缘点-钢壳边缘点的距离。 #region namespace imports using System; using System.Collections; using System.Drawing; using System.IO; using System.Windows.Forms; using Cognex.VisionPro; using Cognex.VisionPro.To…

[项目前置]websocket协议

websocket协议介绍 WebSocket 协议是一种在单个 TCP 连接上进行全双工通讯的协议。 WebSocket 使得客户端和服务器之间的数据交换变得更简单&#xff0c;允许服务器主动向客户端推送数据。它在 2011 年成为国际标准&#xff0c;现在被所有现代浏览器支持。WebSocket 设计用于…

YOLOv8 | 网络结构 | 详细讲解YOLOv8的网络结构

⭐欢迎大家订阅我的专栏一起学习⭐ 🚀🚀🚀订阅专栏,更新及时查看不迷路🚀🚀🚀 YOLOv5涨点专栏:http://t.csdnimg.cn/70xZa YOLOv8涨点专栏:http://t.csdnimg.cn/Cb89a YOLOv7专栏:http://t.csdnimg.cn/HaTdn 💡魔改网络、复现论文、优化创新💡 …

【No.13】蓝桥杯二分查找|整数二分|实数二分|跳石头|M次方根|分巧克力(C++)

二分查找算法 知识点 二分查找原理讲解在单调递增序列 a 中查找 x 或 x 的后继在单调递增序列 a 中查找 x 或 x 的前驱 二分查找算法讲解 枚举查找即顺序查找&#xff0c; 实现原理是逐个比较数组 a[0:n-1] 中的元素&#xff0c;直到找到元素 x 或搜索整个数组后确定 x 不在…

面试笔记——Redis(双写一致、持久化)

双写一致 双写一致性&#xff1a; 当修改了数据库中的数据&#xff0c;也要更新缓存的数据&#xff0c;使缓存和数据库中的数据保持一致。 相关问题&#xff1a;使用Redis作为缓存&#xff0c;mysql的数据如何与Redis进行同步&#xff1f;——双写一致性问题 回答时&#xff0…

数字范围按位与

链接&#xff1a; 201. 数字范围按位与 - 力扣&#xff08;LeetCode&#xff09; 这个题目看起来很难&#xff0c;但是 按位与 的特点是 如果全是1 为 1 其余全为 0 然后这道题其实就是在找最长公共前缀&#xff08;为啥不说后缀&#xff0c;观察可知&#xff0c;后缀那部分…

【Mysql】硬盘性能压测(Sysbench工具)

1、IOPS和吞吐量介绍 IOPS&#xff08;每秒输入/输出操作数&#xff09;&#xff1a;是衡量存储设备每秒能够执行的输入/输出操作的数量。对于数据库等需要频繁读写的应用程序而言&#xff0c;IOPS 是一个关键的性能指标。更高的 IOPS 意味着存储设备能够处理更多的读写请求&am…

css盒子模型及浮动

内容(content)、内边距(padding)、边框(border)、外边距(margin) oder:1px solid red; 边框的粗细 边框的样式&#xff08;虚线还是实线&#xff09; 边框的颜色 border中也有一些属性可以直接调某一个方向上的边框的粗细&#xff0c;样式&#xff0c;颜色 border-left\bord…

24计算机考研调剂 | 【官方】中国航天系统科学与工程研究院

中国航天系统科学与工程研究院2024年硕士研究生招生预调剂通知 调剂招生信息 研究院概况与专业特色&#xff1a; 中国航天系统科学与工程研究院&#xff08;简称&#xff1a;十二院&#xff09;是中国航天科技集团有限公司的直属单位&#xff0c;是在原中国航天工程咨询中心 …

【软考】UML中的图之状态图

目录 1. 说明2. 图示 1. 说明 1.状态图&#xff08;State Diagram&#xff09;展现了一个状态机。2.由状态、转换、事件和活动组成。3.关注系统的动态视图。4.对于接口、类和协作的行为建模尤为重要。5.强调对象行为的事件顺序。6.通常包括简单状态和组合状态、转换&#xff0…
最新文章