当前位置: 首页 > news >正文

【C++】关联式容器——map和set

1 关联式容器

STL中我们常用的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。
那什么是关联式容器呢?它与序列式容器有什么区别?
关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是**<key, value>结构的键值对**,在数据检索时比序列式容器效率更高。

2 键值对(pair)

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。
比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。

stl中关于键值对的定义

template <class T1, class T2>
struct pair
{typedef T1 first_type;typedef T2 second_type;T1 first;T2 second;pair() : first(T1()), second(T2()){}pair(const T1& a, const T2& b) : first(a), second(b){}
};

![[Pasted image 20240324204650.png]]

可见,pair内有两个成员变量,一个是first,即key;一个是second,即value。

pair的构造函数:
![[Pasted image 20240324204901.png]]

在C++98中,pair共有三个构造函数。

  1. 无参构造函数,根据模板参数推导出类型,调用该类型的默认构造函数生成key和value的值。
  2. 拷贝构造函数
  3. 通过两个值来构造,以key、value的顺序。

此外,C++中还提供了一种构造键值对的方法,利用make_pair函数
![[Pasted image 20240324205256.png]]

可以看到,make_pair函数本质上是创建一个键值对对象并返回其拷贝。使用make_pair的好处是不用我们显示写模板参数。
在map的插入操作中,就需要插入一个一个的键值对。此时我们可以利用匿名对象构造插入,也可以使用make_pair函数。此外,C++11中还支持了多参数构造函数的隐式类型转换,为插入键值对提供了一种更新的方式,将在下文中演示。

3 树形结构的关联式容器

根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构
树型结构的关联式容器主要有四种:map、set、multimap、multiset。
这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

4 set

4.1 set

set的文档介绍如下:
![[Pasted image 20240324210048.png]]

翻译:

  1. set是按照一定次序存储元素的容器
  2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
  3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
  4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
  5. set在底层是用二叉搜索树(红黑树)实现的。

注意:

  1. 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
  2. set中插入元素时,只需要插入value即可,不需要构造键值对。
  3. set中的元素不可以重复(因此可以使用set进行去重)。
  4. 使用set的迭代器遍历set中的元素,可以得到有序序列
  5. set中的元素默认按照小于来比较
  6. set中查找某个元素,时间复杂度为: l o g 2 n log_2 n log2n
  7. set中的元素不允许修改(文档最后一句,set底层是搜索二叉树,如果允许修改整个树的大小关系就乱套了)
  8. set中的底层使用二叉搜索树(红黑树)来实现

注意set的模板参数中有一个Compare,这个是用于比较的仿函数,在priority_queue中也用到过仿函数这一工具。

4.2 set的使用

知晓了set的作用,set的使用其实非常简单,有了前面stl容器的使用经验,非常方便上手。
首先是set的构造函数,根据之前的经验,无非就是全缺省的默认构造函数、迭代器区间构造和拷贝构造。
![[Pasted image 20240324210831.png]]

不过要注意的是,由于set底层是一颗树,在执行拷贝构造和赋值时代价是比较大的,因为要进行深拷贝

4.2.1 insert

下面是比较重要的insert
![[Pasted image 20240324211508.png]]

对于set,常用的插入操作时第一个函数。我们可以看见返回值是一个键值对,这是什么意思呢?
其实,这里牵扯到map实现方面的问题。在map中的insert需要设计成这样以支持[]运算符重载,这里是为了统一风格而设计。

由于set内不允许有重复元素,当插入元素并不存在于set中时才能执行插入,此时返回一个键值对,键值对中的key是插入元素的迭代器,value是一个bool值,如果插入成功则为true;当插入元素已经存在于set,此时键值对中的key是那个重复元素的迭代器,而value就为false。

其他的一些操作,命名也都沿袭了stl一贯的风格,看一眼大概就知道其功能。
![[Pasted image 20240324212146.png]]

4.2.2 erase和find

想要删除一个元素可以用erase。可以直接以待删除元素的值作为参数。

// 在就删除,不在就不做任何处理
s.erase(3);
s.erase(30);
for (auto e : s)
{cout << e << " ";
}
cout << endl;

但是要注意的是,如果在set中没有找到要删除的值,是什么都不会发生的。
我们也可以用迭代器进行删除,用find搜索待删除元素。

// 这个值在,找到有效位置,再进行删除
pos = s.find(5);
s.erase(pos);

两种方式的区别是,find如果没有找到,而直接对其erase,是会报错的。

这是由于如果find找不到,将会返回end位置的迭代器,导致越界相关的问题。

此外,我们知道算法库里面也有一个find,通过一段迭代器区间来进行查找,但是这个find的效率不如set内置的效率高,因为set中时根据红黑树来查找的,而算法库中的find是根据迭代器一个一个的找。时间复杂度是对数级别和线性级别的差别。

4.2.3 count

count也可以用于查找一个元素在不在set中,如果在返回1,不在返回0。

4.2.4 lower_bound和upper_bound

![[Pasted image 20240324213219.png]]

返回迭代器到下界
返回一个迭代器,该迭代器指向容器中的第一个元素,该元素不被认为位于val之前(即,它要么等价,要么在val之后)。
该函数使用其内部比较对象(key_comp)来确定这一点,并返回一个迭代器,指向key_comp(element,val)将返回false的第一个元素。
如果用默认比较类型(less)实例化set类,则该函数返回一个指向不小于val的第一个元素的迭代器。(即>=val的第一个值)
类似的成员函数upper_bound具有与lower_bound相同的行为,只是set包含一个与val等效的元素:在这种情况下,lower_bound返回一个指向该元素的迭代器,而upper_bound返回一个指向下一个元素的迭代器。(即>val的第一个值)
![[Pasted image 20240324213237.png]]

5 multiset

multyset和set非常类似,其区别是multiset允许键值冗余,即允许存在重复的元素,其余操作都是一样的。
此时如果我们再对multiset执行count操作,那么返回值就可能大于1了。

  1. multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
  2. 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。
  3. 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
  4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。
  5. multiset底层结构为二叉搜索树(红黑树)。

注意:

  1. multiset中再底层中存储的是<value, value>的键值对
  2. mtltiset的插入接口中只需要插入即可
  3. 与set的区别是,multiset中的元素可以重复,set是中value是唯一的
  4. 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列
  5. multiset中的元素不能修改
  6. 在multiset中找某个元素,时间复杂度为 O ( l o g 2 N ) O(log_2 N) O(log2N)
  7. multiset的作用:可以对元素进行排序

6 map

6.1 map

先来看看map的介绍
![[Pasted image 20240324213920.png]]

  1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
  2. 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair:typedef pair<const key, T> value_type;
  3. 在内部,map中的元素总是按照键值key进行比较排序的。
  4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
  5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
  6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

map内部的成员变量中,有如下三个是最为关键的
![[Pasted image 20240324214143.png]]

由上到下分别是:
键(key)类型
值(value)类型(map有映射的意思,即key映射(mapped)之后的值为value)
键值对(key,value)类型

在map中,键值通常用于排序和唯一标识元素,而映射值存储与该键相关联的内容。键和映射值的类型可能不同,组合在成员类型value_type中,这是一种组合了两者的pair类型:

typdef pair<const Key, T> value_type;

其实,map和set本质上是非常接近的,区别在于存储的数据不同而已。map存放的是<key,value>,而set存放的是<value,value>

6.2 常用接口

![[Pasted image 20240324214445.png]]

map大多数接口和set也很类似。先来看insert。
![[Pasted image 20240324214646.png]]

这里对于最常用的第一个,其返回值的意义同set是一样的。
对于map的insert,支持以下几种方式。

pair<string, string> p("banana", "香蕉");
m.insert(p);
m.insert(pair<string, string>("apple", "苹果"));
m.insert(make_pair("orange", "橙子"));
m.insert({ "blue","蓝色" });    // C++11新增,多参数构造函数的隐式类型转换

还需要注意的是,如果插入的时候,key相同,但是val不相同,是不会插入进去的,也不会覆盖进去的。即插入过程中,只比较key。key相同就不插入了。

删除操作也与set类似,需要注意的是,同样是以key作为标识。

6.3 map的[]运算符重载

map的[]运算符重载跟之前的序列容器(如vector,string)等实现方式有比较明显的区别。先来看文档说明。
![[Pasted image 20240324220558.png]]

可以看到,是以key为参数,返回值为该key对应的value的引用。这是为什么呢?
其实官方还给了一个非常重要的解释。
![[Pasted image 20240324220739.png]]

我们把中间部分拆开来看
![[Pasted image 20240324220812.png]]

会发现调用的是insert函数,而insert函数的返回值是一个pair
![[Pasted image 20240324220850.png]]

再来看函数功能的介绍
![[Pasted image 20240324221050.png]]

访问元素
如果k与容器中某个元素的键匹配,则该函数返回对其映射值的引用。
如果k与容器中任何元素的键不匹配,则该函数用该键插入一个新元素,并返回对其映射值的引用。注意,这总是将容器的大小增加1,即使没有将映射值赋给元素(元素是使用其默认构造函数构造的)。
类似的成员函数map::at在具有键的元素存在时具有相同的行为,但在不存在时抛出异常。

简而言之, 原理就是用<key, T()>构造一个键值对,然后调用insert()函数将该键值对插入到map中

  • 如果key已经存在,插入失败,insert函数返回该key所在位置的迭代器
  • 如果key不存在,插入成功,insert函数返回新插入元素所在位置的迭代器
  • operator[]函数最后将insert返回值键值对中的value返回
    有了这种机制,就可以利用下面的代码统计关键词的个数.
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" };map<string, int> countMap;for (auto e : arr){countMap[e]++;}map<string, int>::iterator it = countMap.begin();while (it != countMap.end()){cout << it->first << ":" << it->second << endl;it++;}

countMap对象中,它的两个参数是string和int,第一次的时候不存在,所以会创建一个pair<string,int>对象。int则会调用它的默认构造函数,即结果为0。然后有一个++,所以最终会将这个值给插入进去。

由于[]运算符重载返回的是value的引用,那么就可以实现以下几种功能:

  1. 插入
  2. 查找
  3. 修改
  4. 插入+修改
    ![[Pasted image 20240324222612.png]]

7 multimap

类比multiset,multimap即允许一个键对应多个值。
这个在实际生活中也是有意义的,比如一个英文单词可能有多个中文意思。
但是与map在使用上还是有一些区别,比如这个容器没有提供[]运算符重载,因为无法根据一个key确定需要取的是哪个value。
同时,insert函数和erase函数也有一些变化。
insert不会再返回键值对,因为插入永远是成功的,只需要返回迭代器就可以了
![[Pasted image 20240324222707.png]]

而对于erase,由于一个key对应多个value,此时对一个key进行删除,会将所有value一并删除。

总结

  1. Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key,value>,其中多个键值对之间的key是可以重复的。
  2. 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;
  3. 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
  4. multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
  5. multimap在底层用二叉搜索树(红黑树)来实现。

注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。

相关文章:

  • mysql80-DBA数据库学习1
  • C++入门:类和对象(上)
  • 车辆信息查询API:高效获取车牌号对应车辆的实时信息
  • 从0写一个问卷调查APP的第13天-1
  • MySQL基础复习
  • Python安装手册
  • 【课程】Java构架师42套阶段课程
  • vscode集成git管理项目
  • ensp ppp验证实验(二)
  • 低代码开发平台开源:依靠科技力量实现数字化转型!
  • Guava之EventBus源码分析
  • 从0到1:Java构建高并发、高可用分布式系统的实战经验分享
  • G - Find a way
  • RUST:Arc (Atomic Reference Counted) 原子引用计数
  • 面试笔记——Redis(双写一致、持久化)
  • MySQL数据库运维之数据恢复
  • PHP那些事儿
  • select2 取值 遍历 设置默认值
  • Vue2.x学习三:事件处理生命周期钩子
  • 简析gRPC client 连接管理
  • 开源SQL-on-Hadoop系统一览
  • 深入浅出webpack学习(1)--核心概念
  • 一天一个设计模式之JS实现——适配器模式
  • 湖北分布式智能数据采集方法有哪些?
  • # C++之functional库用法整理
  • #HarmonyOS:软件安装window和mac预览Hello World
  • (1/2)敏捷实践指南 Agile Practice Guide ([美] Project Management institute 著)
  • (175)FPGA门控时钟技术
  • (c语言版)滑动窗口 给定一个字符串,只包含字母和数字,按要求找出字符串中的最长(连续)子串的长度
  • (蓝桥杯每日一题)平方末尾及补充(常用的字符串函数功能)
  • (三)uboot源码分析
  • (原创)boost.property_tree解析xml的帮助类以及中文解析问题的解决
  • (原創) 如何將struct塞進vector? (C/C++) (STL)
  • (转)如何上传第三方jar包至Maven私服让maven项目可以使用第三方jar包
  • (转)淘淘商城系列——使用Spring来管理Redis单机版和集群版
  • .axf 转化 .bin文件 的方法
  • .Net 中的反射(动态创建类型实例) - Part.4(转自http://www.tracefact.net/CLR-and-Framework/Reflection-Part4.aspx)...
  • .NET6 开发一个检查某些状态持续多长时间的类
  • .net之微信企业号开发(一) 所使用的环境与工具以及准备工作
  • .pings勒索病毒的威胁:如何应对.pings勒索病毒的突袭?
  • @RequestMapping处理请求异常
  • @vue/cli脚手架
  • [1] 平面(Plane)图形的生成算法
  • [Android 13]Input系列--获取触摸窗口
  • [Android] Upload package to device fails #2720
  • [BZOJ4337][BJOI2015]树的同构(树的最小表示法)
  • [C# 开发技巧]实现属于自己的截图工具
  • [C#]C# winform部署yolov8目标检测的openvino模型
  • [C/C++]数据结构 栈和队列()
  • [C++]——带你学习类和对象
  • [C++核心编程](四):类和对象——封装
  • [CareerCup] 2.1 Remove Duplicates from Unsorted List 移除无序链表中的重复项
  • [HeadFrist-HTMLCSS学习笔记][第一章Web语言:开始了解HTML]
  • [HOW TO]怎么在iPhone程序中实现可多选可搜索按字母排序的联系人选择器
  • [java/jdbc]插入数据时获取自增长主键的值