当前位置: 首页 > news >正文

【数据结构】堆(二)——堆排序、TOP-K问题

作者:一个喜欢猫咪的的程序员 

专栏:《数据结构》

喜欢的话:世间因为少年的挺身而出,而更加瑰丽。                                  ——《人民日报》


目录

堆排序:(以小堆为例)

 Heapsort函数(堆排序):

向下调整具体的时间复杂度:

向上调整具体的时间复杂度:

如何实现堆排序

TOP-K问题:


堆排序:(以小堆为例)

堆的分类:

  • 升序or降序
  • 大堆or小堆
void test2()
{//堆排序
	int array[] = { 27,15,19,18,28,34,65,49,25,37 };
	Heapsort(array, sizeof(array) / sizeof(array[0]));
	for (int i = 0; i < sizeof(array) / sizeof(array[0]); i++)
	{
		printf("%d ", array[i]);
	}
	printf("\n");

}

 Heapsort函数(堆排序):

int array[] = { 27,15,19,18,28,34,65,49,25,37 };

需将这个数组进行大堆排列,分为两种调整形式:向上调整和向下调整

向上调整和向下调整的思想可以参考我的例外一篇博客:http://t.csdn.cn/YFSpd

void Ajustup(HPDataType*a, int child)
{//N*logN
	assert(a);
	//int child = n - 1;
	while (child > 0)
	{
		int parent = (child - 1) / 2;
		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			child = parent;
		}
		else
		{
			break;
		}
	}
}
void Ajustdown(HPDataType* a, int n,int parent)
{//O(N)
	assert(a);
	int child = 2 * parent+1;
	while (child<n)
	{
		if (child + 1 < n && a[child] < a[child + 1])//  <假设左子树大
		{
			child++;
		}
		if (a[child] > a[parent])//>大堆,<为小堆
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = child * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

 向上调整和向下调整具体的时间复杂度是多少呢?

向下调整具体的时间复杂度:

假设树高为h

第h层,有2^(h-1)个节点,需要向下调整0次(直接不算,从第h-1层开始算)。

第h-1层,有2^(h-2)个节点,需要向下调整1层。

第h-2层,有2^(h-3)个节点,需要向下调整2层。

......

第4层,有2^3个节点,需要向下调整h-4层。

第3层,有2^2个节点,需要向下调整h-3层。

第2层,有2^1个节点,需要向下调整h-2层。

第1层,有2^0个节点,需要向下调整h-1层。

当h高的次数,最多调整层数为:

F(h)=2^0*(h-1)+2^1*(h-2)+2^2*(h-3)+...+2^(h-3)*2+2^(h-2)*1+2^(h-1)*0       ——①

2*F(h)=2^1*(h-1)+2^2*(h-2)+2^3*(h-3)+...+2^(h-2)*2+2^(h-1)*1+2^(h)*0       ——②

有错位相减②-①可得:

F(h)=-2^0*(h-1)+2^1+2^2+....+2^(h-2)+2^(h-1)

F(h)=2^h-1-h                                                                                                           ——③

 当树高为h时,节点总个数N为:

N=2^0+2^1+...+2^(h-2)+2^(h-1)

N=2^h-1                                                                                                                        ——④

有④可得:h=log(N+1)                                                                                            ——⑤

综合③④⑤可得:

F(N)=N-log(N+1)

  •  因此时间复杂度为O(N)

向上调整具体的时间复杂度:

在一层,需要向上调整0次

第二层,向上调整1次

第三层,向上调整2次

...

第h-1层,向上调整h-2次

第h层,向上调整h-1次

F(h)=2^1*1+2^2*2+....+2^(h-1)*(h-1)。

由错位相减可得:

F(N)=2N(1-log(N+1))。

  • 时间复杂度为O(N*logN)

如何实现堆排序

显然向下调整优于向上调整。

 先利用Ajustdown排序好数组,然后再用交换Ajustdown实现小堆。

void Heapsort(int*a,int n)//堆排序
{//向上调整
	for (int i = 1; i <n; i++)
	{
		Ajustup(a, i);
	}
	//向下调整
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		Ajustdown(a, n, i);
	}
	int end = n - 1;
	while (end>0)
	{
		Swap(&a[0], &a[end]);
		Ajustdown(a, end, 0);
		end--;
	}
	//N*logN
}
void test2()
{//堆排序
	int array[] = { 27,15,19,18,28,34,65,49,25,37 };
	Heapsort(array, sizeof(array) / sizeof(array[0]));
	for (int i = 0; i < sizeof(array) / sizeof(array[0]); i++)
	{
		printf("%d ", array[i]);
	}
	printf("\n");

}

TOP-K问题:

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。

当数据量特别大时,我们造一个数组来存储他们依次存储时,就不大现实。

可以先开一个K个空间的数组,将这个数据量的前K个放进去,将他们小堆排列,并将这个数据量每个数与堆顶的元素相比较,比它大就替代它进入数组,在向下排列,以此循环。

void test3()
{
	int minHeap[5];
	FILE* fout = fopen("data.txt", "r");
	if (fout == NULL)
	{
		perror("fopen fail");
		exit(-1);
	}
	int k = sizeof(minHeap) / sizeof(minHeap[0]);
	for (int i = 0; i < k; i++)
	{
		fscanf(fout,"%d",&minHeap[i]);
	}
	for (int i = 0; i < sizeof(minHeap) / sizeof(minHeap[0]); i++)
	{//检查是否录入数据
		printf("%d ", minHeap[i]);
	}
	printf("\n");
	for (int i = (k - 1 - 1) / 2; i >= 0; i--)
	{
		Ajustdown(minHeap, k, i);
	}
	for (int i = 0; i < sizeof(minHeap) / sizeof(minHeap[0]); i++)
	{//检查是否为大小堆
		printf("%d ", minHeap[i]);
	}
	printf("\n");
	int data = 0;
	while (fscanf(fout, "%d", &data) != EOF)
	{
		if (data > minHeap[0])
		{
			minHeap[0] = data;
			Ajustdown(minHeap, k, 0);
		}
	}
	int end = k - 1;
	while (end > 0)
	{
		Swap(&minHeap[0], &minHeap[end]);
		Ajustdown(minHeap, end, 0);
		end--;
	}//完成升序或者降序
	for (int i = 0; i < sizeof(minHeap) / sizeof(minHeap[0]); i++)
	{//检查是否为大小堆
		printf("%d ", minHeap[i]);
	}
	printf("\n");
	fclose(fout);
}
void test4()
{
	int n, k;
	scanf("%d %d", &n, &k);
	FILE* fint = fopen("data1.txt", "w");
	if (fint == NULL)
	{
		perror("fopen fail");
		exit(-1);
	}
	srand(time(0));
	int randK = k;
	for (size_t i = 0; i < n; ++i)
	{
		int data = rand() % 100000;
		fprintf(fint, "%d\n", data);
	}
	fclose(fint);
	int* minHeap = (int*)malloc(sizeof(int) * k);
	FILE* fout = fopen("data1.txt", "r");
	if (fout == NULL)
	{
		perror("fopen fail");
		exit(-1);
	}
	for (int i = 0; i < k; i++)
	{
		fscanf(fout, "%d", &minHeap[i]);
	}
	for (int i = 0; i < k; i++)
	{//检查是否录入数据
		printf("%d ", minHeap[i]);
	}
	printf("\n");
	for (int i = (k - 1 - 1) / 2; i >= 0; i--)
	{
		Ajustdown(minHeap, k, i);
	}
	for (int i = 0; i < k; i++)
	{//检查是否为大小堆
		printf("%d ", minHeap[i]);
	}
	printf("\n");
	int data = 0;
	while (fscanf(fout, "%d", &data) != EOF)
	{
		if (data > minHeap[0])
		{
			minHeap[0] = data;
			Ajustdown(minHeap, k, 0);
		}
	}
	int end = k - 1;
	while (end > 0)
	{
		Swap(&minHeap[0], &minHeap[end]);
		Ajustdown(minHeap, end, 0);
		end--;
	}//完成升序或者降序
	for (int i = 0; i < k; i++)
	{//检查是否为大小堆,升序或者降序
		printf("%d ", minHeap[i]);
	}
	printf("\n");
	fclose(fout);
}
int main()
{
	//test1();
	test2();
	//test3();
	//test4();
	return 0;
}

相关文章:

  • 关于我的家乡网页设计主题题材——梧州14页HTML+CSS网页
  • Python画一棵茂盛的分形树
  • css知识复习点
  • 公益校园网页制作 大学生网页设计作业 HTML CSS公益网页模板 大学生校园介绍网站毕业设计
  • Qt之天气预报——界面优化篇(含源码+注释)
  • 如果你不是前端,一定不知道我在说什么
  • Spring BOOT 手写一个starter并使用这个starter
  • C/C++停车场管理系统
  • 【C++进阶】C++11新特性上篇(万字详解)
  • C/C++KTV点歌系统
  • 【Linux修炼手册:基本指令(完结)】
  • vmware ESXI 7 升级ESXI 8
  • 毕业设计 单片机温湿度环境检测仪 - stm32 物联网 嵌入式
  • 为什么在SPI通信中提供不同的模式?
  • 马上跨年了,如何用代码写一个“跨年倒计时”呢?
  • 【编码】-360实习笔试编程题(二)-2016.03.29
  • ES6语法详解(一)
  • leetcode-27. Remove Element
  • SSH 免密登录
  • Traffic-Sign Detection and Classification in the Wild 论文笔记
  • 对话 CTO〡听神策数据 CTO 曹犟描绘数据分析行业的无限可能
  • 海量大数据大屏分析展示一步到位:DataWorks数据服务+MaxCompute Lightning对接DataV最佳实践...
  • 如何优雅的使用vue+Dcloud(Hbuild)开发混合app
  • 吐槽Javascript系列二:数组中的splice和slice方法
  • 验证码识别技术——15分钟带你突破各种复杂不定长验证码
  • const的用法,特别是用在函数前面与后面的区别
  • 带你开发类似Pokemon Go的AR游戏
  • 如何在 Intellij IDEA 更高效地将应用部署到容器服务 Kubernetes ...
  • ​LeetCode解法汇总2808. 使循环数组所有元素相等的最少秒数
  • ​软考-高级-系统架构设计师教程(清华第2版)【第1章-绪论-思维导图】​
  • ​软考-高级-系统架构设计师教程(清华第2版)【第9章 软件可靠性基础知识(P320~344)-思维导图】​
  • ​香农与信息论三大定律
  • # 深度解析 Socket 与 WebSocket:原理、区别与应用
  • (C语言)逆序输出字符串
  • (Java实习生)每日10道面试题打卡——JavaWeb篇
  • (定时器/计数器)中断系统(详解与使用)
  • (附源码)ssm教师工作量核算统计系统 毕业设计 162307
  • (附源码)ssm经济信息门户网站 毕业设计 141634
  • (附源码)计算机毕业设计ssm-Java网名推荐系统
  • (附源码)计算机毕业设计SSM教师教学质量评价系统
  • (剑指Offer)面试题34:丑数
  • (三)Pytorch快速搭建卷积神经网络模型实现手写数字识别(代码+详细注解)
  • (一)Dubbo快速入门、介绍、使用
  • (一)基于IDEA的JAVA基础1
  • (转)ObjectiveC 深浅拷贝学习
  • * 论文笔记 【Wide Deep Learning for Recommender Systems】
  • .NET Core IdentityServer4实战-开篇介绍与规划
  • .NET Core 中的路径问题
  • .net 流——流的类型体系简单介绍
  • .NET面试题解析(11)-SQL语言基础及数据库基本原理
  • .NET值类型变量“活”在哪?
  • @Autowired和@Resource的区别
  • [ C++ ] STL---string类的模拟实现
  • [16/N]论得趣
  • [AAuto]给百宝箱增加娱乐功能