😛作者:日出等日落
📘 专栏:数据结构
把每天当作最后一天来过,那么你就能够学会珍惜。你珍惜了时间,时间自然会对你有所回报。
目录
🎄堆的创建:
堆排序:
向下调整的时间复杂度:
向上调整的时间复杂度:
TOP-K问题:
这次是是对上一章节进行了优化,可以替换掉HeapInit函数
如需了解,请看http://t.csdn.cn/SEvl0这一文章,是堆的简单创建
//堆的创建 void HeapCreat(HP* hph, HPDataType* a, int n) { assert(hph); hph->a = (HPDataType*)malloc(sizeof(HPDataType) * n); if (hph->a == NULL) { perror("malloc fail:"); exit(-1); } memcpy(hph->a, a, sizeof(HPDataType) * n); hph->size = hph->capacity = n; //建堆算法 for (int i = (n - 1 - 1) / 2; i >= 0; --i) { AdjustDown(hph->a, n, i); } } //堆的销毁 void HeapDestory(HP* hph) { assert(hph); free(hph->a); hph->a = NULL; hph->capacity = 0; hph->size = 0; } void TestHeap3() { int array[] = { 27, 15, 19, 18, 28, 34, 65, 49, 25, 37 }; HP hp; HeapCreat(&hp, array, sizeof(array) / sizeof(int)); HeapPrint(&hp); HeapDestory(&hp); }
向上调整和向下调整的思想可以参考我的例外一篇博客:http://t.csdn.cn/kDcRa
实现堆排序:
向下调整优于向上调整(下面时间复杂度详解)
先利用Ajustdown排序好数组,然后再用交换Ajustdown实现小堆。
void HeapSort(HPDataType* a,int n) { //这里采用向下调整O(n) for (int i = (n - 1 - 1) / 2; i >= 0; --i) { AdjustDown(a, n, i); } int end = n - 1; //N*O(m=n) while (end > 0) { Swap(&a[0], &a[end]); AdjustDown(a, end, 0); --end; } } void TestHeap4() { int array[] = { 27, 15, 19, 18, 28, 34, 65, 49, 25, 37 }; HeapSort(array, sizeof(array) / sizeof(HPDataType)); for (int i = 0; i < sizeof(array) / sizeof(HPDataType); i++) { printf("%d ", array[i]); } }
//向下调整 void AdjustDown(HPDataType* a, int n, int parent) { int child = parent * 2 + 1; while (child < n) { if (child + 1< n && a[child] > a[child + 1]) { child = child + 1; } //child 大于 parent 就交换 if (a[child] < a[parent]) { Swap(&a[child], &a[parent]); parent = child; child = parent * 2 + 1; } else { break; } } }
假设树高为h:
第一层有2^0个结点;
第二层有2^1个结点;
第三层有2^2个结点;
第h层有2^(h-1)个结点;
进行向下调整的时候要向下调整:
第一层要想下调整2^0*(h-1)次;
第二层要想下调整2^1*(h-2)次;
第h-1层要想下调整2^(h-2)*1次;
第h层要想下调整2^(h-1)*0次;
当h高的次数,最多调整层数为:
F(h)= 2^(h-2)*1+2^(h-3)*2+..........+2^2*(h-3)+2^1*(h-2)+2^0*(h-1) ——①
2*F(h)= 2^(h-1)*1+2^ (h-2)*2+2^(h-3)*3+.........+2^2*(h-2)+2^1*(h-1) ——②
有错位相减②-①可得:
F(h)= 2^(h-1) + 2^(h-2) + 2^(h-3) +......+ 2^2 + 2^1 - h-1
F(h)=2^h-1-h ——③
当树高为h时,节点总个数N为:
N=2^0+2^1+...+2^(h-2)+2^(h-1)
N=2^h-1 ——④
有④可得:h=log(N+1) ——⑤
综合③④⑤可得:
F(N)=N-log(N+1)
因此时间复杂度为O(N)
//向上调整 //child和parent都是下标 void AdjusUp(HPDataType* a, int child) { int parent = (child - 1) / 2; while (child>0) { if (a[parent] < a[child]) { Swap(&a[parent], &a[child]); child = parent; parent = (child - 1) / 2; } else { break; } } }
F(h)=2^1*1+2^2*2+....+2^(h-1)*(h-1)。
由错位相减可得:
F(N)=2N(1-log(N+1))
时间复杂度为O(N*logN)
TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能 数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:
- 用数据集合中前K个元素来建堆
- 前k个最大的元素,则建小堆
- 前k个最小的元素,则建大堆
- 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素 将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。
void TestHeap6() { // 造数据 int n, k; printf("请输入n和k:>"); scanf("%d%d", &n, &k); srand(time(0)); FILE* fin = fopen("Data1.txt", "w"); if (fin == NULL) { perror("fopen fail"); return; } int randK = k; for (size_t i = 0; i < n; ++i) { //随机数插入 int val = rand() % 10000; fprintf(fin, "%d\n", val); } fclose(fin); / // 找topk FILE* fout = fopen("Data1.txt", "r"); if (fout == NULL) { perror("fopen fail"); return; } //int minHeap[5]; int* minHeap = malloc(sizeof(int) * k); if (minHeap == NULL) { perror("malloc fail"); return; } for (int i = 0; i < k; ++i) { fscanf(fout, "%d", &minHeap[i]); } // 建小堆 for (int i = (k - 1 - 1) / 2; i >= 0; --i) { AdjustDown(minHeap, k, i); } int val = 0; while (fscanf(fout, "%d", &val) != EOF) { if (val > minHeap[0]) { minHeap[0] = val; AdjustDown(minHeap, k, 0); } } for (int i = 0; i < k; ++i) { printf("%d ", minHeap[i]); } printf("\n"); fclose(fout); } int main() { TestHeap6(); return 0; }