AcWing 839. 如何理解模拟堆中的heap_swap，hp[N], ph[N]？

历史记录

清除记录

猜你想搜

AcWing热点
App
登录/注册

AcWing 839. 如何理解模拟堆中的heap_swap，hp[N], ph[N]？原题链接简单

作者：

Darron , 2019-10-29 19:03:25 , 所有人可见 , 阅读 23969

333

194

问题

如何理解AcWing 模拟堆这道题中的heap_swap，hp[N], ph[N]？

详解

重点：题目中第k个插入，这里的k相当于链表中的idx，是节点的唯一标识
不理解idx到底是啥意思的可以先看看这篇，其中总结了对链表，Trie树，堆中idx的理解：https://www.acwing.com/solution/content/5673/

1. 关于idx

堆中的每次插入都是在堆尾，但是堆中经常有up和down操作。所以节点与节点的关系并不是用一个ne[idx][2]可以很好地维护的。但是好在堆是个完全二叉树。子父节点的关系可以通过下标来联系（左儿子2n，右儿子2n+1）。就数组模拟来说，知道数组的下标就知道结点在堆中的位置。所以核心就在于即使有down和up操作也能维护堆数组的下标（k）和结点（idx）的映射关系。 比如说：h[k] = x, h数组存的是节点的值，按理来说应该h[idx]来存，但是节点位置总是在变的，因此维护k和idx的映射关系就好啦

举例： 用ph数组来表示ph[idx] = k(idx到下标), 那么结点值为h[ph[idx]], 儿子为ph[idx] * 2和ph[idx] * 2 + 1, 这样值和儿子结点不就可以通过idx联系在一起了吗？

2. 理解hp与ph数组

从上面讨论的可以知道，ph数组主要用于帮助从idx映射到下标k，似乎有了ph数组就可以完成所有操作了，但为什么还要有一个hp数组呢？
原因就在于在swap操作中我们输入是堆数组的下标，无法知道每个堆数组的k下标对应idx（第idx个插入），所以需要hp数组方便查找idx。

void heap_swap(int a, int b)
{
    swap(ph[hp[a]], ph[hp[b]]); 
    swap(hp[a], hp[b]);
    swap(h[a], h[b]);
}

3. 举例：堆中的插入操作

注意： 在堆这个数据结构中，数据的插入都是插入到堆尾，然后再up

if (op == "I")
{
    scanf("%d", &x);
    size ++ ;
    idx ++ ; //记录第几次插入（设置新的idx）
    ph[idx] = size, hp[size] = idx; //每次插入都是在堆尾插入（设置ph与hp）
    h[ph[idx]] = x; //记录插入的值 
    up(ph[idx]);
}

4. 举例：删除第idx个插入元素

删除操作，三个步骤：
1. 找到第idx个插入元素在堆数组中的位置（堆数组下标）
2. 与堆尾元素交换
3. 在原来第idx个元素所在的位置进行down和up操作。（up，down，swap操作的都输入都是下标）

很显然，在第一步中，显然ph[idx]查找即可。第二步，直接swap操作。第三步需要找到原来第idx的元素所在的位置，由于交换完后ph[idx]的值变了，变为堆尾的下标了，所以必须要在之前保存ph[idx]的值

if (op == "D")
{
    scanf("%d", &idx);
    k = ph[idx]; //必须要保存当前被删除结点的下标
    heap_swap(k, size);//第idx个插入的元素移到了堆尾，此时ph[idx]指向堆尾 
    size --;  //删除堆尾
    up(k);//k是之前记录被删除的结点的下标
    down(k);
}

86 评论

13333409541 2022-04-26 17:40

132

/*
1、理解hp与ph数组，以及为什么需要它们
* 堆h[i]只能存放数据，不能存放是第几个数字，所以需要ph[k] = i来指明，第k个数字在h[]中对应的i是多少
* 在执行交换操作的时候，可以直接交换数字,swap(h[a],h[b])
但是对于ph[k_1] = a和ph[k_2] = b来说，a和b是它们存放的值，不能通过值来找下标，也就是找不k_1,k_2是多少
* 于是引入hp[a] = k_2，hp[b] = k_2，则可以实现反向的操作

2、形象理解heap_swap中的次序是任意的
h[]：房间号无直接实际意义，里边住着犯人
ph[]：花名册，狱警所有，写明了几号犯人住在哪个房间号里，用于抓某些人
（但是狱警无权过问每个号里住的是谁）
hp[]：住户册，监狱所有，写明了哪个房间号里住的是几号，用于管理监狱
（但是监狱没必要知道哪个犯人住在哪里）
heap_swap：已知两个犯人住的地方，交换它们住的地方，并且让狱警和管理处都知道这件事情
swap(h[a], h[b])：两个人换地方住
swap(hp[a], hp[b])：监狱管理处翻房间号，把里边存放的犯人号交换
swap(ph[hp[a]], ph[hp[b]])：狱警：先申请查住户册，看这两个地方住的谁，再在花名册下写下来，这两个人位置换了
h[a] = 10, h[b] = 20 swap: h[a] = 20,h [b] = 10
hp[a] = 1 ,hp[b] = 2 swap:hp[a] = 2 ,hp[b] = 1
ph[1] = a ,ph[2] = b swap:ph[1] = b ,ph[2] = a
//这种不变形也很像线代中：代表交换的初等矩阵，进行逆运算之后，仍然是该初等矩阵

筑梦师 2022-05-05 22:40

大佬解释的很清楚，终于明白了orz

小黑不开心 2022-06-07 21:28

orz

TYF 2022-06-29 17:22

orz

disheng 2022-08-08 00:36

orz

冬眠三个月灿烂 2022-08-13 11:11

生动形象orz

世蒂 2022-08-28 18:56

牛！

Zzint 2022-09-17 11:11

orz

YXjack 2022-10-18 18:56

太强了（模拟堆这个图可以玩狱警/doge）

今天一定早点睡 2022-11-10 17:45

# 写的真好

原神高手 2022-11-21 19:31

orz

二成 2022-11-26 13:48

Orz

菜得睡不着 2023-03-07 22:52

orz

迟早药丸 2023-03-11 21:13

Orz，大佬牛逼，写的太好了

Isaacs 2023-03-14 10:37

orz

TYGK 2023-04-05 17:40

# orz

落默星辰 2023-05-06 00:18

orz

ZeqII柒 2023-05-30 21:32

Orz~

wawu 2023-06-21 16:22

感谢，解释的真的很好

TESJackeyLove 2023-07-17 13:48

https://www.acwing.com/activity/content/code/content/6714238/
给大佬的讲解配了个例子

elasticity 2023-08-27 23:14

orz

NoLoveExist 2023-12-17 11:49

orz

蒻苟的算法梦 2024-01-25 14:18

orz

FITZ_8 2024-09-23 19:20

orz

nomain. 2024-11-04 10:00

太牛逼了

学习中的兜兜li有sugar 2025-02-26 22:44 · 黑龙江

h[1] = a ,ph[2] = b swap:ph[1] = b ,ph[2] = a
中可以发现直接是 ph[hp[a]] = b ph[hp[b]] = a 就行，不用调用swap函数，毕竟 ph 数组存放的是 h 的下标, 用h 的下标 a,b 去间接交换 ph 数组中的值, 而对应的 ph[hp[a]] 在没用交换函数时值就是a , 而ph[hp[b]] 为b ;
所以可以直接赋值来减少一次函数的调用

安意 2022-11-13 17:02

h[x] 表示树中位置 x 的元素
ph[k] = x 表示第 k 个插入的元素在树中存放的位置 x
此时如果要交换 ph 中的两个元素需要知道树中位置 x 是第几个被插入的, 于是便引入了数组 hp
hp[x] = k 表示树中位置 x 存放的为第 k 个插入的元素

很自然的事 2022-11-28 17:24

妙啊

鹏栖梧桐 2024-03-31 17:27 回复了很自然的事的评论

orz

lsxstart 2024-08-01 16:42

tql

一一呀 2023-08-26 12:54

#include <iostream>

using namespace std;

const int N = 1e5 + 10;
//h代表heap（堆），ph（point->heap）可以获得第几个插入的元素现在在堆的那个位置
//hp(heap->point)可以获得在堆的第n个元素存的是第几个插入的元素
//siz是大小
int h[N], ph[N], hp[N], siz;
int n, idx = 0; //idx-每个元素的插入次序

// 堆的全新的交换方式
void heap_swap(int a, int b)
{
    //先由hp找到对应的插入次序，然后交换ph数组中记录的两个元素的下标
    swap(ph[hp[a]], ph[hp[b]]);
    swap(hp[a], hp[b]); //交换hp数组中记录的两个元素的插入次序
    swap(h[a], h[b]); // 最后交换堆中的两个元素
}

void down(int u)
{
    int t = u; //让t代指u以及其两个儿子（三个点）中的最大值，先初始化为u
    if (u * 2 <= siz && h[u * 2] < h[t]) t = u * 2;
    if (u * 2 + 1 <= siz && h[u * 2 + 1] < h[t]) t = u * 2 + 1;
    if (u != t)
    {
        heap_swap(u, t);
        down(t);
    }
}

void up(int u)
{
    while (u / 2 && h[u / 2] > h[u])
    {
        heap_swap(u, u / 2);
        u /= 2;
    }
}

int main()
{
    scanf("%d", &n);
    while (n--)
    {
        string op;
        int k, x;
        cin >> op;

        //插入一个数 x
        if (op == "I")
        {
            scanf("%d", &x);
            siz++;
            idx++;
            ph[idx] = siz; //堆尾插入，故第idx次插入的元素下标为siz
            hp[siz] = idx; //当前下标为siz的元素为第idx次插入
            h[siz] = x; //当前插入的值，即h[ph[idx]=x
            up(siz); //从堆尾向上调整
        }
        //输出当前集合中的最小值
        else if (op == "PM") printf("%d\n", h[1]);
        //删除当前集合中的最小值
        else if (op == "DM")
        {
            heap_swap(1, siz); //用堆尾元素覆盖头元素
            siz--;
            down(1);
        }
        //删除第 k 个插入的数
        else if (op == "D")
        {
            scanf("%d", &k);
            k = ph[k];
            heap_swap(k, siz);
            siz--;
            down(k), up(k); //只会执行一个
        }
        //修改第 k 个插入的数，将其变为 x
        else if (op == "C")
        {
            scanf("%d%d", &k, &x);
            k = ph[k];
            h[k] = x;
            down(k), up(k);
        }
    }

    return 0;

}

Bingxiu 2023-03-18 20:31

可以用multiset+unordered_map直接模拟，适合 $Saber$

#include<bits/stdc++.h>
using namespace std;
multiset<int> q;
unordered_map<int,int> f;
int n,k,x,l;
string s;
int main(){
    ios::sync_with_stdio(0),cin>>n;
    for(int i=1;i<=n;++i){
        cin>>s;
        if(s=="I") cin>>x,f[++l]=x,q.insert(x);
        else if(s=="PM") cout<<*q.begin()<<"\n";
        else if(s=="DM") q.erase(q.begin());
        else if(s=="D") cin>>k,q.erase(q.find(f[k]));
        else cin>>k>>x,q.erase(q.find(f[k])),q.insert(f[k]=x);
    }
}

acwing_71508 2023-12-19 11:49

saber啥意思

Bingxiu 2023-12-23 15:39 回复了 acwing_71508 的评论

AC Saber

acwing_go 2022-10-10 19:56

# Or2

_Agony 2024-03-06 11:29

你屁股怎么能这么翘

烟台陈坤 2022-11-26 16:06

ORZ

Attacca 2022-10-10 01:46

为什么vs2019用scanf会会报错

cher_h 2022-10-10 23:08

好像是微软觉得这个函数不安全，自己改成了scanf_s

虚设良辰 2023-01-14 11:20

可以加上这个宏定义#define _CRT_SECURE_NO_WARNINGS，就能用scanf了

Attacca 2023-01-17 14:26 回复了虚设良辰的评论

加上这个确实可以，谢谢

星火_6 2022-03-26 20:48

删除操作里面， k = ph[idx]; //必须要保存当前被删除结点的下标，这一点非常重要，不然ph[idx]在交换操作后可能会发生变化，从而导致后续up, down的传入参数有问题

孙雪岚 2025-04-06 14:32 · 黑龙江

一、ph[] 和 hp[] 的含义
ph[k] = a: 第 k 个插入的数在堆中的下标是 a
hp[a] = k: 堆中下标是 a 的节点是第 k 个插入的数

二、为什么要引入 ph[] 和 hp[]?
AcWing 839. 模拟堆和 AcWing 838. 堆排序最大的不同在于，需要记录第 k 个插入的数在堆中的位置，因而自然引出 ph[] 数组。

三、只引入 ph[] 为什么不行?
问题是交换节点 a 和 b，同时也需要交换节点 a 和 b 对应的 ph 值，即要找到 ph[i] = a 和 ph[j] = b，进行交换 swap(ph[i], ph[j])，这样就需要遍历 ph[]，时间复杂度高。
注意：ph[] 的有效下标一直到当前插入的数的个数，而非堆中的节点数目cnt，因此需要遍历的点更多，并且删除节点时，也必须删除该节点对应的 ph 值，否则会存在多个 ph[?] = a 的情况。

补充：
1、思路分析如下图
微信图片_20250406141725.jpg
2、尝试模拟了只用 ph[] 的情况，出现 Time Limited Exceeded，
代码如下：

#include <iostream>
#include <algorithm>
#include <string.h>

using namespace std;

const int N = 100010;

int h[N], cnt; // 用 size 不如用 cnt
int hp[N], ph[N]; // ph[k] 第 k 个插入的元素 在堆中的位置

void heap_swap(int a, int b)
{
    int i = 1, j = 1; // 记录结点 a 和 b 对应的 k 值（第几个插入的数）
    for(; i < N; i++){
        if(ph[i] == a) break;
    }
    for(; j < N; j++){
        if(ph[j] == b) break; 
    }
    swap(ph[i], ph[j]);
    swap(h[a], h[b]);
}

// 循环执行：在当前结点及其孩子节点中，选择最小值与当前节点交换
void down(int u)
{
    int t = u; // t 记录当前三者的最小值
    // 和左儿子比较
    if(u*2 <= cnt && h[u*2] < h[t]){
        t = u*2;
    }
    // 和右儿子比较
    if(u*2 + 1 <= cnt && h[u*2+1] < h[t]){
        t = u*2 + 1;
    }
    if(t != u){
        heap_swap(t, u);
        down(t);
    }
}

// 循环执行：如果比父节点小，则上移
void up(int u)
{
    while(u/2 && h[u/2] > h[u]){
        heap_swap(u/2, u);
        u = u/2;
    }
}

int main()
{
    int n, m = 0; // 记录是当前第几个插入的数

    scanf("%d", &n);

    while(n --){
        char op[5];
        int k, x;

        scanf("%s", op);
        if(!strcmp(op, "I")){ // strcmp 返回值：<0 表示 str1 < str2, =0 表示 str1 = str2, >0 表示 str1 > str2
            scanf("%d", &x);
            cnt ++;
            m ++;
            ph[m] = cnt, hp[cnt] = m;
            h[cnt] = x;
            up(cnt); // 没有采用数组建堆的O(n)方式，而是采用 插入到尾结点再 up() 调整 这一基本做法，时间复杂度更高
        }
        else if (!strcmp(op, "PM")){
            printf("%d\n", h[1]);
        }
        else if(!strcmp(op, "DM")){
            heap_swap(1, cnt);
            // 由于删除元素元素，结点 cnt 对应的 ph 无意义
            for(int i = 1; i < N; i++){
                if(ph[i] == cnt){
                    ph[i] = 0;
                    break;
                }
            }
            cnt --;
            down(1);
        }
        else if(!strcmp(op, "D")){
            scanf("%d", &k);
            k = ph[k];
            heap_swap(k, cnt);
            // 由于删除元素元素，结点 cnt 对应的 ph 无意义
            for(int i = 1; i < N; i++){
                if(ph[i] == cnt){
                    ph[i] = 0;
                    break;
                }
            }
            cnt --;
            down(k), up(k); // 至多只执行一个
        }
        else{
            scanf("%d%d", &k, &x);
            k = ph[k];
            h[k] = x;
            down(k), up(k);
        }
    }

    return 0;
}

Aspacey 2025-02-22 21:44 · 河北

其实理解完全没有那么难更没有为此写一篇题解建议好好学一下数据结构理论课对学习算法有大帮助

Joy_0 2025-03-18 20:51 · 湖南

有无推荐？

pfy 2024-08-04 20:24

交换前ph[hp[a]]=a, ph[hp[b]]=b

今日臭明日香 2024-05-14 18:21

else if(s==”D”){
cin>>x;

        heap_swap(ph[x],si);

        si--;

        down(ph[x]),up(ph[x]);


    }

为什么我这么写就会有问题呢？

不想实名上网了 2024-02-26 13:38

orz

acwing_54sb 2023-12-23 13:26

int ph[N], hp[N];
//ph[j] = k : 第j个插入点的下标是k； hp[k] = j : k下标表示的是第j个点插入的其中k是下标！
//ph作用很大很显然，是用来在位置j上存储一个数，表示它是第k个输进程序的。在数组发生改变时，或直接要求更改第k个插入时，输入的是k、是ph[j]=k的右值，但是我要改变的不是k，是想把k的位置j和另一个位置i上的值交换位置，所以现在的情况是只知道值k但是难以知道k对应的位置j，所以一个通过右值k找回下标的映射表hp[k] = j就应运而生了