树状数组 | Panjoel's Blog

先来看几个问题吧。

1.什么是树状数组？

顾名思义，就是用数组来模拟树形结构呗。那么衍生出一个问题，为什么不直接建树？答案是没必要，因为树状数组能处理的问题就没必要建树。和 $Trie$ 树的构造方式有类似之处。

2.树状数组可以解决什么问题

可以解决大部分基于区间上的更新以及求和问题。

3.树状数组和线段树的区别在哪里

树状数组可以解决的问题都可以用线段树解决，这两者的区别在哪里呢？树状数组的系数要少很多，就比如字符串模拟大数可以解决大数问题，也可以解决 $1+1$ 的问题，但没人会在 $1+1$ 的问题上用大数模拟。

4.树状数组的优点和缺点

修改和查询的复杂度都是 $O(logN)$ ，而且相比线段树系数要少很多，比传统数组要快，而且容易写。

缺点是遇到复杂的区间问题还是不能解决，功能还是有限。

一、树状数组介绍

二叉树大家一定都知道，如下图

每个位置只有一个方框，令每个位置存的就是子节点的值的和，则有

$C[1] = A[1];$

$C[2] = A[1] + A[2];$

$C[3] = A[3];$

$C[4] = A[1] + A[2] + A[3] + A[4];$

$C[5] = A[5];$

$C[6] = A[5] + A[6];$

$C[7] = A[7];$

$C[8] = A[1] + A[2] + A[3] + A[4] + A[5] + A[6] + A[7] + A[8];$

可以发现，这颗树是有规律的。

$C[i] = A[i - 2^k+1] + A[i - 2^k+2] + ... + A[i];$ //k为i的二进制中从最低位到高位连续零的长度

例如i = 8(1000)时候，k = 3，可自行验证。

这个怎么实现求和呢，比如我们要找前7项和，那么应该是 $SUM = C[7] + C[6] + C[4];$

而根据上面的式子，容易的出 $SUM_i= C[i] + C[i-2^{k1}]+C[(i - 2^{k1}) - 2^{k2}]+ .....;$

其实树状数组就是一个二进制上面的应用。

现在新的问题来了 $2^k$ 该怎么求呢，不难得出 $2^k = i$ $\&$ $(i^{i-1});$ 但这个还是不好求出呀，前辈的智慧就出来了， $2^k$ = i $\&$ $(-i);$

为什么呢？

这里利用的负数的存储特性，负数是以补码存储的，对于整数运算 $x$ $\&$ $(-x)$ 有

● $当x为0时，即0\&0，结果为0；$

●当 $x$ 为奇数时，最后一个比特位为1，取反加1没有进位，故 $x$ 和 $-x$ 除最后一位外前面的位正好相反，按位与结果为 $0$ 。结果为 $1$ 。

●当 $x$ 为偶数，且为 $2$ 的m次方时，x的二进制表示中只有一位是1（从右往左的第m+1位），其右边有m位0，故x取反加1后，从右到左第有m个0，第m+1位及其左边全是1。这样，x& (-x) 得到的就是x。

●当x为偶数，却不为2的m次方的形式时，可以写作x= y * ( $2^k$ )。其中，y的最低位为1。实际上就是把x用一个奇数左移k位来表示。这时，x的二进制表示最右边有k个0，从右往左第k+1位为1。当对x取反时，最右边的k位0变成1，第k+1位变为0；再加1，最右边的k位就又变成了0，第k+1位因为进位的关系变成了1。左边的位因为没有进位，正好和x原来对应的位上的值相反。二者按位与，得到：第k+1位上为1，左边右边都为0。结果为 $2^k$ 。

总结一下：x&(-x)，当x为0时结果为0；x为奇数时，结果为1；x为偶数时，结果为x中2的最大次方的因子。

而且这个有一个专门的称呼，叫做 $lowbit$ ，即取 $2^k$ 。

二、如何建立树状数组

上面已经解释了如何用树状数组求区间和，那么如果我们要更新某一个点的值呢，还是一样的，上面说了 $C[i] = A[i - 2^k+1] + A[i - 2^k+2] + ... + A[i]，$ 那么如果我们更新某个 $A[i]$ 的值，则会影响到所有包含有 $A[i]$ 位置。如果求 $A[i]$ 包含哪些位置里呢，同理有

$A[i] $包含于 $C[i + 2^k]、C[(i + 2^k) + 2^k]...；$

好，现在已经搞清楚了更新和求和，就可以来建树状数组了。如果上面的求和、更新或者lowbit步骤还没搞懂的化，建议再思考弄懂再往下看。

那么构造一个树状数组则为

int n;
int a[1005],c[1005]; //对应原数组和树状数组

int lowbit(int x){
    return x&(-x);
}

void updata(int i,int k){    //在i位置加上k
    while(i <= n){
        c[i] += k;
        i += lowbit(i);
    }
}

int getsum(int i){        //求A[1 - i]的和
    int res = 0;
    while(i > 0){
        res += c[i];
        i -= lowbit(i);
    }
    return res;
}

这样就构造了一个树状数组。下面看一道模板题目吧。

题目链接：https://vjudge.net/problem/HDU-1166

直接看代码吧

#include <bits/stdc++.h>
using namespace std;

int n,m;
int a[50005],c[50005]; //对应原数组和树状数组

int lowbit(int x){
    return x&(-x);
}

void updata(int i,int k){    //在i位置加上k
    while(i <= n){
        c[i] += k;
        i += lowbit(i);
    }
}

int getsum(int i){        //求A[1 - i]的和
    int res = 0;
    while(i > 0){
        res += c[i];
        i -= lowbit(i);
    }
    return res;
}

int main(){
    int t;
    cin>>t;
    for(int tot = 1; tot <= t; tot++){
        cout << "Case " << tot << ":" << endl;
        memset(a, 0, sizeof a);
        memset(c, 0, sizeof c);
        cin>>n;
        for(int i = 1; i <= n; i++){
            cin>>a[i];
            updata(i,a[i]);   //输入初值的时候，也相当于更新了值
        }

        string s;
        int x,y;
        while(cin>>s && s[0] != 'E'){
            cin>>x>>y;
            if(s[0] == 'Q'){    //求和操作
                int sum = getsum(y) - getsum(x-1);    //x-y区间和也就等于1-y区间和减去1-(x-1)区间和
                cout << sum << endl;
            }
            else if(s[0] == 'A'){
                updata(x,y);
            }
            else if(s[0] == 'S'){
                updata(x,-y);    //减去操作，即为加上相反数
            }
        }

    }
    return 0;
}

这就是最简单的点更新区间求和了。

三、树状数组的几种变式(区间更新，区间查询)

上面介绍的是最普通的单点更新，区间查询，但如果有些时候是区间更新，单点求和怎么半，又或是区间更新，区间求和怎么办。这里将介绍各种情况该怎么写。

如果上面的单点更新，区间查询还没看懂，建议再思考再往下看。

1.单点更新、单点查询

传统数组可做

2.单点更新、区间查询

已讲解，详细看上面

3.区间更新、单点查询

这就是第一个问题，如果题目是让你把x-y区间内的所有值全部加上k或者减去k，然后查询操作是问某个点的值，这种时候该怎么做呢。如果是像上面的树状数组来说，就必须把x-y区间内每个值都更新，这样的复杂度肯定是不行的，这个时候，就不能再用数据的值建树了，这里我们引入差分，利用差分建树。

假设我们规定 $A[0] = 0;$

则有 $A[i] = Σij = 1D[j];(D[j] = A[j] - A[j-1])，$ 即前面i项的差值和，这个有什么用呢？例如对于下面这个数组

$A[] = 1 2 3 5 6 9$
$D[] = 1 1 1 2 1 3$

如果我们把[2,5]区间内值加上2，则变成了

$A[] = 1 4 5 7 8 9$
$D[] = 1 3 1 2 1 1$

发现了没有，当某个区间 $[x,y]$ 值改变了，区间内的差值是不变的，只有 $D[x]$ 和 $D[y+1]$ 的值发生改变，至于为什么我想我就不用解释了吧。

所以我们就可以利用这个性质对 $D[]$ 数组建立树状数组，代码为：

 1 int n,m;
 2 int a[50005] = {0},c[50005]; //对应原数组和树状数组
 3 
 4 int lowbit(int x){
 5     return x&(-x);
 6 }
 7 
 8 void updata(int i,int k){    //在i位置加上k
 9     while(i <= n){
10         c[i] += k;
11         i += lowbit(i);
12     }
13 }
14 
15 int getsum(int i){        //求D[1 - i]的和，即A[i]值
16     int res = 0;
17     while(i > 0){
18         res += c[i];
19         i -= lowbit(i);
20     }
21     return res;
22 }
23 
24 int main(){
25     cin>>n;27     for(int i = 1; i <= n; i++){
28         cin>>a[i];
29         updata(i,a[i] - a[i-1]);   //输入初值的时候，也相当于更新了值
31     }
32   
33     //[x,y]区间内加上k
34     updata(x,k);    //A[x] - A[x-1]增加k
35     updata(y+1,-k);        //A[y+1] - A[y]减少k
36   
37     //查询i位置的值
38     int sum = getsum(i);
39 
40     return 0;
41 }

这样就把，原来要更新一个区间的值变成了只需要更新两个点。也很容易理解吧。

4.区间更新、区间查询

上面我们说的差值建树状数组，得到的是某个点的值，那如果我既要区间更新，又要区间查询怎么办。这里我们还是利用差分，由上面可知

$∑ni = 1A[i] = ∑ni = 1 ∑ij = 1D[j];$

则 $A[1]+A[2]+...+A[n]$

$= (D[1]) + (D[1]+D[2]) + … + (D[1]+D[2]+…+D[n]) $

$= n*D[1] + (n-1)*D[2] +... +D[n]$

$= n * (D[1]+D[2]+...+D[n]) - (0*D[1]+1*D[2]+...+(n-1)*D[n])$

所以上式可以变为 $∑ni = 1A[i] = n*∑ni = 1D[i] - ∑ni = 1( D[i]*(i-1) );$

如果你理解前面的都比较轻松的话，这里也就知道要干嘛了，维护两个数状数组 $，sum1[i] = D[i]，sum2[i] = D[i]*(i-1);$

int n,m;
int a[50005] = {0};
int sum1[50005];    //(D[1] + D[2] + ... + D[n])
int sum2[50005];    //(1*D[1] + 2*D[2] + ... + n*D[n])

int lowbit(int x){
    return x&(-x);
}

void updata(int i,int k){
    int x = i;    //因为x不变，所以得先保存i值
    while(i <= n){
        sum1[i] += k;
        sum2[i] += k * (x-1);
        i += lowbit(i);
    }
}

int getsum(int i){        //求前缀和
    int res = 0, x = i;
    while(i > 0){
        res += x * sum1[i] - sum2[i];
        i -= lowbit(i);
    }
    return res;
}

int main(){
    cin>>n;
    for(int i = 1; i <= n; i++){
        cin>>a[i];
        updata(i,a[i] - a[i-1]);   //输入初值的时候，也相当于更新了值
    }

    //[x,y]区间内加上k
    updata(x,k);    //A[x] - A[x-1]增加k
    updata(y+1,-k);        //A[y+1] - A[y]减少k

    //求[x,y]区间和
    int sum = getsum(y) - getsum(x-1);

    return 0;
}