Codeforces 1103 E. Radix sum

题目链接 (opens new window)

神题。

题意:给定一个长度为105的幂级数a,将卷积的下标运算定义为十进制下的不进位加法,求ak258的结果。k109

题解:

考虑在复数域下的做法,那么根据卷积的复合只要将a看作是5维的、每一维长度为10的幂级数,对每一维做长度为10的循环卷积即可。然而现在是取模甚至不是对质数取模。那么我们需要关心两个问题:

1、如何解决求逆元的问题。

2、如何在模意义下找到10次单位根,即ω10

第一个问题比较好解决,考虑在计算过程中,唯一需要做除法的时候就是在IDFT之后将所有数字除以105,那么考虑到5的逆元是存在的,直接计算即可。现在我们的问题是要除以25。那么我们显然可以通过unsigned long long求得x25mod264的结果,考虑如何求出xmod258。我们知道这样一个事实:

如果x25mod264y,那么x24mod264只可能为y2或者y2+263,发现两者在模263意义下显然是等价的,于是y2就是x24mod263,以此类推,y32就是xmodx59,虽然不知道为什么出题人要开258,但是我们只要再取模一下就可以得到我们想要的结果了。

现在的问题是在模意义下找到ω10。这个问题有些困难,但是我们可以发现ω105在模264意义下是存在的,即1。于是我们只要知道ω102=ω5,就可以计算出ω10

一个比较简单的解决办法是,我们设x=ω5,将普通的数字转化为形式幂级数。这样做虽然可以,但是在相乘的过程中显然次数会非常爆炸。但是我们同时可以注意到一个简单的事实:ω55=1,即x51=0,也就是说我们的形式幂级数中x51的倍数值为0,因此其实都是不必要的。于是我们可以将形式幂级数放在模x51的多项式环下,这样我们的次数界可以保持在5并且依然保证这么做的正确性。

同时我们可以发现,x=1x51的值也为0,这其实是不必要的。于是我们还可以将模多项式改为x51x1=1+x+x2+x3+x4,可以发现这个多项式的根只有ω5,ω52,ω53,ω544个无理数,我们接下来的解法会用到这一点。

于是我们将模1+x+x2+x3+x4的多项式环作为一种数据类型,直接进行DFT后计算每一项的快速幂,再进行IDFT即可。现在我们还有最后一个疑问是得到的每一个答案中xx2或者x3的系数会不会非0,如果出现这种情况似乎比较棘手。但是接下来我们可以证明这三项的系数一定是0

DFT的正确性可知,我们计算得到的答案和n2暴力的答案应该是一样的。而n2暴力的答案都是整数,因此我们得到的答案实际上也必定是整数。也就是说,假如某个答案xx2或者x3的系数有至少一个非0,那我们设它们分别为a1,a2,a3,于是我们可以得知a1x+a2x2+a3x3一定是一个整数,设其为y,那么也就是说我们可以满足方程y+a1x+a2x2+a3x3=0,将其因式分解为ki(xri)的形式,其中k是一个非0整数,ri是这个方程的某个根,可以得知其次高项的系数为k(iri),同时由前面的结论可知根中至少包含ω5,ω52,ω53,ω54中的1个,同时受次数的限制最多包含3个。可以发现无论怎样选取,它们相加的结果也必然是无理数,于是可证明该方程不存在。于是a1,a2,a3都为0

代码:

#include<cstdio>
#include<cstring>
typedef unsigned long long ull;
const ull mod=1ll<<58;
const ull inv5=14757395258967641293ull;
struct complex
{
	ull a[4];
	complex(ull x=0)
	{
		a[0]=x;a[1]=a[2]=a[3]=0;
		return;
	}
	inline complex operator+(const complex &th)
	{
		complex res;
		res.a[0]=a[0]+th.a[0];
		res.a[1]=a[1]+th.a[1];
		res.a[2]=a[2]+th.a[2];
		res.a[3]=a[3]+th.a[3];
		return res;
	}
	inline complex operator-(const complex &th)
	{
		complex res;
		res.a[0]=a[0]-th.a[0];
		res.a[1]=a[1]-th.a[1];
		res.a[2]=a[2]-th.a[2];
		res.a[3]=a[3]-th.a[3];
		return res;
	}
	inline complex operator*(const complex &th)
	{
		ull b[7];
		b[0]=a[0]*th.a[0];
		b[1]=a[0]*th.a[1]+a[1]*th.a[0];
		b[2]=a[0]*th.a[2]+a[1]*th.a[1]+a[2]*th.a[0];
		b[3]=a[0]*th.a[3]+a[1]*th.a[2]+a[2]*th.a[1]+a[3]*th.a[0];
		b[4]=a[1]*th.a[3]+a[2]*th.a[2]+a[3]*th.a[1];
		b[5]=a[2]*th.a[3]+a[3]*th.a[2];
		b[6]=a[3]*th.a[3];
		b[5]-=b[6];b[4]-=b[6];b[3]-=b[6];b[2]-=b[6];b[6]=0;
		b[4]-=b[5];b[3]-=b[5];b[2]-=b[5];b[1]-=b[5];b[5]=0;
		b[3]-=b[4];b[2]-=b[4];b[1]-=b[4];b[0]-=b[4];b[4]=0;
		complex res;
		res.a[0]=b[0];res.a[1]=b[1];res.a[2]=b[2];res.a[3]=b[3];
		return res;
	}
}w10[10];
inline complex qpow(complex a,int b)
{
	complex res=w10[0];
	for(;b;a=a*a,b>>=1)
		if(b&1)
			res=res*a;
	return res;
}
inline void init()
{
	register int i;
	w10[0].a[0]=1;w10[1].a[3]=-1;
	for(i=2;i<10;i++)
		w10[i]=w10[i-1]*w10[1];
	return;
}
const int N=1e5+5;
const int pow10[]={1,10,100,1000,10000,100000,1000000};
int n;
complex a[N],b[10];
inline void hddft()
{
	register int d,i,j,k;
	for(d=0;d<5;d++)
	{
		for(i=0;i<100000;i++)
			if((i/pow10[d])%10==0)
			{
				memset(b,0,sizeof(b));
				for(j=0;j<10;j++)
					for(k=0;k<10;k++)
						b[j]=b[j]+a[i+k*pow10[d]]*w10[j*k%10];
				for(j=0;j<10;j++)
					a[i+j*pow10[d]]=b[j];
			}
	}
	return;
}
inline void hdidft()
{
	register int d,i,j,k;
	for(d=0;d<5;d++)
	{
		for(i=0;i<100000;i++)
			if((i/pow10[d])%10==0)
			{
				memset(b,0,sizeof(b));
				for(j=0;j<10;j++)
					for(k=0;k<10;k++)
						b[j]=b[j]+a[i+k*pow10[d]]*w10[(10-j*k%10)%10];
				for(j=0;j<10;j++)
					a[i+j*pow10[d]]=b[j];
			}
	}
	ull w=inv5*inv5*inv5*inv5*inv5;
	for(i=0;i<100000;i++)
		a[i]=a[i]*w;
	return;
}
signed main()
{
	int x;
	register int i;
	init();
	scanf("%d",&n);
	for(i=1;i<=n;i++)
		scanf("%d",&x),a[x].a[0]++;
	hddft();
	for(i=0;i<100000;i++)
		a[i]=qpow(a[i],n);
	hdidft();
	for(i=0;i<n;i++)
		printf("%llu\n",(a[i].a[0]/32)%mod);
	return 0;
}