关键词:三生素数;三生素数素率;三生素数常数;三生素数计算区间。
三生素数定义:如果P是素数,P+2也是素数,P+6还是素数,我们把这三个素数称为三生素数。
三生素数素率:是三生素数在自然数中分布的变化率。公式是:1/6(P-3)/P。(P为大于或等于5的素数)
三生素数常数:0.997331001139617
三生素数计算区间:27n^2。(n为自然数1;2;3;4;5.....)
三生素数有无穷多
三生素数虽然比双生素数少,但是,其优点是计算方便。尤其是三生素数的构成,前两个是差为2的双生素数。只要能够证明三生素数有无穷多,那么,双生素数有无穷多亦可顺理成章的证明。
本文是通过计算结果及其误差分析来证明三生素数有无穷多的。
在计算的时候,计算区间的n与三生素数素率中的n要一一对应。即第一个计算区间27对应P1=5;
即第二个计算区间108对应P2=7;.....。而三生素数常数:0.997331001139617 在每个计算区间都要用。
比如:
序号 素率 区间 计算值 实际值误差率
n (P-3)/P 27n^2 常数*素率*区间
1 6.6666666667 27 2.793 3 -6.92
2 3.8095238095 108 5.101 5 2.01
3 2.7705627706 243 7.712 8 -3.60
4 2.1312021312 432 10.180 10 1.80
5 1.7551076375 675 12.813 12 6.77
6 1.4779853789 972 15.325 15 2.17
7 1.2852046773 1323 17.955 18 -0.25
8 1.1522524693 1728 20.855 22 -5.20
9 1.0407441658 2187 23.698 25 -5.21
10 0.9563595037 2700 26.750 29 -7.76
11 0.8863819791 3267 29.878 30 -0.41
12 0.8245413759 3888 32.970 33 -0.09
13 0.7719110753 4563 36.126 37 -2.36
14 0.7282179956 5292 39.432 42 -6.11
15 0.6911899619 6075 42.875 45 4.72
16 0.6571970129 6912 46.302 47 -1.49
17 0.6277702810 7803 49.852 47 6.07
18 0.6012447762 8748 53.454 52 2.80
19 0.5765360868 9747 57.042 55 3.71
20 0.5546423113 10800 60.739 58 4.72
21 0.5345949989 11907 64.482 60 7.47
22 0.5165749427 13068 68.323 63 8.45
23 0.5005983981 14283 72.307 68 6.33
24 0.4857291387 15552 76.336 70 9.05
25 0.4715816881 16875 80.364 75 7.15
26 0.4583597716 18252 84.434 78 8.25
27 0.4457443651 19683 88.499 82 7.93
上表是误差率的第一个变化周期。本周期的特点是误差率波动大,最大正误差率为9.05 %;最大负误差率为-7.76 。
由下表可见,在第1020个区间及以后的全部区间,误差率的绝对值都小于1%。且波动很小:
序号 素率 区间 计算值 实际值 误差率
n (P-3)/P 27n^2 常数*素率*区间
1020 0.0691019996 28090800 19360.493 19545 -0.94
1021 0.0690765540 28145907 19391.329 19571 -0.92
1022 0.0690511613 28201068 19422.188 19605 -0.93
1023 0.0690257966 28256283 19453.065 19634 -0.92
1024 0.0690004536 28311552 19483.957 19670 -0.95
1025 0.0689751447 28366875 19514.869 19695 -0.91
1026 0.0689498822 28422252 19545.802 19726 -0.91
1027 0.0689246843 28477683 19576.763 19761 -0.93
1028 0.0688995262 28533168 19607.744 19794 -0.94
1029 0.0688743835 28588707 19638.740 19829 -0.96
1030 0.0688492804 28644300 19669.755 19861 -0.96
1031 0.0688241926 28699947 19700.785 19886 -0.93
在第7800个区间及以后的全部区间,误差率的绝对值都小于0.5%。且波动很小:
序号 素率 区间 计算值 实际值 误差率
n ( P-3)/P27n^2 常数*素率*区间
7800 0.0351716609 1642680000 576216.802 574621 0.28
7801 0.0351703359 1643101227 576342.845 574745 0.28
7802 0.0351690113 1643522508 576468.904 574878 0.28
7803 0.0351676870 1643943843 576594.975 575000 0.28
7804 0.0351663630 1644365232 576721.060 575117 0.28
7805 0.0351650392 1644786675 576847.154 575231 0.28
7806 0.0351637154 1645208172 576973.257 575362 0.28
7807 0.0351623918 1645629723 577099.370 575488 0.28
7808 0.0351610682 1646051328 577225.493 575603 0.28
7809 0.0351597456 1646472987 577351.639 575705 0.29
7810 0.0351584233 1646894700 577477.798 575825 0.29
在第12300个区间及以后的全部区间,误差率的绝对值都小于0.1%。且波动很小:
序号 素率 区间 计算值 实际值 误差率
n (P-3)/P 27n^2 常数*素率*区间
12300 0.0308622499 4084830000 1257306.712 1258142 -0.07
12301 0.0308615470 4085494227 1257482.518 1258288 -0.06
12302 0.0308608441 4086158508 1257658.336 1258445 -0.06
12303 0.0308601414 4086822843 1257834.165 1258603 -0.06
12304 0.0308594387 4087487232 1258010.003 1258766 -0.06
12305 0.0308587360 4088151675 1258185.851 1258945 -0.06
12306 0.0308580335 4088816172 1258361.709 1259115 -0.06
12307 0.0308573310 4089480723 1258537.577 1259307 -0.06
12308 0.0308566285 4090145328 1258713.453 1259490 -0.06
12309 0.0308559261 4090809987 1258889.339 1259681 -0.06
12310 0.0308552237 4091474700 1259065.235 1259861 -0.06
12311 0.0308545216 4092139467 1259241.147 1260023 -0.06
综上所述,计算结果的误差率越来越小,总体上是正负交错,趋向于0。
有几点说明:
①素率公式究竟是1/6(P-3)/P,还是(P-3)/P?
这里采用的是前者。
全部公式:∏(N)≈0.997811001139616* 27n^2*1/6∏﹙1-3/pn﹚+1
最后的+1,是指第一组三生素数5;7;11。它不属于公式计算范围内。第一组三生素数5;7;11之所以特殊,是因为除了第一组三生素数5;7;11之外,其余三生素数中的首项都可以写成:30x+11或者30x+17这两种形式。
②为什么用27n^2来分割计算区间?
由于素数分布的复杂性,人们不可能找到一个恒等式来表示素数与自然数之间的关系。因此,取得一个误差很小的近似值是十分重要的。
用27n^2来分割计算区间,此时误差最小。
③常数0.997331001139617是为了让极限误差趋于0而设计的。
计算结果的误差率越来越小不仅是事实,还可以配合上下界公式计算。
上界公式:在公式中加一个上界系数使其计算结果永远为上界值;
下界公式:在公式中加一个上界系数使其计算结果永远为下界值。
这样一来,产生几个新的概念:
上界理论误差率:是上界系数与常数之比;此为正值。
下界理论误差率:是下界系数与常数之比;此为负值。
极限理论误差率: 是上界系数与 下界系数之比;此为正值。
实际极限误差率:是上界误差率与下界误差率的绝对值之和。
最后,出现了应该有趣的现象:
(1)上界理论误差率在任何区间都是+11.5。下界理论误差率在任何区间都是-11.5%
(2)理论极限误差率永远大于任意区间的实际最大误差率的绝对值。
(3)上界实际误差率永远为正值,下界实际误差率永远为负值。其绝对值之和永远小于极限理论误差率。
因此,我们可以得出结论:
(1)由于上界理论误差率与下界理论误差率在任何区间,都是绝对值相等的11.5%,
上,下界实际误差率的极限就是11.5%。因此可知,近似计算的极限理论误差率是0;
事实上,当N=1224963时,近似误差率为0.03%;上界实际误差率为11.53%;下界实际误差率为-11.47%。此时,三个误差率都接近极限值。
当N=1825200时,近似误差率为0.01%;上界实际误差率为11.51%;下界实际误差率为-11.49%。此时,三个误差率更接近极限值。