Die Goldbach-Vermutung aus Laiensicht

Problemstellung

Die starke Goldbach-Vermutung (deutsch) ist eines der erstaunlichsten und faszinierendsten Probleme der Zahlentheorie. Sie lautet ganz simpel: Jede gerade Zahl n > 2 ist als Summe zweier Primzahlen p, q darstellbar, also
n = p + q   (∀ n = 2z, n > 2)
Die ersten Zerlegungen sind zB
4 = 2 + 2
6 = 3 + 3
8 = 3 + 5
10 = 3 + 7 = 5 + 5
...
Wir bezeichnen hier als Goldbachzahl ngz(z) die Anzahl der Zerlegungen der natürlichen Zahl z als z = ½(p+q) mit Primzahlen p ≤ q.
Die Tabelle der ersten 100 Goldbachzahlen ist (computergeneriert):

Tab. 1

znngz(z)
1 2 0
2 4 1
3 6 1
4 8 1
5 10 2
6 12 1
7 14 2
8 16 2
9 18 2
10 20 2
znngz(z)
11 22 3
12 24 3
13 26 3
14 28 2
15 30 3
16 32 2
17 34 4
18 36 4
19 38 2
20 40 3
znngz(z)
21 42 4
22 44 3
23 46 4
24 48 5
25 50 4
26 52 3
27 54 5
28 56 3
29 58 4
30 60 6
znngz(z)
31 62 3
32 64 5
33 66 6
34 68 2
35 70 5
36 72 6
37 74 5
38 76 5
39 78 7
40 80 4
znngz(z)
41 82 5
42 84 8
43 86 5
44 88 4
45 90 9
46 92 4
47 94 5
48 96 7
49 98 3
50 100 6
znngz(z)
51 102 8
52 104 5
53 106 6
54 108 8
55 110 6
56 112 7
57 114 10
58 116 6
59 118 6
60 120 12
znngz(z)
61 122 4
62 124 5
63 126 10
64 128 3
65 130 7
66 132 9
67 134 6
68 136 5
69 138 8
70 140 7
znngz(z)
71 142 8
72 144 11
73 146 6
74 148 5
75 150 12
76 152 4
77 154 8
78 156 11
79 158 5
80 160 8
znngz(z)
81 162 10
82 164 5
83 166 6
84 168 13
85 170 9
86 172 6
87 174 11
88 176 7
89 178 7
90 180 14
znngz(z)
91 182 6
92 184 8
93 186 13
94 188 5
95 190 8
96 192 11
97 194 7
98 196 9
99 198 13
100 200 8
Numerische Untersuchungen mit Computern zeigen, daß für größere Zahlen n die Anzahl der möglichen Zerlegungen kontinuierlich (aber nicht monoton) ansteigt. ZB. findet man auf der Wikipedia-Seite die Grafik für die Anzahl der Zerlegungen bis n = 2z = 1,000,000:

Abb. 1

alt

Sie zeigt, daß zB für z > 400,000 (n > 800,000) die Goldbach-Zahl ngz(z) stets größer als 3,000 ist, und weiter unbegrenzt ansteigt [Die Punktwolke sieht zwar nicht so aus, aber es ist tatsächlich eine zahlentheoretische Funktion]. Zum Beweis der Goldbach-Vermutung genügt jedoch schon eine einzige Zerlegung! (Die Goldbach-Vermutung lautet damit: Es gibt keine natürliche Zahl z > 0 für die ngz(z) = 0 ist.) Zum Beweis der GV muß man für jede Zahl z einen Algorithmus angeben, der mind. eine Zerlegung liefert; zu ihrer Widerlegung (hypothet.) genügt eine Zahl.
Das Streifen-Muster in dieser Punktwolke ist heuristisch gut zu erklären: Das Primzahltheorem besagt, daß eine zufällig gewählte Zahl m mit der Wahrscheinlichkeit 1/ln(m) eine Primzahl ist. Die Wahrscheinlichkeit, daß m und (n-m) gleichzeitig PZ sind, ist also 1/ln(m)ln(n-m). [Diese Rechnung setzt voraus, daß die zwei Wahrscheinlichkeiten unabhängig voneinander sind, was natürlich nicht erfüllt ist.]
Trotzdem ergibt die Funktion f0(n) = n/ln²(n) eine sehr gute Parametrisierung der Goldbach-Zahlen.

Eigene numerische Experimente

[Mit Numerik kann man keine math. Sätze beweisen, aber sie kann helfen, solche Sätze aufzuspüren.]
Wir benutzen als unabh. Variable die Zahl z = n/2, die alle natürl. Zahlen z > 0 durchläuft und suchen alle Zerlegungen z = ½(p+q), p &le q.

Analyse der Daten

Es fällt auf, daß die Streuung der GZ, wenn man eine Fit-Kurve ∼ n/ln²(n) anpaßt, sehr groß ist. Allerdings ist ein deutliches Streifenmuster zu erkennen, das man evtl. erklären kann. Dazu klassifizieren wir die Zahlen z nach der Teilerfunktion σ0(z) (= Anzahl der Teiler von z, einschließlich 1 und z; für alle Primzahlen p gilt folglich zB. σ0(p) = 2). Das ergibt die folgende Grafik (Beachte, die x-Achse ist um den Faktor 2 gegenüber Abb. 1 verlängert, weil n=2z!).

Abb. 2

alt

Hier sind die Punktfarben nach σ0(z) gewählt (oberer Farbbalken). Außerdem sind drei Kurven f(z) = c f0(z) = c 2z/ln²(z) für c = [0.7, 1.5, 3.0] eingezeichnet.
Wählt man nur die Teilmenge der Zahlen mit σ0(z) &le 4 aus, erkennt man klare Muster:

Abb. 3

alt

Rot (σ0(z)=2) sind alle Primzahlen z = p (diese haben natürlich immer ua. die triviale Zerlegung 2p = p + p). Orange (σ0(z)=4) sind alle Zahlen der Form z = p1 p2, p1 ≠p2 und z = p13.
Man erkennt, daß die Varianz der Goldbach-Zahlen innerhalb der einzelnen Klassen deutlich geringer ist. Die einzelnen orangen Streifen entsprechen den Fällen p1 = 2,3,5,... (Es gibt nur 168 Zahlen z < 1,000,000 mit σ0(z)=3; sie haben die Darstellung z = p12.)
Eine noch bessere Klassifikation der Goldbach-Zahlen ergibt sich, wenn man in der Grafik als unabh. Variable anstelle von z die Teilerfunktion σ1(z) benutzt (= Summe der Teiler von z, einschließlich 1 und z; der x-Bereich ist entsprechend größer).

Abb. 4

alt

Ein Gnuplot aller Zerlegungen der ersten 1,000,000 PZ ergibt zB. einen optimalen Fit (der Koeffizient im Logarithmus wurde ausprobiert) mit ngz(p) ≈ f(p) = 1.3115⋅p/ln²(0.666⋅p) mit einer Standard-Abweichung von δ = 112.7 und einer max. Abweichung δmax=648.1 (für p=14,395,261, ngz(p)=72,406). Erstaunlich ist die sehr geringe Streuung der Punkte (im Vergleich zu oben). Die max. rel. Abweichung ist kleiner als 1% und wird für größere p immer kleiner.

Abb. 5

alt

Eine Histogramm-Darstellung der Verteilung der Goldbach-Zahlen über f = c f0(n) = cn/ln²(0.666⋅n) zeigt klare Maxima für den Quotienten c = 1.3116, 2.6232 und ein breites Minimum bei c ≈ 2.45. Die beiden Maxima fallen mit denen von σ0(z) = 2,4 zusammen.

Abb. 6

alt

Auch hier sind die Histogramme der Teilmengen σ0(z) = 2,4,6,8,10 dargestellt, wobei für 2 eine eingipflige VF zu erkennen ist (mit Max bei 1.3116). Die absoluten Minima und Maxima der Werte von c(z) sind cmin = 0.160 (für z = 3) und cmax = 5.426 (für z = 510510 = 2⋅3⋅5⋅7⋅11⋅13⋅17).
Der Anfang und das Ende der Zahlen-Tabelle (aufsteigend nach c soriert) zeigt diese (für alle z < 1,000,000):

Tab. 2

alt

Tab. 3

alt
Das Ende der Tabelle legt ein simples Verfahren zum Finden der Zahlen mit max. Quotienten c nahe, als Produkt aller PZ kleiner als eine gegebenen PZ: z = 3⋅5⋅7⋅11⋅13⋅17⋅⋅⋅


Das obige Schema läßt sich verallgemeinern, indem man numerisch die Zerlegungen der Zahlen z = f ⋅ p (f=1,2,3,...) bestimmt. Man erhält folgende beste Fits (für die Zahlen z < 7,700,000):

Tab. 4

Fit der Goldbachzahlen von z=fp mit z ln²(0.66z)
fzc δ
1,2,4,8 2n p, n ≥ 0 1.3112 82.5
3,6,9 2n 3m p, n ≥ 0, m > 0 2.6223109.5
5,10 2n 5m p, n ≥ 0, m > 0 1.7482 92.4
7 2n 7m p, n ≥ 0, m > 0 1.5734 88.3
Es ist sehr bemerkenswert, daß die Fits für verschiedene f nahezu identisch sind (zB für f = 1,2,4,8), obwohl die entsprechenden Mengen {z} natürlich disjunkt sind (bis auf die ersten max. 3 Elemente). Sie betrifft sowohl die Koeffizienten c als auch Varianzen und den Koeffizienten im Logarithmus (der - per Hand optimiert - für alle f den Wert ≈ 0.666 hat). Es wäre schön, Erklärungen für die offenkundigen Relationen c(k) ≈ c(2k), c(3) ≈ 2c(1), c(5) ≈ 4/3c(1), c(7) ≈ 6/5c(1), (und den ln-Koeff ≈ 2/3) zu haben. Die naheliegende Vermutung lautet c(p) ≈ (p-1)/(p-2)c(1).
Die obige Identität der Fits ist leicht mißzuverstehen: Sie bedeutet nicht, daß zb z = p und z = 2⋅p eine näherungsweise gleiche Zerlegungszahl haben, sondern, daß für z = p und für eine Primzahl q, für die gilt p ≈ 2⋅q, die Zerlegungszahl näherungsweise gleich ist, also ngz(p) ≈ ngz(2q) für p ≈ 2⋅q.
Ein Auszug aus der Tabelle verdeutlicht das:

Tab. 5

p ngz(p) ngz(2p) ngz(3p) ngz(4p) ngz(5p) ngz(6p) ngz(7p) ngz(8p) ngz(9p) ngz(10p)
...
100003 1071 1869 5306 3372 5421 9555 6405 6014 13493 9688
100019 1045 1878 5279 3386 5485 9467 6495 5967 13306 9757
100043 1060 1867 5256 3357 5456 9530 6527 6013 13366 9684
100049 1072 1896 5284 3357 5393 9540 6487 6007 13334 9801
...
200003 1907 3323 9561 6024 9601 17108 11641 10848 23976 17583
200009 1897 3343 9387 6122 9757 16910 11591 10910 24034 17607
200017 1872 3348 9474 5969 9781 17144 11603 10940 24104 17575
...
300007 2595 4750 13309 8536 13730 24185 16486 15348 34275 24900
300017 2682 4729 13221 8484 13728 24051 16414 15408 34184 24963
300023 2612 4693 13341 8490 13674 24088 16545 15439 34282 24888
...
400009 3325 5980 17058 10906 17522 31104 21117 19666 43522 31953
400031 3358 6004 17063 10913 17518 30671 21096 19805 43706 32032
400033 3384 6030 17064 10938 17461 30847 21114 19796 43822 31899
...

Das empirisch gewonnene Muster läßt sich weiter verallgemeinern für Primzahlprodukte, wenn man die Tabelle der Fits erweitert für größere Faktoren f = 11..25 (hier bis p ≤ 33,933,979 um mehr samples zu haben): [Wenn man für jedes f einzeln den optimalen ln-Koeffizient bestimmt (minimale Standardabweichung), erhält man optimale Werte von lf = 0.673 - 0.676, im Mittel lf ≈ 0.6745]

Tab. 6

Fit der Goldbachzahlen von z=fp mit z/ln²(0.6745z)
fsamplespmax c(f)c(f)/c(1) δ dmax
1 2085615 33933979 1.3138 1.000 160.5 1014.4
2 1089318 16966991 1.3138 1.000 160.2 1039.7
3 745696 11311319 2.6276 2.000 213.5 1464.4
4 570075 8483479 1.3138 1.000 160.0 950.3
5 463046 6786761 1.7517 1.333 179.4 1088.8
6 390754 5655659 2.6276 2.000 213.4 1232.7
7 338543 4847699 1.5766 1.200 171.5 973.8
8 299043 4241723 1.3138 1.000 160.0 964.5
9 268043 3770381 2.6276 2.000 213.0 1168.0
10 243094 3393373 1.7517 1.333 179.1 961.2
11 222479 3084901 1.4598 1.111 165.5 1085.1
12 205267 2827823 2.6276 2.000 212.9 1254.7
13 190552 2610287 1.4332 1.091 164.8 1058.4
14 177918 2423851 1.5766 1.200 171.1 1053.9
15 166927 2262233 3.5035 2.667 236.8 1300.5
16 157246 2120863 1.3138 1.000 159.5 909.2
17 148650 1996109 1.4014 1.067 162.5 977.9
18 141001 1885207 2.6276 2.000 213.7 1279.2
19 134091 1785977 1.3911 1.059 162.1 911.8
20 127902 1696697 1.7517 1.333 179.2 983.8
21 122253 1615891 3.1531 2.400 226.9 1342.5
22 117137 1542451 1.4598 1.111 164.9 939.5
23 112415 1475387 1.3764 1.048 162.0 1033.8
24 108092 1413889 2.6276 2.000 213.4 1236.6
25 104074 1357351 1.7517 1.333 179.2 1048.3
Man sieht sofort, daß zB gilt c(15)/c(1) = c(3⋅5)/c(1) = 2.667 ≈ 2 ⋅ 4/3, oder c(21)/c(1) = 2 ⋅ 6/5, und allgemein für zwei PZ p,q ≠ 2: c(p⋅q)/c(1) = c(p)/c(1) ⋅ c(q)/c(1) = (p-1)/(p-2) ⋅ (q-1)/(q-2).

Versuch der Reduktion der Streuung

Mit einfachen Worten (nicht mathematisch exakt) ausgedrückt, kann man dieses Ergebnis auch so formulieren: Die Goldbachzahl einer Zahl, die zB. durch die Primzahl p = 3 teilbar ist, ist etwa (p-1)/(p-2) = 2 mal so groß, wie die einer etwa gleichgroßen Zahl, die nicht durch 3 teilbar ist (wenn alle anderen Primteiler unberücksichtigt bleiben können - was natürlich idR nicht der Fall ist).
Das legt die Definition einer (neuen?) zahlentheoretischen Funktion ν(z) ≥ 1.0 nahe: ν(z) := ∏ (pi-1)/(pi-2), als das Produkt über alle Primteiler (pi ≠ 2, pi|z) von z. Damit definieren wir normierte Goldbachzahlen gemäß n*gz(z) := ngz(z)/ν(z).
Für diese normierten GZ ergibt sich folgende Grafik (die y-Skala ist der besseren Auflösung wegen gegenüber der Abb. 2 um den Faktor 4 vergrößert):

Abb. 7

alt

Den direkten Vergleich der GZ (rot) mit den NGZ (grün) zeigt die folgende Abb. bis z = 1,000,000 :

Abb. 8

alt

Das entsprechende Histogramm der normierten GZ zeigt klassische Gaußverteilungen (hier ist die c*-Skala im Vergleich zu Abb. 6 verkürzt), mit einem Minimum von c*min = 0.08 (für z=3) und Maximum von c*max = 1.652 (für z=71), die auch unabhängig von σ0 zu sein scheinen (visuell).

Abb. 9

alt

Ein Ausschnitt einer Tabelle, bei der diese Normierung angewandt wird, ergibt zB (die Spalten mit dem '*' kennzeichnen die entsprechenden normierten Werte):

Tab. 7

alt

Eine Auflistung der ersten 1,000,000 GZ zeigt, daß die Intervalle der normierten c* für größer werdende z immer enger werden:

Tab. 8

Fit der normierten Goldbachzahlen mit z/ln²(0.666z)
z-Intervall c*min (bei z) c*max (bei z)
3 - 49999 0.0798 3 1.6516 71
50000 - 99999 1.2086 72064 1.3981 53993
100000 - 149999 1.2393 142684 1.3868 103567
150000 - 199999 1.2499 172751 1.3747 185141
200000 - 249999 1.2497 239566 1.3666 200726
250000 - 299999 1.2532 265411 1.3648 269261
300000 - 349999 1.2590 303904 1.3594 302936
350000 - 399999 1.2606 361486 1.3626 356216
400000 - 449999 1.2669 409246 1.3584 433781
450000 - 499999 1.2664 477329 1.3562 469757
500000 - 549999 1.2673 522326 1.3510 524350
550000 - 599999 1.2703 562924 1.3521 558091
600000 - 649999 1.2701 612022 1.3522 630068
650000 - 699999 1.2682 685291 1.3499 677762
700000 - 749999 1.2754 718456 1.3509 704294
750000 - 799999 1.2719 791299 1.3453 786152
800000 - 849999 1.2760 841546 1.3492 847472
850000 - 899999 1.2764 899629 1.3441 859589
900000 - 949999 1.2772 915253 1.3415 914477
950000 - 999999 1.2772 954094 1.3448 972347

Um den optimalen Koeffizienten im Logarithmus ln(k ⋅ z) genauer zu bestimmen (bisher benutzt k ≈ 0.6745), berechnen wir die Streuung der Differenzen
δ(k) = sqrt(∑ |n*gz(z) - c*z/ln²(k ⋅ z)|²/n),   z = 3 ... 1,000,000
für verschiedene k=0.6,..., 0.8, und erhalten folgende Tabelle (dmax ist die maximale Differenz in der Summe):

Tab. 9

Fit des Koeffizienten k in z/ln²(kz)
k c* δ dmax bei z
0.600 1.2899 28.463 187.7 972347
0.605 1.2915 28.445 187.4 972347
0.610 1.2932 28.427 187.2 972347
0.615 1.2948 28.411 187.0 972347
0.620 1.2964 28.396 186.7 972347
0.625 1.2980 28.382 186.5 972347
0.630 1.2996 28.370 186.3 972347
0.635 1.3012 28.358 186.0 972347
0.640 1.3028 28.348 185.9 847472
0.645 1.3044 28.338 185.8 847472
0.650 1.3059 28.330 185.6 847472
0.655 1.3075 28.322 185.5 847472
0.660 1.3090 28.316 185.4 847472
0.665 1.3105 28.310 185.3 847472
0.670 1.3120 28.306 185.1 847472
0.675 1.3135 28.302 185.0 847472
0.680 1.3150 28.299 184.9 847472
0.685 1.3165 28.297 184.8 847472
0.690 1.3179 28.296 184.7 847472
0.695 1.3194 28.295 184.6 847472
0.700 1.3208 28.296 184.7 990586
0.705 1.3223 28.297 184.9 990586
0.710 1.3237 28.299 185.2 990586
0.715 1.3251 28.302 185.4 990586
0.720 1.3265 28.305 185.6 990586
0.725 1.3279 28.309 185.8 990586
0.730 1.3293 28.314 186.0 990586
0.735 1.3307 28.319 186.2 990586
0.740 1.3321 28.325 186.4 990586
0.745 1.3335 28.332 186.6 990586
0.750 1.3348 28.339 186.8 990586
0.755 1.3362 28.347 187.0 990586
0.760 1.3375 28.355 187.2 990586
0.765 1.3388 28.365 187.4 990586
0.770 1.3402 28.374 187.6 990586
0.775 1.3415 28.384 187.8 990586
0.780 1.3428 28.395 188.0 990586
0.785 1.3441 28.406 188.2 990586
0.790 1.3454 28.418 188.4 990586
0.795 1.3467 28.430 188.6 990586

Das Optimum (minimale Streuung &delta) liegt bei k = 0.695 und der entspr. Koeff ist c* = 1.3194. Das Ergebnis dieser ganzen Rechnungen kann man zusammenfassen zu folg. Aussage:
Die Goldbachzahl einer gegebenen Zahl z ist ungefähr ngz(z) ≈ 1.3194 ⋅ν(z) ⋅ z/ln²(0.695 ⋅ z), wobei ν(z) := ∏ (p-1)/(p-2) das Produkt über alle Primteiler (p ≠ 2, p|z) von z ist.

"Reduzierte" Goldbachzahlen (1.7.12)

[Die ursprüngl. Idee war, die Reduktion Modulo (4) auszunutzen, um die Quadratsummen-Zerlegung der PZ zu bestimmen, denn alle PZ p ≡ 1 (4) lassen sich als Summe von 2 Quadraten darst., und man erhält damit eine Darst. von 2z als Summe von 4 Q. Es zeigte sich aber eine andere interessante Eigenschaft bzgl. der Normierung (s.u.)]
Zur Erklärung des oben numerisch gefundenen Gesetzes der Approximation der GZ untersuchen wir, wie oft sich eine Zahl n=2z als Summe von bestimmten Teilmengen der PZ darstellen läßt, hier bspw. den linearen Teilmengen modulo (m), definiert als Pr := {p}, p ≡ r(m), die wir hier bezeichnen als ngz(z,Pr²) also z = ½ (p1 + p2), wobei p1 ≤ p2, (p1, p2) ∈ (Pr,Pr) := Pr².
Analog definieren wir die "gemischten" reduzierten GZ, als ngz(z,PrPr'), (r ≠ r') als Anzahl der Darst. von z = ½ (p1 + p2), wobei p1 ≤ p2, (p1, p2) ∈ (Pr,Pr') := PrPr'.
(Man beachte, daß die Produktmengen disjunkt sind: PrPr' ∩ Pr'Pr = ∅, weil wir p1 ≤ p2 vorausgesetzt haben).
Da per Definition alle RGZ &ge 0 sind, genügt es zum Beweis der Goldbach-Vermutung zu zeigen, daß für jedes z eine einzige RGZ ngz(z,PrPr') > 0 existiert.

Reduktion Modulo (4)

Die Menge der PZ zerfällt zB in die 2 Teilmengen P1 = {p}, p ≡ 1(4) und P3 = {p}, p ≡ 3(4) (die Primzahl 2 kann hier außer acht gelassen werden).
Mit der Menge P1 allein sind alle geraden Zahlen z = 2m gar nicht darstellbar, da 1 ⊕ 1 ≡ 2 ≠ 0 (4) und alle ungeraden Zahlen z = 2m+1 haben die 2 Darstellungsformen P1P1 und P3P3, da 1 ⊕ 1 ≡ 3 ⊕ 3 ≡ 2(4) . Es gilt offensichtlich (für ungerades u): ngz(u) = ngz(u,P1²) + ngz(u,P3²), und für alle geraden g gilt ngz(g) = ngz(g,P1P3) + ngz(g,P3P1).)
Numerische Tests zeigen, daß alle ungeraden Z. durch P3², und auch alle (außer den vier Zahlen z=3,7,19,31) durch P1² darstellbar sind.
Eine Tabelle der ersten GZ lautet (GZ-4.dat):

Tab. 10

Reduzierte GZ modulo (4)
z ngz(z) ngz(z,P1²) ngz(z,P3²)
3101
5211
7202
9211
11312
13312
15312
17422
19202
21422
23422
25413
27523
29431
31303
33633
35523
37523
39734
41523
43514
45936
47523
49312
51844
53633
55624
571055
59633

Asymptotisch gilt (numerisch) ngz(z,P1²) ≈ ngz(z,P3²) ≈ 1/2 ngz(z), siehe folgende Abb. 10 für alle ungeraden z < 2,900,037 (mit x = ngz(z) und y = ngz(z,P1²) )

Abb. 10

alt

Die Primfaktorzerlegung (GZP-41.dat) analog wie in Tab. 6 (nur für ungerade f sinnvoll) ergibt für ngz(z,P1²) ein völlig analoges Verhalten wie dort. Einzig der optimale ln-Koeffizient ist anders. Bei individuellen Fits (für jedes f einzeln) ergibt sich der Bereich lf = 0.723 - 0.741, im Mittel lf ≈ 0.73, wir benutzen hier lf = 0.73. Damit erhält man folg. Tabelle

Tab. 11

Fit der Goldbachzahlen ngz(z,P1²) von z=fp mit z/ln²(0.73z)
fsamplespmax c(f)c(f)/c(1) δ dmax
1 523586 7742923 0.6634 1.000 63.1 408.9
3 188583 2580973 1.3268 2.000 82.8 505.8
5 117563 1548577 0.8846 1.333 70.6 369.6
7 86163 1106129 0.7961 1.200 67.5 364.9
9 68365 860323 1.3268 2.000 82.7 451.5
11 56834 703897 0.7371 1.111 64.7 340.9
13 48776 595579 0.7237 1.091 65.0 350.7
15 42753 516193 1.7691 2.667 90.8 492.5
17 38121 455461 0.7077 1.067 63.8 331.6
19 34413 407521 0.7024 1.059 64.1 361.5
21 31435 368689 1.5922 2.400 87.6 479.2
23 28926 336649 0.6950 1.048 63.7 336.0
25 26782 309713 0.8845 1.333 70.8 349.2
27 24979 286771 1.3268 2.000 82.7 419.1
29 23394 266993 0.6880 1.037 62.8 329.7
31 22025 249763 0.6863 1.034 62.9 352.7
33 20800 234629 1.4743 2.222 85.2 498.1
35 19714 221219 1.0615 1.600 75.2 395.7
37 18741 209267 0.6824 1.029 62.8 312.7
39 17867 198533 1.4474 2.182 85.1 411.3
41 17068 188843 0.6805 1.026 62.6 299.8
43 16347 180053 0.6796 1.024 63.7 347.9
45 15671 172049 1.7691 2.667 90.5 489.1
47 15078 164743 0.6782 1.022 63.1 305.0
49 14524 158017 0.7961 1.200 67.1 377.5
Die empirisch festgestellte Tatsache, daß der optimale Fit für den ln-Koeffizienten für ngz(z,P1²) anders ist als für ngz(z) (und folgl. auch anders als für ngz(z,P3²)) beweist, daß die beiden Summanden doch nicht das gleiche asymptot. Verhalten für große z haben, wie Abb. 10 nahelegte.
Die Zerlegung in beide Summanden führt damit zu einer weiteren Reduktion der Streuung??

Reduktion Modulo (3)

Die PZ zerfallen in die 2 Teilmengen p ≡ 1,2 (3) (der Sonderfall p=3 kann hier auch außer acht gelassen werden, da er max. Eins zu ngz beiträgt, wenn 2z = 3 + q).
Die 3 Fälle z ≡ 0,1,2 (3) ergeben sich als
  1. z ≡ 0 (3): ngz(z) = ngz(z,P1P2) +ngz(z,P2P1)
  2. z ≡ 1 (3): ngz(z) = ngz(z,P1²)
  3. z ≡ 2 (3): ngz(z) = ngz(z,P2²)
(6.7.) Man erkennt hier schon, daß sich für durch 3 teilbare z eine doppelte Darst. ergibt, im Vergleich zu den anderen beiden Fällen. Dies kann als Erklärung der oben gefundenen, empirischen Musters (Normierung) helfen.

Reduktion Modulo (5)

Um die weitere Reduktion bzgl. beliebiger PZ zu veranschaulichen, betrachten wir noch den Fall mod. (5). Auch hier setzen wir an p ≢ 0 (5) (und vernachlässigen den Fall p = 5).
Die Additionstabelle für z = ½(p+q) ergibt (Beispiel: z= ½(5m+1 + 5n+2) = ½(5(m+n-1)+8) ≡ 4(5) )
p = 1 2 3 4
q z = ½(p+q)
1 1 4 2 0
2 4 2 0 3
3 2 0 3 1
4 0 3 1 4
Die 5 Fälle z ≡ 0,1,2,3,4 (5) ergeben sich also als
  1. z ≡ 0 (5): ngz(z) = ngz(z,P1P4) +ngz(z,P2P3) + ngz(z,P3P2) +ngz(z,P4P1)
  2. z ≡ 1 (5): ngz(z) = ngz(z,P1²) +ngz(z,P3P4) + ngz(z,P4P3)
  3. z ≡ 2 (5): ngz(z) = ngz(z,P2²) +ngz(z,P1P3) + ngz(z,P3P1)
  4. usw.
Man erkennt wiederum, daß z ≡ 0 (5) aus 4 = 5-1 Summanden besteht, während z ≡ 1,2,3,4 (5) jeweils nur 3 = 5-2 Summanden hat.

Reduktion Modulo (3² = 9)

Hier gibt es 6 = 3*(3-1) verschiedene Primzahlreste r = 1,2,4,5,7,8. Die Additionstabelle ergibt dafür
p = 1 2 4 5 7 8
q z = ½(p+q)
1 1 6 7 3 4 0
2 6 2 3 8 0 5
4 7 3 4 0 1 6
5 3 8 0 5 6 2
7 4 0 1 6 7 3
8 0 5 6 2 3 8
Die Summen haben also jeweils
  1. für z ≡ 0 (3) (z ≡ 0,3,6 (9)) mit 3*(3-1) = 6 Terme
  2. für z ≢ 0 (3) (z ≡ 1,2,4,5,7,8 (9)) mit jeweils 3*(3-2) = 3 Terme

Reduktion Modulo einer 2-er Potenz (2k), k > 0

Wir betrachten also die Primzahl-Reste von p ≡ r mod (2k), r = 1,3,5,...,2k-1.
Also z = ½(p+q) = ½((2km + r) + (2km' + r')) = 2k-1(m+m') + ½(r+r'). Es folgt, daß die Reste von z mod (2k-1) alle Werte r = 0,1,2,..,2k-1-1 mit der gleichen Häufigkeit (nämlich 2k-1-fach) annehmen.
Für die GZ bedeutet das: Die GZ ngz(z) ist für jedes beliebige z die Summe von 2k-1 RGZ.

Reduktion Modulo bel. Primzahl (p), p ≠ 2

Das obige ist verallgemeinerbar für Reduktionen modulo bzgl. beliebiger PZ p: Für z ≡ 0 (p) hat ngz(z) genau p-1 reduzierte Summanden, und für z ≢ 0 (p) hat ngz(z) genau p-2 reduzierte Summanden.
[Erläuterung: für gegebenes z,p gibt es (p-1)² RGZ ngz(z,PrPr'), von denen genau p-1 bzw. p-2 ≠ 0 sind, und alle anderen = 0.]

Reduktion Modulo bel. Primzahl (p²), p ≠ 2

Aus der Verallg. von mod (p²) = (3²) erhalten wir: Für alle z ≡ 0 (p) hat ngz(z) genau p(p-1) reduzierte Summanden und für alle z ≢ 0 (p) genau p(p-2) reduzierte Summanden.

Reduktion Modulo bel. Primzahlprodukt (p x q), p ≠ q, p,q ≠ 2

Wir betrachten als Beispiel die PZ p =3, q = 5, also die Reduktion mod. (15). Die (vollständige) Additionstabelle dafür ist (computergeneriert):

Additionstabelle z = ½(p1 + p2) modulo (3 x 5)
+ 01234567891011121314
008192103114125136147
181921031141251361470
219210311412513614708
392103114125136147081
421031141251361470819
510311412513614708192
631141251361470819210
711412513614708192103
841251361470819210311
912513614708192103114
1051361470819210311412
1113614708192103114125
1261470819210311412513
1314708192103114125136
1470819210311412513614
Legende: p1 oder p2 ist keine PZ (durch 3 oder 5 teilbar) z ist durch 3x5 teilbar z ist durch 3 teilbar z ist durch 5 teilbar

Erläuterung: Es gibt p x q = 3 x 5 = 15 Reste mod (15). Die Summanden p1 und p2 können pq - p -q + 1 = (p-1)(q-1) = 2*4 = 8 verschiedene Reste mod (15) haben: ri = (1,2,4,7,8,11,13,14) (das sind die Spalten/Zeilen der Tab., die nicht rot sind). Die möglichen Reste von z (15) haben nach Tab. folgende Häufigkeiten (das sind dann die Anzahlen der RGZ-Summanden von GZ, als Beispiel gilt für z ≡ 5 (15): ngz(z) = ngz(z,P2P8) +ngz(z,P8P2) + ngz(z,P11P14) + ngz(z,P14P11)).
  1. z ≡ 0 (15) : 8 Terme
  2. z ≡ 3,6,9,12 (15) : jeweils 6 Terme
  3. z ≡ 5,10 (15) : jeweils 4 Terme
  4. z ≡ 1,2,4,7,8,11,13,14 (15) : jeweils 3 Terme
Wir verallgemeinern das zu:
  1. z ≡ 0 (pq) : hat (p-1)⋅(q-1) Terme (= 2⋅4)
  2. z ≡ 0 (p), z ≢ 0 (q): jeweils (p-1)⋅(q-2) Terme (= 2⋅3)
  3. z ≡ 0 (q), z ≢ 0 (p): jeweils (q-1)⋅(p-2) Terme (= 4⋅1)
  4. z ≢ 0 (p,q) : jeweils (p-2)⋅(q-2) Terme (= 1⋅3)

Zusammenfassung (8.7.12)

[Man erkennt deutlich einen Zusammenhang mit der oben definierten Normierungsfunktion ν = ∏ (pi-1)/(pi-2). Es bleibt aber zu klären, worin er genau besteht.]
Es sei m eine bel. nat. Zahl m = 2k p1k1 p2k2 ⋅⋅⋅ pnkn (die normale Primfaktorzerlegung von m). Dann ist die Anzahl der reduzierten GZ mod (m) einer bel. Zahl z gleich 2k' p1k1 -1(p1-1) p2k2 -1(p2-1) ⋅⋅⋅pnkn -1(pn-1), wenn z ≡ 0 (p1 p2... pn), mit k' = k-1 wenn k > 0 (sonst k' = 0). Für jeden Primfaktor pi, für den z ≢ 0 (pi) gilt, muß darin der Faktor (pi-1) → (pi-2) ersetzt werden.
Als Spezialfälle kann man natürlich m = z betrachten, oder auch m = p1 p2⋅⋅⋅ (wobei p1, p2⋅⋅⋅ alle Primfaktoren von z sind)

Benutzung der Primzahlfunktion, 13.7.12

Laut Wikipedia (Prime Numer Theorem, PNT) ist die Primzahlfunktion π(x) (für bel. reelle x) definiert als Anzahl der PZ ≤ x (zB π(8) = π(10.999) = 4 (2,3,5,7)). Diese Funktion wird durch den Integrallogarithmus π(x) ≈ Li(x) = ∫ dt/ln t angenähert.
Mit der PZF gilt: x ist PZ, gdw. π(x) - π(x-1) = 1 (sonst ist der Ausdruck = 0). Wir erhalten damit eine Formel für die GZ ngz(z) = ∑ (π(x) - π(x-1))⋅(π(2z-x) - π(2z-x-1)) (Summation über x = 2 ... 2z-2) [Diese Formel gilt noch exakt].
Die Näherung mit Li ergibt π(x) - π(x-1) ≈ π'(x) ≈ 1/ln x (was nur im Mittelwert stimmt), also ngz(z) ≈ ∑ 1/(ln(x)⋅ln(2z-x)).
Eine numerische Rechnung zeigt (mit "java PZFunktion"), daß diese Summe durch c z/ln²(k z) optimal approximiert wird, mit k = 0.650 c = 1.982 δ = 1.0 dmax = 3.0 bei z = 200100, für z = 100 ... 10,000,000.
≢ ≣ ≤