Die Goldbach-Vermutung aus Laiensicht

Problemstellung

Die starke Goldbach-Vermutung (deutsch) ist eines der erstaunlichsten und faszinierendsten Probleme der Zahlentheorie. Sie lautet ganz simpel: Jede gerade Zahl n > 2 ist als Summe zweier Primzahlen p, q darstellbar, also n = p + q (∀ n = 2z, n > 2) Die ersten Zerlegungen sind zB

4	=	2 + 2
6	=	3 + 3
8	=	3 + 5
10	=	3 + 7 =	5 + 5
...

Wir bezeichnen hier als Goldbachzahl n_gz(z) die Anzahl der Zerlegungen der natürlichen Zahl z als z = ½(p+q) mit Primzahlen p ≤ q.
Die Tabelle der ersten 100 Goldbachzahlen ist (computergeneriert):

Tab. 1

z	n	n_gz(z)
1	2	0
2	4	1
3	6	1
4	8	1
5	10	2
6	12	1
7	14	2
8	16	2
9	18	2
10	20	2

z	n	n_gz(z)
11	22	3
12	24	3
13	26	3
14	28	2
15	30	3
16	32	2
17	34	4
18	36	4
19	38	2
20	40	3

z	n	n_gz(z)
21	42	4
22	44	3
23	46	4
24	48	5
25	50	4
26	52	3
27	54	5
28	56	3
29	58	4
30	60	6

z	n	n_gz(z)
31	62	3
32	64	5
33	66	6
34	68	2
35	70	5
36	72	6
37	74	5
38	76	5
39	78	7
40	80	4

z	n	n_gz(z)
41	82	5
42	84	8
43	86	5
44	88	4
45	90	9
46	92	4
47	94	5
48	96	7
49	98	3
50	100	6

z	n	n_gz(z)
51	102	8
52	104	5
53	106	6
54	108	8
55	110	6
56	112	7
57	114	10
58	116	6
59	118	6
60	120	12

z	n	n_gz(z)
61	122	4
62	124	5
63	126	10
64	128	3
65	130	7
66	132	9
67	134	6
68	136	5
69	138	8
70	140	7

z	n	n_gz(z)
71	142	8
72	144	11
73	146	6
74	148	5
75	150	12
76	152	4
77	154	8
78	156	11
79	158	5
80	160	8

z	n	n_gz(z)
81	162	10
82	164	5
83	166	6
84	168	13
85	170	9
86	172	6
87	174	11
88	176	7
89	178	7
90	180	14

z	n	n_gz(z)
91	182	6
92	184	8
93	186	13
94	188	5
95	190	8
96	192	11
97	194	7
98	196	9
99	198	13
100	200	8

Numerische Untersuchungen mit Computern zeigen, daß für größere Zahlen n die Anzahl der möglichen Zerlegungen kontinuierlich (aber nicht monoton) ansteigt. ZB. findet man auf der Wikipedia-Seite die Grafik für die Anzahl der Zerlegungen bis n = 2z = 1,000,000:

Abb. 1

Sie zeigt, daß zB für z > 400,000 (n > 800,000) die Goldbach-Zahl n_gz(z) stets größer als 3,000 ist, und weiter unbegrenzt ansteigt [Die Punktwolke sieht zwar nicht so aus, aber es ist tatsächlich eine zahlentheoretische Funktion]. Zum Beweis der Goldbach-Vermutung genügt jedoch schon eine einzige Zerlegung! (Die Goldbach-Vermutung lautet damit: Es gibt keine natürliche Zahl z > 0 für die n_gz(z) = 0 ist.) Zum Beweis der GV muß man für jede Zahl z einen Algorithmus angeben, der mind. eine Zerlegung liefert; zu ihrer Widerlegung (hypothet.) genügt eine Zahl.
Das Streifen-Muster in dieser Punktwolke ist heuristisch gut zu erklären: Das Primzahltheorem besagt, daß eine zufällig gewählte Zahl m mit der Wahrscheinlichkeit 1/ln(m) eine Primzahl ist. Die Wahrscheinlichkeit, daß m und (n-m) gleichzeitig PZ sind, ist also 1/ln(m)ln(n-m). [Diese Rechnung setzt voraus, daß die zwei Wahrscheinlichkeiten unabhängig voneinander sind, was natürlich nicht erfüllt ist.]
Trotzdem ergibt die Funktion f₀(n) = n/ln²(n) eine sehr gute Parametrisierung der Goldbach-Zahlen.

Eigene numerische Experimente

[Mit Numerik kann man keine math. Sätze beweisen, aber sie kann helfen, solche Sätze aufzuspüren.]
Wir benutzen als unabh. Variable die Zahl z = n/2, die alle natürl. Zahlen z > 0 durchläuft und suchen alle Zerlegungen z = ½(p+q), p &le q.

Analyse der Daten

Es fällt auf, daß die Streuung der GZ, wenn man eine Fit-Kurve ∼ n/ln²(n) anpaßt, sehr groß ist. Allerdings ist ein deutliches Streifenmuster zu erkennen, das man evtl. erklären kann. Dazu klassifizieren wir die Zahlen z nach der Teilerfunktion σ₀(z) (= Anzahl der Teiler von z, einschließlich 1 und z; für alle Primzahlen p gilt folglich zB. σ₀(p) = 2). Das ergibt die folgende Grafik (Beachte, die x-Achse ist um den Faktor 2 gegenüber Abb. 1 verlängert, weil n=2z!).

Abb. 2

Hier sind die Punktfarben nach σ₀(z) gewählt (oberer Farbbalken). Außerdem sind drei Kurven f(z) = c f₀(z) = c 2z/ln²(z) für c = [0.7, 1.5, 3.0] eingezeichnet.
Wählt man nur die Teilmenge der Zahlen mit σ₀(z) &le 4 aus, erkennt man klare Muster:

Abb. 3

Rot (σ₀(z)=2) sind alle Primzahlen z = p (diese haben natürlich immer ua. die triviale Zerlegung 2p = p + p). Orange (σ₀(z)=4) sind alle Zahlen der Form z = p₁ p₂, p₁ ≠p₂ und z = p₁³.
Man erkennt, daß die Varianz der Goldbach-Zahlen innerhalb der einzelnen Klassen deutlich geringer ist. Die einzelnen orangen Streifen entsprechen den Fällen p₁ = 2,3,5,... (Es gibt nur 168 Zahlen z < 1,000,000 mit σ₀(z)=3; sie haben die Darstellung z = p₁².)
Eine noch bessere Klassifikation der Goldbach-Zahlen ergibt sich, wenn man in der Grafik als unabh. Variable anstelle von z die Teilerfunktion σ₁(z) benutzt (= Summe der Teiler von z, einschließlich 1 und z; der x-Bereich ist entsprechend größer).

Abb. 4

Ein Gnuplot aller Zerlegungen der ersten 1,000,000 PZ ergibt zB. einen optimalen Fit (der Koeffizient im Logarithmus wurde ausprobiert) mit n_gz(p) ≈ f(p) = 1.3115⋅p/ln²(0.666⋅p) mit einer Standard-Abweichung von δ = 112.7 und einer max. Abweichung δ_max=648.1 (für p=14,395,261, n_gz(p)=72,406). Erstaunlich ist die sehr geringe Streuung der Punkte (im Vergleich zu oben). Die max. rel. Abweichung ist kleiner als 1% und wird für größere p immer kleiner.

Abb. 5

Eine Histogramm-Darstellung der Verteilung der Goldbach-Zahlen über f = c f₀(n) = cn/ln²(0.666⋅n) zeigt klare Maxima für den Quotienten c = 1.3116, 2.6232 und ein breites Minimum bei c ≈ 2.45. Die beiden Maxima fallen mit denen von σ₀(z) = 2,4 zusammen.

Abb. 6

Auch hier sind die Histogramme der Teilmengen σ₀(z) = 2,4,6,8,10 dargestellt, wobei für 2 eine eingipflige VF zu erkennen ist (mit Max bei 1.3116). Die absoluten Minima und Maxima der Werte von c(z) sind c_min = 0.160 (für z = 3) und c_max = 5.426 (für z = 510510 = 2⋅3⋅5⋅7⋅11⋅13⋅17).
Der Anfang und das Ende der Zahlen-Tabelle (aufsteigend nach c soriert) zeigt diese (für alle z < 1,000,000):

Tab. 2
alt
Tab. 3
alt

Das Ende der Tabelle legt ein simples Verfahren zum Finden der Zahlen mit max. Quotienten c nahe, als Produkt aller PZ kleiner als eine gegebenen PZ: z = 3⋅5⋅7⋅11⋅13⋅17⋅⋅⋅

Das obige Schema läßt sich verallgemeinern, indem man numerisch die Zerlegungen der Zahlen z = f ⋅ p (f=1,2,3,...) bestimmt. Man erhält folgende beste Fits (für die Zahlen z < 7,700,000):

Tab. 4

Fit der Goldbachzahlen von *z=fp* mit *z ln²(0.66z)*
f	z	c	δ
1,2,4,8	2ⁿ p, n ≥ 0	1.3112	82.5
3,6,9	2ⁿ 3^m p, n ≥ 0, m > 0	2.6223	109.5
5,10	2ⁿ 5^m p, n ≥ 0, m > 0	1.7482	92.4
7	2ⁿ 7^m p, n ≥ 0, m > 0	1.5734	88.3

Es ist sehr bemerkenswert, daß die Fits für verschiedene f nahezu identisch sind (zB für f = 1,2,4,8), obwohl die entsprechenden Mengen {z} natürlich disjunkt sind (bis auf die ersten max. 3 Elemente). Sie betrifft sowohl die Koeffizienten c als auch Varianzen und den Koeffizienten im Logarithmus (der - per Hand optimiert - für alle f den Wert ≈ 0.666 hat). Es wäre schön, Erklärungen für die offenkundigen Relationen c(k) ≈ c(2k), c(3) ≈ 2c(1), c(5) ≈ 4/3c(1), c(7) ≈ 6/5c(1), (und den ln-Koeff ≈ 2/3) zu haben. Die naheliegende Vermutung lautet c(p) ≈ (p-1)/(p-2)c(1).
Die obige Identität der Fits ist leicht mißzuverstehen: Sie bedeutet nicht, daß zb z = p und z = 2⋅p eine näherungsweise gleiche Zerlegungszahl haben, sondern, daß für z = p und für eine Primzahl q, für die gilt p ≈ 2⋅q, die Zerlegungszahl näherungsweise gleich ist, also n_gz(p) ≈ n_gz(2q) für p ≈ 2⋅q.
Ein Auszug aus der Tabelle verdeutlicht das:

Tab. 5

p	n_gz(p)	n_gz(2p)	n_gz(3p)	n_gz(4p)	n_gz(5p)	n_gz(6p)	n_gz(7p)	n_gz(8p)	n_gz(9p)	n_gz(10p)
...
100003	1071	1869	5306	3372	5421	9555	6405	6014	13493	9688
100019	1045	1878	5279	3386	5485	9467	6495	5967	13306	9757
100043	1060	1867	5256	3357	5456	9530	6527	6013	13366	9684
100049	1072	1896	5284	3357	5393	9540	6487	6007	13334	9801
...
200003	1907	3323	9561	6024	9601	17108	11641	10848	23976	17583
200009	1897	3343	9387	6122	9757	16910	11591	10910	24034	17607
200017	1872	3348	9474	5969	9781	17144	11603	10940	24104	17575
...
300007	2595	4750	13309	8536	13730	24185	16486	15348	34275	24900
300017	2682	4729	13221	8484	13728	24051	16414	15408	34184	24963
300023	2612	4693	13341	8490	13674	24088	16545	15439	34282	24888
...
400009	3325	5980	17058	10906	17522	31104	21117	19666	43522	31953
400031	3358	6004	17063	10913	17518	30671	21096	19805	43706	32032
400033	3384	6030	17064	10938	17461	30847	21114	19796	43822	31899
...

Das empirisch gewonnene Muster läßt sich weiter verallgemeinern für Primzahlprodukte, wenn man die Tabelle der Fits erweitert für größere Faktoren f = 11..25 (hier bis p ≤ 33,933,979 um mehr samples zu haben): [Wenn man für jedes f einzeln den optimalen ln-Koeffizient bestimmt (minimale Standardabweichung), erhält man optimale Werte von lf = 0.673 - 0.676, im Mittel lf ≈ 0.6745]

Tab. 6

Fit der Goldbachzahlen von *z=fp* mit *z/ln²(0.6745z)*
f	samples	p_max	c(f)	c(f)/c(1)	δ	d_max
1	2085615	33933979	1.3138	1.000	160.5	1014.4
2	1089318	16966991	1.3138	1.000	160.2	1039.7
3	745696	11311319	2.6276	2.000	213.5	1464.4
4	570075	8483479	1.3138	1.000	160.0	950.3
5	463046	6786761	1.7517	1.333	179.4	1088.8
6	390754	5655659	2.6276	2.000	213.4	1232.7
7	338543	4847699	1.5766	1.200	171.5	973.8
8	299043	4241723	1.3138	1.000	160.0	964.5
9	268043	3770381	2.6276	2.000	213.0	1168.0
10	243094	3393373	1.7517	1.333	179.1	961.2
11	222479	3084901	1.4598	1.111	165.5	1085.1
12	205267	2827823	2.6276	2.000	212.9	1254.7
13	190552	2610287	1.4332	1.091	164.8	1058.4
14	177918	2423851	1.5766	1.200	171.1	1053.9
15	166927	2262233	3.5035	2.667	236.8	1300.5
16	157246	2120863	1.3138	1.000	159.5	909.2
17	148650	1996109	1.4014	1.067	162.5	977.9
18	141001	1885207	2.6276	2.000	213.7	1279.2
19	134091	1785977	1.3911	1.059	162.1	911.8
20	127902	1696697	1.7517	1.333	179.2	983.8
21	122253	1615891	3.1531	2.400	226.9	1342.5
22	117137	1542451	1.4598	1.111	164.9	939.5
23	112415	1475387	1.3764	1.048	162.0	1033.8
24	108092	1413889	2.6276	2.000	213.4	1236.6
25	104074	1357351	1.7517	1.333	179.2	1048.3

Man sieht sofort, daß zB gilt c(15)/c(1) = c(3⋅5)/c(1) = 2.667 ≈ 2 ⋅ 4/3, oder c(21)/c(1) = 2 ⋅ 6/5, und allgemein für zwei PZ p,q ≠ 2: c(p⋅q)/c(1) = c(p)/c(1) ⋅ c(q)/c(1) = (p-1)/(p-2) ⋅ (q-1)/(q-2).

Versuch der Reduktion der Streuung

Mit einfachen Worten (nicht mathematisch exakt) ausgedrückt, kann man dieses Ergebnis auch so formulieren: Die Goldbachzahl einer Zahl, die zB. durch die Primzahl p = 3 teilbar ist, ist etwa (p-1)/(p-2) = 2 mal so groß, wie die einer etwa gleichgroßen Zahl, die nicht durch 3 teilbar ist (wenn alle anderen Primteiler unberücksichtigt bleiben können - was natürlich idR nicht der Fall ist).
Das legt die Definition einer (neuen?) zahlentheoretischen Funktion ν(z) ≥ 1.0 nahe: ν(z) := ∏ (p_i-1)/(p_i-2), als das Produkt über alle Primteiler (p_i ≠ 2, p_i|z) von z. Damit definieren wir normierte Goldbachzahlen gemäß n*_gz(z) := n_gz(z)/ν(z).
Für diese normierten GZ ergibt sich folgende Grafik (die y-Skala ist der besseren Auflösung wegen gegenüber der Abb. 2 um den Faktor 4 vergrößert):

Abb. 7

Den direkten Vergleich der GZ (rot) mit den NGZ (grün) zeigt die folgende Abb. bis z = 1,000,000 :

Abb. 8

Das entsprechende Histogramm der normierten GZ zeigt klassische Gaußverteilungen (hier ist die c*-Skala im Vergleich zu Abb. 6 verkürzt), mit einem Minimum von c*_min = 0.08 (für z=3) und Maximum von c*_max = 1.652 (für z=71), die auch unabhängig von σ₀ zu sein scheinen (visuell).

Abb. 9

Ein Ausschnitt einer Tabelle, bei der diese Normierung angewandt wird, ergibt zB (die Spalten mit dem '*' kennzeichnen die entsprechenden normierten Werte):

Tab. 7

Eine Auflistung der ersten 1,000,000 GZ zeigt, daß die Intervalle der normierten c* für größer werdende z immer enger werden:

Tab. 8

Fit der normierten Goldbachzahlen mit *z/ln²(0.666z)*
z-Intervall	c_min*	(bei z)	c_max*	(bei z)
3 - 49999	0.0798	3	1.6516	71
50000 - 99999	1.2086	72064	1.3981	53993
100000 - 149999	1.2393	142684	1.3868	103567
150000 - 199999	1.2499	172751	1.3747	185141
200000 - 249999	1.2497	239566	1.3666	200726
250000 - 299999	1.2532	265411	1.3648	269261
300000 - 349999	1.2590	303904	1.3594	302936
350000 - 399999	1.2606	361486	1.3626	356216
400000 - 449999	1.2669	409246	1.3584	433781
450000 - 499999	1.2664	477329	1.3562	469757
500000 - 549999	1.2673	522326	1.3510	524350
550000 - 599999	1.2703	562924	1.3521	558091
600000 - 649999	1.2701	612022	1.3522	630068
650000 - 699999	1.2682	685291	1.3499	677762
700000 - 749999	1.2754	718456	1.3509	704294
750000 - 799999	1.2719	791299	1.3453	786152
800000 - 849999	1.2760	841546	1.3492	847472
850000 - 899999	1.2764	899629	1.3441	859589
900000 - 949999	1.2772	915253	1.3415	914477
950000 - 999999	1.2772	954094	1.3448	972347

Um den optimalen Koeffizienten im Logarithmus ln(k ⋅ z) genauer zu bestimmen (bisher benutzt k ≈ 0.6745), berechnen wir die Streuung der Differenzen
δ(k) = sqrt(∑ |n*_gz(z) - c*z/ln²(k ⋅ z)|²/n), z = 3 ... 1,000,000 für verschiedene k=0.6,..., 0.8, und erhalten folgende Tabelle (d_max ist die maximale Differenz in der Summe):

Tab. 9

Fit des Koeffizienten k in *z/ln²(kz)*
k	c*	δ	d_max	bei z
0.600	1.2899	28.463	187.7	972347
0.605	1.2915	28.445	187.4	972347
0.610	1.2932	28.427	187.2	972347
0.615	1.2948	28.411	187.0	972347
0.620	1.2964	28.396	186.7	972347
0.625	1.2980	28.382	186.5	972347
0.630	1.2996	28.370	186.3	972347
0.635	1.3012	28.358	186.0	972347
0.640	1.3028	28.348	185.9	847472
0.645	1.3044	28.338	185.8	847472
0.650	1.3059	28.330	185.6	847472
0.655	1.3075	28.322	185.5	847472
0.660	1.3090	28.316	185.4	847472
0.665	1.3105	28.310	185.3	847472
0.670	1.3120	28.306	185.1	847472
0.675	1.3135	28.302	185.0	847472
0.680	1.3150	28.299	184.9	847472
0.685	1.3165	28.297	184.8	847472
0.690	1.3179	28.296	184.7	847472
0.695	1.3194	28.295	184.6	847472
0.700	1.3208	28.296	184.7	990586
0.705	1.3223	28.297	184.9	990586
0.710	1.3237	28.299	185.2	990586
0.715	1.3251	28.302	185.4	990586
0.720	1.3265	28.305	185.6	990586
0.725	1.3279	28.309	185.8	990586
0.730	1.3293	28.314	186.0	990586
0.735	1.3307	28.319	186.2	990586
0.740	1.3321	28.325	186.4	990586
0.745	1.3335	28.332	186.6	990586
0.750	1.3348	28.339	186.8	990586
0.755	1.3362	28.347	187.0	990586
0.760	1.3375	28.355	187.2	990586
0.765	1.3388	28.365	187.4	990586
0.770	1.3402	28.374	187.6	990586
0.775	1.3415	28.384	187.8	990586
0.780	1.3428	28.395	188.0	990586
0.785	1.3441	28.406	188.2	990586
0.790	1.3454	28.418	188.4	990586
0.795	1.3467	28.430	188.6	990586

Das Optimum (minimale Streuung &delta) liegt bei k = 0.695 und der entspr. Koeff ist c* = 1.3194. Das Ergebnis dieser ganzen Rechnungen kann man zusammenfassen zu folg. Aussage:

Die Goldbachzahl einer gegebenen Zahl z ist ungefähr n_gz(z) ≈ 1.3194 ⋅ν(z) ⋅ z/ln²(0.695 ⋅ z), wobei ν(z) := ∏ (p-1)/(p-2) das Produkt über alle Primteiler (p ≠ 2, p|z) von z ist.

"Reduzierte" Goldbachzahlen (1.7.12)

[Die ursprüngl. Idee war, die Reduktion Modulo (4) auszunutzen, um die Quadratsummen-Zerlegung der PZ zu bestimmen, denn alle PZ p ≡ 1 (4) lassen sich als Summe von 2 Quadraten darst., und man erhält damit eine Darst. von 2z als Summe von 4 Q. Es zeigte sich aber eine andere interessante Eigenschaft bzgl. der Normierung (s.u.)]
Zur Erklärung des oben numerisch gefundenen Gesetzes der Approximation der GZ untersuchen wir, wie oft sich eine Zahl n=2z als Summe von bestimmten Teilmengen der PZ darstellen läßt, hier bspw. den linearen Teilmengen modulo (m), definiert als P_r := {p}, p ≡ r(m), die wir hier bezeichnen als n_gz(z,P_r²) also z = ½ (p₁ + p₂), wobei p₁ ≤ p₂, (p₁, p₂) ∈ (P_r,P_r) := P_r².
Analog definieren wir die "gemischten" reduzierten GZ, als n_gz(z,P_rP_r'), (r ≠ r') als Anzahl der Darst. von z = ½ (p₁ + p₂), wobei p₁ ≤ p₂, (p₁, p₂) ∈ (P_r,P_r') := P_rP_r'.
(Man beachte, daß die Produktmengen disjunkt sind: P_rP_r' ∩ P_r'P_r = ∅, weil wir p₁ ≤ p₂ vorausgesetzt haben).
Da per Definition alle RGZ &ge 0 sind, genügt es zum Beweis der Goldbach-Vermutung zu zeigen, daß für jedes z eine einzige RGZ n_gz(z,P_rP_r') > 0 existiert.

Reduktion Modulo (4)

Die Menge der PZ zerfällt zB in die 2 Teilmengen P₁ = {p}, p ≡ 1(4) und P₃ = {p}, p ≡ 3(4) (die Primzahl 2 kann hier außer acht gelassen werden).
Mit der Menge P₁ allein sind alle geraden Zahlen z = 2m gar nicht darstellbar, da 1 ⊕ 1 ≡ 2 ≠ 0 (4) und alle ungeraden Zahlen z = 2m+1 haben die 2 Darstellungsformen P₁P₁ und P₃P₃, da 1 ⊕ 1 ≡ 3 ⊕ 3 ≡ 2(4) . Es gilt offensichtlich (für ungerades u): n_gz(u) = n_gz(u,P₁²) + n_gz(u,P₃²), und für alle geraden g gilt n_gz(g) = n_gz(g,P₁P₃) + n_gz(g,P₃P₁).)
Numerische Tests zeigen, daß alle ungeraden Z. durch P₃², und auch alle (außer den vier Zahlen z=3,7,19,31) durch P₁² darstellbar sind.
Eine Tabelle der ersten GZ lautet (GZ-4.dat):

Tab. 10

Reduzierte GZ *modulo (4)*
z	n_gz(z)	n_gz(z,P₁²)	n_gz(z,P₃²)
3	1	0	1
5	2	1	1
7	2	0	2
9	2	1	1
11	3	1	2
13	3	1	2
15	3	1	2
17	4	2	2
19	2	0	2
21	4	2	2
23	4	2	2
25	4	1	3
27	5	2	3
29	4	3	1
31	3	0	3
33	6	3	3
35	5	2	3
37	5	2	3
39	7	3	4
41	5	2	3
43	5	1	4
45	9	3	6
47	5	2	3
49	3	1	2
51	8	4	4
53	6	3	3
55	6	2	4
57	10	5	5
59	6	3	3

Asymptotisch gilt (numerisch) n_gz(z,P₁²) ≈ n_gz(z,P₃²) ≈ 1/2 n_gz(z), siehe folgende Abb. 10 für alle ungeraden z < 2,900,037 (mit x = n_gz(z) und y = n_gz(z,P₁²) )

Abb. 10

Die Primfaktorzerlegung (GZP-41.dat) analog wie in Tab. 6 (nur für ungerade f sinnvoll) ergibt für n_gz(z,P₁²) ein völlig analoges Verhalten wie dort. Einzig der optimale ln-Koeffizient ist anders. Bei individuellen Fits (für jedes f einzeln) ergibt sich der Bereich lf = 0.723 - 0.741, im Mittel lf ≈ 0.73, wir benutzen hier lf = 0.73. Damit erhält man folg. Tabelle

Tab. 11

Fit der Goldbachzahlen *n_gz(z,P₁²)* von *z=fp* mit *z/ln²(0.73z)*
f	samples	p_max	c(f)	c(f)/c(1)	δ	d_max
1	523586	7742923	0.6634	1.000	63.1	408.9
3	188583	2580973	1.3268	2.000	82.8	505.8
5	117563	1548577	0.8846	1.333	70.6	369.6
7	86163	1106129	0.7961	1.200	67.5	364.9
9	68365	860323	1.3268	2.000	82.7	451.5
11	56834	703897	0.7371	1.111	64.7	340.9
13	48776	595579	0.7237	1.091	65.0	350.7
15	42753	516193	1.7691	2.667	90.8	492.5
17	38121	455461	0.7077	1.067	63.8	331.6
19	34413	407521	0.7024	1.059	64.1	361.5
21	31435	368689	1.5922	2.400	87.6	479.2
23	28926	336649	0.6950	1.048	63.7	336.0
25	26782	309713	0.8845	1.333	70.8	349.2
27	24979	286771	1.3268	2.000	82.7	419.1
29	23394	266993	0.6880	1.037	62.8	329.7
31	22025	249763	0.6863	1.034	62.9	352.7
33	20800	234629	1.4743	2.222	85.2	498.1
35	19714	221219	1.0615	1.600	75.2	395.7
37	18741	209267	0.6824	1.029	62.8	312.7
39	17867	198533	1.4474	2.182	85.1	411.3
41	17068	188843	0.6805	1.026	62.6	299.8
43	16347	180053	0.6796	1.024	63.7	347.9
45	15671	172049	1.7691	2.667	90.5	489.1
47	15078	164743	0.6782	1.022	63.1	305.0
49	14524	158017	0.7961	1.200	67.1	377.5

Die empirisch festgestellte Tatsache, daß der optimale Fit für den ln-Koeffizienten für n_gz(z,P₁²) anders ist als für n_gz(z) (und folgl. auch anders als für n_gz(z,P₃²)) beweist, daß die beiden Summanden doch nicht das gleiche asymptot. Verhalten für große z haben, wie Abb. 10 nahelegte.
Die Zerlegung in beide Summanden führt damit zu einer weiteren Reduktion der Streuung??

Reduktion Modulo (3)

Die PZ zerfallen in die 2 Teilmengen p ≡ 1,2 (3) (der Sonderfall p=3 kann hier auch außer acht gelassen werden, da er max. Eins zu n_gz beiträgt, wenn 2z = 3 + q).
Die 3 Fälle z ≡ 0,1,2 (3) ergeben sich als

z ≡ 0 (3): n_gz(z) = n_gz(z,P₁P₂) +n_gz(z,P₂P₁)
z ≡ 1 (3): n_gz(z) = n_gz(z,P₁²)
z ≡ 2 (3): n_gz(z) = n_gz(z,P₂²)

(6.7.) Man erkennt hier schon, daß sich für durch 3 teilbare z eine doppelte Darst. ergibt, im Vergleich zu den anderen beiden Fällen. Dies kann als Erklärung der oben gefundenen, empirischen Musters (Normierung) helfen.

Reduktion Modulo (5)

Um die weitere Reduktion bzgl. beliebiger PZ zu veranschaulichen, betrachten wir noch den Fall mod. (5). Auch hier setzen wir an p ≢ 0 (5) (und vernachlässigen den Fall p = 5).
Die Additionstabelle für z = ½(p+q) ergibt (Beispiel: z= ½(5m+1 + 5n+2) = ½(5(m+n-1)+8) ≡ 4(5) )

q	z = ½(p+q)
p =	1	2	3	4
1	1	4	2	0
2	4	2	0	3
3	2	0	3	1
4	0	3	1	4

Die 5 Fälle z ≡ 0,1,2,3,4 (5) ergeben sich also als

z ≡ 0 (5): n_gz(z) = n_gz(z,P₁P₄) +n_gz(z,P₂P₃) + n_gz(z,P₃P₂) +n_gz(z,P₄P₁)
z ≡ 1 (5): n_gz(z) = n_gz(z,P₁²) +n_gz(z,P₃P₄) + n_gz(z,P₄P₃)
z ≡ 2 (5): n_gz(z) = n_gz(z,P₂²) +n_gz(z,P₁P₃) + n_gz(z,P₃P₁)
usw.

Man erkennt wiederum, daß z ≡ 0 (5) aus 4 = 5-1 Summanden besteht, während z ≡ 1,2,3,4 (5) jeweils nur 3 = 5-2 Summanden hat.

Reduktion Modulo (3² = 9)

Hier gibt es 6 = 3*(3-1) verschiedene Primzahlreste r = 1,2,4,5,7,8. Die Additionstabelle ergibt dafür

p =	1	2	4	5	7	8
q	z = ½(p+q)
1	1	6	7	3	4	0
2	6	2	3	8	0	5
4	7	3	4	0	1	6
5	3	8	0	5	6	2
7	4	0	1	6	7	3
8	0	5	6	2	3	8

Die Summen haben also jeweils

für z ≡ 0 (3) (z ≡ 0,3,6 (9)) mit 3*(3-1) = 6 Terme
für z ≢ 0 (3) (z ≡ 1,2,4,5,7,8 (9)) mit jeweils 3*(3-2) = 3 Terme

Reduktion Modulo einer 2-er Potenz (2^k), k > 0

Wir betrachten also die Primzahl-Reste von p ≡ r mod (2^k), r = 1,3,5,...,2^k-1.
Also z = ½(p+q) = ½((2^km + r) + (2^km' + r')) = 2^k-1(m+m') + ½(r+r'). Es folgt, daß die Reste von z mod (2^k-1) alle Werte r = 0,1,2,..,2^k-1-1 mit der gleichen Häufigkeit (nämlich 2^k-1-fach) annehmen.
Für die GZ bedeutet das: Die GZ n_gz(z) ist für jedes beliebige z die Summe von 2^k-1 RGZ.

Reduktion Modulo bel. Primzahl (p), p ≠ 2

Das obige ist verallgemeinerbar für Reduktionen modulo bzgl. beliebiger PZ p: Für z ≡ 0 (p) hat n_gz(z) genau p-1 reduzierte Summanden, und für z ≢ 0 (p) hat n_gz(z) genau p-2 reduzierte Summanden.
[Erläuterung: für gegebenes z,p gibt es (p-1)² RGZ n_gz(z,P_rP_r'), von denen genau p-1 bzw. p-2 ≠ 0 sind, und alle anderen = 0.]

Reduktion Modulo bel. Primzahl (p²), p ≠ 2

Aus der Verallg. von mod (p²) = (3²) erhalten wir: Für alle z ≡ 0 (p) hat n_gz(z) genau p(p-1) reduzierte Summanden und für alle z ≢ 0 (p) genau p(p-2) reduzierte Summanden.

Reduktion Modulo bel. Primzahlprodukt (p x q), p ≠ q, p,q ≠ 2

Wir betrachten als Beispiel die PZ p =3, q = 5, also die Reduktion mod. (15). Die (vollständige) Additionstabelle dafür ist (computergeneriert):

Additionstabelle *z = ½(p₁ + p₂) modulo (3 x 5)*
+	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14
0	0	8	1	9	2	10	3	11	4	12	5	13	6	14	7
1	8	1	9	2	10	3	11	4	12	5	13	6	14	7	0
2	1	9	2	10	3	11	4	12	5	13	6	14	7	0	8
3	9	2	10	3	11	4	12	5	13	6	14	7	0	8	1
4	2	10	3	11	4	12	5	13	6	14	7	0	8	1	9
5	10	3	11	4	12	5	13	6	14	7	0	8	1	9	2
6	3	11	4	12	5	13	6	14	7	0	8	1	9	2	10
7	11	4	12	5	13	6	14	7	0	8	1	9	2	10	3
8	4	12	5	13	6	14	7	0	8	1	9	2	10	3	11
9	12	5	13	6	14	7	0	8	1	9	2	10	3	11	4
10	5	13	6	14	7	0	8	1	9	2	10	3	11	4	12
11	13	6	14	7	0	8	1	9	2	10	3	11	4	12	5
12	6	14	7	0	8	1	9	2	10	3	11	4	12	5	13
13	14	7	0	8	1	9	2	10	3	11	4	12	5	13	6
14	7	0	8	1	9	2	10	3	11	4	12	5	13	6	14

Legende: p₁ oder p₂ ist keine PZ (durch 3 oder 5 teilbar) z ist durch 3x5 teilbar z ist durch 3 teilbar z ist durch 5 teilbar

Erläuterung: Es gibt p x q = 3 x 5 = 15 Reste mod (15). Die Summanden p₁ und p₂ können pq - p -q + 1 = (p-1)(q-1) = 2*4 = 8 verschiedene Reste mod (15) haben: r_i = (1,2,4,7,8,11,13,14) (das sind die Spalten/Zeilen der Tab., die nicht rot sind). Die möglichen Reste von z (15) haben nach Tab. folgende Häufigkeiten (das sind dann die Anzahlen der RGZ-Summanden von GZ, als Beispiel gilt für z ≡ 5 (15): n_gz(z) = n_gz(z,P₂P₈) +n_gz(z,P₈P₂) + n_gz(z,P₁₁P₁₄) + n_gz(z,P₁₄P₁₁)).

z ≡ 0 (15) : 8 Terme
z ≡ 3,6,9,12 (15) : jeweils 6 Terme
z ≡ 5,10 (15) : jeweils 4 Terme
z ≡ 1,2,4,7,8,11,13,14 (15) : jeweils 3 Terme

Wir verallgemeinern das zu:

z ≡ 0 (pq) : hat (p-1)⋅(q-1) Terme (= 2⋅4)
z ≡ 0 (p), z ≢ 0 (q): jeweils (p-1)⋅(q-2) Terme (= 2⋅3)
z ≡ 0 (q), z ≢ 0 (p): jeweils (q-1)⋅(p-2) Terme (= 4⋅1)
z ≢ 0 (p,q) : jeweils (p-2)⋅(q-2) Terme (= 1⋅3)

Zusammenfassung (8.7.12)

[Man erkennt deutlich einen Zusammenhang mit der oben definierten Normierungsfunktion ν = ∏ (p_i-1)/(p_i-2). Es bleibt aber zu klären, worin er genau besteht.]
Es sei m eine bel. nat. Zahl m = 2^k p₁^k₁ p₂^k₂ ⋅⋅⋅ p_n^k_n (die normale Primfaktorzerlegung von m). Dann ist die Anzahl der reduzierten GZ mod (m) einer bel. Zahl z gleich 2^k' p₁^{k₁ -1}(p₁-1) p₂^{k₂ -1}(p₂-1) ⋅⋅⋅p_n^{k_n -1}(p_n-1), wenn z ≡ 0 (p₁ p₂... p_n), mit k' = k-1 wenn k > 0 (sonst k' = 0). Für jeden Primfaktor p_i, für den z ≢ 0 (p_i) gilt, muß darin der Faktor (p_i-1) → (p_i-2) ersetzt werden.
Als Spezialfälle kann man natürlich m = z betrachten, oder auch m = p₁ p₂⋅⋅⋅ (wobei p₁, p₂⋅⋅⋅ alle Primfaktoren von z sind)

Benutzung der Primzahlfunktion, 13.7.12

Laut Wikipedia (Prime Numer Theorem, PNT) ist die Primzahlfunktion π(x) (für bel. reelle x) definiert als Anzahl der PZ ≤ x (zB π(8) = π(10.999) = 4 (2,3,5,7)). Diese Funktion wird durch den Integrallogarithmus π(x) ≈ Li(x) = ∫ dt/ln t angenähert.
Mit der PZF gilt: x ist PZ, gdw. π(x) - π(x-1) = 1 (sonst ist der Ausdruck = 0). Wir erhalten damit eine Formel für die GZ n_gz(z) = ∑ (π(x) - π(x-1))⋅(π(2z-x) - π(2z-x-1)) (Summation über x = 2 ... 2z-2) [Diese Formel gilt noch exakt].
Die Näherung mit Li ergibt π(x) - π(x-1) ≈ π'(x) ≈ 1/ln x (was nur im Mittelwert stimmt), also n_gz(z) ≈ ∑ 1/(ln(x)⋅ln(2z-x)).
Eine numerische Rechnung zeigt (mit "java PZFunktion"), daß diese Summe durch c z/ln²(k z) optimal approximiert wird, mit k = 0.650 c = 1.982 δ = 1.0 dmax = 3.0 bei z = 200100, für z = 100 ... 10,000,000.

≢ ≣ ≤

z	n_gz(z)	n_gz(z,P₁²)	n_gz(z,P₃²)
3	1	0	1
5	2	1	1
7	2	0	2
9	2	1	1
11	3	1	2
13	3	1	2
15	3	1	2
17	4	2	2
19	2	0	2
21	4	2	2
23	4	2	2
25	4	1	3
27	5	2	3
29	4	3	1
31	3	0	3
33	6	3	3
35	5	2	3
37	5	2	3
39	7	3	4
41	5	2	3
43	5	1	4
45	9	3	6
47	5	2	3
49	3	1	2
51	8	4	4
53	6	3	3
55	6	2	4
57	10	5	5
59	6	3	3

+	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14
0	0	8	1	9	2	10	3	11	4	12	5	13	6	14	7
1	8	1	9	2	10	3	11	4	12	5	13	6	14	7	0
2	1	9	2	10	3	11	4	12	5	13	6	14	7	0	8
3	9	2	10	3	11	4	12	5	13	6	14	7	0	8	1
4	2	10	3	11	4	12	5	13	6	14	7	0	8	1	9
5	10	3	11	4	12	5	13	6	14	7	0	8	1	9	2
6	3	11	4	12	5	13	6	14	7	0	8	1	9	2	10
7	11	4	12	5	13	6	14	7	0	8	1	9	2	10	3
8	4	12	5	13	6	14	7	0	8	1	9	2	10	3	11
9	12	5	13	6	14	7	0	8	1	9	2	10	3	11	4
10	5	13	6	14	7	0	8	1	9	2	10	3	11	4	12
11	13	6	14	7	0	8	1	9	2	10	3	11	4	12	5
12	6	14	7	0	8	1	9	2	10	3	11	4	12	5	13
13	14	7	0	8	1	9	2	10	3	11	4	12	5	13	6
14	7	0	8	1	9	2	10	3	11	4	12	5	13	6	14

z	n_gz(z)	n_gz(z,P₁²)	n_gz(z,P₃²)
3	1	0	1
5	2	1	1
7	2	0	2
9	2	1	1
11	3	1	2
13	3	1	2
15	3	1	2
17	4	2	2
19	2	0	2
21	4	2	2
23	4	2	2
25	4	1	3
27	5	2	3
29	4	3	1
31	3	0	3
33	6	3	3
35	5	2	3
37	5	2	3
39	7	3	4
41	5	2	3
43	5	1	4
45	9	3	6
47	5	2	3
49	3	1	2
51	8	4	4
53	6	3	3
55	6	2	4
57	10	5	5
59	6	3	3

+	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14
0	0	8	1	9	2	10	3	11	4	12	5	13	6	14	7
1	8	1	9	2	10	3	11	4	12	5	13	6	14	7	0
2	1	9	2	10	3	11	4	12	5	13	6	14	7	0	8
3	9	2	10	3	11	4	12	5	13	6	14	7	0	8	1
4	2	10	3	11	4	12	5	13	6	14	7	0	8	1	9
5	10	3	11	4	12	5	13	6	14	7	0	8	1	9	2
6	3	11	4	12	5	13	6	14	7	0	8	1	9	2	10
7	11	4	12	5	13	6	14	7	0	8	1	9	2	10	3
8	4	12	5	13	6	14	7	0	8	1	9	2	10	3	11
9	12	5	13	6	14	7	0	8	1	9	2	10	3	11	4
10	5	13	6	14	7	0	8	1	9	2	10	3	11	4	12
11	13	6	14	7	0	8	1	9	2	10	3	11	4	12	5
12	6	14	7	0	8	1	9	2	10	3	11	4	12	5	13
13	14	7	0	8	1	9	2	10	3	11	4	12	5	13	6
14	7	0	8	1	9	2	10	3	11	4	12	5	13	6	14