Ipotesi percentuale per fattorizzazione

Ipotesi su p < n come possibile percentuale di n = √N
per una fattorizzazione più veloce
°°°°°°°°°°°°°°°
Francesco Di Noto, Michele Nardelli
(Gruppo “B.Riemann”)
Abstract
In this paper we show our conjecture about “mathematical
spettroscopy” able to speed up factoring of N = p*q with p < n
as possible percent of n = √N, where N = p*q.
Riassunto
In questo lavoro esporremo una nostra breve ipotesi su un
possibile spettroscopio matematico probabilistico per velocizzare
la fattorizzazione ( il concetto di spettrometro, o più esattamente
“spettroscopio matematico” è stato elaborato dal prof. Marcus du
1
Sautoy nel suo libro ”L’enigma dei numeri primi”, Rizzoli - Nota
finale), e da noi ora ripreso per basarci la nostra ipotesi.
Speriamo e cercheremo di dimostrare in futuro (ma avendo
come priorità l’ipotesi di Riemann) quella che qui chiameremo
brevemente “Ipotesi su p < n come possibile percentuale di n =
√N per una fattorizzazione più veloce”, con la quale cercare il
probabile fattore principale p’ (primo o composto) , più o meno
prossimo al valore reale di p con buone probabilità di trovarcelo
(errore medio del 20% in base ad alcuni calcoli); e quindi
risparmiando una buona parte del tempo di calcolo tradizionale.
Nel suo libro di cui sopra, Marcus du Sautoy lamentava l’assenza
di uno “spettroscopio” matematico in grado di trovare p di
p*q = N, analogamente a come i chimici hanno già il loro bravo
spettroscopio in grado di determinare quali elementi chimici
compongono la sostanza analizzata. Probabilmente si riferiva ad
uno spettroscopio matematico deterministico, che possa sostituire
facilmente la notoriamente lunga (per N molto grandi)
2
fattorizzazione a “forza bruta” (dividere N per tutti i numeri primi
da 2 ad n = √N, con N = p*q nel caso più semplice (due soli
fattori)). Tale spettroscopio deterministico forse in realtà non
esiste, vista la già nota “indisciplina “ dei numeri primi nella
loro successione e distribuzione, quest’ultima in parte regolata
dalle stime logaritmiche di π(N), dalla funzione zeta di Riemann,
ecc.
Di recente però abbiamo dimostrata la congettura di Cramer –
Shank (Rif.1); ora abbiamo la certezza che dato un numero primo
pn, il numero primo successivo pn+1 si trova sicuramente
2
nell’intervallo pn + (ln pn) , come nuova regolarità, purtroppo di
nessun aiuto per il nostro scopo.
Uno spettrometro matematico (termine che preferiamo a
spettroscopio) probabilistico, secondo la nostra ipotesi,
sarebbe tuttavia possibile: ci indicherebbe una più o meno piccola
porzione di n = √N in cui cercare il valore reale di p, con ottime
probabilità di trovarlo, senza bisogno di “esplorare” le rimanenti
3
porzioni di n.
Per cominciare, occorrerebbe trovare un numero probabile p’
prossimo al valore di p e cercare quest’ultimo in questa “zona”
intorno a p’, con tutto l’armamentario algoritmico che già
possediamo; e quindi trascurando le altre zone, con notevole
riduzione dei tempi di calcolo, notoriamente molto lunghi per N
molto grandi, per esempio i numeri RSA.
E qui veniamo finalmente alla nostra ipotesi: il nostro
spettrometro matematico probabilistico potrebbe essere costituito,
sebbene per il momento solo in casi particolari già individuati,
dalla semplice parte decimale della radice quadrata di n,d = √N ,
dove d (parte decimale) sono le sole due cifre dopo la virgola.
Moltiplicando d per 100, abbiamo, in tali casi, la percentuale di
n in cui trovare p’, e poi p reale nelle sue vicinanze.
Facciamo qualche semplice esempio pratico: poniamo N = 29 083
Ovviamente faremo finta di non sapere che 29 083 = 127*229,
poiché 29083 è un numero piccolo e facilmente fattorizzabile;
4
l’utilità della congettura vale ovviamente per N molto grandi, ma
appartenenti alla stessa casistica, cioè con rapporto q/p ≈ 2, in
questo caso 229/127=1,803.
Avremo che:
n = √N = 170,53 = √29 083; d = 0,53;
0,53*100 = 53 = 53% di n ; 170/100 = 1,7 = 1% di n =1% di 170
p’ = 1,7*53 = 90,1 ≈ 90, o più semplicemente170*0,53 = 90,1≈90
quindi, p’ ≈ p reale ; cercando dopo 90 (valore per difetto), si
trova 90 + 37 =127 = p reale, con 37/1,7 ≈ 21,76 % di n
esplorato, eliminando tutti i numeri primi inferiori a 90 (≈53%
di n, e corrispondente risparmio del tempo di calcolo tradizionale
Non è ancora molto, ma nemmeno tanto poco.
Altro esempio particolare (molto frequente) per
N = (53*101) = 5 353
n = √5 353 = 73,16 dove d = 0,16; ora però la percentuale
approssimativa è invece 100 - 16 = 84, infatti p’ = 73*0,84 =
61,32 ≈ 53, , in questo caso p’ superiore a p reale anziché
5
inferiore come nel caso precedente.
Quindi la percentuale approssimativa utile è in genere
p’ = 100* 0,d , oppure, come in altri casi come per N 5353,
p’’ = 100*(1 – 0,d).
Ma, a volte, è anche una media aritmetica tra p’ e p’’, oppure
una media aritmetica tra n,d e p’.
Infine, per p circa la metà di n, la parte decimale 0,d si aggira su
0,50, il che significa che p’≈ p’’≈ p reale, con tutti e tre i numeri
nella parte centrale di n,d = √N. Alcune eccezioni sono pur sempre
possibili.
Queste sono le pochissime regolarità emerse finora dal caos
apparente della fattorizzazione se si considera 100* 0,d come
vera percentuale di n in cui si possa trovare p .
Dimostrando (noi o altri) in futuro la nostra ipotesi e poi
sfruttando le suddette regolarità (valide in modo attendibile, al
momento, solo per i prodotti di numeri gemelli o molto vicini tra
loro) , si può arrivare ad uno spettroscopio più completo e
6
attendibile anche per gli altri casi, con differenze q-p ancora
maggiori, o, equivalentemente, per rapporti q/p maggiori.
Purtroppo finora non si conosce bene come calcolare q/p , neanche
in modo approssimativo, conoscendo solo N, e quindi senza
conoscere p e q, essendo questi proprio le incognite della
fattorizzazione p*q = N.
N = 1 000 ( = 23 * 53).
n = √1 000 = 31,62 , 0,d = 62 ≈ 62%
p’ ≈ 31*0,62 = 19,22 ≈ 20 = p = 22 * 5 fattore principale di 1000,
infatti 1000/20 = 50, con rapporto 50/20 = 2,5 e quindi rientra
nella casistica (q/p ≈ 2).
Ma anche 100 - 62 = 38, e anche il 38% di 31, uguale a 11,78,
è prossimo a 10, un altro fattore composto di 1000.
Fattore principale p’ è il gruppo di piccoli fattori di N il cui
prodotto è più vicino ad n, o uno dei più vicini (in questo caso è
20 , il più vicino a n = 31; ma anche 25 è minore di 31, però il
62% di 31 è 19,22 cioè circa 20, e quindi più attendibile) in modo
7
da rientrare nella casistica che risponde bene alla nostra
congettura. Altro esempio di N con molti fattori:
N = 360 = 23 * 32 * 5, n = √360 = 18,97
L’alto valore di d, (0,97) , indica una piccola differenza tra q e p
(vedi caso successivo sui numeri gemelli) , infatti 360 =18*20,
con 20 – 18 = 2, come per i numeri gemelli.
Usando lo spettrometro matematico, abbiamo
p’ = 18*0,97=17,46 ≈ 18 = 2*32 (gruppetto di fattori di 360 il
cui prodotto, 18, è minore di n,d = 18,97); se invece consideriamo
interamente n, abbiamo 18,97*0,97 = 18,40 ≈ 18, avendo in ogni
caso un valore molto prossimo a p = 18.
Questo ancora rudimentale spettrometro matematico funziona
bene con i prodotti tra due numeri gemelli, nei quali la radice
quadrata ha una parte decimale molto alta, cioè di tipo 0,99…
Per esempio, per alcune coppie :
1) N = 11*13 = 143; n,d = √143 = 11,95 quindi p’ ≈ il 95% di 11
p’= 11*0,95= 10,45 ≈ 11
8
2) N = 59*61 = 3599;
n,d = √3599 = 59,991666 ,
p’ ≈ 59*0,99 = 58,41≈ 59 = p reale
3) N = 101*103 = 10403 ; n,d = √10403 = 101,99509
p’ ≈ 101*0,99 = 99,99 ≈ 101
per una coppia di gemelli ancora più grande:
4) N = 12161*12163 = 147 914 243; , n,d = √147914243 =
= 12161,999958…
p’ = 12161*0,9999 = 12159,78 ≈ 12161 = p
(più grande è la coppia di gemelli, più cifre 9 ci sono nella parte
decimale di n). Inoltre, bisogna tenerne conto nella percentuale per
avere risultati più precisi; infatti, se si calcola p’ con sole due cifre
9, abbiamo 12161*0,99 = 12039,39 , inferiore a 12059 di venti
unità.
Un solo esempio per un numero RSA che rientra nella nostra
casistica (parte decimale d maggiore di 0,50), per la quale la
ipotesi sembra funzionare:
N= RSA(120) = (dalla voce “Numeri RSA” di Wikipedia
9
“RSA-120
RSA-120 è stato fattorizzato nel giugno 1993 da Thomas Denny, Bruce A. Dodson, Arjen K.
Lenstra, e Mark S. Manasse. Il calcolo ha richiesto circa tre mesi. [6]
La fattorizzazione di RSA-120 è la seguente:
RSA-120 = 227010481295437363334259960947493668895875336466084780038173
258247009162675779735389791151574049166747880487470296548479
RSA-120 = 327414555693498015751146303749141488063642403240171463406883
× 693342667110830181197325401899700641361965863127336680673013”
Poiché la radice quadrata di 2270 (le prime quattro cifre, poiché
120 è un numero pari) è circa:
47,64, il 64% di 47; 47*0,64=30,08 = p’, quindi p, in
proporzione, è un numero primo prossimo a 3008…seguito da 56
cifre = 120/2 – 4, poiché la radice quadrata è formata in genere da
c/2 oppure c/2 +1 cifre); infatti il fattore p (evidenziato in rosso, e
in blu il fattore q) è relativamente prossimo a 3008… seguito da
56 cifre: abbiamo risparmiato il tempo di calcolo per tutti i
numeri primi da 3 a 3008…; ed anche i “fattorizzatori” Thomas
Denny et al. lo avrebbero risparmiato nel 1993 se avessero
conosciuto la nostra congettura e/o una sua possibile
dimostrazione.
Un risultato addirittura migliore si ottiene se si considerano le
sole prime due cifre di RSA -120, e cioè 22; poiché √22 = 4,69
e 4,69*0,69 = 3,2361…= p’, e quindi p reale sarebbe prossimo a
32361… seguito da 55 cifre , e infatti è vicino al valore reale
10
3274 seguito da 56 cifre (vedi il fattore p di cui sopra nella
citazione di Wikipedia).
Una semplice previsione per RSA – 420, non ancora fattorizzato,
usando la nostra congettura:
da Wikipedia, “Numeri RSA:
RSA-420
“RSA-420 non è ancora stato fattorizzato.
RSA-420 =
2091366302476510731652556423163330737009653626605245054798522959941292730258
1898373570076188752609749648953525484925466394800509169219344906273145413634
2427186266197097846022969248579454916155633686388106962365337549155747268356
4666583846809964354191550136023170105917441056517493690125545320242581503730
3405952887826925813912683942756431114820292313193705352716165790132673270514
3817744164107601735413785886836578207979”
Poiché le prime quattro cifre sono 2091, e √2091= 45,72 e con
parte decimale 0,72 molto vicina alla parte decimale reale,
(e quindi rientra nella casistica prevista dalla congettura) abbiamo
p’ =45,72*0,72 = 32,91, e quindi p’ ≈ 3291 seguito da 120-4 =116
cifre, e q = N/p’ = 2091/32,91 = 63,53 ≈ 6353 seguito da 116
cifre. Infatti 3291…*6353… = 20907723… ≈ 20913663… molto
vicino a RSA – 420 cifre. Ne riparleremo quando il numero RSA
- 420 sarà finalmente fattorizzato, per confermare o meno la
11
nostra previsione approssimativa su p e q.
Conclusione
Non rimane ora che dimostrare la nostra congettura, per farvi
rientrare il maggior numero di casi utili , per esempio alcuni
numeri RSA la cui radice quadrata sia maggiore di 0,50.
Invitiamo i matematici eventualmente interessati a questa
dimostrazione ( che potrebbe far entrare il problema della
fattorizzazione veloce tra i problemi P, come i test di primalità
che già lo sono, per esempio il test indiano AKS).
Anche noi ovviamente tenteremo tale dimostrazione, che
potrebbe anche non avere bisogno della dimostrazione dell’ipotesi
di Riemann (RH) come invece molti si aspetterebbero, collegando
la distribuzione dei numeri primi con la fattorizzazione dei
numeri composti (vedi Nota finale).
La RH riguarda infatti soltanto la distribuzione dei numeri primi
singoli, e non , almeno direttamente, quella dei fattori dei numeri
composti. Per questi ultimi, sarebbe probabilmente più utile la
congettura di Goldbach, legata all’algoritmo di fattorizzazione alla
Fermat, nel quale compare la semisomma s = (p+q)/2 = S/2, da qui
Goldbach (p e q sono simmetrici, cioè equidistanti, da S/2 = N/2):
s2 = N + d2, con d = semidifferenza (q-p)/2
da cui poi p = s - d e q = s + d
12
oppure qualche altra congettura che tratta coppie di numeri primi,
come la congettura dei numeri gemelli, (con differenza 2) o di
Polignac (differenza 2n), entrambe collegate a quella di Goldbach.
Una coppia di gemelli è sempre l’ultima coppia di Goldbach per
molti N ( ma non tutti) di forma N = 12k , e tutte le altre coppie di
Goldbach sono formate da due numeri primi con distanza
maggiore (2k) e decrescente a partire dalla prima coppia (3, N-3 se
anche N-3 è primo, per esempio per N = 20 abbiamo la prima
coppia 3 + 17 = 20 = numero N pari). Per un numero di forma
12k con ultima coppia di Goldbach = due numeri primi gemelli,
facciamo l’esempio di 120 : l’ultima coppia di Goldbach è 59 e
61, tale che 59 + 61 = 120, mentre la prima coppia è
7 + 113 = 120, essendo 120 - 3 = 117 = 3*3*13, e quindi non
primo, e 120 – 5 = 115 = 5*23, anche questo non primo.
Circa il prodotto, 59*61 = 3 599, vedi secondo esempio sui
numeri gemelli a pagina 8.
Nota (sullo spettrometro e la RH)
Dal “Blog Matematico” di Umberto Cerreti, “Congettura di
Riemann e sicurezza mondiale”:
13
•
“…Concludendo: l'intero sistema di sicurezza mondiale entrerebbe in gravi
difficoltà se qualcuno trovasse un algoritmo veloce per la fattorizzazione di interi.
Che cosa c'entra tutto questo con la congettura di Riemann? Sentiamo le parole
del professor Marcus du Sautoy, autore di un bestseller pubblicato in Italia da
Rizzoli, con il titolo "L'enigma dei numeri primi":
L'intero commercio elettronico dipende dai numeri primi. Io ho descritto i primi
come atomi: ciò che manca ai matematici è uno spettrometro di primi. I chimici
hanno una macchina che, se ci mettete una molecola, vi dice di quali atomi è
composta. I matematici non hanno inventato una versione analoga di essa. Se
l'ipotesi di Riemann è vera, essa non produrrà di per sé uno spettrometro. Ma la
sua dimostrazione potrebbe farci capire meglio il funzionamento dei numeri
primi, e quindi la dimostrazione potrebbe essere trasformata in qualcosa che
potrebbe produrre questo spettrometro di primi. Se ciò accadrà, metterà in
ginocchio l'intero commercio elettronico nello spazio di una notte”.
Quindi, niente RH, almeno direttamente, per quanto riguarda un
possibile spettrometro. L’unica relazione nota tra RH e
fattorizzazione, o una delle poche, è che la fattorizzazione veloce è
in P se la RH è vera.
Occorre quindi rivolgersi eventualmente ad altre congetture , come
per esempio quella di Goldbach ( o, come prima accennato, ad altre
congetture che contemplano coppie di numeri primi come possibili p
e q per il prodotto N = p*q) , per dimostrare questa nostra
congettura sul possibile spettrometro matematico basato sulla parte
decimale di n,d = √N, e considerare 100*0,d , oppure 100*(1- 0,d)
come possibile percentuale di n equivalente o quasi a p’ ≈ p reale
di p*q = N
14
ALTRI ESEMPI NUMERICI PER CONGETTURA
PERCENTUALE , con cenni a prima (p’-p) e seconda differenza
(p’ – p’’) percentuale)
1) 100 895 598 169 =
898 423 x 112 303
n = √100 895 598 169 = 317 640 ,67 d = 0,67 percentuale reale
112 303/3176,4067= 35,35% p’ = 317640*0,67 = 212818 ;
1% = 3176,4067; 212 818 – 112 303 = 100 515;
100515/3176,4067 = 31,64%
differenza percentuale 67 – 35 = 32
percentuale complementare
p’’= n*1-0,67) = n* 0.33= 104 821≈ 112 303
differenza 104821 - 112 303 = -7482 ; -7482/3176,40 = -2,35% di
distanza tra p reale e p’’
p’ – p’’ = 212 818 - 104 821= 107 997 ≈ 112 303
seconda differenza percentuale 107 997 - 112 303 = -4 306;
-4306/3176= - 1,355
15
questa seconda differenza percentuale è ancora minore della prima,
-2,35
2) 1 409 305 684 859
= 705 967 x 1 996 277
n = √1 409 305 684 859 = 1187141, 81
d=0,81, percentuale reale =
59,46%, (cioè 705967/11871,4181)
1187141*0,81 = 961 584
differenza 81 - 59= +22
differenza complementare:
1- 0, 81= 0,19 p’’= 1 187 141*0,19 = 225 556 (troppo basso P
Media aritmetica tra p’ e p’’ (961 584+225 556)/2 = 593 570
Differenza percentuale
593570- 705967 = 112 397 / 11871 = 9,468%
Ma, curiosamente, anche
p ≈ p’ – p’’ = 961584 – 225556 = 736028 ≈ 705967
seconda differenza percentuale 736 028 – 705967 = 30061
30061/11871 = 2,53%, minore della prima differenza percentuale,
9,468
Vogliamo anche inserire come esempi quattro numeri connessi con la
16
Teoria di stringa eterotica connessa al gruppo di Lie E8. I numeri sono
992, 496, 248 e 128.
Per 496, abbiamo che 496 = 31 * 24 = 31 * 16; n = √496 = 22,27 dove
d = 0,27 che è la percentuale reale p. In questo caso, utilizziamo la p’’,
cioè la percentuale complementare già vista in precedenza. Avremo:
p’’ = n * (1 – 0,27) = 22,27 * 0,73 = 16,2571 ≈ 16. La differenza sarà
d = 16,2571 – 16 = 0,2571. Ora, 0,2571 / 0,2227 (che è dato da 22,27 /
100) = 1,154% che è la distanza tra p reale e p’’.
Proviamo con 248. Abbiamo che 248 = 31 * 23 = 31 * 4 * 2. Si ha:
n = √248 = 15,748; d = 0,748 percentuale reale p. Ora utilizziamo, come
prima, la percentuale complementare p’’. Avremo:
p’’ = n * (1 – 0,748) = 15,748 * 0,252 = 3,9684 ≈ 4. La differenza sarà
d = 4 – 3,9684 = 0,0315. Ora 0,0315 / 0,1578 ≈ 0,2% che è la distanza tra
p reale e p’’.
Con 128 avremo: 128 = 27 = 16 * 8; n = √128 = 11,31370; d = 0,31 e
p’’ = n * (1 – 0,31) = 11,31 * 0,69 = 7,80 ≈ 8; 8 – 7,80 = 0,20;
0,20 / 0,113137 = 1,76%.
Infine, con 992 avremo: 992 = 31 * 25 = 31 * 32 = 31 * 16 * 2;
n = √992 = 31,4960; d = 0,496; p’’ = n * (1 – 0,49) = 31,49 * 0,51 =
17
= 16,0599 ≈ 16. d = 16,0599 – 16 = 0,0599; 0,0599 / 0,3149 = 0,19%.
Vediamo che, in tutti e quattro casi, con il seguente procedimento, si
ottengono dei fattori dei numeri esaminati. Precisamente, per 496 il 16, per
248 il 4, per 128 il fattore 8 e per 992 sempre il 16. Notiamo come questi
numeri siano fondamentali nelle teorie di superstringa, in quanto l’8 è il
numero inerente le vibrazioni fisiche delle superstringhe.
Conclusione :
La seconda differenza percentuale ( tra p’ e p’’) nei due casi sopra
esaminati su numeri molto grandi è in valore assoluto, circa la radice
quadrata della prima differenza percentuale (tra p’ e p reale)
primo esempio:
1,35 ≈ √2,35 = 1,53
secondo esempio
2,53 ≈ √9,46 = 3,07
p potrebbe quindi essere (con discrepanze medie del + 10% circa):
vicino a p’ =
n*0,d
vicino a p’’ = n*(1-d)
(in caso di basso rapporto q/p, es. primi gemelli)
(percentuale complementare, in diversi casi)
vicino alla media aritmetica tra p’ e p’’
vicino alla media tra n e p’
vicino alla differenza p’- p’’ , come nei due casi di cui sopra.
18
Tali punti possiedono i maggiori picchi di probabilità in cui trovare più
facilmente p reale di p*q = N
Riferimenti
1) “Proposta di Dimostrazione Congettura di Cramer – Shank”
Rosario Turco, Maria Colonnese, Michele Nardelli, Giovanni Di Maria,
Francesco Di Noto, Annarita Tulumello, in sezione “Articoli sulla Teoria
dei Numeri; del nostro sito www.gruppoeratostene.com
Caltanissetta 1.2.2012
19