Ipotesi su p < n come possibile percentuale di n = √N per una fattorizzazione più veloce °°°°°°°°°°°°°°° Francesco Di Noto, Michele Nardelli (Gruppo “B.Riemann”) Abstract In this paper we show our conjecture about “mathematical spettroscopy” able to speed up factoring of N = p*q with p < n as possible percent of n = √N, where N = p*q. Riassunto In questo lavoro esporremo una nostra breve ipotesi su un possibile spettroscopio matematico probabilistico per velocizzare la fattorizzazione ( il concetto di spettrometro, o più esattamente “spettroscopio matematico” è stato elaborato dal prof. Marcus du 1 Sautoy nel suo libro ”L’enigma dei numeri primi”, Rizzoli - Nota finale), e da noi ora ripreso per basarci la nostra ipotesi. Speriamo e cercheremo di dimostrare in futuro (ma avendo come priorità l’ipotesi di Riemann) quella che qui chiameremo brevemente “Ipotesi su p < n come possibile percentuale di n = √N per una fattorizzazione più veloce”, con la quale cercare il probabile fattore principale p’ (primo o composto) , più o meno prossimo al valore reale di p con buone probabilità di trovarcelo (errore medio del 20% in base ad alcuni calcoli); e quindi risparmiando una buona parte del tempo di calcolo tradizionale. Nel suo libro di cui sopra, Marcus du Sautoy lamentava l’assenza di uno “spettroscopio” matematico in grado di trovare p di p*q = N, analogamente a come i chimici hanno già il loro bravo spettroscopio in grado di determinare quali elementi chimici compongono la sostanza analizzata. Probabilmente si riferiva ad uno spettroscopio matematico deterministico, che possa sostituire facilmente la notoriamente lunga (per N molto grandi) 2 fattorizzazione a “forza bruta” (dividere N per tutti i numeri primi da 2 ad n = √N, con N = p*q nel caso più semplice (due soli fattori)). Tale spettroscopio deterministico forse in realtà non esiste, vista la già nota “indisciplina “ dei numeri primi nella loro successione e distribuzione, quest’ultima in parte regolata dalle stime logaritmiche di π(N), dalla funzione zeta di Riemann, ecc. Di recente però abbiamo dimostrata la congettura di Cramer – Shank (Rif.1); ora abbiamo la certezza che dato un numero primo pn, il numero primo successivo pn+1 si trova sicuramente 2 nell’intervallo pn + (ln pn) , come nuova regolarità, purtroppo di nessun aiuto per il nostro scopo. Uno spettrometro matematico (termine che preferiamo a spettroscopio) probabilistico, secondo la nostra ipotesi, sarebbe tuttavia possibile: ci indicherebbe una più o meno piccola porzione di n = √N in cui cercare il valore reale di p, con ottime probabilità di trovarlo, senza bisogno di “esplorare” le rimanenti 3 porzioni di n. Per cominciare, occorrerebbe trovare un numero probabile p’ prossimo al valore di p e cercare quest’ultimo in questa “zona” intorno a p’, con tutto l’armamentario algoritmico che già possediamo; e quindi trascurando le altre zone, con notevole riduzione dei tempi di calcolo, notoriamente molto lunghi per N molto grandi, per esempio i numeri RSA. E qui veniamo finalmente alla nostra ipotesi: il nostro spettrometro matematico probabilistico potrebbe essere costituito, sebbene per il momento solo in casi particolari già individuati, dalla semplice parte decimale della radice quadrata di n,d = √N , dove d (parte decimale) sono le sole due cifre dopo la virgola. Moltiplicando d per 100, abbiamo, in tali casi, la percentuale di n in cui trovare p’, e poi p reale nelle sue vicinanze. Facciamo qualche semplice esempio pratico: poniamo N = 29 083 Ovviamente faremo finta di non sapere che 29 083 = 127*229, poiché 29083 è un numero piccolo e facilmente fattorizzabile; 4 l’utilità della congettura vale ovviamente per N molto grandi, ma appartenenti alla stessa casistica, cioè con rapporto q/p ≈ 2, in questo caso 229/127=1,803. Avremo che: n = √N = 170,53 = √29 083; d = 0,53; 0,53*100 = 53 = 53% di n ; 170/100 = 1,7 = 1% di n =1% di 170 p’ = 1,7*53 = 90,1 ≈ 90, o più semplicemente170*0,53 = 90,1≈90 quindi, p’ ≈ p reale ; cercando dopo 90 (valore per difetto), si trova 90 + 37 =127 = p reale, con 37/1,7 ≈ 21,76 % di n esplorato, eliminando tutti i numeri primi inferiori a 90 (≈53% di n, e corrispondente risparmio del tempo di calcolo tradizionale Non è ancora molto, ma nemmeno tanto poco. Altro esempio particolare (molto frequente) per N = (53*101) = 5 353 n = √5 353 = 73,16 dove d = 0,16; ora però la percentuale approssimativa è invece 100 - 16 = 84, infatti p’ = 73*0,84 = 61,32 ≈ 53, , in questo caso p’ superiore a p reale anziché 5 inferiore come nel caso precedente. Quindi la percentuale approssimativa utile è in genere p’ = 100* 0,d , oppure, come in altri casi come per N 5353, p’’ = 100*(1 – 0,d). Ma, a volte, è anche una media aritmetica tra p’ e p’’, oppure una media aritmetica tra n,d e p’. Infine, per p circa la metà di n, la parte decimale 0,d si aggira su 0,50, il che significa che p’≈ p’’≈ p reale, con tutti e tre i numeri nella parte centrale di n,d = √N. Alcune eccezioni sono pur sempre possibili. Queste sono le pochissime regolarità emerse finora dal caos apparente della fattorizzazione se si considera 100* 0,d come vera percentuale di n in cui si possa trovare p . Dimostrando (noi o altri) in futuro la nostra ipotesi e poi sfruttando le suddette regolarità (valide in modo attendibile, al momento, solo per i prodotti di numeri gemelli o molto vicini tra loro) , si può arrivare ad uno spettroscopio più completo e 6 attendibile anche per gli altri casi, con differenze q-p ancora maggiori, o, equivalentemente, per rapporti q/p maggiori. Purtroppo finora non si conosce bene come calcolare q/p , neanche in modo approssimativo, conoscendo solo N, e quindi senza conoscere p e q, essendo questi proprio le incognite della fattorizzazione p*q = N. N = 1 000 ( = 23 * 53). n = √1 000 = 31,62 , 0,d = 62 ≈ 62% p’ ≈ 31*0,62 = 19,22 ≈ 20 = p = 22 * 5 fattore principale di 1000, infatti 1000/20 = 50, con rapporto 50/20 = 2,5 e quindi rientra nella casistica (q/p ≈ 2). Ma anche 100 - 62 = 38, e anche il 38% di 31, uguale a 11,78, è prossimo a 10, un altro fattore composto di 1000. Fattore principale p’ è il gruppo di piccoli fattori di N il cui prodotto è più vicino ad n, o uno dei più vicini (in questo caso è 20 , il più vicino a n = 31; ma anche 25 è minore di 31, però il 62% di 31 è 19,22 cioè circa 20, e quindi più attendibile) in modo 7 da rientrare nella casistica che risponde bene alla nostra congettura. Altro esempio di N con molti fattori: N = 360 = 23 * 32 * 5, n = √360 = 18,97 L’alto valore di d, (0,97) , indica una piccola differenza tra q e p (vedi caso successivo sui numeri gemelli) , infatti 360 =18*20, con 20 – 18 = 2, come per i numeri gemelli. Usando lo spettrometro matematico, abbiamo p’ = 18*0,97=17,46 ≈ 18 = 2*32 (gruppetto di fattori di 360 il cui prodotto, 18, è minore di n,d = 18,97); se invece consideriamo interamente n, abbiamo 18,97*0,97 = 18,40 ≈ 18, avendo in ogni caso un valore molto prossimo a p = 18. Questo ancora rudimentale spettrometro matematico funziona bene con i prodotti tra due numeri gemelli, nei quali la radice quadrata ha una parte decimale molto alta, cioè di tipo 0,99… Per esempio, per alcune coppie : 1) N = 11*13 = 143; n,d = √143 = 11,95 quindi p’ ≈ il 95% di 11 p’= 11*0,95= 10,45 ≈ 11 8 2) N = 59*61 = 3599; n,d = √3599 = 59,991666 , p’ ≈ 59*0,99 = 58,41≈ 59 = p reale 3) N = 101*103 = 10403 ; n,d = √10403 = 101,99509 p’ ≈ 101*0,99 = 99,99 ≈ 101 per una coppia di gemelli ancora più grande: 4) N = 12161*12163 = 147 914 243; , n,d = √147914243 = = 12161,999958… p’ = 12161*0,9999 = 12159,78 ≈ 12161 = p (più grande è la coppia di gemelli, più cifre 9 ci sono nella parte decimale di n). Inoltre, bisogna tenerne conto nella percentuale per avere risultati più precisi; infatti, se si calcola p’ con sole due cifre 9, abbiamo 12161*0,99 = 12039,39 , inferiore a 12059 di venti unità. Un solo esempio per un numero RSA che rientra nella nostra casistica (parte decimale d maggiore di 0,50), per la quale la ipotesi sembra funzionare: N= RSA(120) = (dalla voce “Numeri RSA” di Wikipedia 9 “RSA-120 RSA-120 è stato fattorizzato nel giugno 1993 da Thomas Denny, Bruce A. Dodson, Arjen K. Lenstra, e Mark S. Manasse. Il calcolo ha richiesto circa tre mesi. [6] La fattorizzazione di RSA-120 è la seguente: RSA-120 = 227010481295437363334259960947493668895875336466084780038173 258247009162675779735389791151574049166747880487470296548479 RSA-120 = 327414555693498015751146303749141488063642403240171463406883 × 693342667110830181197325401899700641361965863127336680673013” Poiché la radice quadrata di 2270 (le prime quattro cifre, poiché 120 è un numero pari) è circa: 47,64, il 64% di 47; 47*0,64=30,08 = p’, quindi p, in proporzione, è un numero primo prossimo a 3008…seguito da 56 cifre = 120/2 – 4, poiché la radice quadrata è formata in genere da c/2 oppure c/2 +1 cifre); infatti il fattore p (evidenziato in rosso, e in blu il fattore q) è relativamente prossimo a 3008… seguito da 56 cifre: abbiamo risparmiato il tempo di calcolo per tutti i numeri primi da 3 a 3008…; ed anche i “fattorizzatori” Thomas Denny et al. lo avrebbero risparmiato nel 1993 se avessero conosciuto la nostra congettura e/o una sua possibile dimostrazione. Un risultato addirittura migliore si ottiene se si considerano le sole prime due cifre di RSA -120, e cioè 22; poiché √22 = 4,69 e 4,69*0,69 = 3,2361…= p’, e quindi p reale sarebbe prossimo a 32361… seguito da 55 cifre , e infatti è vicino al valore reale 10 3274 seguito da 56 cifre (vedi il fattore p di cui sopra nella citazione di Wikipedia). Una semplice previsione per RSA – 420, non ancora fattorizzato, usando la nostra congettura: da Wikipedia, “Numeri RSA: RSA-420 “RSA-420 non è ancora stato fattorizzato. RSA-420 = 2091366302476510731652556423163330737009653626605245054798522959941292730258 1898373570076188752609749648953525484925466394800509169219344906273145413634 2427186266197097846022969248579454916155633686388106962365337549155747268356 4666583846809964354191550136023170105917441056517493690125545320242581503730 3405952887826925813912683942756431114820292313193705352716165790132673270514 3817744164107601735413785886836578207979” Poiché le prime quattro cifre sono 2091, e √2091= 45,72 e con parte decimale 0,72 molto vicina alla parte decimale reale, (e quindi rientra nella casistica prevista dalla congettura) abbiamo p’ =45,72*0,72 = 32,91, e quindi p’ ≈ 3291 seguito da 120-4 =116 cifre, e q = N/p’ = 2091/32,91 = 63,53 ≈ 6353 seguito da 116 cifre. Infatti 3291…*6353… = 20907723… ≈ 20913663… molto vicino a RSA – 420 cifre. Ne riparleremo quando il numero RSA - 420 sarà finalmente fattorizzato, per confermare o meno la 11 nostra previsione approssimativa su p e q. Conclusione Non rimane ora che dimostrare la nostra congettura, per farvi rientrare il maggior numero di casi utili , per esempio alcuni numeri RSA la cui radice quadrata sia maggiore di 0,50. Invitiamo i matematici eventualmente interessati a questa dimostrazione ( che potrebbe far entrare il problema della fattorizzazione veloce tra i problemi P, come i test di primalità che già lo sono, per esempio il test indiano AKS). Anche noi ovviamente tenteremo tale dimostrazione, che potrebbe anche non avere bisogno della dimostrazione dell’ipotesi di Riemann (RH) come invece molti si aspetterebbero, collegando la distribuzione dei numeri primi con la fattorizzazione dei numeri composti (vedi Nota finale). La RH riguarda infatti soltanto la distribuzione dei numeri primi singoli, e non , almeno direttamente, quella dei fattori dei numeri composti. Per questi ultimi, sarebbe probabilmente più utile la congettura di Goldbach, legata all’algoritmo di fattorizzazione alla Fermat, nel quale compare la semisomma s = (p+q)/2 = S/2, da qui Goldbach (p e q sono simmetrici, cioè equidistanti, da S/2 = N/2): s2 = N + d2, con d = semidifferenza (q-p)/2 da cui poi p = s - d e q = s + d 12 oppure qualche altra congettura che tratta coppie di numeri primi, come la congettura dei numeri gemelli, (con differenza 2) o di Polignac (differenza 2n), entrambe collegate a quella di Goldbach. Una coppia di gemelli è sempre l’ultima coppia di Goldbach per molti N ( ma non tutti) di forma N = 12k , e tutte le altre coppie di Goldbach sono formate da due numeri primi con distanza maggiore (2k) e decrescente a partire dalla prima coppia (3, N-3 se anche N-3 è primo, per esempio per N = 20 abbiamo la prima coppia 3 + 17 = 20 = numero N pari). Per un numero di forma 12k con ultima coppia di Goldbach = due numeri primi gemelli, facciamo l’esempio di 120 : l’ultima coppia di Goldbach è 59 e 61, tale che 59 + 61 = 120, mentre la prima coppia è 7 + 113 = 120, essendo 120 - 3 = 117 = 3*3*13, e quindi non primo, e 120 – 5 = 115 = 5*23, anche questo non primo. Circa il prodotto, 59*61 = 3 599, vedi secondo esempio sui numeri gemelli a pagina 8. Nota (sullo spettrometro e la RH) Dal “Blog Matematico” di Umberto Cerreti, “Congettura di Riemann e sicurezza mondiale”: 13 • “…Concludendo: l'intero sistema di sicurezza mondiale entrerebbe in gravi difficoltà se qualcuno trovasse un algoritmo veloce per la fattorizzazione di interi. Che cosa c'entra tutto questo con la congettura di Riemann? Sentiamo le parole del professor Marcus du Sautoy, autore di un bestseller pubblicato in Italia da Rizzoli, con il titolo "L'enigma dei numeri primi": L'intero commercio elettronico dipende dai numeri primi. Io ho descritto i primi come atomi: ciò che manca ai matematici è uno spettrometro di primi. I chimici hanno una macchina che, se ci mettete una molecola, vi dice di quali atomi è composta. I matematici non hanno inventato una versione analoga di essa. Se l'ipotesi di Riemann è vera, essa non produrrà di per sé uno spettrometro. Ma la sua dimostrazione potrebbe farci capire meglio il funzionamento dei numeri primi, e quindi la dimostrazione potrebbe essere trasformata in qualcosa che potrebbe produrre questo spettrometro di primi. Se ciò accadrà, metterà in ginocchio l'intero commercio elettronico nello spazio di una notte”. Quindi, niente RH, almeno direttamente, per quanto riguarda un possibile spettrometro. L’unica relazione nota tra RH e fattorizzazione, o una delle poche, è che la fattorizzazione veloce è in P se la RH è vera. Occorre quindi rivolgersi eventualmente ad altre congetture , come per esempio quella di Goldbach ( o, come prima accennato, ad altre congetture che contemplano coppie di numeri primi come possibili p e q per il prodotto N = p*q) , per dimostrare questa nostra congettura sul possibile spettrometro matematico basato sulla parte decimale di n,d = √N, e considerare 100*0,d , oppure 100*(1- 0,d) come possibile percentuale di n equivalente o quasi a p’ ≈ p reale di p*q = N 14 ALTRI ESEMPI NUMERICI PER CONGETTURA PERCENTUALE , con cenni a prima (p’-p) e seconda differenza (p’ – p’’) percentuale) 1) 100 895 598 169 = 898 423 x 112 303 n = √100 895 598 169 = 317 640 ,67 d = 0,67 percentuale reale 112 303/3176,4067= 35,35% p’ = 317640*0,67 = 212818 ; 1% = 3176,4067; 212 818 – 112 303 = 100 515; 100515/3176,4067 = 31,64% differenza percentuale 67 – 35 = 32 percentuale complementare p’’= n*1-0,67) = n* 0.33= 104 821≈ 112 303 differenza 104821 - 112 303 = -7482 ; -7482/3176,40 = -2,35% di distanza tra p reale e p’’ p’ – p’’ = 212 818 - 104 821= 107 997 ≈ 112 303 seconda differenza percentuale 107 997 - 112 303 = -4 306; -4306/3176= - 1,355 15 questa seconda differenza percentuale è ancora minore della prima, -2,35 2) 1 409 305 684 859 = 705 967 x 1 996 277 n = √1 409 305 684 859 = 1187141, 81 d=0,81, percentuale reale = 59,46%, (cioè 705967/11871,4181) 1187141*0,81 = 961 584 differenza 81 - 59= +22 differenza complementare: 1- 0, 81= 0,19 p’’= 1 187 141*0,19 = 225 556 (troppo basso P Media aritmetica tra p’ e p’’ (961 584+225 556)/2 = 593 570 Differenza percentuale 593570- 705967 = 112 397 / 11871 = 9,468% Ma, curiosamente, anche p ≈ p’ – p’’ = 961584 – 225556 = 736028 ≈ 705967 seconda differenza percentuale 736 028 – 705967 = 30061 30061/11871 = 2,53%, minore della prima differenza percentuale, 9,468 Vogliamo anche inserire come esempi quattro numeri connessi con la 16 Teoria di stringa eterotica connessa al gruppo di Lie E8. I numeri sono 992, 496, 248 e 128. Per 496, abbiamo che 496 = 31 * 24 = 31 * 16; n = √496 = 22,27 dove d = 0,27 che è la percentuale reale p. In questo caso, utilizziamo la p’’, cioè la percentuale complementare già vista in precedenza. Avremo: p’’ = n * (1 – 0,27) = 22,27 * 0,73 = 16,2571 ≈ 16. La differenza sarà d = 16,2571 – 16 = 0,2571. Ora, 0,2571 / 0,2227 (che è dato da 22,27 / 100) = 1,154% che è la distanza tra p reale e p’’. Proviamo con 248. Abbiamo che 248 = 31 * 23 = 31 * 4 * 2. Si ha: n = √248 = 15,748; d = 0,748 percentuale reale p. Ora utilizziamo, come prima, la percentuale complementare p’’. Avremo: p’’ = n * (1 – 0,748) = 15,748 * 0,252 = 3,9684 ≈ 4. La differenza sarà d = 4 – 3,9684 = 0,0315. Ora 0,0315 / 0,1578 ≈ 0,2% che è la distanza tra p reale e p’’. Con 128 avremo: 128 = 27 = 16 * 8; n = √128 = 11,31370; d = 0,31 e p’’ = n * (1 – 0,31) = 11,31 * 0,69 = 7,80 ≈ 8; 8 – 7,80 = 0,20; 0,20 / 0,113137 = 1,76%. Infine, con 992 avremo: 992 = 31 * 25 = 31 * 32 = 31 * 16 * 2; n = √992 = 31,4960; d = 0,496; p’’ = n * (1 – 0,49) = 31,49 * 0,51 = 17 = 16,0599 ≈ 16. d = 16,0599 – 16 = 0,0599; 0,0599 / 0,3149 = 0,19%. Vediamo che, in tutti e quattro casi, con il seguente procedimento, si ottengono dei fattori dei numeri esaminati. Precisamente, per 496 il 16, per 248 il 4, per 128 il fattore 8 e per 992 sempre il 16. Notiamo come questi numeri siano fondamentali nelle teorie di superstringa, in quanto l’8 è il numero inerente le vibrazioni fisiche delle superstringhe. Conclusione : La seconda differenza percentuale ( tra p’ e p’’) nei due casi sopra esaminati su numeri molto grandi è in valore assoluto, circa la radice quadrata della prima differenza percentuale (tra p’ e p reale) primo esempio: 1,35 ≈ √2,35 = 1,53 secondo esempio 2,53 ≈ √9,46 = 3,07 p potrebbe quindi essere (con discrepanze medie del + 10% circa): vicino a p’ = n*0,d vicino a p’’ = n*(1-d) (in caso di basso rapporto q/p, es. primi gemelli) (percentuale complementare, in diversi casi) vicino alla media aritmetica tra p’ e p’’ vicino alla media tra n e p’ vicino alla differenza p’- p’’ , come nei due casi di cui sopra. 18 Tali punti possiedono i maggiori picchi di probabilità in cui trovare più facilmente p reale di p*q = N Riferimenti 1) “Proposta di Dimostrazione Congettura di Cramer – Shank” Rosario Turco, Maria Colonnese, Michele Nardelli, Giovanni Di Maria, Francesco Di Noto, Annarita Tulumello, in sezione “Articoli sulla Teoria dei Numeri; del nostro sito www.gruppoeratostene.com Caltanissetta 1.2.2012 19