CRITTOGRAFIA A CHIAVE PUBBLICA E CRITTOSISTEMA RSA

1 - Crittografia a chiave pubblica

Il 1976 è un anno importantenella storia della crittografia moderna, non solo perla nascita del DES ma anche per l'introduzione di un nuovo concetto. Grazie a Diffie-Hellman e, indipendentemente, Merkle tale idea rivoluzionerà il modo di "comunicare in segreto": i cifrari a chiave pubblica. L'impatto di questo nuovo nozionenon fu immediato anche se poi risultò dirompente. Ci sono varie motivazioni, anche se in parte ancora oscure, del rifiuto iniziale nell’adozione di questo nuovo concetto. Diffie in un suo scrittoè stato più che mai esplicito e molto critico, imputando lavera causa di tutto ciòad una scelta "partigiana" della comunità e delle aziende che vedevano nel DES e nella produzione dei suoi "marchingegni hardware" un grosso business. Le stesse "bontà" commerciali non sembravanocerte dal nuovo protocollo crittografico,cosicché il suo avvento venne soltanto rimandato, ma non fu possibile evitarlodata l'innovazione introdotta e le frontiere chepotenzialmente si dischiudevano con questa nuova forma dicrittografia. Infatti il cambiamento era indubbiamenteradicale, vediamo di capire il perché.

1.1 - La chiave

Isistemi di crittografia a chiave pubblica, chiamatianche sistemi a due chiavi oasimmetrici, differiscono dai sistemi crittografici convenzionali perchénon c'è più una singola chiave segreta condivisa da una coppia di utenti.Piuttosto, un generico utente A ha una propria chiave K_A= (P_A, S_A),dove P_A è la parte pubblica e S_Aè quella segreta. Le chiavi pubbliche vengono memorizzate in un file a cui tutti gli utenti del crittosistema possono accedere. La chiave pubblica P_A effettua una trasformazione pubblica su un certo messaggio M generando il messaggio P_A(M); mentre la chiave privata P_B effettua una trasformazioneprivata generando il messaggio S_A(M). Detto M l'insieme dei messaggi, le funzioni P_A : M -> M e S_A : M -> M sono definite, rispettivamente, funzioni di cifratura e decifratura. In tale sistema possiamo avere:

· M = S_A(P_A(M))

· M = P_A(S_A(M))

o entrambele relazioni.

Uno dei requisiti di queste funzioni èche la funzione di decifratura deve essere del tipo "oneway". Una funzione è detta "oneway" quando èfacile da calcolare ma difficile da invertire, sempre chenon si ha un'informazione segretaaggiuntiva. Così, se S_A(M) è una funzione di questo tipo, la decifraturada parte del crittoanalista èdifficile da realizzare. Un esempiodi funzioneritenuta "oneway" è: f(x) = x^a mod n dove n è il prodottodi dueprimi p e q abbastanzagrandi, a è un intero positivo ed f : Z_n -> Z_n .

1.2 - Sicurezza

Per garantire la sicurezza, le trasformazionidi unsistema a chiave pubblica devono soddisfareM = S_A(P_A(M)). Supponendo che Avoglia spedire un messaggio in maniera sicura M a B.Allora:

· A ottiene la chiave pubblica di B, P_B;

· A calcola il testo cifrato C = P_B (M) corrispondente al messaggio M e lo spedisce a B;

· B riceve il testo cifrato C e adoperala sua chiave privata S_B per ottenere il messaggio M, S_B (C) = S_B (P_B (M)) = M.

Nel caso in cui un nemico intercettiuna trasmissione daA, certamente nonpuò essere decifrata perché S_B è privata, perquesto motivo la sicurezzaè garantita.

1.3 - Autenticità

Poiché tutti possonoaccedere a P_B, B non può conoscerel'identità del mittente, perciò una trasmissionediA potrebbe essere alterata. Quindi per garantireautenticitàed integrità, le trasmissioni di un sistemaa chiavepubblica devono soddisfare P_A (S_A (M)) = M. Supponiamo che A voglia mandareun messaggio autenticoa B. Allora:

· A calcola la sua firma digitale C’ = S_A (M‘);

· A spedisce la coppia (M ‘, C’) (messaggio, firma);

· Quando B riceverà lacoppia (M‘, C‘) può verificareche questo provengada A essendo P_A la chiave pubblicadi A, verificando l'equazione M’ = P_A (C’).

Così B può accertare che il messaggioè stato spedito da A e non è stato alterato.Infatti, assumendo che M’ èun testo in chiarovalido, B sa che C è stato spedito da A e non è stato alteratodurante la trasmissione.Questo segue dalla natura''oneway'' della funzione P_A. Se un crittoanalistaparteda un messaggio M' potrebbe trovareC' tale cheP_A (C') = M', questo implicherebbeche P_A è invertibile, il che è un assurdo.

1.4 - Confronto con il crittosistema a chiave privata

Quindi il sistema achiave pubblica presenta varie differenze rispettoal sistema a chiave privata. Nell'ambito della crittografia achiave segreta si ha che:

La chiave dicifratura è essenzialmente uguale a quella di decifrazione,e comunque ciascuna può essere facilmente calcolatadall'altra.
La chiavi risultanonote ad entrambi i partner.
La chiave è tenutasegreta da entrambi i partner.

Con la crittografia a chiavepubblica questi concetti subiscono una radicale modifica:

La chiave di cifraturaè completamente diversa dalla chiave di decifrazione.
La chiave di cifraturaè nota a tutti, e dunque è resa pubblica dal destinatario.
La chiave di decifrazioneè mantenuta segreta dal destinatario ed è nota soltanto a lui.
Le funzioni di cifratura edecifrazione sono note a tutti.

2 - Crittosistema RSA

Nel 1978 Rivest, Shamir e Adlemanpubblicarono sulla famosa rivista "Communications of the ACM" ladescrizione del cifrario RSA (dalle loro iniziali) chepossedeva molte interessanti caratteristiche: costituiva il primo(insieme al cifrario di Merkle ed Hellman) esempio di cifrarioa chiave pubblica; operava a blocchi interpretando ognimessaggio come un numero intero; la sua sicurezza si fondava sulladifficoltà della fattorizzazione di numeri interi moltograndi. Sebbene abbia attratto l'interesse dinumerosi crittoanalisti, l'RSA rimane sino ad oggi sostanzialmenteinviolato, e se a tutto ciò si aggiunge una grandissima semplicitàstrutturale, ecco che possiamo ben capire perché questometodo di cifratura abbia avuto così tantosuccesso.Per la sua semplicità l'RSA è ampiamente utilizzato enumerose sono le sue realizzazioni in hardware presentate nel corso di questi anni. Si èdetto che la sicurezza dell'RSA sia strettamente legata al problemadella fattorizzazione, ma nessuno ha mai provato che questo legamesignifichi che i due problemi siano computazionalmenteequivalenti. Comunque tutti gli sforzi fatti per rompere RSA hannoportato inevitabilmente ad individuare algoritmi per la fattorizzazione. D'altrocanto, esistono delle varianti di RSA (Rabin, 1979) chesono dimostrativamente equivalenti al problema della fattorizzazione,e dunque ritenute più sicure almeno daun punto di vista matematico. Però queste varianti non sono semplici come RSA e quindi non hanno avuto il suo stesso successo.

2.1 - Algoritmo RSA

Generazione delle chiavi

1. A genera due numeri primi grandi p e q ;
2. A calcola n = p × q e f(n) = (p - 1)(q - 1) ;
3. A sceglie un numero 1 < e < f(n) tale che gcd(e, f(n)) = 1;
4. A calcola d = e^-1 mod f(n) usando l’algoritmo di Euclide Esteso;
5. A pubblica n ed e come sua chiave pubblica P_A = (e, n).
6. A conserva n e d come sua chiave privata S_A = (d, n).

Per generare la chiave pubblicadicifratura, l'utente A del sistema RSA scegliea caso due numeri primi piuttostograndi p e q; il loro prodotto n = p ×q,unito ad un numeroe, costituiscono la chiave pubblica P_A = (e, n)del sistema.Il numero e è scelto in modo chegcd(e, f(n)) =1 dove f(n) = (p - 1)(q - 1), è la funzionedi Eulero. La chiave privata è costituitadalla coppia S_A = (d, n), dove d è calcolatocome l’inverso moltiplicativo di e mod f(n). La proprietàche e e f(n) sono primi garantisce sempre l'esistenzadell'inverso moltiplicativo d.

Cifratura e decifratura

Per effettuare la cifraturadi unmessaggio

M Î Z_n,

il mittente A prelevadall'elencola chiave pubblica P_B dell'utente destinatarioB e calcola il testo cifrato

C = P_B (M) = M^e mod n.

Il destinatario conoscendo la sua chiave segretaS_B= (d, n) calcola il messaggio in chiaro

M= S_B (C) = C^d mod n.

Correttezza

Verifichiamo ora che la fasedicifratura e quella di decifratura sono unal'inversadell'altra. Poiché

ed º 1 mod f(n)

si ha

ed = t × f(n) + 1

con t intero e t ³1. Suppostoche M Î Z_n^*, siha:

C^d = M^ed = M^ed = M^t^×f⁽ⁿ⁾⁺¹mod n = M

in quantoper il teorema di Eulerosi ha che: x^f(n) = 1mod n.

Nel caso in cui la lunghezza di M sia maggiore di n, si avrebbe che M e (M mod n) originerebbero lo stesso crittogramma. Per ovviare a questo problema si assume che i messaggi siano numeri minori di n. Questo lo si può semplicemente ottenere decomponendo la sequenza di bit rappresentanti il messaggio in chiaro, in gruppi di l =ëlog₂ nû bit ciascuno. Così facendo si garantisce che m < 2^l< n. Questo è un semplice accorgimento cui tutti devono essere a conoscenza.

Nel casa in cui M Î Z_n- Z_n^*per la correttezza si utilizza il teorema del resto cinese.

2.2 - Esempio RSA con piccoli numeri

Generazione delle chiavi

A sceglie due numeri primi p e q:

p = 47, q = 71

A calcola n = p × q e f(n) = (p - 1) × (q - 1)

n = 47 × 71 = 3337, f(n) = 46 × 70 = 3220

· A sceglie e tale che gcd(e,f(n)) = 1

e = 79

· A calcola d = e^-1 mod f(n)

d = 79^-1 mod 3220 = 1019

· La chiave pubblica è la coppia (e, n)

(e, n) = (79, 3337)

· La chiave privata è la coppia (d, n)

(d, n) = (1019, 3337)

Cifratura

Un utente B spedisce adA il messaggio M = 688 conoscendo la suachiave pubblica P_A = (79, 3337)
B calcola C = M^e mod n

C = 688⁷⁹ mod 3337 = 1570

Decifratura

· A riceve il messaggio cifrato C = 1570

· A si ricava M con la formula M = C^d mod n

M = 1570¹⁰¹⁹ mod 3337 = 688

2.3 - Computazioni di RSA

Le procedure del crittosistema RSA si basano sull'elevazione a potenza modulare e sulla risoluzione di equazioni modulari.

2.3.1 - Elevazione a potenza modulare

L’operazione dell’elevazioneapotenza modulare consiste nel calcolarex^y modz dove x, y e z sono interi. Presentiamo varie procedure per effettuare il calcolo.

Metodo naive

Intuitivamente si può semplicementemoltiplicarex per se stesso y volte facendoad ogni passo modulo z per evitare cifre troppograndi.Tale metodo è alla base del seguente algoritmo:

POTENZA MODULARE NAIVE(x,y,z)
	a ¬ 1;
	for i = 1 to y do
		a¬ (a × x ) mod z
	return a

Tale algoritmo in realtà non è utilizzatoin quanto poco efficiente. Il numero cicli,infatti , è asintoticamente ugualea y. Quindi se y èdi 512 bit si avranno 2⁵¹² cicli. I metodirealmente utilizzatisono due: il metodo"Left to right" e il metodo "Right to left".

Metodo Left-to-Right

Ricordando che vogliamo calcolare x^y mod z, supponiamoche y₀y₁y₂y₃…y_tsiano i bit da cui è formato yespresso in basedue, il valore di y è quindi:

y = y₀+2(y₁+2(y₂+2(y₃…2(y_t-1+2y_t)…))) ,

da cui

Da tali considerazioni siottiene il seguente algoritmo:

METODO LEFT TO RIGHT(x,y,z)
	a ¬ 1;
	for I = t downto 0 do
		a¬ (a × a ) mod z
		if y_i= 1 then a¬ (a × x ) mod z
	return a

Chiaramente tale algoritmo èmigliorerispetto a quello precedente infatti se yècomposto da 512 bit ora il numero di cicli è512.

Metodo Right-to-Left

Anche tale metodo segue da considerazioni matematiche infatti si ha che:

y = y₀2⁰ +y₁2¹+ ... + y_t-12^t-1 + y_t2^t

da cui

Da ciò segue l’algoritmo per il calcolo di x^y mod z :

METODO RIGHT TO LEFT(x,y,z)
	if y = 0 then return 1
	X ¬ x; P ¬ 1;
	If y₀= 1 then X ¬ x
	for I = 1 to t do
		X ¬ (X × X) mod z
		if y_i= 1 then P ¬ (P × X ) mod z
	return P

Anche questo metodo impiega 512 cicli se y è di 512 bit.

2.3.2 - Equazioni modulari

Le equazioni modulari consistono nel risolverel’equazione ax º b (mod n). Tale calcolo richiede la conoscenza dell'algoritmo di Euclide e dell'algoritmo di Euclide Esteso.

Algoritmo di Euclide

L’algoritmo di Euclide,descrittonegli "Elementi di Euclide" [300 A.C.], è utilizzatoprincipalmente per il calcolo del MassimoComune Divisore; l’algoritmodi Euclide esteso è utilizzato per la risoluzione delleequazioni lineari modulari. Il nostrointeressea risolvere tali equazioni dipende dal fatto che sonoutilizzateper il calcolo di un parametro fondamentalenel sistema crittografico RSA. L’algoritmo di Euclidesi basa sul "Teoremadi ricorsione del MassimoComune Divisore" che dice: "Per tutti gli interi a³ 0e b>0 il gcd(a, b) è uguale al gcd(b, a mod b)".

EUCLIDE (a,b)
	if b = 0 then return a
		else return EUCLIDE (b, a mod b)

Assumendo a > bsi ha chel’algoritmo di Euclide esegue al più log bchiamate, in ogni chiamata si hanno O((log a)²)operazionisui bit da cui in totale si hanno O((log a)³) operazionisui bit. Dall’analisi in realtà si ottieneche Euclide richiede al più O((log a)²)operazioni sui bit.

Esempio Consideriamo la computazione del gcd(30,21):

EUCLIDE(30,21) = EUCLIDE(21,9) = EUCLIDE(9,3) = EUCLIDE(3,0) = 3

In questa computazione ci sono solo tre chiamate ricorsive.

L’algoritmo non sarà ricorsivo all’infinito poiché il secondo parametro decresce strettamente in ogni chiamata ricorsiva. Così l’algoritmo di Euclide termina sempre con una risposta corretta.

Algoritmo di Euclide Esteso

La procedura prendein input due interi arbitrari (a e b) e restituisce una tripla (g, x, y)che soddisfa l’equazione:

g = gcd(a,b) = ax + by.

Il seguente pseudo-codice implementa l'algoritmo di Eulero Esteso:

EUCLIDE-ESTESO (a, b)
	if b = 0 then return (a, 1, 0)
	(g’, x’ ,y’) ¬ EUCLIDE-ESTESO (b, a mod b)
	(g, x, y) ¬(g’, y’, x’ - ë a / b û y’)
	return (g, x, y)

Quest’algoritmo permette dirisolvere equazioni del tipo ax º b (mod n) o ax º1 (mod n). Tale algoritmo ha un tempo di esecuzione uguale all'algoritmo di Euclide.

Esempio EUCLIDE-ESTESO(99,78):

Da cui i valori finali: g = 3, x = -11 e y = 14.

Possiamo dimostrare che tali valori sono incorretti sostituendo tali valori in

g = gcd(a,b) = ax + by.

Quindi abbiamo che

3 = 99*-11 + 78*14

come volevasi dimostrare.

Risoluzioni di equazioni modulari

Supponiamodi voler risolverel’equazione ax º b (mod n), tale equazione ha soluzione se e solose g|b, dove g = gcd(a, n). In tal caso ci sono esattamente g distinte soluzioni modulo n:

x' (b/g) + i (n/g) per i = 0, 1, …g-1,

dove x’ si ottiene risolvendo l'equazione g = ax’ + ny utilizzandol’algoritmo EUCLIDE-ESTESO(a, n) precedentementetrattato.

Per ottenere le g distinte soluzioni si può usare il seguente algoritmo:

RISOLUZIONE-EQUAZIONI-LINEARI-MODULARI (a, b, n)
	(g, x’, y’)¬ EUCLIDE-ESTESO(a, n)
	if g\|b
		then x₀¬x’(b/g) mod n
		for i = 0 to g- 1
			do print (x₀ + i (n/g))mod n
	else print "nessuna soluzione"

Il tipo di equazionilineari modulariutilizzate nell’RSA è ax º 1 (mod n), essaha soluzione se e solo se gcd(a, n) = 1.

La soluzione èx’ dove 1 = ax’ + ny.

Usando EUCLIDE-ESTESO(a, n) è possibile ottenere tale soluzione, che viene denotata con a^-1mod n.

2.4 - Generazione di chiavi

L’algoritmodi generazione dellechiavi permette di generare la chiave pubblica (e,n) ela chiave privata (d,n). Tale algoritmopuò essere schematizzato in 5 punti:

Input L (lunghezza modulo)
Genera2 primi di lunghezza L/2
n ¬ p × q
scegli 1 < e < f(n), comunque piccolo
if gcd(e, (p-1)(q-1)) = 1

then d ¬ e^-1 mod (p – 1)(q – 1)

else goto 4

Lalunghezza L definita nel punto 1 indica da quanti bit sarà composto n, è quindi fondamentale scegliere un valore appropriato per garantire una buona sicurezza. I due numeri generati al passo 2 sono di lunghezza L/2 perché il prodotto di tali numeri è di lunghezza L. Nei passisuccessivi (3,4,5) vengono generati e, d ed n; (e,n) rappresenta la chiave pubblica, (d,n) quella privata.

In realtà l’algoritmo utilizzato in pratica è il seguente:

Input L (lunghezza modulo)
e ¬ 3oppure e ¬ 2¹⁶+ 1
Genera 2 primidi lunghezza L/2
n ¬ p × q
if gcd(e, (p - 1)(q - 1)) = 1

then d ¬ e^-1 mod (p – 1)(q – 1)

else goto 3

La scelta di e = 3 oppure e = 2¹⁶ + 1 = 65537 dipende dal fatto che la rappresentazione binaria che ne consegue contiene solo 2 bit uguali ad 1. Una simile rappresentazione facilita il processo di cifratura in quanto si possono usare i metodi, left-to-right o right-to-left, precedentemente descritti per effettuare l'elevazione a potenza modulare. Il fissare e in questo modo non fa perdere sicurezza al sistema, ma rende molto veloce il processo di cifratura.

3 - Sicurezza di RSA

La sicurezza dell'RSA si basasulfatto che la funzione di cifratura x^e mod n è una funzione "one-way" che è computazionalmentedifficile da invertire per un nemico chevolesse decifrare un messaggio. Solo conoscendo la fattorizzazione di n è possibile trovare il valore delle chiavi. Infatti conoscendo la fattorizzazione di n èpossibilecalcolare f(n)=(p-1)(q-1) e calcolare d = e^-1 mod f(n) usandol'algoritmoesteso di Euclide. Da ciò si deduceche la sicurezza dell'RSA dipende dal problema di fattorizzaregrandi numeri. Di conseguenza il modo piùovvio di attaccare il sistema, è quello di tentare di risolverequest’ultimo problema.Gli algoritmi più efficienti, conosciuti fino ad ora, hannounacomplessità

Fattorizzare unnumero di 664 bit richiedealmeno 10²³ passi usando gli algoritmi più efficienti; per cui ipotizzandodi avere una rete costituita daun milione di computer con ciascuno di loro che esegueun milione di passi al secondo, il tempoimpiegatoper fattorizzare n sarebbe dell'ordine dei 4000 anni. Sepoi nfosse un numero a 1024 bit la stessa rete impiegherebbe 10¹⁰ anniper fattorizzarlo. Ciò sottolinea l’osservazione fatta nell’introduzione e cioè che non è impossibile decifrare un testo cifratocon il crittosistema RSA, ma piuttosto è computazionalmente difficile.

3.1 - Fattorizzazione

Fattorizzareun numero n significa trovare i suoi fattori primi. Il problema della fattorizzazione è uno dei più vecchinella teoria dei numeri. In questa sezione faremo una discussione informale sui migliori algoritmidi fattorizzazione conosciuti. Attualmente, gli algoritmi capaci di fattorizzare in modo efficiente numeri molto grandi, sono due:

• Quadratic Sieve. Questoè l'algoritmo più veloce conosciuto per numeri con meno di 150 cifre decimali; mentre perun numero maggiore di cifre è chiamata Multiple Polynomial Quadratic Sieve. Per questo algoritmo la versionepiù veloce è Double Large Prime Variation of the Multiple Polynomial Quadratic Sieve.

• Number Field Sieve (NFS) . Questoè l'algoritmo di fattorizzazione conosciuto più veloce. Quando fu proposto non era moltopratico, ma c' è stato un cambiamento dovuto alle implementazioni degli ultimi anni.L' algoritmo Multiple Polynomial Quadratic Sieve è più veloce per numeri piccoli (da 110 a 135 cifre decimali a secondo delle implementazioni).

Esistono altri algoritmidi fattorizzazione che però sono stati sostituiti da questi due menzionati sopra:

• Elliptic Curve Method (ECM) . Questometodo è stato molto usato per trovare fattori di numeri a 38 cifre, ma non più grandi. Per numeri più grandi, gli altri algoritmi sono più veloci.

• Trial Division. Questo è il più vecchioalgoritmo di fattorizzazione, ed implica il controllo di ogni numero primo minore o ugualedella radice quadrata del numero candidato. Se n < 10¹², questo è unmetodo di fattorizzazione ragionevole, ma per n più grande abbiamo tecniche più sofisticate.

.3.1.1 - Quadratic Sieve

Questo algoritmo fu inventatoda Pomerance agli inizi degli anni ‘80.E basato su un’idea molto semplice: se riusciamo a trovare xe y tali che x² º y² mod n e x ¹ ± y mod n allora gcd(x – y, n) è un fattorenon banale di n.Il metodo usa una factor base, che è un insieme B di primi piccoli.Ricaviamodiversi interi x tali che tuttii fattori primi di x² mod n stiano nella factor base B. (Come questosiafatto lo vedremo dopo). L’idea è di prendere il prodotto di diversi x in modo che ogni primonella factor base venga usato un numero pari di volte. Così avremo unacongruenza del tipo desiderato x² º y² mod n, che può portarci ad una fattorizzazione di n.

Esempio Consideriamon = 15770708441. Sia B = {2; 3; 5; 7; 11; 13} la factor base. Consideriamo le tre congruenze:

(8340934156)² º 3 × 7 mod n

(12044942944)² º 2 × 7 × 13 mod n

(2773700011)² º 2 × 3 × 13 mod n

Se prendiamo il prodotto di queste tre congruenze, abbiamo:

(8340934156 × 12044942944 × 2773700011)² º (2 × 3 × 7 × 13) ² mod n

Riducendo l'espressione nella parentesi modulo n, abbiamo

(9503435785)² º (546)² mod n

Quindi calcolando gcd(9503435785-546; 15770708441); troviamo il fattore 115759 di n.

Supponiamoche B={p₁, p₂, ... p_B} sia la factor base. SiaC leggermente più grande di B (diciamo C = B + 10) e supponiamo di aver ottenuto C congruenze:

x_j² º p₁^a1j × p₂^a2j × ... × p_B^aBj mod n per 1 £ j £ C

Per ogni j, consideriamo il vettore:

a_j= {a_1jmod 2, ..., a_Bj mod 2}Î (Z₂)^B

Se riuscissimo a trovare un sottoinsieme degli a_jche sommati modulo 2 danno il vettore (0,0,…… ), allora il prodotto deicorrispondenti x_juserà ogni fattore di B un numero pari di volte. Vediamo con un esempio che esiste una dipendenza anche se C < B.

Esempio I tre vettori a_1; a₂; a₃sono:

a₁= (0; 1; 0; 1; 0; 0)

a₂= (1; 0; 0; 1; 0; 1)

a₃= (1; 1; 0; 0; 0; 1)

E’ facile vedere che

a₁+ a₂ + a₃ = (0,0,0,0,0,0) mod 2

Questo dà origine allacongruenza che abbiamo visto nell'esempio 1 che fattorizza n. Osserviamo che per trovare un sottoinsieme di C vettori a₁, ..., a_C, la cui somma modulo 2 è il vettore di tutti zeri, non è niente di più che trovare una combinazione lineare (su Z₂) di questi vettori. Dato C > B, tale dipendenza linearedeve esistere e può essere trovata facilmente usando il metodo standard dell’eliminazione gaussiana. La ragione del perchéC > B + 1 è che non c' è nessuna garanzia che unadata congruenza x² º y² mod n produrrà la fattorizzazione di n. Approssimativamente solo per il 50% dellevolte accade che x º ± y mod n mod n. Ma se C > B + 1, allora possiamo ottenere varie di queste congruenze (che sorgono da dipendenze lineari diverse tra gli a_j ).

Resta da discutere come otteniamo gli interi x_j tali che x_j²mod n fattorizzino completamente sulla factor base B. Un metodo usato comunemente è usare gli interi della forma:

x_i = i + ë n^1/2û i=1,2,...

Allora una proceduraal setaccio è usata per determinare quegli x_i che sono fattori su B. C' è naturalmenteun tradeoff : se B = |B| è grande, allora abbiamo bisogno di più congruenze prima di poter trovare una relazione di dipendenza.

3.1.2 - Algoritmi in pratica

Nel caso peggiore, ilrunning time asintotico degli algoritmi quadratic sieve e elliptic curve è essenzialmente lo stesso. Ma intale situazione, quadratic sieve supera elliptic curve poichè le costanti nascoste sono più piccole.Il metodo elliptic curve è più utile se i fattori primi di n sono di taglia diversa.Un numero molto grande che fu fattorizzato usando il metodo dell'elliptic curve fu il numero di Fermat 2²¹¹-1 nel 1988 da Brent. Perfattorizzare i moduli dell’RSA (dove n = pq; p e q sono primi e sono circa della stessa lunghezza) il quadraticsieve è ora l’algoritmo che ha più successo. Nel 1983, il quadratic seive fattorizzòcon successo un numero di 69 cifre che era un fattore (composto) di 2²⁵¹( questo calcolofu fatto da David, Holdredge e Simmons).Con il progresso i numerisonosaliti fino a 106 cifre furono fattorizzati con questo metodo da Lenstra e Manasse, chedistribuirono i calcoli a centinaia di postazioni di lavoro separate (chiamarono questo approccio "fattorizzazionetramite posta elettronica"). La fattorizzazione di un RSA120 (che è una lista di numeri compostiche sono dell'ordine di 120 cifre) richiese 825 MIPSanni (MIPS= un milione di istruzioni per secondo)di tempo di computazione e si usò una factor base di cardinalità 245810. Il Number Field Sieve è il piùrecente dei tre algoritmi, e sembra avere una grande potenzialità poiché il suo runnig timeasintotico è più veloce sia del Quadratic sieve sia dell’Elliptic curve. E’ ancora in fase di sviluppo,ma si pensa che il Number field sieve potrebbe provare di essere più veloce per numeri che hanno più di 125130 cifre.

Carl Pomerance ha progettatouna macchina di fattorizzazione modulare. La grandezza del numero che si può fattorizzare dipende da quanto è grandela macchina che si può fornire. Il modello di dimostrazione di Pomerance èun’implementazione di $ 25.000 che può fattorizzare numeri di 100 cifre in due settimane. Una macchina di $10 milioni potrebbe fattorizzare un numero di 150 cifre in un anno. Teoricamente non ci sono limiti per questomodello di fattorizzazione. Per fattorizzare un numero di 200 cifre in un anno, la macchina costerebbe $ 100 bilioni.

3.2 - Attacchi RSA

Osserviamo che per uncrittoanalista rompere l'RSA equivale a calcolare f(n). Infatti, se n e f(n) sono conosciutied n è il prodotto di due primi p e q, n può essere facilmente fattorizzato risolvendo le dueseguenti equazioni: n = p × q e f(n)= (p - 1)(q - 1). Nelle due incognite p e q. Sostituendoq = n / p nella seconda equazione se ne ottiene un’unica di secondo grado nella sola incognita p:

p² - (n - f(n) + 1)p + n = 0.

Le due radici di questaequazionesono i fattori p e q. Quindi se un crittoanalista conosce il valore di f(n) può fattorizzare n e rompere il sistema.

Esempio Supponiamo cheil crittoanalista conosca f(n) = 84754668 e n = 84773093.Questeinformazioni gli permettono di scrivere l'equazione: p² - 18426p + 84773093 = 0. Risolvendol’equazione si ottengono le due radici 9539 e 8887 che rappresentano i fattori p e q di n.

3.2.1 - Attacco Chosen Ciphertext

Mostriamo questotipo di attacco nei seguenti casi:

CASO 1: consideriamodue utenti di una rete, Oscar e Alice, e supponiamo cheOscar intercetti le comunicazioni di Aliceprelevando i messaggi cifrati C. Matematicamente Oscar vuolcalcolare M = C^d. Per calcolare M egli sceglieper primo un numero casuale r tale che r < n, ed inoltre conosce la chiave pubblica e di Alice. Egli può calcolare:

x = r^e mod n

y = xC mod n

t = r^-1 mod n

Se x = r^emod n allorar = x^d mod n per cui t = x^-d mod n.Ora Oscar manda y ad Alice chiedendone la firma, e Alicespedisce ad Oscar u = y^d mod n (da notare che Alice ha firmato y e non una suaversione hash). Oscar può calcolare:

tu mod n = x^-d y^d mod n = x^-d x^d C^d mod n = C^d mod n = M

CASO 2: supponiamo diavere un computer Hall che notifichi documenti. In altre parolese un utente vuole farsi notificare un documento,lo spedisce ad Hall, il quale lo firma con la sua chiave privata, e lo rispedisce al mittente. (Non sonoutilizzate funzioni one-way hash). Supponiamo che Oscar voglia farsinotificare un documento N da Hall il quale per una ragione qualsiasinon voglia farlo. Per prima cosa Oscar sceglieun valore arbitrario X e calcola Y = X^e, prelevando la chiave pubblica e di Hall.In seguito calcola M = Y N e fa firmare M da Hall. Quindi Hallgli ritorna M^d mod n, da ciò Oscar calcola

(M^d mod n) X^-1 = N^dmod n

cioè la firma del documento N. Questo è possibileperché l'esponenziazione preserva la strutturamoltiplicativa dell'input, cioè:

(XM)^d = X^d M^d mod n

CASO 3: Oscar vuole farfirmare a Bob un documento M₃ che Bob non vuole firmare. Allora Oscar, genera due documenti M₁, M₂ tali che:

M₃ºM₁ M₂mod n

Quindi manda alla firma di Bob sia M₁ che M₂e calcola:

M₃^dmod n = M₁^dmod n M₂^dmod n

che è la firma di M₃.

3.2.2 - Attacco Common Modulus

Supponiamo che due utenti usano un modulo comune n ed esponenti di crittazione e₁ed e₂ con gcd(e₁, e₂) = 1. Se viene inviato lo stesso messaggio M ad entrambi, allora vengono calcolati i testi cifrati come:

C₁ = M^e1 mod n

C₂ = M^e2 mod n

Se entrambi C₁, C₂ vengono intercettati allora un intruso può, usando l'algoritmo di Euclide, calcolare r ed s tali che :

re₁ + se₂ = 1

e quindi ottenere

M = C₁^r C₂^s mod n.

3.2.3 - Attacco Low Exponent

A priori l'esponentedi crittazione e nello schema RSA è arbitrario. Comunque, si consiglia di scegliere un valore di e in modo daessere lo stesso per tutti gli utenti del sistema. Scegliere e = 2 è impossibile in quanto 2 non è primocon p - 1 o q - 1. Ci sono comunque interessi teorici nella scelta del valore 2 in quanto Rabin eWilliams hanno notato che modificando l’RSA ed usando 2 come esponente, un attacco del tipo ciphertext-only ètanto difficile quanto fattorizzare.

La scelta del valore 3 può esserefatta nell'RSA; essa comporta vantaggi dovuti alla semplicità della codifica e decodifica dei messaggi. Questovalore ed altri esponenti dello stesso ordine di grandezza sono consigliati anche se comunque soffronodi qualche problema. Illustriamo cosa comporta la scelta delvalore e = 3. Per prima cosa gli utenti devono essere sicuri che ogni blocco M che deveessere codificato soddisfi la relazione M³ >> n. E’ consigliabile rispettare tale relazioneperché essendoC = M³ mod n diviene semplicemente C = M³ se M³ < n. In questo caso la ricerca di M si riduceal semplice problema del calcolare una radice cubica. Così l'uso di e = 3 fa si che essa possa essere scelta inun sottoinsieme di [0; n) piuttosto che l'intero intervallo come sarebbe preferibile. Cipossono essere altri problemi nello scegliere e = 3. Infatti supponiamo che A mandi lo stesso messaggio ad ognunodei B_i, con i = 1, 2, 3. Supponiamo che i vari B_i usino come modulo n_i e M < n_i per ogni i. Assumiamo che ognuno degli {n₁, n₂, n₃} siano generati come prodotto di due numeri primi casuali;la probabilità fra i sei primi usati è circa zero. Dunque può essere soddisfacente assumere che gli n_i siano coppie relativamente prime.

Sia C_i = M³ mod n_i. Supponiamoche i tre messaggi cifrati siano intercettati. Usando il teorema Cinese del resto, il nemico può trovarex nell' intervallo [0; n' ), con n' = n₁n₂n₃ dove x º C_i mod n_i con i = 1 ,2, 3. Quindi xºM mod n'. Essendo M³ < n' risulta M³ = x, così M = x^1/3. Quindi il testoin chiaro M può essere facilmente recuperato dai tre testi cifrati. Concludendo, l'uso die = 3 o di altri esponenti dello stesso ordine di grandezza, rendono l'RSA vulnerabile rispettoad attacchi di tipo ciphertext-only. Il mittente può cercare di modificare M per ogni destinatario inmodo da evitare questo attacco. Hastad ha dimostrato che in generale la scelta di un bassoesponente rende comunque l'RSA vulnerabile se ci sono dipendenze lineari tra parti del testo in chiaro.

4 - Bibliografia

Ronald L. Rivest, Adi Shamir, and Leonard M. Adleman, A Method for Obtaining Digital Signatures and Public-Key Cryptosystems, Communications of the ACM 21,2 (Feb. 1978), 120--126.
Bruce Schneier, Applied Cryptography, John Wiley & Sons Inc., 1996
James Nechvaltal, Public key cryptography, da Contemporary Cryptology IEEE PRESS 1992
T.H.Cormen, C.E. Leiserson, R.L. Rivest, Introduction to algorithms, John Wiley & Sons Inc., 1990