Getallenlichamenzeef

De getallenlichamenzeef is een algoritme om samengestelde getallen te ontbinden in priemfactoren. De basis van deze methode is rond 1988 ontwikkeld door de Britse wiskundige John Pollard, die daarmee het zevende fermatgetal factoriseerde. In de jaren daarna zijn verschillende verbeteringen aangebracht, onder andere door Arjen en Hendrik Lenstra, waardoor het momenteel een van de snelste algoritmen is om een getal te factoriseren. Vooral voor getallen vanaf 100 cijfers is deze methode zeer geschikt; kleinere getallen kunnen sneller met de kwadratische zeef, een eenvoudigere methode om getallen te ontbinden, worden gefactoriseerd.[1]

Geschiedenis

De eerste versie van de getallenlichamenzeef (in het Engels: general number field sieve of GNFS) is bedacht door John Pollard. Deze versie, die de speciale getallenlichamenzeef (in het Engels: special number field sieve of SNFS) heet, kan alleen worden gebruikt voor getallen van de vorm r e s {\displaystyle r^{e}-s} met e {\displaystyle e} groot en r {\displaystyle r} en | s | {\displaystyle |s|} klein. Van deze vorm zijn bijvoorbeeld de fermatgetallen. De wiskundigen Joe Buhler en Carl Pomerance bedachten een manier om de speciale getallenlichamenzeef aan te passen, zodat de zeef voor alle getallen (met uitzondering van priemmachten) gebruikt kan worden. Dit leidde tot de algemene getallenlichamenzeef, meestal simpelweg getallenlichamenzeef genoemd.

De eerste getallen die met de speciale getallenlichamenzeef gefactoriseerd werden, zijn 2 128 + 1 {\displaystyle 2^{128}+1} ,     2 144 3 {\displaystyle \ \ 2^{144}-3} (een getal van 44 cijfers waarvan het ontbinden destijds 47 uur duurde) en 2 153 + 3 {\displaystyle 2^{153}+3} (een getal van 47 cijfers dat in 61 uur gefactoriseerd kon worden). Daarnaast is de speciale getallenlichamenzeef gebruikt om onder andere het negende fermatgetal, dat 155 cijfers telt, en mersennepriemgetallen te ontbinden.[2] In januari 2010 heeft een groep wiskundigen een 768-bits RSA-encryptiesleutel weten te kraken met behulp van de getallenlichamenzeef.[3]

Idee

In zekere zin is de getallenlichamenzeef te zien als verbetering van Dixons factorisatiemethode en de kwadratische zeef: men maakt ook hier gebruik van een ontbindingsbasis om gladde factoren te vinden. Daarna wordt eveneens gezocht naar twee getallen die verschillend zijn, maar gekwadrateerd hetzelfde getal opleveren modulo N {\displaystyle N} , waar N {\displaystyle N} het te factoriseren getal is.

Een verschil met de kwadratische zeef is dat niet langer uitsluitend gewerkt wordt met kwadratische veeltermen. Daarnaast wordt gewerkt over andere getallenlichamen dan de gehele getallen en de gehele getallen modulo N {\displaystyle N} , wat als direct gevolg heeft dat de getallenlichamenzeef veel gecompliceerder is dan eerdere methoden.[4]

Achterliggende wiskunde

De kwadratische zeef, waarop de getallenlichamenzeef gebaseerd is, zoekt naar getallen x {\displaystyle x} en y {\displaystyle y} zodanig dat

x 2 y 2 ( mod N )  en  x ± y {\displaystyle x^{2}\equiv y^{2}{\pmod {N}}\quad {\mbox{ en }}x\neq \pm y}

Deze getallen worden gevonden door een functie ϕ {\displaystyle \phi } te definiëren en op zoek te gaan naar geschikte getallen x i {\displaystyle x_{i}} , zodat x 2 {\displaystyle x^{2}} eenvoudig kan worden gevonden als een uitdrukking in deze x i {\displaystyle x_{i}} en y 2 {\displaystyle y^{2}} kan worden gedefinieerd als het product van de functiewaarden ϕ ( x i ) {\displaystyle \phi (x_{i})} . Feitelijk vervult de functie ϕ {\displaystyle \phi } hier de rol van een ringhomomorfisme, dat kwadraten in de ring Z {\displaystyle \mathbb {Z} } afbeeldt op kwadraten in de ring Z / N Z {\displaystyle \mathbb {Z} /N\mathbb {Z} } , dit is de ring van gehele getallen modulo N {\displaystyle N} . De getallenlichamenzeef gaat uit van hetzelfde idee, maar algemener, door een andere ring dan Z {\displaystyle \mathbb {Z} } te gebruiken.[5]

Formeel: zij R {\displaystyle R} een ring en ϕ : R Z / N Z {\displaystyle \phi :R\to \mathbb {Z} /N\mathbb {Z} } een ringhomomorfisme. Als er een r R {\displaystyle r\in R} is met

ϕ ( r 2 ) = y 2 ( mod N )  en  x = ϕ ( r ) , {\displaystyle \phi (r^{2})=y^{2}{\pmod {N}}\quad {\mbox{ en }}\quad x=\phi (r),}

dan geldt

x 2 ϕ ( r ) 2 ϕ ( r 2 ) y 2 ( mod N ) {\displaystyle x^{2}\equiv \phi (r)^{2}\equiv \phi (r^{2})\equiv y^{2}{\pmod {N}}}

In dat geval geldt dat

x 2 y 2 0 ( mod N ) , {\displaystyle x^{2}-y^{2}\equiv 0{\pmod {N}},}

waaruit direct volgt

N = g g d ( N ,   x 2 y 2 ) | g g d ( N ,   x y ) g g d ( N ,   x + y ) {\displaystyle N=\mathrm {ggd} (N,\ x^{2}-y^{2})|\mathrm {ggd} (N,\ x-y)\cdot \mathrm {ggd} (N,\ x+y)}

Als deze grootste gemene delers niet gelijk zijn aan 1 en N {\displaystyle N} , dan hebben we twee niet-triviale factoren gevonden. Op die factoren kunnen we, als ze zelf niet priem zijn, hetzelfde procedé toepassen om een priemfactorontbinding van N {\displaystyle N} te verkrijgen. Je kunt met bijvoorbeeld de priemgetaltest bepalen of de gevonden factor priem is.

Keuze van de ring

Iedere polynoom f ( x ) = x n + a n 1 x n 1 + + a 0 {\displaystyle f(x)=x^{n}+a_{n-1}x^{n-1}+\ldots +a_{0}} , waarvan de coëfficiënt van de hoogste macht van x {\displaystyle x} gelijk aan 1 is en de echte coëfficiënten geheel, rationaal, reëel of complex zijn, is volgens de hoofdstelling van de algebra te schrijven als

f ( x ) = ( x θ 1 ) ( x θ 2 ) ( x θ d ) , {\displaystyle f(x)=(x-\theta _{1})(x-\theta _{2})\cdots (x-\theta _{d}),}

met θ i {\displaystyle \theta _{i}} element van de gekozen verzameling, waaruit de coëfficiënten worden gekozen.

Men kan nu een nulpunt ϑ {\displaystyle \vartheta } van deze polynoom kiezen en de lichaamsuitbreiding Q ( ϑ ) {\displaystyle \mathbb {Q} (\vartheta )} bekijken. Deze lichaamsuitbreiding is een lichaam, en kan worden gezien als de verzameling van polynomen in ϑ {\displaystyle \vartheta } met rationale coëfficiënten, ofwel de Q {\displaystyle \mathbb {Q} } -lineaire combinaties van { 1 , ϑ , ϑ 2 , , ϑ d 1 } {\displaystyle \{1,\vartheta ,\vartheta ^{2},\ldots ,\vartheta ^{d-1}\}} . Het ons beperken tot gehele coëfficiënten, dus Z {\displaystyle \mathbb {Z} } -lineaire combinaties, zou als voordeel hebben dat dit eenvoudiger rekent. Er bestaat een ring die we hiervoor kunnen gebruiken.

Een complex getal α {\displaystyle \alpha } heet een algebraïsch geheel getal als het een nulpunt is van een polynoom f ( x ) {\displaystyle f(x)} met gehele coëfficiënten, met de coëfficiënt van de hoogste macht van x {\displaystyle x} gelijk aan 1. Bij een gegeven f ( x ) {\displaystyle f(x)} van graad d {\displaystyle d} met gehele coëfficiënten en een nulpunt ϑ C {\displaystyle \vartheta \in \mathbb {C} } kunnen we de verzameling R [ ϑ ] {\displaystyle R[\vartheta ]} vormen van alle algebraïsch gehele getallen in Q ( ϑ ) . {\displaystyle \mathbb {Q} (\vartheta ).} Deze verzameling vormt een deelring van het lichaam Q ( ϑ ) {\displaystyle \mathbb {Q} (\vartheta )} . De verzameling van alle Z {\displaystyle \mathbb {Z} } -lineaire combinaties van { 1 , ϑ , ϑ 2 , , ϑ d 1 } {\displaystyle \{1,\vartheta ,\vartheta ^{2},\ldots ,\vartheta ^{d-1}\}} vormt op zijn beurt weer een deelring van R [ θ ] {\displaystyle R[\theta ]} en we noteren hem als Z [ θ ] {\displaystyle \mathbb {Z} [\theta ]} . Het is deze ring die we zullen gaan gebruiken.

Een belangrijke propositie[4] zegt namelijk het volgende. Zij f ( x ) {\displaystyle f(x)} op deze manier gedefinieerd, ϑ C {\displaystyle \vartheta \in \mathbb {C} } een nulpunt van f ( x ) {\displaystyle f(x)} en m Z / N Z {\displaystyle m\in \mathbb {Z} /N\mathbb {Z} } zodanig dat

f ( m ) 0 ( mod N ) {\displaystyle f(m)\equiv 0{\pmod {N}}}

Dan is de afbeelding

ϕ : Z [ ϑ ] Z / N Z {\displaystyle \phi :\mathbb {Z} [\vartheta ]\to \mathbb {Z} /N\mathbb {Z} }

die ϑ {\displaystyle \vartheta } op m {\displaystyle m} afbeeldt een surjectief ringhomomorfisme.

Als we zo'n f , ϑ {\displaystyle f,\,\vartheta } en m {\displaystyle m} hebben, kunnen we dus een surjectief ringhomomorfisme ϕ {\displaystyle \phi } construeren. Daarna gaan we dan op zoek naar een verzameling U {\displaystyle U} (zie volgende paragraaf) van paren ( a , b ) {\displaystyle (a,b)} waarvoor geldt dat

( a , b ) U ( a + b ϑ ) = β 2 {\displaystyle \prod _{(a,b)\in U}(a+b\vartheta )=\beta ^{2}}

en

( a , b ) U ( a + b m ) = y 2 , {\displaystyle \prod _{(a,b)\in U}(a+bm)=y^{2},}

waarin β Z [ ϑ ] {\displaystyle \beta \in \mathbb {Z} [\vartheta ]} en y Z {\displaystyle y\in \mathbb {Z} } .

Hebben we zo'n U {\displaystyle U} eenmaal gevonden, dan zijn we klaar, want dan geldt

x 2 ϕ ( β ) 2 ϕ ( β 2 ) ϕ ( ( a , b ) U ( a + b ϑ ) ) ( a , b ) U ϕ ( a + b ϑ ) ( a , b ) U ( a + b m ) y 2 ( mod N ) . {\displaystyle x^{2}\equiv \phi (\beta )^{2}\equiv \phi (\beta ^{2})\equiv \phi \left(\prod _{(a,b)\in U}(a+b\vartheta )\right)\equiv \prod _{(a,b)\in U}\phi (a+b\vartheta )\equiv \prod _{(a,b)\in U}(a+bm)\equiv y^{2}{\pmod {N}}.} [4]

Het vinden van U {\displaystyle U}

Met de bovenstaande paragraaf in het achterhoofd zien we direct dat we een functie f {\displaystyle f} moeten kiezen. Daarbij zoeken we dan een nulpunt ϑ {\displaystyle \vartheta } en een "nulpunt modulo N {\displaystyle N} " m {\displaystyle m} . Vervolgens willen we een verzameling U {\displaystyle U} van geschikte paren ( a , b ) {\displaystyle (a,b)} vinden. Dat kan door een algebraïsche ontbindingsbasis I {\displaystyle I} voor Z [ ϑ ] {\displaystyle \mathbb {Z} [\vartheta ]} te kiezen (bestaande uit een eindig aantal priemidealen van graad 1 van Z [ θ ] {\displaystyle \mathbb {Z} [\theta ]} ) waarover de getallen a + b ϑ {\displaystyle a+b\vartheta } volledig factoriseren en een rationale ontbindingsbasis F {\displaystyle F} (bestaande uit kleine priemgetallen) voor Z {\displaystyle \mathbb {Z} } waarover de getallen a + b m {\displaystyle a+bm} volledig factoriseren. Als een getal ontbindt over een gekozen ontbindingsbasis, dan noemen we het glad. Als we genoeg paren ( a , b ) {\displaystyle (a,b)} hebben gevonden waarvoor zowel a + b ϑ {\displaystyle a+b\vartheta } als a + b m {\displaystyle a+bm} glad zijn, dan is er zeker een verzameling U {\displaystyle U} te maken bestaande uit (een deel van) de paren ( a , b ) {\displaystyle (a,b)} zodat

( a , b ) U ( a + b ϑ ) = β 2 en ( a , b ) U ( a + b m ) = y 2 , {\displaystyle \prod _{(a,b)\in U}(a+b\vartheta )=\beta ^{2}\quad {\textrm {en}}\quad \prod _{(a,b)\in U}(a+bm)=y^{2},}

waar β Z [ ϑ ] {\displaystyle \beta \in \mathbb {Z} [\vartheta ]} en y Z {\displaystyle y\in \mathbb {Z} } . Hoe dit precies in zijn werk gaat, verschilt niet wezenlijk van de kwadratische zeef.

Met de laatste regels van de vorige paragraaf zijn dan de gewenste getallen x {\displaystyle x} , y {\displaystyle y} met

x 2 y 2 ( mod N )  en  x ± y {\displaystyle x^{2}\equiv y^{2}{\pmod {N}}\quad {\mbox{ en }}x\neq \pm y}

te vinden.

Omdat we werken met twee vrij te kiezen variabelen a {\displaystyle a} en b {\displaystyle b} , wordt vaak b = 1 {\displaystyle b=1} vast gekozen en laat men a {\displaystyle a} variëren. Daarna hoogt men b {\displaystyle b} iets op en zoekt men opnieuw naar geschikte waarden van a {\displaystyle a} . Merk op dat voor vaste p F {\displaystyle p\in F} en vaste b {\displaystyle b} voor alle a Z {\displaystyle a\in \mathbb {Z} } geldt dat

p a + b m a + b m 0 ( mod p ) {\displaystyle p\mid a+bm\iff a+bm\equiv 0{\pmod {p}}}

Daaruit volgt dat

a b m ( mod p ) {\displaystyle a\equiv -bm{\pmod {p}}} ,

ofwel dat a {\displaystyle a} van de vorm a = b m + k p {\displaystyle a=-bm+kp} met k Z {\displaystyle k\in \mathbb {Z} } moet zijn. Op deze manier kunnen we veel a {\displaystyle a} al wegstrepen als ongeschikt, wat het woord zeef in de naam getallenlichamenzeef verklaart (zie ook zeef van Eratosthenes).

Aanvullende opmerkingen

Al wat nog rest, is het kiezen van een functie f {\displaystyle f} , een bijbehorend nulpunt ϑ {\displaystyle \vartheta } en een m Z {\displaystyle m\in \mathbb {Z} } zodanig dat

f ( m ) 0 ( mod N ) {\displaystyle f(m)\equiv 0{\pmod {N}}}

Het is niet bekend wat de beste keuze voor f {\displaystyle f} is, noch wat de graad van f {\displaystyle f} zou moeten zijn, noch hoe we m {\displaystyle m} het beste kunnen vinden. Het algoritme werkt echter ook voor keuzes die niet optimaal zijn, dus is dit ook niet echt van belang. Wel zijn er natuurlijk resultaten over welke waarden het in de praktijk goed doen. Voor getallen van meer dan 110 cijfers leert de ervaring dat d = 5 {\displaystyle d=5} goed werkt; voor kleinere getallen zijn d = 4 {\displaystyle d=4} (vanaf 80 cijfers) en d = 3 {\displaystyle d=3} (vanaf 50 cijfers) beter.[4]

Nu berekent men eerst met de entierfunctie m = N 1 / d {\displaystyle m=\lfloor N^{1/d}\rfloor } . Dan kan men N {\displaystyle N} m {\displaystyle m} -tallig schrijven als

N = m d + a d 1 m d 1 + + a 1 m + a 0 {\displaystyle N=m^{d}+a_{d-1}m^{d-1}+\ldots +a_{1}m+a_{0}} ,

met coëfficiënten 0 a i < m {\displaystyle 0\leq a_{i}<m} voor 0 i < d {\displaystyle 0\leq i<d} . De veelterm f {\displaystyle f} wordt dan gegeven door

f ( x ) = x d + a d 1 x d 1 + + a 1 x + a 0 {\displaystyle f(x)=x^{d}+a_{d-1}x^{d-1}+\ldots +a_{1}x+a_{0}}

Merk op dat f {\displaystyle f} niet irreducibel hoeft te zijn. Als f {\displaystyle f} reducibel is, geldt echter dat

f ( x ) = g ( x ) h ( x ) {\displaystyle f(x)=g(x)\cdot h(x)}

voor niet-constante veeltermen g {\displaystyle g} en h {\displaystyle h} , waaruit volgt dat

N = f ( m ) = g ( m ) h ( m ) {\displaystyle N=f(m)=g(m)\cdot h(m)}

waarschijnlijk een niet-triviale factorisatie van N {\displaystyle N} is. Als f {\displaystyle f} dus reducibel is, dan zijn we nu waarschijnlijk klaar; als dat niet zo is, dan kunnen we de getallenlichamenzeef gebruiken.

Complexiteit

De complexiteit van het algoritme wordt in de O-notatie gegeven door

O ( e c ( ln n ) 1 / 3 ( ln ln n ) 2 / 3 ) , {\displaystyle O\left(e^{c\,(\ln {n})^{1/3}(\ln {\ln {n}})^{2/3}}\right),}

waarin c {\displaystyle c} een constante is met als waarde ongeveer 1,923.

Ter vergelijking: de kwadratische zeef heeft als complexiteit

O ( e ( ln n ) 1 / 2 ( ln ln n ) 1 / 2 ) . {\displaystyle O\left(\mathrm {e} ^{(\ln {n})^{1/2}(\ln {\ln {n}})^{1/2}}\right).}

Hieruit volgt direct dat voor grote n {\displaystyle n} men beter de getallenlichamenzeef kan gebruiken om een getal te ontbinden.

Bronnen, noten en/of referenties
  1. H.W. Lenstra Jr., Het ontbinden van grote getallen in priemfactoren, Nieuwe Wiskrant 15, september 1995, 7-15
  2. A.K. Lenstra en H.W. Lenstra Jr., The development of the number field sieve, Lecture notes in mathematics, Springer-Verlag, Berlijn, 1993
  3. T. Kleinjung et al., Factorization of a 768-bit RSA modulus
  4. a b c d M.E. Briggs, An Introduction to the General Number Field Sieve, masterscriptie, april 1998
  5. C. Pomerance, The number field sieve, Mathematics of Computation, 1943-1993, Fifty Years of Computational Mathematics, W. Gautschi, ed., Proc. Symp. Appl. Math. 48, American Mathematical Society, Providence, 1994, pp. 465-480. Gearchiveerd op 6 mei 2021.