Brent-Verfahren

Das Brent-Verfahren ist ein Verfahren der numerischen Mathematik zur iterativen Bestimmung einer Nullstelle, welches die Bisektion, das Sekantenverfahren (bzw. lineare Interpolation) und die inverse quadratische Interpolation miteinander kombiniert. Das Verfahren wurde von Richard P. Brent 1973 entwickelt und ist eine Modifizierung des früheren Algorithmus von Theodorus Dekker (1969).

Grundidee

Problem: Gesucht ist die Nullstelle f ( x ) = 0 {\displaystyle f(x)=0} einer stetigen Funktion f : [ a , b ] R {\displaystyle f\colon [a,b]\to \mathbb {R} }
Gegeben sind zwei Startwerte a {\displaystyle a} und b {\displaystyle b} , deren Funktionswerte f ( a ) {\displaystyle f(a)} und f ( b ) {\displaystyle f(b)} unterschiedliches Vorzeichen besitzen, d. h. f ( a ) f ( b ) < 0 {\displaystyle f(a)\cdot f(b)<0} , so dass nach Zwischenwertsatz eine Nullstelle im Intervall [ a , b ] {\displaystyle [a,b]} existiert.

Zur Lösung dieses Problems kann man nun unterschiedliche Lösungsansätze verwenden. Allgemein wird man mit der Bisektion immer zu einer Näherung kommen. Aber es gibt auch Verfahren, die für glatte Funktionen schneller konvergieren können, wie das Sekantenverfahren mit superlinearer Konvergenz. Es gibt aber Beispiele, wo das Sekantenverfahren gar nicht konvergiert, da dieses Verfahren nur lokal konvergent ist, das heißt, es hängt davon ab, wie die Startwerte gewählt sind.

Die Dekker-Methode vereinigt nun die beiden Vorteile der zwei Verfahren.

Verfahren von Dekker

Drei Punkte gehören zu jedem Iterationsschritt:

  • b k {\displaystyle b_{k}} ist der aktuelle Iterationswert
  • a k {\displaystyle a_{k}} ist der gegenüberliegende Punkt, d. h. ein Punkt, so dass f ( a k ) {\displaystyle f(a_{k})} und f ( b k ) {\displaystyle f(b_{k})} unterschiedliches Vorzeichen besitzen, so dass das Intervall [ a k , b k ] {\displaystyle \left[a_{k},b_{k}\right]} die Nullstelle enthält. Außerdem sollte noch folgendes gelten: | f ( b k ) | | f ( a k ) | {\displaystyle |f(b_{k})|\leq |f(a_{k})|} , damit b k {\displaystyle b_{k}} eine bessere Näherung ist als a k {\displaystyle a_{k}} .
  • b k 1 {\displaystyle b_{k-1}} ist der vorherige Iterationswert (im ersten Iterationsschritt setzten wir b k 1 = a 0 {\displaystyle b_{k-1}=a_{0}} ).

Für jeden Iterationsschritt werden zwei vorläufige Werte ermittelt. Der erste durch das Sekantenverfahren:

s = b k b k b k 1 f ( b k ) f ( b k 1 ) f ( b k ) , {\displaystyle s=b_{k}-{\frac {b_{k}-b_{k-1}}{f(b_{k})-f(b_{k-1})}}f(b_{k}),}

und der zweite durch die Bisektion:

m = a k + b k 2 . {\displaystyle m={\frac {a_{k}+b_{k}}{2}}.}

Wenn der Wert des Sekantenverfahrens s {\displaystyle s} zwischen b k {\displaystyle b_{k}} und m {\displaystyle m} liegt, dann wird das der neue Iterationswert b k + 1 = s {\displaystyle b_{k+1}=s} , ansonsten der Mittelpunkt nach Bisektion ( b k + 1 = m {\displaystyle b_{k+1}=m} ).

Der neue Punkt a k + 1 {\displaystyle a_{k+1}} wird so gewählt, dass f ( a k + 1 ) {\displaystyle f(a_{k+1})} und f ( b k + 1 ) {\displaystyle f(b_{k+1})} unterschiedliche Vorzeichen besitzen, dies geschieht folgendermaßen: wenn f ( a k ) {\displaystyle f(a_{k})} und f ( b k + 1 ) {\displaystyle f(b_{k+1})} unterschiedliche Vorzeichen haben, dann wird a k + 1 = a k {\displaystyle a_{k+1}=a_{k}} . Ansonsten müssen f ( b k + 1 ) {\displaystyle f(b_{k+1})} und f ( b k ) {\displaystyle f(b_{k})} unterschiedliche Vorzeichen haben, so dass a k + 1 = b k {\displaystyle a_{k+1}=b_{k}} .

Schlussendlich muss b k + 1 {\displaystyle b_{k+1}} die bessere Näherung sein, also es muss gelten | f ( b k + 1 ) | | f ( a k + 1 ) | {\displaystyle |f(b_{k+1})|\leq |f(a_{k+1})|} , wenn nicht, werden einfach beide Variablen getauscht.

Damit ist ein Iterationsschritt durchgeführt.

Verfahren von Brent

Die Dekker-Methode konvergiert schnell, wenn die Funktion gutartig ist. Es gibt aber Beispiele, bei denen in jedem Iterationsschritt das Sekantenverfahren verwendet wird, aber die b k {\displaystyle b_{k}} nur sehr langsam konvergieren. Insbesondere | b k b k 1 | {\displaystyle |b_{k}-b_{k-1}|} kann beliebig klein werden, d. h. b k 1 {\displaystyle b_{k-1}} liegt sehr nah bei b k {\displaystyle b_{k}} . In diesem Fall benötigt Dekkers Methode weit mehr Iterationsschritte als die Bisektion.

Um dies zu vermeiden, hat Brent das Verfahren leicht modifiziert, indem zur Berechnung der neuen Näherung gegebenenfalls drei Punkte a , b {\displaystyle a,b} und c {\displaystyle c} verwendet werden, die drei Punkte umfassen die Näherung des letzten Iterationsschrittes und den dazugehörigen gegenüberliegenden Punkt, dessen Funktionswert ein anderes Vorzeichen besitzt, und eine „ältere“ Näherung aus einem vorherigen Schritt. Außerdem werden noch mehr Voraussetzungen verlangt, bevor überhaupt eine Interpolation durchgeführt wird, so dass ein zu langsames Konvergieren ausgeschlossen werden kann und das Verfahren nicht viel langsamer als die Bisektion konvergiert. Außerdem verwendet Brent nicht nur die lineare Interpolation, sondern auch die inverse quadratische Interpolation, wenn die drei Punkte a , b {\displaystyle a,b} und c {\displaystyle c} unterschiedliche Funktionswerte f ( a ) , f ( b ) {\displaystyle f(a),f(b)} und f ( c ) {\displaystyle f(c)} besitzen. Dies verspricht eine etwas bessere Effizienz bei der Annäherung an die Nullstelle.

Die Interpolation wird durchgeführt, wenn der dadurch neu berechnete Punkt s in dem Intervall [ 3 4 ( c b ) ( c b ) , b ] {\displaystyle \left[{\tfrac {3}{4}}(c-b)(c-b),b\right]} liegt, sonst führt man einen Bisektionsschritt durch. Außerdem soll die Änderung des Punktes b k + 1 = b k + d {\displaystyle b_{k+1}=b_{k}+d} größer sein als ein gewisser Toleranzwert t o l {\displaystyle tol} , welcher aus der gewünschten Genauigkeit t {\displaystyle t} und der Maschinengenauigkeit ε {\displaystyle \varepsilon } berechnet wird. Sollte der Schritt kleiner sein, ändert man den Punkt b um diesen Toleranzschritt, um wenigstens | b k b k 1 | t o l {\displaystyle |b_{k}-b_{k-1}|\geq tol} zu gewährleisten, also man rechnet b k + 1 = b k ± t o l {\displaystyle b_{k+1}=b_{k}\pm tol} . Nach so einem kleinen Schritt um t o l {\displaystyle tol} wird spätestens im übernächsten Iterationsschritt eine Bisektion durchgeführt, um so das Verfahren nicht viel langsamer konvergieren zu lassen als die Bisektion an sich.

Brent zeigt, dass seine Methode höchstens N 2 {\displaystyle N^{2}} Iterationsschritte benötigte, wobei N {\displaystyle N} die Anzahl der Iterationsschritte für die Bisektion ist. Wenn die Funktion f {\displaystyle f} gutartig ist, dann wird die Brent-Methode in der Regel die inverse quadratische oder die lineare Interpolation verwenden und somit superlinear konvergieren.

Algorithmus von Brent für Matlab

Folgender Algorithmus liegt dem Brent-Verfahren zugrunde:

fa=f(a); fb=f(b);

if fa*fb>0
    error('f(a) und f(b) sollten unterschiedliche Vorzeichen haben');
end

c=a; fc=fa;   %Zu Beginn ist c = a

c=a; fc=fa; d=b-a; e=d;

iter=0;
maxiter=1000

while iter<maxiter
    iter=iter+1

    if fb*fc>0
        c=a; fc=fa; d=b-a; e=d;
    end

    if abs(fc)<abs(fb)
        a=b; b=c; c=a;
        fa=fb; fb=fc; fc=fa;
    end

    tol=2*eps*abs(b)+t; m=(c-b)/2; %Toleranz

    if (abs(m)>tol) && (abs(fb)>0) %Verfahren muss noch durchgeführt werden

        if (abs(e)<tol) || (abs(fa)<=abs(fb))
            d=m; e=m;
        else
            s=fb/fa;
            if a==c
                p=2*m*s; q=1-s;
            else
                q=fa/fc; r=fb/fc;
                p=s*(2*m*q*(q-r)-(b-a)*(r-1));
                q=(q-1)*(r-1)*(s-1);
            end
            if p>0
                q=-q;
            else
                p=-p;
            end
            s=e; e=d;
            if ( 2*p<3*m*q-abs(tol*q) ) && (p<abs(s*q/2))
                d=p/q;
            else
                d=m; e=m;
            end
        end

        a=b; fa=fb;

        if abs(d)>tol
            b=b+d
        else
            if m>0
                b=b+tol;
            else
                b=b-tol;
            end
        end
    else
        break;
    end

    fb=f(b);
 end

 xs=b;

Beispiel

Für die bei x = 1 {\displaystyle x=1} gelegene Nullstelle der Funktion

f ( x ) = e x ln ( x ) {\displaystyle f(x)=e^{-x}\ln(x)}

erhält man mit den Startwerten a = 0 , 05 {\displaystyle a=0{,}05} und b = 1 , 7 {\displaystyle b=1{,}7} und der gewünschten Genauigkeit von t = 10 20 {\displaystyle t=10^{-20}} für die drei Verfahren folgende Ergebnisse:

Verfahren Anzahl der Iterationsschritte Fehler nach Ende der Iteration
Brent 9 0
Sekantenverfahren konvergiert nicht in 1000 Schritten entfällt
Bisektion 31 1.164153*10−10

Die Iterationsschritte des Brent-Verfahrens genauer betrachtet:

Iterationsschritt angewendeter Schritt aktuelle Näherung x ≈
1 Lineare Interpolation 1.6457
2 Bisektion 0.84785889251506
3 Lineare Interpolation 1.18604831457557
4 Lineare Interpolation 1.04253452228117
5 Quadratische Interpolation 0.99590946651532
6 Lineare Interpolation 1.00026718046634
7 Lineare Interpolation 1.00000163554039
8 Quadratische Interpolation 0.99999999999436
9 Lineare Interpolation 1

Literatur

  • Richard Brent: Algorithms for Minimization without Derivatives. Dover 2002
  • Press et al.: Numerical Recipes in C. Cambridge University Press, 1991
  • John Burkardt: BRENT – Algorithms for Minimization Without Derivatives, Programmbibliothek in C++.